JPH1066067A - 映像データ圧縮装置およびその方法 - Google Patents
映像データ圧縮装置およびその方法Info
- Publication number
- JPH1066067A JPH1066067A JP21470796A JP21470796A JPH1066067A JP H1066067 A JPH1066067 A JP H1066067A JP 21470796 A JP21470796 A JP 21470796A JP 21470796 A JP21470796 A JP 21470796A JP H1066067 A JPH1066067 A JP H1066067A
- Authority
- JP
- Japan
- Prior art keywords
- data
- picture
- video data
- compression
- calculated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
とができ、しかも、処理に要する時間が短い映像データ
圧縮装置等を提供する。 【解決手段】エンコーダ制御部22は、圧縮符号化のた
めの前処理を行うとともに、Iピクチャーに圧縮される
ピクチャーの絵柄の難しさを示すパラメータとしてフラ
ットネスおよびイントラACを生成する。動き検出器1
4は、動き予測の予測誤差量(ME残差)を算出する。
FIFOメモリ160は、入力された映像データの各ピ
クチャーを遅延する。ホストコンピュータ20は、ME
残差、フラットネスおよびイントラACにより、各ピク
チャーの絵柄の難しさを示す実難度データDj を近似
し、さらに、近似した実難度データDj から、圧縮映像
データの目標データ量Tj を算出する。エンコーダ18
は、圧縮映像データのデータ量が、ほぼ、目標データ量
Tj となるように圧縮符号化を行う。
Description
を圧縮符号化する映像データ圧縮装置およびその方法に
関する。
縮のディジタル映像データをMPEG(moving picture
experts group)等の方法により、Iピクチャー(intra c
oded picture) 、Bピクチャー(bi-directionaly predi
ctive coded picture)およびPピクチャー(predictive
coded picture)から構成されるGOP(group of pictur
es) 単位に圧縮符号化して光磁気ディスク(MOディス
ク;magneto-optical disc)等の記録媒体に記録する際
には、圧縮符号化後の圧縮映像データのデータ量(ビッ
ト量)を、伸長復号後の映像の品質を高く保ちつつ記録
媒体の記録容量以下、あるいは、通信回線の伝送容量以
下にする必要がある。
備的に圧縮符号化して圧縮符号化後のデータ量を見積も
り(1パス目)、次に、見積もったデータ量に基づいて
圧縮率を調節し、圧縮符号化後のデータ量が記録媒体の
記録容量以下になるように圧縮符号化する(2パス目)
方法が採られる(以下、このような圧縮符号化方法を
「2パスエンコード」とも記す)。
縮符号化を行うと、同じ非圧縮映像データに対して同様
な圧縮符号化処理を2回施す必要があり、時間がかかっ
てしまう。また、1回の圧縮符号化処理で最終的な圧縮
映像データを算出することができないために、撮影した
映像データをそのまま実時間的(リアルタイム)に圧縮
符号化し、記録することができない。
てなされたものであり、2パスエンコードによらずに、
所定のデータ量以下に音声・映像データを圧縮符号化す
ることができる映像データ圧縮装置およびその方法を提
供することを目的とする。また、本発明は、ほぼ実時間
的に映像データを圧縮符号化することができ、しかも、
伸長復号後に高品質な映像を得ることができる映像デー
タ圧縮装置およびその方法を提供することを目的とす
る。また、本発明は、2パスエンコードによらずに、圧
縮符号化後のデータ量を見積もって圧縮率を調節し、圧
縮符号化処理を行うことができる映像データ圧縮装置お
よびその方法を提供することを目的とする。
に、本発明に係る映像データ圧縮装置は、動画の非圧縮
映像データの複雑さをピクチャーごとに指標する指標デ
ータ(統計量)を算出する指標データ算出手段と、算出
した前記指標データに基づいて、前記非圧縮映像データ
の圧縮後のデータ量の目標値をピクチャーごとに算出す
る目標値算出手段と、前記非圧縮映像データを所定の圧
縮方法により、圧縮後のデータ量が算出した前記目標値
になるように圧縮する圧縮手段とを有する。
像データを、複数の種類のピクチャー(Iピクチャー、
PピクチャーおよびBピクチャーまたはこれらの組み合
わせ)を所定の順番で含むピクチャータイプシーケンス
に圧縮し、前記指標データ算出手段は、Pピクチャーお
よびBピクチャーに圧縮されるピクチャーの前記指標デ
ータとしてME残差を算出し、Iピクチャーに圧縮され
るピクチャーの前記指標データとしてフラットネスおよ
びイントラACデータまたはこれらのいずれかを算出
し、前記目標値算出手段は、算出した前記指標データに
基づいて、圧縮後のデータ量に対応する難度データを算
出し、さらに、算出した難度データに基づいて、前記目
標値を算出する。
記非圧縮映像データのIピクチャーの前記指標データと
してアクティビティを算出する。
時間、遅延して出力する遅延手段ををさらに有し、前記
目標値算出手段は、前記遅延手段が前記非圧縮映像デー
タを遅延している間に算出した前記指標データに基づい
て、前記遅延手段が出力したピクチャーに対する前記目
標値を算出し、前記圧縮手段は、前記遅延手段が出力し
たピクチャーを、圧縮後のデータ量が、算出した前記目
標値になるように圧縮する。
て、遅延手段は、圧縮符号化後のデータ量を見積もるの
に充分な指標データを得るために、例えば、非圧縮映像
データがLピクチャー入力される時間だけ、非圧縮映像
データを遅延する。指標データ算出手段は、動画の非圧
縮映像データのピクチャーそれぞれの絵柄の複雑さを指
標する指標データを算出する。
り、遅延手段により遅延された動画の非圧縮映像データ
を、他のピクチャーへの参照なく圧縮・伸長されるIピ
クチャーと、前方のピクチャーを参照して圧縮・伸長さ
れるPピクチャー、および、前後のピクチャーを参照し
て圧縮・伸長されるBピクチャーの組み合わせとを、所
定の順番で含むピクチャータイプシーケンスに圧縮符号
化する。なお、圧縮符号化処理の際、圧縮手段は、圧縮
後の映像データのデータ量が、ほぼ、目標値算出手段が
算出した目標値になるようにする。
参照しないIピクチャーの指標データとして、フラット
ネス(flatness)およびイントラAC(intra AC)またはこ
れらのいずれか、他のピクチャーを参照するPピクチャ
ーおよびBピクチャーの指標データとして動き予測の予
測誤差量(ME残差)を算出する。
坦さを表す指標として定義され、映像の複雑さを表し、
映像の絵柄の難しさ(難度)および圧縮後のデータ量と
相関性を有する。また、イントラACは、ピクチャー内
の映像データの平均値と、MPEG方式におけるDCT
処理単位のDCTブロックごとの映像データとの分散値
の総和として定義され、フラットネスと同様に、映像の
複雑さを表し、映像の絵柄の難しさ(難度)および圧縮
後のデータ量と相関性を有する。
クトルによる動き補償処理後に、入力ピクチャーと参照
ピクチャーの映像データとの差分値の絶対値和あるいは
自乗値和として定義され、映像の動きの速さおよび絵柄
の複雑さを表し、フラットネスと同様に、映像の絵柄の
難しさ(難度)および圧縮後のデータ量と相関性を有す
る。また、Iピクチャーの指標データとして、MPEG
方式の圧縮アルゴリズムとして有名なTM5[test mode
l 5; ISO/IEC JTC/SC29 (1993)] において、マクロブロ
ックに対する量子化処理の量子化値を決定するために用
いられるアクティビティ(activity)を用いることも可能
である。
映像データの総データ量を記録媒体の記録容量以下に抑
え、しかも、圧縮映像データの品質を可能な限り高く保
つことができるように、圧縮映像データの圧縮映像デー
タのデータ量の目標値を算出する。目標値は、例えば、
遅延された非圧縮映像データの第j番目のピクチャーを
圧縮符号化する際に、非圧縮映像データの第(j−A)
番目〜第(j+L−1)番目のピクチャーから得られた
指標データを絵柄の複雑さ(難度)を示すものとして用
い、第j番目のピクチャーが、その絵柄の複雑さに応じ
たデータ量に圧縮符号化されるようにデータ量を割り振
ることにより算出される。
は、動画の非圧縮映像データの複雑さをピクチャーごと
に指標する指標データを算出し、算出した前記指標デー
タに基づいて、前記非圧縮映像データの圧縮後のデータ
量の目標値をピクチャーごとに算出し、前記非圧縮映像
データを所定の圧縮方法により、圧縮後のデータ量が算
出した前記目標値になるように圧縮する。
式といった映像データの圧縮符号化方式により、高い周
波数成分が多い絵柄、あるいは、動きが多い絵柄といっ
た難度(difficulty)が高い映像データを圧縮符号化する
と、一般的に圧縮に伴う歪みが生じやすくなる。このた
め、難度が高い映像データは低い圧縮率で圧縮符号化す
る必要があり、難度が高いデータを圧縮符号化して得ら
れる圧縮映像データに対しては、難度が低い絵柄の映像
データの圧縮映像データに比べて、多くの目標データ量
を配分する必要がある。
応的に目標データ量を配分するためには、従来技術とし
て示した2パスエンコード方式が有効である。しかしな
がら、2パスエンコード方式は、実時間的な圧縮符号化
に不向きである。第1の実施形態として示す簡易2パス
エンコード方式は、かかる2パスエンコード方式の問題
点を解決するためになされたものであり、非圧縮映像デ
ータを予備的に圧縮符号化して得られる圧縮映像データ
の難度データから非圧縮映像データの難度を算出し、予
備的な圧縮符号化により算出した難度に基づいて、FI
FOメモリ等により所定の時間だけ遅延した非圧縮映像
データの圧縮率を適応的に制御することができる。
1の構成を示す図である。図1に示すように、映像デー
タ圧縮装置1は、圧縮符号化部10およびホストコンピ
ュータ20から構成され、圧縮符号化部10は、エンコ
ーダ制御部12、動き検出器(motion estimator)14、
簡易2パス処理部16、第2のエンコーダ(encoder) 1
8から構成され、簡易2パス処理部16は、FIFOメ
モリ160および第1のエンコーダ162から構成され
る。映像データ圧縮装置1は、これらの構成部分によ
り、編集装置およびビデオテープレコーダ装置等の外部
機器(図示せず)から入力される非圧縮映像データVI
Nに対して、上述した簡易2パスエンコードを実現す
る。
ンピュータ20は、映像データ圧縮装置1の各構成部分
の動作を制御する。また、ホストコンピュータ20は、
簡易2パス処理部16のエンコーダ162が非圧縮映像
データVINを予備的に圧縮符号化して生成した圧縮映
像データのデータ量、DCT処理後の映像データの直流
成分(DC成分)の値および直流成分(AC成分)の電
力値を制御信号C16を介して受け、受けたこれらの値
に基づいて圧縮映像データの絵柄の難度を算出する。さ
らに、ホストコンピュータ20は、算出した難度に基づ
いて、エンコーダ18が生成する圧縮映像データの目標
データ量Tj を制御信号C18を介してピクチャーごと
に割り当て、エンコーダ18の量子化回路166(図
3)に設定し、エンコーダ18の圧縮率をピクチャー単
位に適応的に制御する。
タVINのピクチャーの有無をホストコンピュータ20
に通知し、さらに、非圧縮映像データVINのピクチャ
ーごとに圧縮符号化のための前処理を行う。つまり、エ
ンコーダ制御部12は、入力された非圧縮映像データを
符号化順に並べ替え、ピクチャー・フィールド変換を行
い、非圧縮映像データVINが映画の映像データである
場合に3:2プルダウン処理(映画の24フレーム/秒
の映像データを、30フレーム/秒の映像データに変換
し、冗長性を圧縮符号化前に取り除く処理)等を行い、
映像データS12として簡易2パス処理部16のFIF
Oメモリ160およびエンコーダ162に対して出力す
る。動き検出器14は、非圧縮映像データの動きベクト
ルの検出を行し、エンコーダ制御部12およびエンコー
ダ162,18に対して出力する。
メモリ160は、エンコーダ制御部12から入力された
映像データS12を、例えば、非圧縮映像データVIN
が、L(Lは整数)ピクチャー入力される時間だけ遅延
し、遅延映像データS16としてエンコーダ18に対し
て出力する。
6のエンコーダ162の構成を示す図である。エンコー
ダ162は、例えば、図2に示すように、加算回路16
4、DCT回路166、量子化回路(Q)168、可変
長符号化回路(VLC)170、逆量子化回路(IQ)
172、逆DCT(IDCT)回路174、加算回路1
76および動き補償回路178から構成される一般的な
映像データ用圧縮符号化器であって、入力される映像デ
ータS12をMPEG方式等により圧縮符号化し、圧縮
映像データのピクチャーごとのデータ量等をホストコン
ピュータ20に対して出力する。
データを映像データS12から減算し、DCT回路16
6に対して出力する。DCT回路166は、加算回路1
64から入力される映像データを、例えば、16画素×
16画素のマクロブロック単位に離散コサイン変換(D
CT)処理し、時間領域のデータから周波数領域のデー
タに変換して量子化回路168に対して出力する。ま
た、DCT回路166は、DCT後の映像データのDC
成分の値およびAC成分の電力値をホストコンピュータ
20に対して出力する。
ら入力された周波数領域のデータを、固定の量子化値Q
で量子化し、量子化データとして可変長符号化回路17
0および逆量子化回路172に対して出力する。可変長
符号化回路170は、量子化回路168から入力された
量子化データを可変長符号化し、可変長符号化の結果と
して得られた圧縮映像データのデータ量を、制御信号C
16を介してホストコンピュータ20に対して出力す
る。逆量子化回路172は、可変長符号化回路168か
ら入力された量子化データを逆量子化し、逆量子化デー
タとして逆DCT回路174に対して出力する。
2から入力される逆量子化データに対して逆DCT処理
を行い、加算回路176に対して出力する。加算回路1
76は、動き補償回路178の出力データおよび逆DC
T回路174の出力データを加算し、加算回路164お
よび動き補償回路178に対して出力する。動き補償回
路178は、加算回路176の出力データに対して、動
き検出器14から入力される動きベクトルに基づいて動
き補償処理を行い、加算回路176に対して出力する。
成を示す図である。図3に示すように、エンコーダ18
は、図2に示したエンコーダ162に、量子化制御回路
180を加えた構成になっている。エンコーダ18は、
これらの構成部分により、ホストコンピュータ20から
設定される目標データ量Tj に基づいて、FIFOメモ
リ160によりLピクチャー分遅延された遅延映像デー
タS16に対して動き補償処理、DCT処理、量子化処
理および可変長符号化処理を施して、MPEG方式等の
圧縮映像データVOUTを生成し、外部機器(図示せ
ず)に出力する。
180は、可変長量子化回路170が出力する圧縮映像
データVOUTのデータ量を順次、監視し、遅延映像デ
ータS16の第j番目のピクチャーから最終的に生成さ
れる圧縮映像データのデータ量が、ホストコンピュータ
20から設定された目標データ量Tj に近づくように、
順次、量子化回路168に設定する量子化値Qj を調節
する。また、可変長量子化回路170は、圧縮映像デー
タVOUTを外部に出力する他に、遅延映像データS1
6を圧縮符号化して得られた圧縮映像データVOUTの
実際のデータ量Sj を制御信号C18を介してホストコ
ンピュータ20に対して出力する。
圧縮装置1の簡易2パスエンコード動作を説明する。図
4(A)〜(C)は、第1の実施形態における映像デー
タ圧縮装置1の簡易2パスエンコードの動作を示す図で
ある。エンコーダ制御部12は、映像データ圧縮装置1
に入力された非圧縮映像データVINに対して、エンコ
ーダ制御部12により符号化順にピクチャーを並べ替え
る等の前処理を行い、図4(A)に示すように映像デー
タS12としてFIFOメモリ160およびエンコーダ
162に対して出力する。なお、エンコーダ制御部12
によるピクチャーの順番並べ替えにより、図4等に示す
ピクチャーの符号化の順番と伸長復号後の表示の順番と
は異なる。
データS12の各ピクチャーをLピクチャー分だけ遅延
し、エンコーダ18に対して出力する。エンコーダ16
2は、入力された映像データS12のピクチャーを予備
的に順次、圧縮符号化し、第j(jは整数)番目のピク
チャーを圧縮符号化して得られた圧縮符号化データのデ
ータ量、DCT処理後の映像データのDC成分の値、お
よび、AC成分の電力値をホストコンピュータ20に対
して出力する。
映像データS16は、FIFOメモリ160によりLピ
クチャーだけ遅延されているので、図4(B)に示すよ
うに、エンコーダ18が、遅延映像データS16の第j
(jは整数)番目のピクチャー(図4(B)のピクチャ
ーa)を圧縮符号化している際には、エンコーダ162
は、映像データS12の第j番目のピクチャーからLピ
クチャー分先の第(j+L)番目のピクチャー(図4
(B)のピクチャーb)を圧縮符号化していることにな
る。従って、エンコーダ18が遅延映像データS16の
第j番目のピクチャーの圧縮符号化を開始する際には、
エンコーダ162は映像データS12の第j番目〜第
(j+L−1)番目のピクチャー(図4(B)の範囲
c)の圧縮符号化を完了しており、これらのピクチャー
の圧縮符号化後の実難度データDj ,D j+1 ,Dj+2 ,
…,Dj+L-1 は、ホストコンピュータ20により既に算
出されている。
により、エンコーダ18が遅延映像データS16の第j
番目のピクチャーを圧縮符号化して得られる圧縮映像デ
ータに割り当てる目標データ量Tj を算出し、算出した
目標データ量Tj を量子化制御回路180に設定する。
12の第j番目のピクチャーの実難度データであり、
R’j は、映像データS12,S16の第j番目〜第
(j+L−1)番目のピクチャーに割り当てることがで
きる目標データ量の平均であり、R’j の初期値(R’
1 )は、圧縮映像データの各ピクチャーに平均して割り
当て可能な目標データ量であり、下に示す式2で表さ
れ、エンコーダ18が圧縮映像データを1ピクチャー分
生成する度に、式3に示すように更新される。
e)は、通信回線の伝送容量や、記録媒体の記録容量に基
づいて決められる1秒当たりのデータ量(ビット量)を
示し、ピクチャーレート(Picture rate)は、映像データ
に含まれる1秒当たりのピクチャーの数(30枚/秒
(NTSC),25枚/秒(PAL))を示し、数値F
j+L は、ピクチャータイプに応じて定められるピクチャ
ー当たりの平均データ量を示す。エンコーダ18のDC
T回路166は、入力される遅延映像データS16の第
j番目のピクチャーをDCT処理し、量子化回路168
に対して出力する。量子化回路168は、DCT回路1
66から入力された第j番目のピクチャーの周波数領域
のデータを、量子化制御回路180が目標データ量Tj
に基づいて調節する量子化値Qj により量子化し、量子
化データとして可変長符号化回路170に対して出力す
る。可変長符号化回路170は、量子化回路168から
入力された第j番目のピクチャーの量子化データを可変
長符号化して、ほぼ、目標データ量Tj に近いデータ量
の圧縮映像データVOUTを生成して出力する。
ーダ18が、遅延映像データS16の第(j+1)番目
のピクチャー(図4(C)のピクチャーa’)を圧縮符
号化している際には、エンコーダ162は、映像データ
S12の第(j+1)番目〜第(j+L)番目のピクチ
ャー(図4(C)の範囲c’)の圧縮符号化を完了し、
これらのピクチャーの実難度データDj+1 ,Dj+2 ,D
j+3 ,・・・,Dj+Lは、ホストコンピュータ20によ
り既に算出されている。
エンコーダ18が遅延映像データS16の第(j+1)
番目のピクチャーを圧縮符号化して得られる圧縮映像デ
ータに割り当てる目標データ量Tj+1 を算出し、エンコ
ーダ18の量子化制御回路180に設定する。
0から量子化制御回路180に設定された目量データ量
Tj に基づいて第(j+1)番目のピクチャーを圧縮符
号化し、目標データ量Tj+1 に近いデータ量の圧縮映像
データVOUTを生成して出力する。さらに以下、同様
に、映像データ圧縮装置1は、遅延映像データS16の
第k番目のピクチャーを、量子化値Qk (k=j+2,
j+3,…)をピクチャーごとに変更して順次、圧縮符
号化し、圧縮映像データVOUTとして出力する。
した映像データ圧縮装置1によれば、短時間で非圧縮映
像データVINの絵柄の難度を算出し、算出した難度に
応じた圧縮率で適応的に非圧縮映像データVINを圧縮
符号化することができる。つまり、第1の実施形態に示
した映像データ圧縮装置1によれば、2パスエンコード
方式と異なり、ほぼ実時間的に、非圧縮映像データVI
Nの絵柄の難度に基づいて適応的に非圧縮映像データV
INを圧縮符号化をすることができ、実況放送といった
実時間性を要求される用途に応用可能である。なお、第
1の実施形態に示した他、本発明に係るデータ多重化装
置1は、エンコーダ162が圧縮符号化した圧縮映像デ
ータのデータ量を、そのまま難度データとして用い、ホ
ストコンピュータ20の処理の簡略化を図る等、種々の
構成を採ることができる。
れば、実時間かつ、絵柄の難度に応じた適応的な非圧縮
映像データに対する圧縮符号化処理が可能である。しか
しながら、第1の実施形態に示した簡易2パスエンコー
ド方式を用いた場合、実時間性が厳しく要求される場合
には、FIFOメモリ160の遅延時間を大きくするこ
とができず、真に適切な目標データ量Tj の算出が難し
く、圧縮映像データVOUTを伸長復号して得られる映
像の品質が低下してしまう可能性がある。
態に示した映像データ圧縮装置1(図1)を用い、ホス
トコンピュータ20の処理内容を変更して、FIFOメ
モリ160の遅延時間を長くしなくても適切な目標デー
タ量Tj の値を得ることができるように、非圧縮映像デ
ータをLピクチャー分、予備的に圧縮符号化して得られ
た圧縮映像データの第j番目のピクチャー〜第(j+L
−1)番目のピクチャーの実難度データDj 〜Dj+L-1
から、圧縮映像データの第(j+L)番目のピクチャー
〜第(j+L+B)番目のピクチャー(Bは整数)の難
度データ(予測難度データ)Dj+L 〜Dj+L+B を算出
し、実際に得られた難度データDj 〜Dj+ L-1 (実難度
データ)および予測によって得られた難度データD’
j+L 〜D’j+ L+B に基づいて、第1の実施形態に示した
簡易2パスエンコード方式よりも適切な目標データ量T
j の値を得ることができる圧縮符号化方式(予測簡易2
パスエンコード方式)を説明する。
2パスエンコード方式を概念的に説明する。予測簡易2
パスエンコード方式は、徐々に絵柄が難しくなってゆ
く、つまり、徐々に圧縮符号化時のDCT処理後の高い
周波数成分が多くなり、動きが速くなってゆく非圧縮映
像データの絵柄は、さらに難しくなってゆき、逆に、徐
々に絵柄が難しくなくなって(簡単になって)ゆく非圧
縮映像データの絵柄は、さらに簡単になってゆくであろ
うと予測可能であることを前提する。
は、ホストコンピュータ20が、この前提に基づいて、
さらに絵柄が難しくなってゆくと予測される場合には、
さらに絵柄が難しいピクチャーに備えて、その時点で圧
縮符号化しているピクチャーに割り当てる目標データ量
を節約し、逆に、さらに絵柄が簡単になってゆくと予測
される場合には、その時点で圧縮符号化しているピクチ
ャーに割り当てる目標データ量を増やすようにエンコー
ダ18に対する圧縮率の制御を行う。
概念的な説明を続ける。映像データは、一般的に、時間
方向および空間方向について相関性が高く、映像データ
の圧縮符号化は、これらの相関性に着目し、冗長性を除
くことにより行われる。時間方向について相関性が高い
ということは、現時点の非圧縮映像データのピクチャー
の難度とそれ以降の非圧縮映像データのピクチャーの難
度とが近いということを意味する。また、難度の増減の
傾向も、現時点までの難度の増減の傾向がそれ以降も続
くことが多い。
ゆっくりとカメラを水平方向に回し初め、最後に一定の
回転速度で回転しながら、静止している物体を撮影する
場合の非圧縮映像データの絵柄を考える。最初はカメラ
が停止状態であるため、静止映像が撮影され、絵柄の難
度は低くなる。次に、カメラを回し始めて1〜2秒後に
一定の回転速度になると仮定すると、カメラを回し始め
て1〜2秒間は絵柄の難度は高くなる傾向を示す。この
状態を、映像データ圧縮装置1側から見ると、数GOP
分の圧縮映像データを生成する間、入力される非圧縮映
像データの絵柄の難度が高くなる傾向が続くことにな
る。
は、非圧縮映像データの絵柄の難度が増大傾向を示した
場合に、それ以降の絵柄の難度が増大傾向を示すと予測
するのは妥当である。以下に説明する予測簡易2パスエ
ンコード方式は、このような難度および難度の増減傾向
の時間的相関性を積極的に利用して、圧縮映像データの
各ピクチャーに対して、第1の実施形態に示した簡易2
パスエンコード方式においてよりも適切な目標データ量
の割り当てを行おうとするものである。
圧縮装置1の予測簡易2パスエンコードの動作を説明す
る。図5(A)〜(C)は、第2の実施形態における映
像データ圧縮装置1の予測簡易2パスエンコードの動作
を示す図である。エンコーダ制御部12は、第1の実施
形態においてと同様に、映像データ圧縮装置1に入力さ
れた非圧縮映像データVINに対して、エンコーダ制御
部12により符号化順にピクチャーを並べ替える等の前
処理を行い、図5(A)に示すように映像データS12
としてFIFOメモリ160およびエンコーダ162に
対して出力する。
においてと同様に、入力された映像データS12の各ピ
クチャーをLピクチャー分だけ遅延し、エンコーダ18
に対して出力する。エンコーダ162は、第1の実施形
態においてと同様に、入力された映像データS12のピ
クチャーを予備的に順次、圧縮符号化し、第j(jは整
数)番目のピクチャーを圧縮符号化して得られた圧縮符
号化データのデータ量、DCT処理後の映像データのD
C成分の値およびAC成分の電力値をホストコンピュー
タ20に対して出力する。ホストコンピュータ20は、
エンコーダ162から入力されたこれらの値に基づい
て、実難度データDj を順次、算出する。
映像データS16は、FIFOメモリ160によりLピ
クチャーだけ遅延されているので、図5(B)に示すよ
うに、エンコーダ18が、遅延映像データS16の第j
番目のピクチャー(図5(B)のピクチャーa)を圧縮
符号化している際には、エンコーダ162は、第1の実
施形態においてと同様に、映像データS12の第j番目
のピクチャーからLピクチャー分先の第(j+L)番目
のピクチャー(図5(B)のピクチャーb)を圧縮符号
化していることになる。
S16の第j番目のピクチャーの圧縮符号化を開始する
際には、エンコーダ162は映像データS12の第(j
−A)番目〜第(j+L−1)番目のピクチャー(図5
(B)の範囲c、但し、図5はA=0の場合を示す)の
圧縮符号化を完了し、これらのピクチャーの圧縮符号化
後のデータ量、および、DCT処理後の映像データのD
C成分の値およびAC成分の電力値をホストコンピュー
タ20に対して出力している。ホストコンピュータ20
は、エンコーダ162から入力されたこれらの値に基づ
いて、難度データ(実難度データ、図5(B)の範囲
d)Dj-A ,Dj-A+1 ,…,Dj ,Dj+1,Dj+2 ,
…,Dj+L-1 の算出を既に終了している。なお、Aは整
数であり、正負を問わない。
Dj-A ,Dj-a+1 ,…,Dj ,Dj+ 1 ,Dj+2 ,…,D
j+L-1 に基づいて、映像データS12の第(j+L)番
目〜第(j+L+B)番目のピクチャーの圧縮符号化後
の難度データ(予測難度データ、図5(B)の範囲e)
D’j+L ,D’j+L+1 ,D’j+L+2 ,…,D’j+L+Bを
予測し、下に示す式4により、遅延映像データS16の
第j番目のピクチャーの圧縮符号化後の目標データ量T
j を算出する。従って、遅延映像データS16の第j番
目のピクチャーの圧縮符号化後の目標データ量Tj を算
出するために、実難度データと予測難度データとを含め
て、図5(B)の範囲cの(A+L+B+1)ピクチャ
ー分の難度データを用いることになる。なお、予測難度
データD j ’は、例えば、実難度データDj を直線近似
し、近似により得られた直線を外挿する等の方法により
算出されうる。
じである。エンコーダ18は、第1の実施形態と同様
に、ホストコンピュータ20により量子化制御回路18
0に設定された目標データ量Tj に基づいて、目標デー
タ量Tj に近いデータ量の圧縮映像データVOUTを生
成して出力する。さらに、ホストコンピュータ20は、
図5(B)に示した動作と同様に、遅延映像データS1
6の第(j+1)番目のピクチャー(図5(C)のピク
チャーa’)に対しても、映像データS12の第(j+
L+1)番目のピクチャー(図5(C)のピクチャー
b’)以前の図5(C)の範囲d’の実難度データD
j-A+1,Dj-A+2 ,…,Dj ,Dj+1 ,Dj+2 ,…,D
j+L 、および、図5(C)の範囲e’に示す予測難度デ
ータ、D’j+L+1 ,D’j+L+2 ,D’j+L+3 ,…,D’
j+L+B+1 、つまり、図5(C)の範囲c’に示す実難度
データと予測難度データとに基づいて、遅延映像データ
S16の第(j+1)番目のピクチャーの圧縮符号化後
の目標データ量Tj+1 を算出する。エンコーダ18は、
ホストコンピュータ20が算出した目量データ量Tj+1
に基づいて、遅延映像データS16の第(j+1)番目
のピクチャーを圧縮符号化し、目標データ量Tj+1 に近
いデータ量の圧縮符号化データVOUTを生成する。な
お、以上の映像データ圧縮装置1の予測簡易2パスエン
コード動作は、遅延映像データS16の第(j+1)番
目のピクチャーに対しても同様である。
おける映像データ圧縮装置1の動作を整理して説明す
る。図6は、第2の実施形態における映像データ圧縮装
置1(図1)の動作を示すフローチャートである。図6
に示すように、ステップ102(S102)において、
ホストコンピュータ20は、式1等に用いられる数値
j,R’1 を、j=−(L−1),R’1 =(Bit rate
×(L+B))/Picture rate として初期化する。
ストコンピュータ20は、数値jが0より大きいか否か
を判断する。数値jが0より大きい場合にはS106の
処理に進み、小さい場合にはS110の処理に進む。ス
テップ106(S106)において、エンコーダ162
は、映像データS12の第(j+L)番目のピクチャー
を圧縮符号化し、実難度データDj+L を生成する。
ストコンピュータ20は数値jをインクリメントする
(j=j+1)。ステップ110(S110)におい
て、ホストコンピュータ20は、遅延映像データS16
に第j番目のピクチャーが存在するか否かを判断する。
第j番目のピクチャーが存在する場合にはS112の処
理に進み、存在しない場合には圧縮符号化処理を終了す
る。
ストコンピュータ20は、数値jが数値Aよりも大きい
か否かを判断する。数値jが数値Aよりも大きい場合に
はS114の処理に進み、小さい場合にはS116の処
理に進む。ステップ114(S114)において、ホス
トコンピュータ20は、実難度データDj-A 〜Dj+L-1
に基づいて、予測難度データD’j+L 〜D’j+L+B を算
出する。ステップ116(S116)において、ホスト
コンピュータ20は実難度データD1 〜Dj+L-1 から、
予測難度データD’j+L 〜D’j+L+B を算出する。
ストコンピュータ20は、式4を用いて目標データ量T
j を算出し、エンコーダ18の量子化制御回路180に
設定する。さらに、エンコーダ18は、量子化制御回路
180に設定された目標データ量Tj に基づいて遅延映
像データS16の第j番目のピクチャーを圧縮符号化
し、第j番目のピクチャーから実際に得られた圧縮映像
データのデータ量Sj をホストコンピュータ20に対し
て出力する。ステップ120(S120)において、ホ
ストコンピュータ20は、エンコーダ18からのデータ
量Sj を記憶し、さらに、映像データS12の第(j+
L)番目のピクチャーの実難度データDj+L を出力す
る。
ンコーダ18は、遅延映像データS16の第j番目を圧
縮符号化して得られた圧縮映像データVOUTを外部に
出力する。ステップ124(S124)において、ホス
トコンピュータ20は、ピクチャータイプに応じて、式
3中に用いられる数値Fj+L を算出する。ステップ12
6(S126)において、ホストコンピュータ20は、
式3に示した演算(R’j+1 =R’j −Sj +Fj+L )
を行う。
した映像データ圧縮装置1による予測簡易2パスエンコ
ードによれば、短時間で非圧縮映像データVINの絵柄
の難度を算出し、算出した難度に基づいて予測した難度
をさらに用いて適応的に非圧縮映像データVINを圧縮
符号化することができ、簡易2パスエンコード方式に比
べて、より適切な目標データ量を圧縮映像データの各ピ
クチャーに割り当てることが可能である。従って、予測
簡易2パスエンコード方式による圧縮映像データを伸長
復号した場合、簡易2パスエンコード方式による圧縮映
像データを伸長復号した場合に比べて、より高品質な映
像を得ることができる。
形態に示した簡易2パスエンコード方式、および、第2
の実施形態に示した予測簡易2パスエンコード方式は、
入力される非圧縮映像データに、ほぼ1GOP分(例え
ば、0.5秒)程度の遅延を与えるだけで圧縮符号化
し、適切なデータ量の圧縮映像データを生成することが
できる優れた方式である。
ダーを2つ必要とする。一般に、映像データを圧縮符号
化するエンコーダーは大規模のハードウェアを必要と
し、集積回路化しても非常に高価であり、しかも、サイ
ズが大きい。従って、これらの方式がエンコーダーを2
つ必要とすることは、これらの方式を実現する装置の低
コスト化、小型化および省電力化を妨げる。また、圧縮
符号化に要する時間遅延は、短ければ短いほど望ましい
が、実難度データDj および予測難度データDj’の算
出処理および予備的な圧縮符号化処理そのものが数ピク
チャー分の処理時間を要するので、これらの処理自体
が、時間遅延の短縮化を妨げる原因となる。
るためになされたものであって、1つのエンコーダを用
いるのみで、簡易2パスエンコード方式および予測簡易
2パスエンコード方式と同等に適切なデータ量の圧縮映
像データを生成することができ、しかも、処理に要する
時間遅延がより短い映像データ圧縮方式を提供すること
を目的とする。
係る映像データ圧縮装置2の構成の概要を示す図であ
る。図8は、図7に示した映像データ圧縮装置2の圧縮
符号化部24の詳細な構成を示す図である。なお、図7
および図8において、映像データ圧縮装置2の構成部分
のうち、第1の実施形態および第2の実施形態において
説明した映像データ圧縮装置1(図1,図2)の構成部
分と同一のものには同一の符号を付して示してある。
は、映像データ圧縮装置1(図1,図2)の圧縮符号化
部10を、圧縮符号化部10からエンコーダ162を除
いた圧縮符号化部24で置換し、エンコーダ制御部12
をエンコーダ制御部22で置換し、バッファメモリ(buf
fer)182を付加した構成を採る。図8に示すように、
圧縮符号化部24は、映像並び替え回路220、走査変
換・マクロブロック化回路222および統計量算出回路
224から構成され、圧縮符号化部24の他の構成部分
は、圧縮符号化部10と同一の構成を採る。
部12と同様に、非圧縮映像データVINのピクチャー
の有無をホストコンピュータ20に通知し、さらに、非
圧縮映像データVINのピクチャーごとに圧縮符号化の
ための前処理を行う。エンコーダ制御部22において、
映像並び替え回路220は、入力された非圧縮映像デー
タを符号化順に並べ替える。
は、ピクチャー・フィールド変換を行い、非圧縮映像デ
ータVINが映画の映像データである場合に3:2プル
ダウン処理等を行う。統計量算出回路224は、映像並
び替え回路220および走査変換・マクロブロック化回
路222により処理され、Iピクチャーに圧縮符号化さ
れるピクチャーからフラットネス(flatness)およびイン
トラAC(intra AC)等の統計量を算出する。
分により、非圧縮映像データの統計量(フラットネス,
イントラAC)および動き予測の予測誤差量(ME残
差)を非圧縮映像データVINの絵柄の難度の代わりに
用いて、映像データ圧縮装置1(図1,図2)と同様に
適応的に目標データ量Tj を算出して、高精度なフィー
ドフォワード制御を行うことにより、非圧縮映像データ
VINを適切なデータ量の圧縮映像データに圧縮符号化
する。なお、映像データ圧縮装置2においては、動き検
出器14およびエンコーダ制御部22の統計量算出回路
224により、予め検出された指標データに基づいて目
標データ量Tj が定めるられることから、以下、映像デ
ータ圧縮装置2における圧縮符号化方式を、フィード・
フォワード・レート・コントロール(FFRC; feed f
oward rate control)方式と呼ぶことにする。
と、参照ピクチャーの映像データとの差分値の絶対値和
あるいは自乗値和として定義され、動き検出器14によ
り、圧縮後にPピクチャーおよびBピクチャーとなるピ
クチャーから算出され、映像の動きの速さおよび絵柄の
複雑さを表し、フラットネスと同様に、難度および圧縮
後のデータ量と相関性を有する。
の参照なしに圧縮符号化されるため、ME残差を求める
ことができず、ME残差に代わるパラメータとして、フ
ラットネスおよびイントラACを用いる。また、フラッ
トネスは、映像データ圧縮装置2を実現するために、映
像の空間的な平坦さを表す指標として新たに定義された
パラメータであって、映像の複雑さを指標し、映像の絵
柄の難しさ(難度)および圧縮後のデータ量と相関性を
有する。また、イントラACは、映像データ圧縮装置2
を実現するために、MPEG方式におけるDCT処理単
位のDCTブロックごとの映像データとの分散値の総和
として新たに定義したパラメータであって、フラットネ
スと同様に、映像の複雑さを指標し、映像の絵柄の難し
さおよび圧縮後のデータ量と相関性を有する。
トラACについて説明する。第1の実施形態および第2
の実施形態において説明した簡易2パスエンコード方式
および予測簡易2パスエンコード方式において、実難度
データDj は映像の絵柄の難しさを示し、目標データ量
Tj は実難度データDj に基づいて算出される。
データのデータ量を、目標データ量Tj が示す値に近づ
けるために、量子化回路168(図2,図8)において
量子化値Qj の制御が行われる。従って、映像データを
圧縮符号化せずに得られ、実難度データDj と同様に映
像データの絵柄の複雑さ(難しさ)を適切に示すパラメ
ータを、エンコーダ18の量子化回路168における量
子化処理以前に得ることができれば、エンコーダ162
(図1)を省略し、処理遅延時間の短縮するという目的
を達成することができる。ME残差、フラットネスおよ
びイントラACは、実難度データDj と強い相関を有す
るので、このような目的を達成するために適切である。
ャーおよびBピクチャーを生成する際には、動き検出器
14は、圧縮対象となるピクチャー(入力ピクチャー)
の注目マクロブロックと、参照されるピクチャー(参照
ピクチャー)との間の差分値の絶対値和あるいは自乗値
和が最小となるようなマクロブロックを探し、動きベク
トルを求める。ME残差は、このように、動きベクトル
を求める際に、最小になった各マクロブロックの差分値
の絶対和または自乗和を、ピクチャー全体について総和
した値として定義される。
り、Pピクチャーを生成する際のME残差と実難度デー
タDj との相関関係を示す図である。図10は、映像デ
ータ圧縮装置1,2により、Bピクチャーを生成する際
のME残差と実難度データDj との相関関係を示す図で
ある。なお、図9および図10においては、実難度デー
タDj として、エンコーダ18が固定の量子化値を用い
て圧縮符号化して得られた圧縮映像データのデータ量を
用いており(以下、図12,図13において同じ)、図
9および図10は、CCIRにより規格化された標準画
像[cheer (cheer leaders), mobile (mobile and calen
der), tennis (table tennis), diva(diva with nois
e)] およびその他の画像(resort)を実際にMPEG2方
式により圧縮符号化した場合に得られるME残差と実難
度データDj との関係を示すグラフであり、図9および
図10において、グラフの縦軸(difficulty)が実難度デ
ータDj を示し、横軸(me resid)がME残差を示す。図
9および図10を参照して分かるように、ME残差は実
難度データDj と非常に強い相関関係を有する。従っ
て、圧縮後にPピクチャーまたはBピクチャーとなるピ
クチャーの実難度データDj の代わりに、ME残差は、
目標データ量T j の生成に用いられ得る。
ラットネスは、まず、図11に示すように、MPEG方
式においてDCT処理の単位となるDCTブロックそれ
ぞれを、2画素×2画素の小ブロックに分割し、次に、
これらの小ブロック内の対角の画素のデータ(画素値)
の差分値を算出し、差分値を所定の閾値と比較し、さら
に、差分値が閾値よりも小さくなる小ブロック総数をピ
クチャーごとに求めることにより算出される。なお、フ
ラットネスの値は、映像の絵柄が空間的に複雑であるほ
ど小さくなり、平坦であれば大きくなる。
り、Iピクチャーを生成する際のフラットネスと実難度
データDj との相関関係を示す図である。なお、図12
は、図9および図10と同様に、CCIRにより規格化
された標準画像およびその他の画像を実際にMPEG2
方式により圧縮符号化した場合に得られるフラットネス
と実難度データDj との関係を示すグラフであり、図1
2において、グラフの縦軸(difficulty)が実難度データ
Dj を示し、横軸(flatness)がフラットネスを示す。図
12に示すように、フラットネスと実難度データDj に
は、強い負の相関関係があり、実難度データDj は、フ
ラットネスを一次関数に代入する等の方法により近似可
能であることがわかる。
ク内の画素それぞれの画素値と、DCTブロック内の画
素値の平均値との差分の絶対値の総和として算出され
る。つまり、イントラACは、下の式5により求めるこ
とができる。
り、Iピクチャーを生成する際のイントラACと実難度
データDj との相関関係を示す図である。なお、図13
は、図9および図10と同様に、CCIRにより規格化
された標準画像およびその他の画像を実際にMPEG2
方式により圧縮符号化した場合に得られるイントラAC
と実難度データDj との関係を示すグラフであり、図1
3において、グラフの縦軸(difficulty)が実難度データ
Dj を示し、横軸(intra AC)がフラットネスを示す。図
13に示すように、イントラACと実難度データDj に
は、強い正の相関関係があり、実難度データDj は、イ
ントラACを一次関数に代入する等の方法により近似可
能であることがわかる。
(統計量)により実難度データDjを一次関数等により
近似可能であることが分かる。従って、各ピクチャータ
イプの実難度データDj は、以下に示すように算出可能
である。
り、Bピクチャーについては下に示す式7により、実難
度データDj はME残差により近似される。また、Iピ
クチャーについては、式6,7と同様の近似式により実
難度データDj は、フラットネスおよびイントラACま
たはこれらのいずかにより近似される。
スエンコード方式においては、これらの近似により得ら
れた実難度データDj を、式1に代入することにより目
標データ量Tj が算出される。あるいは、第2の実施形
態に示した予測簡易2パスエンコード方式においては、
これらの近似により得られた実難度データDj から予測
難度データDj ’が算出され、実難度データDj および
予測難度データDj ’を式4に代入することにより目標
データ量Tj が算出される。
ットネスおよびイントラACで近似し、簡易2パスエン
コード方式により非圧縮映像データを圧縮符号化する場
合を例に、映像データ圧縮装置2の動作を説明する。エ
ンコーダ制御部22において、映像並び替え回路220
は、非圧縮映像データVINを符号化順にピクチャーを
並べ替え、走査変換・マクロブロック化回路222は、
ピクチャー・フィールド変換等を行い、統計量算出回路
224は、Iピクチャーに圧縮符号化されるピクチャー
に対して、図11および式5に示した演算処理を行い、
フラットネスおよびイントラAC等の統計量を算出す
る。
ピクチャーに圧縮符号化されるピクチャーについて動き
ベクトルを生成し、さらに、ME残差を算出する。FI
FOメモリ160は、入力された映像データをLピクチ
ャー分だけ遅延する。
4が生成したME残差に対して式6および式7に示した
演算処理を行って実難度データDj を近似し、式6およ
び式7と同様な演算処理を行って、フラットネスおよび
イントラACにより実難度データDj を近似する。さら
に、ホストコンピュータ20は、近似した実難度データ
Dj を式1に代入し、目標データ量Tj を算出し、算出
した目標データ量Tj をエンコーダ18の量子化制御回
路180に設定する。
延した映像データの第j番目のピクチャーをDCT処理
する。量子化回路168は、DCT回路166から入力
された第j番目のピクチャーの周波数領域のデータを、
量子化制御回路180が目標データ量Tj に基づいて調
節する量子化値Qj により量子化する。可変長符号化回
路170は、量子化回路168から入力された第j番目
のピクチャーの量子化データを可変長符号化して、ほ
ぼ、目標データ量Tj に近いデータ量の圧縮映像データ
VOUTを生成して、バッファメモリ182を介して外
部に出力する。
知られるTM5方式等においては、マクロブロックの量
子化値(MQUANT)を算出するために、下の式8に示すアク
ティビティ(activity)という統計量が用いられる。アク
ティビティは、フラットネスおよびイントラACと同様
に、実難度データDj と強い相関関係を有するので、こ
れらパラメータの代わりにアクティビティを用いて、実
難度データDj を近似し、圧縮符号化を行うように映像
データ圧縮装置2を構成してもよい。
2パスエンコードを行う場合を例に、映像データ圧縮装
置2の動作を説明したが、映像データ圧縮装置2は、予
測簡易2パスエンコードを行いうることはいうまでもな
い。また、第3の実施形態に示した映像データ圧縮装置
2に対しても、第1の実施形態および第2の実施形態に
示した映像データ圧縮装置1に対してと同様の変形が可
能である。
形態に示したFFRC方式においては、統計的に求めら
れた指標データ(統計量)、つまり、ME残差、フラッ
トネス、イントラACおよびアクティビティを、式6お
よび式7等の一次関数に代入して実難度データDj を近
似する。これらの指標データと難度データDj とは、図
9、図10、図12および図13に示したように、強い
相関関係を有するが、映像データの絵柄によっては、上
記一次関数から若干の誤差が生じる。
置2の処理は、かかる問題点を解決するためになされた
ものであり、映像データの絵柄等に応じて、式6および
式7等に示した重み付け係数ap ,aB 等を、適応的に
刻一刻と調節して、第3の実施形態においてより高い精
度で実難度データDj を指標データで近似することがで
き、より高い品質の圧縮映像データを生成することがで
きるように改良されている。
圧縮装置2の処理の概要を説明する。映像データ圧縮装
置2(図8)のエンコーダ18が、1ピクチャー分の圧
縮符号化を終了するたびに、ホストコンピュータ20に
は、生成した圧縮映像データの1ピクチャー分のデータ
量が判明し、さらに、圧縮符号化時の量子化値Qj の平
均値、および、以下に説明するグローバルコンプレクシ
ティ(global complexity) を算出することができる。グ
ローバルコンプレクシティは、MPEGのTM5におい
て、圧縮映像データのデータ量と量子化値Qj とを乗算
した値として、下の式9−1〜式9−3に示すように定
義され、映像の絵柄の複雑さを示す。
Si ,Sb ,Sp は、それぞれIピクチャー、Bピクチ
ャーおよびPピクチャーのデータ量を示し、Qi ,
Qb ,Qp は、それぞれIピクチャー、Bピクチャーお
よびPピクチャーを生成する際の量子化値Qj の平均値
を示し、Xi ,Xb ,Xp は、それぞれIピクチャー、
BピクチャーおよびPピクチャーのグローバルコンプレ
クシティを示す。式9−1〜9−3に示したグローバル
コンプレクシティは、実難度データDjとは必ずしも一
致しないが、量子化値Qj の平均値が極端に大きかった
り小さかったりしない限り、実難度データDj とほぼ一
致する。
びBピクチャーの指標データ、例えばイントラAC(他
のパラメータでも可)およびME残差と、グローバルコ
ンプレクシティとが比例関係にあるとすると、これらの
指標データとグローバルコンプレクシティとの比例係数
εI ,εP ,εB は、下の式10−1〜式10−3によ
り算出できる。
j は、式10−1〜式10−3により算出した比例係数
εI ,εP ,εB を用いて、下の式11−1〜式11−
3に示すように算出される。
数10−3に示したように、比例係数εI ,εP ,εB
を、エンコーダ18がピクチャーを1枚圧縮符号化する
たびに算出して最適化し、式11−1〜式11−3によ
り各ピクチャータイプの実難度データDj の値を求める
ことにより、映像データの絵柄に関わらず、指標データ
により実難度データDj を、常に最適に近似することが
できる。
式11に示したように近似された実難度データDj に対
して、式1に示した演算処理を行って目標データ量Tj
を算出する。なお、MPEGのTM5におけるように、
実難度データDj に基づいて定める値に対して、意図的
に、実際に算出する目標データ量Tj の値を一定の比率
で変更する場合には、下の式12−1〜式12−3によ
り、目標データ量Tj を算出することができる。
において、DI,P,B は、エンコーダ18に入力される前
のFIFOメモリ160にバッファリングされているL
ピクチャー分の非圧縮映像データから生成された指標デ
ータにより近似された実難度データDj を示し、R
j は、第j番目のピクチャー以降のL枚のピクチャーに
割り当てることができるデータ量の平均値を示す。
における映像データ圧縮装置2の動作を説明する。図1
4は、第4の実施形態における映像データ圧縮装置2
(図8)の圧縮符号化動作を示す図である。エンコーダ
制御部22は、第3の実施形態においてと同様に、非圧
縮映像データVINを符号化順にピクチャーを並べ替
え、ピクチャー・フィールド変換等を行い、Iピクチャ
ーに圧縮符号化される第j+L番目のピクチャーからフ
ラットネスおよびイントラAC等の統計量を算出する
(図14a)。
の実施形態においてと同様に、PピクチャーおよびBピ
クチャーに圧縮符号化される第j+L番目のピクチャー
について動きベクトルを生成し、さらに、ME残差を算
出する(図14a)。FIFOメモリ160は、第1の
実施形態〜第3の実施形態においてと同様に、入力され
た映像データをLピクチャー分だけ遅延する。ホストコ
ンピュータ20は、動き検出器14が生成したME残差
に対して式11−1,11−2に示した演算処理を行っ
て実難度データDj を近似し、式11−3に示した演算
処理を行って、イントラAC等により実難度データDj
を近似する(図14b)。さらに、ホストコンピュータ
20は、近似した実難度データDj を式1あるいは式1
2−1〜12−3に代入し、目標データ量Tj を算出し
て、エンコーダ18の量子化制御回路180に設定する
(図14c)。
1の実施形態〜第3の実施形態においてと同様に、遅延
した映像データの第j番目のピクチャーをDCT処理す
る。量子化回路168は、DCT回路166から入力さ
れた第j番目のピクチャーの周波数領域のデータを、量
子化制御回路180が目標データ量Tj に基づいて調節
する量子化値Qj により量子化するとともに、第j番目
のピクチャーの圧縮符号化に用いた量子化値Qj の平均
値を算出し、ホストコンピュータ20に対して出力す
る。可変長符号化回路170は、第1の実施形態〜第3
の実施形態においてと同様に、量子化回路168から入
力された第j番目のピクチャーの量子化データを可変長
符号化して、ほぼ、目標データ量Tj に近いデータ量の
圧縮映像データVOUTを生成し、バッファメモリ18
2を介して出力する。
の圧縮符号化を終了すると、ホストコンピュータ20
は、量子化制御回路180から入力される第j番目のピ
クチャーに対する量子化値Qj の平均値と、圧縮符号化
された第j番目のピクチャーのデータ量とに基づいて、
式9−1〜式9−3に示したようにグローバルコンプレ
クシティを算出する(図14d)。さらに、ホストコン
ピュータ20は、算出したグローバルコンプレクシティ
により、式10−1〜式10−3に示したように比例係
数εI ,εP ,εB を更新する(図14e)。更新され
た比例係数εI ,εP ,εB は、次のピクチャーの圧縮
符号化の際の変換式(式11−1〜式11−3)に反映
される。
るホストコンピュータ20の処理内容をさらに説明す
る。図15は、第4の実施形態における映像データ圧縮
装置2のホストコンピュータ20(図8)の処理内容を
示す図である。図15に示すように、ステップ300
(S300)において、ホストコンピュータ20は、第
j+L番目のME残差あるいはイントラAC等の指標デ
ータ(統計量)をエンコーダ制御部22または動き検出
器14から取り込む。
ストコンピュータ20は、第j+1番目のピクチャーが
いずれのピクチャータイプに圧縮符号化されるかを判断
する。第j+1番目のピクチャーがIピクチャーに圧縮
符号化される場合にはS304の処理に進み、Pピクチ
ャーに圧縮符号化される場合にはS306の処理に進
み、Bピクチャーに圧縮符号化される場合にはS308
の処理に進む。
06(S306)およびステップ308(S308)そ
れぞれにおいて、ホストコンピュータ20は、式11−
1〜式11−3により実難度データDj を近似する。ス
テップ310(S310)において、ホストコンピュー
タ20は、近似した実難度データDj を用いて、式1あ
るいは式12−1〜式12−3により、目標データ量T
j を算出する。ステップ312(S312)において、
エンコーダ18は、第j番目のピクチャーを圧縮符号化
する。
ストコンピュータ20は、エンコーダ18が圧縮した第
j番目のピクチャーのデータ量、および、量子化制御回
路180が量子化回路168に設定する量子化値Qj の
平均値から、グローバルコンプレクシティXi ,Xb ,
Xp 〔X(I,B,P)〕を算出する。
ストコンピュータ20は、第j+1番目のピクチャーが
いずれのピクチャータイプに圧縮符号化されるかを判断
する。第j+1番目のピクチャーがIピクチャーに圧縮
符号化される場合にはS318の処理に進み、Pピクチ
ャーに圧縮符号化される場合にはS320の処理に進
み、Bピクチャーに圧縮符号化される場合にはS320
の処理に進む。ステップ318(S318)、ステップ
320(S320)およびステップ322(S322)
それぞれにおいて、ホストコンピュータ20は、式10
−1〜式10−3により比例係数εI ,εP ,εB を更
新する。ステップ324(S324)において、ホスト
コンピュータ20は、数値jをインクリメントする。
えば、下の式13に示すように、実難度データDj と、
比例係数εI ,εP ,εB と指標データとの乗算値との
間にオフセット(δP )が存在する場合がある。このよ
うな場合には、下の式14に示すように、グローバルコ
ンプレクシティXi ,Xb ,Xp からオフセット値
δ I ,δB ,δP を減算した値を指標データで除算する
ことにより、比例係数εI,εP ,εB を算出すること
ができる。また、第4の実施形態に示した映像データ圧
縮装置2の動作についても、第3の実施形態等に示した
ものと同様な変形が可能である。
る映像データ圧縮装置2の動作によれば、第3の実施形
態に示した映像データ圧縮装置2の動作と同じ効果を得
られる他、第3の実施形態におけるよりもさらに正確な
目標データ量Tj が算出でき、この結果、圧縮映像デー
タの品質を向上させることができる。
データ圧縮装置およびその方法によれば、2パスエンコ
ードによらずに、所定のデータ量以下に音声・映像デー
タを圧縮符号化することができる。また、本発明に係る
映像データ圧縮装置およびその方法によれば、ほぼ実時
間的に映像データを圧縮符号化することができ、しか
も、伸長復号後に高品質な映像を得ることができる。ま
た、本発明に係る映像データ圧縮装置およびその方法に
よれば、2パスエンコードによらずに、圧縮符号化後の
データ量を見積もって圧縮率を調節し、圧縮符号化処理
を行うことができる。
図である。
構成を示す図である。
る。
像データ圧縮装置の簡易2パスエンコードの動作を示す
図である。
像データ圧縮装置の予測簡易2パスエンコードの動作を
示す図である。
(図1)の動作を示すフローチャートである。
タ圧縮装置の構成の概要を示す図である。
部の詳細な構成を示す図である。
より、Pピクチャーを生成する際のME残差と実難度デ
ータDj との相関関係を示す図である。
により、Bピクチャーを生成する際のME残差と実難度
データDj との相関関係を示す図である。
により、Iピクチャーを生成する際のフラットネスと実
難度データDj との相関関係を示す図である。
り、Iピクチャーを生成する際のフラットネスと実難度
データDj との相関関係を示す図である。
(図8)の圧縮符号化動作を示す図である。
2のホストコンピュータ(図8)の処理内容を示す図で
ある。
2,22…エンコーダ制御部、14…動き検出器、16
…簡易2パス処理部、160…FIFOメモリ、16
2,18…エンコーダ、164…加算回路、166…D
CT回路、168…量子化回路、170…可変長符号化
回路、172…逆量子化回路、174…逆DCT回路、
176…加算回路、178…動き補償回路、180…量
子化制御回路、182…バッファメモリ、20…ホスト
コンピュータ。
Claims (8)
- 【請求項1】動画の非圧縮映像データの複雑さをピクチ
ャーごとに指標する指標データを算出する指標データ算
出手段と、 算出した前記指標データに基づいて、前記非圧縮映像デ
ータの圧縮後のデータ量の目標値をピクチャーごとに算
出する目標値算出手段と、 前記非圧縮映像データを所定の圧縮方法により、圧縮後
のデータ量が算出した前記目標値になるように圧縮する
圧縮手段とを有する映像データ圧縮装置。 - 【請求項2】前記圧縮手段は、前記非圧縮映像データ
を、複数の種類のピクチャー(Iピクチャー、Pピクチ
ャーおよびBピクチャーまたはこれらの組み合わせ)を
所定の順番で含むピクチャータイプシーケンスに圧縮
し、 前記指標データ算出手段は、PピクチャーおよびBピク
チャーに圧縮されるピクチャーの前記指標データとして
ME残差を算出し、Iピクチャーに圧縮されるピクチャ
ーの前記指標データとしてフラットネスおよびイントラ
ACデータまたはこれらのいずれかを算出し、 前記目標値算出手段は、算出した前記指標データに基づ
いて、圧縮後のデータ量に対応する難度データを算出
し、さらに、算出した難度データに基づいて、前記目標
値を算出する請求項1に記載の映像データ圧縮装置。 - 【請求項3】前記指標データ算出手段は、前記非圧縮映
像データのIピクチャーの前記指標データとしてアクテ
ィビティを算出する請求項1に記載の映像データ圧縮装
置。 - 【請求項4】前記非圧縮映像データを所定の時間、遅延
して出力する遅延手段をさらに有し、 前記目標値算出手段は、前記遅延手段が前記非圧縮映像
データを遅延している間に算出した前記指標データに基
づいて、前記遅延手段が出力したピクチャーに対する前
記目標値を算出し、 前記圧縮手段は、前記遅延手段が出力したピクチャー
を、圧縮後のデータ量が、算出した前記目標値になるよ
うに圧縮する請求項1に記載の映像データ圧縮装置。 - 【請求項5】動画の非圧縮映像データの複雑さをピクチ
ャーごとに指標する指標データを算出し、 算出した前記指標データに基づいて、前記非圧縮映像デ
ータの圧縮後のデータ量の目標値をピクチャーごとに算
出し、 前記非圧縮映像データを所定の圧縮方法により、圧縮後
のデータ量が算出した前記目標値になるように圧縮する
映像データ圧縮方法。 - 【請求項6】前記非圧縮映像データを、複数の種類のピ
クチャー(Iピクチャー、PピクチャーおよびBピクチ
ャーまたはこれらの組み合わせ)を所定の順番で含むピ
クチャータイプシーケンスに圧縮し、 PピクチャーおよびBピクチャーに圧縮されるピクチャ
ーの前記指標データとしてME残差を算出し、Iピクチ
ャーに圧縮されるピクチャーの前記指標データとしてフ
ラットネスおよびイントラACデータまたはこれらのい
ずれかを算出し、 算出した前記指標データに基づいて、圧縮後のデータ量
に対応する難度データを算出し、 算出した難度データに基づいて、前記目標値を算出する
請求項5に記載の映像データ圧縮方法。 - 【請求項7】前記非圧縮映像データのIピクチャーの前
記指標データとしてアクティビティを算出する請求項5
に記載の映像データ圧縮方法。 - 【請求項8】さらに、前記非圧縮映像データを所定の時
間、遅延して出力し、 前記非圧縮映像データを遅延している間に算出した前記
指標データに基づいて、遅延して出力したピクチャーに
対する前記目標値を算出し、 遅延して出力したピクチャーを、圧縮後のデータ量が、
算出した前記目標値になるように圧縮する請求項5に記
載の映像データ圧縮方法。
Priority Applications (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP21470796A JP3765129B2 (ja) | 1996-08-14 | 1996-08-14 | 符号化装置および符号化方法 |
US08/909,448 US6337879B1 (en) | 1996-08-14 | 1997-08-11 | Video data compression apparatus and method of same |
EP97306113A EP0825782A3 (en) | 1996-08-14 | 1997-08-12 | Video data compression apparatus and method |
EP05075397A EP1538847A3 (en) | 1996-08-14 | 1997-08-12 | Video encoder with scene change detector for rearranging pictures before compression |
EP05075396A EP1538846A3 (en) | 1996-08-14 | 1997-08-12 | Video compression with feedback update of parameters used in complexity estimation for rate control |
KR1019970038972A KR100512389B1 (ko) | 1996-08-14 | 1997-08-14 | 영상데이터의 압축장치 및 그 방법 |
US10/045,576 US7050495B2 (en) | 1996-08-14 | 2001-03-20 | Video data compression apparatus and method of same |
US11/223,162 US7881373B2 (en) | 1996-08-14 | 2005-09-08 | Video data compression apparatus and method of same |
US12/967,551 US20110080943A1 (en) | 1996-08-14 | 2010-12-14 | Video data compression apparatus and method of same |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP21470796A JP3765129B2 (ja) | 1996-08-14 | 1996-08-14 | 符号化装置および符号化方法 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005351361A Division JP2006136010A (ja) | 2005-12-05 | 2005-12-05 | 映像データ圧縮装置およびその方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH1066067A true JPH1066067A (ja) | 1998-03-06 |
JP3765129B2 JP3765129B2 (ja) | 2006-04-12 |
Family
ID=16660287
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP21470796A Expired - Lifetime JP3765129B2 (ja) | 1996-08-14 | 1996-08-14 | 符号化装置および符号化方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3765129B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6963610B2 (en) | 2001-01-31 | 2005-11-08 | Nec Corporation | Moving image coding device, moving image coding method and program thereof employing pre-analysis |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6337879B1 (en) | 1996-08-14 | 2002-01-08 | Sony Corporation | Video data compression apparatus and method of same |
-
1996
- 1996-08-14 JP JP21470796A patent/JP3765129B2/ja not_active Expired - Lifetime
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6963610B2 (en) | 2001-01-31 | 2005-11-08 | Nec Corporation | Moving image coding device, moving image coding method and program thereof employing pre-analysis |
Also Published As
Publication number | Publication date |
---|---|
JP3765129B2 (ja) | 2006-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3864461B2 (ja) | 映像データ圧縮装置およびその方法 | |
KR100512389B1 (ko) | 영상데이터의 압축장치 및 그 방법 | |
KR100756596B1 (ko) | 비디오 데이터 부호화 장치 및 비디오 데이터 부호화 방법 | |
EP0677969B1 (en) | Moving picture coding method and an apparatus therefor | |
US7054497B2 (en) | Method and system for optimizing image sharpness during coding and image enhancement | |
JP2006295449A (ja) | レート変換方法及びレート変換装置 | |
KR100394014B1 (ko) | 영상 변환 부호화 장치 | |
JP3765129B2 (ja) | 符号化装置および符号化方法 | |
JP3765130B2 (ja) | 符号化装置および符号化方法 | |
JP3879134B2 (ja) | 符号化装置およびその方法 | |
JPH10108197A (ja) | 画像符号化装置、画像符号化制御方法および画像符号化制御用プログラムを記録した媒体 | |
JP3918208B2 (ja) | 映像データ圧縮装置およびその方法 | |
JP3800965B2 (ja) | データレート変換装置 | |
JPH1066092A (ja) | 映像データ圧縮装置およびその方法 | |
JP3934772B2 (ja) | 可変転送レート符号化方法および装置 | |
JP2007053788A (ja) | 映像データ圧縮装置およびその方法 | |
JP2006136010A (ja) | 映像データ圧縮装置およびその方法 | |
JPH1075444A (ja) | 映像データ圧縮装置およびその方法 | |
JPH10136354A (ja) | 映像信号符号化方法、映像信号符号化装置及び記録媒体 | |
JP3922581B2 (ja) | 可変転送レート符号化方法および装置 | |
JPH1066082A (ja) | 映像データ圧縮装置およびその方法 | |
JPH1075452A (ja) | 映像データ圧縮装置およびその方法 | |
JPH09284772A (ja) | 映像データ圧縮装置およびその方法 | |
JP2006148953A (ja) | 映像データ圧縮装置およびその方法 | |
JPH09261634A (ja) | 映像データ圧縮装置およびその方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050118 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050322 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20051004 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20051205 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060104 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060117 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100203 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100203 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110203 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120203 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130203 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140203 Year of fee payment: 8 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |