JP3765129B2 - 符号化装置および符号化方法 - Google Patents

符号化装置および符号化方法 Download PDF

Info

Publication number
JP3765129B2
JP3765129B2 JP21470796A JP21470796A JP3765129B2 JP 3765129 B2 JP3765129 B2 JP 3765129B2 JP 21470796 A JP21470796 A JP 21470796A JP 21470796 A JP21470796 A JP 21470796A JP 3765129 B2 JP3765129 B2 JP 3765129B2
Authority
JP
Japan
Prior art keywords
video data
picture
data
encoding
difficulty
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP21470796A
Other languages
English (en)
Other versions
JPH1066067A (ja
Inventor
寛司 三原
卓也 北村
隆夫 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP21470796A priority Critical patent/JP3765129B2/ja
Priority to US08/909,448 priority patent/US6337879B1/en
Priority to EP97306113A priority patent/EP0825782A3/en
Priority to EP05075396A priority patent/EP1538846A3/en
Priority to EP05075397A priority patent/EP1538847A3/en
Priority to KR1019970038972A priority patent/KR100512389B1/ko
Publication of JPH1066067A publication Critical patent/JPH1066067A/ja
Priority to US10/045,576 priority patent/US7050495B2/en
Priority to US11/223,162 priority patent/US7881373B2/en
Application granted granted Critical
Publication of JP3765129B2 publication Critical patent/JP3765129B2/ja
Priority to US12/967,551 priority patent/US20110080943A1/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、非圧縮映像データを圧縮符号化する映像データ圧縮装置およびその方法に関する。
【0002】
【従来の技術および発明が解決しようとする課題】
非圧縮のディジタル映像データをMPEG(moving picture experts group)等の方法により、Iピクチャー(intra coded picture) 、Bピクチャー(bi-directionaly predictive coded picture)およびPピクチャー(predictive coded picture)から構成されるGOP(group of pictures) 単位に圧縮符号化して光磁気ディスク(MOディスク;magneto-optical disc)等の記録媒体に記録する際には、圧縮符号化後の圧縮映像データのデータ量(ビット量)を、伸長復号後の映像の品質を高く保ちつつ記録媒体の記録容量以下、あるいは、通信回線の伝送容量以下にする必要がある。
【0003】
このために、まず、非圧縮映像データを予備的に圧縮符号化して圧縮符号化後のデータ量を見積もり(1パス目)、次に、見積もったデータ量に基づいて圧縮率を調節し、圧縮符号化後のデータ量が記録媒体の記録容量以下になるように圧縮符号化する(2パス目)方法が採られる(以下、このような圧縮符号化方法を「2パスエンコード」とも記す)。
【0004】
しかしながら、2パスエンコードにより圧縮符号化を行うと、同じ非圧縮映像データに対して同様な圧縮符号化処理を2回施す必要があり、時間がかかってしまう。また、1回の圧縮符号化処理で最終的な圧縮映像データを算出することができないために、撮影した映像データをそのまま実時間的(リアルタイム)に圧縮符号化し、記録することができない。
【0005】
本発明は上述した従来技術の問題点に鑑みてなされたものであり、2パスエンコードによらずに、所定のデータ量以下に音声・映像データを圧縮符号化することができる映像データ圧縮装置およびその方法を提供することを目的とする。
また、本発明は、ほぼ実時間的に映像データを圧縮符号化することができ、しかも、伸長復号後に高品質な映像を得ることができる映像データ圧縮装置およびその方法を提供することを目的とする。
また、本発明は、2パスエンコードによらずに、圧縮符号化後のデータ量を見積もって圧縮率を調節し、圧縮符号化処理を行うことができる映像データ圧縮装置およびその方法を提供することを目的とする。
【0006】
【課題を解決するための手段】
本発明によれば、映像データを符号化処理する符号化装置において、
上記映像データから、上記映像データの絵柄の難度及び上記映像データの符号化処理後のデータ量と相関性を有する統計量をピクチャ毎に算出する統計量算出手段と、
上記映像データを所定ピクチャ分遅延させる遅延手段と、
上記統計量算出手段により算出された上記統計量を用いて上記映像データの実難度データをピクチャ毎に近似することにより算出された近似難度データと上記遅延手段により遅延された上記映像データの複数ピクチャ分の上記近似難度データの総和との比に従って、上記遅延手段より遅延された上記映像データを符号化処理する際に割り当てる目標符号量をピクチャ毎に算出する目標符号量算出手段と、
上記目標符号量算出手段により算出された上記目標符号量となるように、上記遅延手段より遅延された上記映像データをピクチャ毎に符号化処理する符号化手段と
を備えたことを特徴とする、符号化装置が提供される。
【0007】
好ましくは、上記近似難度データは、上記統計量算出手段により算出された上記統計量の値を、上記統計量と上記映像データの実難度データとの相関関係から得られる所定の一次関数に代入することによって算出される。
請求項1に記載の符号化装置。
【0008】
好ましくは、上記統計量算出手段は、上記符号化手段がIピクチャとして符号化処理する上記映像データのピクチャから、フラットネス又はイントラACを上記統計量として算出する。
また好ましくは、上記統計量算出手段は、上記符号化手段がPピクチャ又はBピクチャとして符号化処理する上記映像データのピクチャから、ME残差を前記統計量として算出する。
【0009】
また本発明によれば、映像データを符号化処理する符号化方法において、
上記映像データから、上記映像データの実難度データと相関性を有する統計量をピクチャ毎に算出する統計量算出工程と、上記映像データを所定ピクチャ分遅延させる遅延工程と、上記統計量算出工程において算出された上記統計量を用いて上記実難度データをピクチャ毎に近似した近似難度データと上記所定ピクチャ分の上記近似難度データの総和とに基づいて、上記遅延工程において遅延された上記映像データを符号化処理する際の目標符号量をピクチャ毎に算出する目標符号量算出工程と、上記目標符号量算出工程において算出された上記目標符号量に基づいて、上記遅延工程において遅延された上記映像データを、フィード・フォワード・レート・コントロールさせながらピクチャ毎に符号化処理する符号化工程とを備えたことを特徴とする、符号化方法が提供される。
【0011】
符号化手段は、例えば、MPEG方式により、動画の非圧縮映像データを、他のピクチャーへの参照なく圧縮・伸長されるIピクチャーと、前方のピクチャーを参照して圧縮・伸長されるPピクチャー、および、前後のピクチャーを参照して圧縮・伸長されるBピクチャーの組み合わせとを、所定の順番で含むピクチャータイプシーケンスに圧縮符号化する。なお、圧縮符号化処理の際、圧縮手段は、圧縮後の映像データのデータ量が、ほぼ、目標値符号量手段が算出した目標値になるようにする。
【0012】
統計量算出手段は、他のピクチャーを参照しないIピクチャーの統計量として、フラットネス(flatness)およびイントラAC(intra AC)またはこれらのいずれか、他のピクチャーを参照するPピクチャーおよびBピクチャーの統計量として動き予測の予測誤差量(ME残差)を算出する。
【0013】
なお、フラットネスは、映像の空間的な平坦さを表す指標として定義され、映像の複雑さを表し、映像の絵柄の難しさ(難度)および圧縮後のデータ量と相関性を有する。
また、イントラACは、たとえばMPEG方式におけるDCT処理単位のDCTブロックごとの映像データの平均値と、DCTブロックごとの映像データとの差分の絶対値の総和として定義され、フラットネスと同様に、映像の複雑さを表し、映像の絵柄の難しさ(難度)および圧縮後のデータ量と相関性を有する。
【0014】
また、ME残差は、圧縮符号化時の動きベクトルによる動き補償処理後に、入力ピクチャーと参照ピクチャーの映像データとの差分値の絶対値和あるいは自乗値和として定義され、映像の動きの速さおよび絵柄の複雑さを表し、フラットネスと同様に、映像の絵柄の難しさ(難度)および圧縮後のデータ量と相関性を有する。
また、Iピクチャーの統計量として、MPEG方式の圧縮アルゴリズムとして有名なTM5[test model 5; ISO/IEC JTC/SC29 (1993)] において、マクロブロックに対する量子化処理の量子化値を決定するために用いられるアクティビティ(activity)を用いることも可能である。
【0015】
目標符号量算出手段は、符号化手段が、例えば、映像データの総データ量を記録媒体の記録容量以下に抑え、しかも、圧縮映像データの品質を可能な限り高く保つことができるように、圧縮映像データの圧縮映像データのデータ量の目標値を算出する。
目標値は、例えば、遅延された非圧縮映像データの第j番目のピクチャーを圧縮符号化する際に、非圧縮映像データの第(j−A)番目〜第(j+L−1)番目のピクチャーから得られた統計量を絵柄の複雑さ(難度)を示すものとして用い、第j番目のピクチャーが、その絵柄の複雑さに応じたデータ量に圧縮符号化されるようにデータ量を割り振ることにより算出される。
【0016】
また、本発明に係る映像データ圧縮方法は、映像データを符号化処理する符号化方法であって、上記映像データから、上記映像データを符号化処理することによって得られる符号化難易度と相関性を有する統計量を算出する統計量算出工程と、上記統計量算出工程において算出された上記統計量から、上記映像データを符号化処理する際の目標符号量を算出する目標符号量算出工程と、上記目標符号量算出工程において算出された上記目標符号量を用いてフィード・フォワード制御を行いながら、上記映像データを符号化処理する符号化工程と、を備える
【0017】
【発明の実施の形態】
第1実施形態
以下、本発明の第1の実施形態を説明する。
MPEG方式といった映像データの圧縮符号化方式により、高い周波数成分が多い絵柄、あるいは、動きが多い絵柄といった難度(difficulty)が高い映像データを圧縮符号化すると、一般的に圧縮に伴う歪みが生じやすくなる。このため、難度が高い映像データは低い圧縮率で圧縮符号化する必要があり、難度が高いデータを圧縮符号化して得られる圧縮映像データに対しては、難度が低い絵柄の映像データの圧縮映像データに比べて、多くの目標データ量を配分する必要がある。
【0018】
このように、映像データの難度に対して適応的に目標データ量を配分するためには、従来技術として示した2パスエンコード方式が有効である。しかしながら、2パスエンコード方式は、実時間的な圧縮符号化に不向きである。
第1の実施形態として示す簡易2パスエンコード方式は、かかる2パスエンコード方式の問題点を解決するためになされたものであり、非圧縮映像データを予備的に圧縮符号化して得られる圧縮映像データの難度データから非圧縮映像データの難度を算出し、予備的な圧縮符号化により算出した難度に基づいて、FIFOメモリ等により所定の時間だけ遅延した非圧縮映像データの圧縮率を適応的に制御することができる。
【0019】
図1は、本発明に係る映像データ圧縮装置1の構成を示す図である。
図1に示すように、映像データ圧縮装置1は、圧縮符号化部10およびホストコンピュータ20から構成され、圧縮符号化部10は、エンコーダ制御部12、動き検出器(motion estimator)14、簡易2パス処理部16、第2のエンコーダ(encoder) 18から構成され、簡易2パス処理部16は、FIFOメモリ160および第1のエンコーダ162から構成される。
映像データ圧縮装置1は、これらの構成部分により、編集装置およびビデオテープレコーダ装置等の外部機器(図示せず)から入力される非圧縮映像データVINに対して、上述した簡易2パスエンコードを実現する。
【0020】
映像データ圧縮装置1において、ホストコンピュータ20は、映像データ圧縮装置1の各構成部分の動作を制御する。また、ホストコンピュータ20は、簡易2パス処理部16のエンコーダ162が非圧縮映像データVINを予備的に圧縮符号化して生成した圧縮映像データのデータ量、DCT処理後の映像データの直流成分(DC成分)の値および直流成分(AC成分)の電力値を制御信号C16を介して受け、受けたこれらの値に基づいて圧縮映像データの絵柄の難度を算出する。さらに、ホストコンピュータ20は、算出した難度に基づいて、エンコーダ18が生成する圧縮映像データの目標データ量Tj を制御信号C18を介してピクチャーごとに割り当て、エンコーダ18の量子化回路166(図3)に設定し、エンコーダ18の圧縮率をピクチャー単位に適応的に制御する。
【0021】
エンコーダ制御部12は、非圧縮映像データVINのピクチャーの有無をホストコンピュータ20に通知し、さらに、非圧縮映像データVINのピクチャーごとに圧縮符号化のための前処理を行う。つまり、エンコーダ制御部12は、入力された非圧縮映像データを符号化順に並べ替え、ピクチャー・フィールド変換を行い、非圧縮映像データVINが映画の映像データである場合に3:2プルダウン処理(映画の24フレーム/秒の映像データを、30フレーム/秒の映像データに変換し、冗長性を圧縮符号化前に取り除く処理)等を行い、映像データS12として簡易2パス処理部16のFIFOメモリ160およびエンコーダ162に対して出力する。
動き検出器14は、非圧縮映像データの動きベクトルの検出を行し、エンコーダ制御部12およびエンコーダ162,18に対して出力する。
【0022】
簡易2パス処理部16において、FIFOメモリ160は、エンコーダ制御部12から入力された映像データS12を、例えば、非圧縮映像データVINが、L(Lは整数)ピクチャー入力される時間だけ遅延し、遅延映像データS16としてエンコーダ18に対して出力する。
【0023】
図2は、図1に示した簡易2パス処理部16のエンコーダ162の構成を示す図である。
エンコーダ162は、例えば、図2に示すように、加算回路164、DCT回路166、量子化回路(Q)168、可変長符号化回路(VLC)170、逆量子化回路(IQ)172、逆DCT(IDCT)回路174、加算回路176および動き補償回路178から構成される一般的な映像データ用圧縮符号化器であって、入力される映像データS12をMPEG方式等により圧縮符号化し、圧縮映像データのピクチャーごとのデータ量等をホストコンピュータ20に対して出力する。
【0024】
加算回路164は、加算回路176の出力データを映像データS12から減算し、DCT回路166に対して出力する。
DCT回路166は、加算回路164から入力される映像データを、例えば、16画素×16画素のマクロブロック単位に離散コサイン変換(DCT)処理し、時間領域のデータから周波数領域のデータに変換して量子化回路168に対して出力する。また、DCT回路166は、DCT後の映像データのDC成分の値およびAC成分の電力値をホストコンピュータ20に対して出力する。
【0025】
量子化回路168は、DCT回路166から入力された周波数領域のデータを、固定の量子化値Qで量子化し、量子化データとして可変長符号化回路170および逆量子化回路172に対して出力する。
可変長符号化回路170は、量子化回路168から入力された量子化データを可変長符号化し、可変長符号化の結果として得られた圧縮映像データのデータ量を、制御信号C16を介してホストコンピュータ20に対して出力する。
逆量子化回路172は、可変長符号化回路168から入力された量子化データを逆量子化し、逆量子化データとして逆DCT回路174に対して出力する。
【0026】
逆DCT回路174は、逆量子化回路172から入力される逆量子化データに対して逆DCT処理を行い、加算回路176に対して出力する。
加算回路176は、動き補償回路178の出力データおよび逆DCT回路174の出力データを加算し、加算回路164および動き補償回路178に対して出力する。
動き補償回路178は、加算回路176の出力データに対して、動き検出器14から入力される動きベクトルに基づいて動き補償処理を行い、加算回路176に対して出力する。
【0027】
図3は、図1に示したエンコーダ18の構成を示す図である。
図3に示すように、エンコーダ18は、図2に示したエンコーダ162に、量子化制御回路180を加えた構成になっている。エンコーダ18は、これらの構成部分により、ホストコンピュータ20から設定される目標データ量Tj に基づいて、FIFOメモリ160によりLピクチャー分遅延された遅延映像データS16に対して動き補償処理、DCT処理、量子化処理および可変長符号化処理を施して、MPEG方式等の圧縮映像データVOUTを生成し、外部機器(図示せず)に出力する。
【0028】
エンコーダ18において、量子化制御回路180は、可変長量子化回路170が出力する圧縮映像データVOUTのデータ量を順次、監視し、遅延映像データS16の第j番目のピクチャーから最終的に生成される圧縮映像データのデータ量が、ホストコンピュータ20から設定された目標データ量Tj に近づくように、順次、量子化回路168に設定する量子化値Qj を調節する。
また、可変長量子化回路170は、圧縮映像データVOUTを外部に出力する他に、遅延映像データS16を圧縮符号化して得られた圧縮映像データVOUTの実際のデータ量Sj を制御信号C18を介してホストコンピュータ20に対して出力する。
【0029】
以下、第1の実施形態における映像データ圧縮装置1の簡易2パスエンコード動作を説明する。
図4(A)〜(C)は、第1の実施形態における映像データ圧縮装置1の簡易2パスエンコードの動作を示す図である。
エンコーダ制御部12は、映像データ圧縮装置1に入力された非圧縮映像データVINに対して、エンコーダ制御部12により符号化順にピクチャーを並べ替える等の前処理を行い、図4(A)に示すように映像データS12としてFIFOメモリ160およびエンコーダ162に対して出力する。
なお、エンコーダ制御部12によるピクチャーの順番並べ替えにより、図4等に示すピクチャーの符号化の順番と伸長復号後の表示の順番とは異なる。
【0030】
FIFOメモリ160は、入力された映像データS12の各ピクチャーをLピクチャー分だけ遅延し、エンコーダ18に対して出力する。
エンコーダ162は、入力された映像データS12のピクチャーを予備的に順次、圧縮符号化し、第j(jは整数)番目のピクチャーを圧縮符号化して得られた圧縮符号化データのデータ量、DCT処理後の映像データのDC成分の値、および、AC成分の電力値をホストコンピュータ20に対して出力する。
【0031】
例えば、エンコーダ18に入力される遅延映像データS16は、FIFOメモリ160によりLピクチャーだけ遅延されているので、図4(B)に示すように、エンコーダ18が、遅延映像データS16の第j(jは整数)番目のピクチャー(図4(B)のピクチャーa)を圧縮符号化している際には、エンコーダ162は、映像データS12の第j番目のピクチャーからLピクチャー分先の第(j+L)番目のピクチャー(図4(B)のピクチャーb)を圧縮符号化していることになる。従って、エンコーダ18が遅延映像データS16の第j番目のピクチャーの圧縮符号化を開始する際には、エンコーダ162は映像データS12の第j番目〜第(j+L−1)番目のピクチャー(図4(B)の範囲c)の圧縮符号化を完了しており、これらのピクチャーの圧縮符号化後の実難度データDj ,Dj+1 ,Dj+2 ,…,Dj+L-1 は、ホストコンピュータ20により既に算出されている。
【0032】
ホストコンピュータ20は、下に示す式1により、エンコーダ18が遅延映像データS16の第j番目のピクチャーを圧縮符号化して得られる圧縮映像データに割り当てる目標データ量Tj を算出し、算出した目標データ量Tj を量子化制御回路180に設定する。
【0033】
【数1】
Figure 0003765129
【0034】
但し、式1において、Dj は映像データS12の第j番目のピクチャーの実難度データであり、R’j は、映像データS12,S16の第j番目〜第(j+L−1)番目のピクチャーに割り当てることができる目標データ量の平均であり、R’j の初期値(R’1 )は、圧縮映像データの各ピクチャーに平均して割り当て可能な目標データ量であり、下に示す式2で表され、エンコーダ18が圧縮映像データを1ピクチャー分生成する度に、式3に示すように更新される。
【0035】
【数2】
Figure 0003765129
【0036】
【数3】
Figure 0003765129
【0037】
なお、式3中の数値ビットレート(Bit rate)は、通信回線の伝送容量や、記録媒体の記録容量に基づいて決められる1秒当たりのデータ量(ビット量)を示し、ピクチャーレート(Picture rate)は、映像データに含まれる1秒当たりのピクチャーの数(30枚/秒(NTSC),25枚/秒(PAL))を示し、数値Fj+L は、ピクチャータイプに応じて定められるピクチャー当たりの平均データ量を示す。
エンコーダ18のDCT回路166は、入力される遅延映像データS16の第j番目のピクチャーをDCT処理し、量子化回路168に対して出力する。
量子化回路168は、DCT回路166から入力された第j番目のピクチャーの周波数領域のデータを、量子化制御回路180が目標データ量Tj に基づいて調節する量子化値Qj により量子化し、量子化データとして可変長符号化回路170に対して出力する。
可変長符号化回路170は、量子化回路168から入力された第j番目のピクチャーの量子化データを可変長符号化して、ほぼ、目標データ量Tj に近いデータ量の圧縮映像データVOUTを生成して出力する。
【0038】
同様に、図4(B)に示すように、エンコーダ18が、遅延映像データS16の第(j+1)番目のピクチャー(図4(C)のピクチャーa’)を圧縮符号化している際には、エンコーダ162は、映像データS12の第(j+1)番目〜第(j+L)番目のピクチャー(図4(C)の範囲c’)の圧縮符号化を完了し、これらのピクチャーの実難度データDj+1 ,Dj+2 ,Dj+3 ,・・・,Dj+L は、ホストコンピュータ20により既に算出されている。
【0039】
ホストコンピュータ20は、式1により、エンコーダ18が遅延映像データS16の第(j+1)番目のピクチャーを圧縮符号化して得られる圧縮映像データに割り当てる目標データ量Tj+1 を算出し、エンコーダ18の量子化制御回路180に設定する。
【0040】
エンコーダ18は、ホストコンピュータ20から量子化制御回路180に設定された目量データ量Tj に基づいて第(j+1)番目のピクチャーを圧縮符号化し、目標データ量Tj+1 に近いデータ量の圧縮映像データVOUTを生成して出力する。
さらに以下、同様に、映像データ圧縮装置1は、遅延映像データS16の第k番目のピクチャーを、量子化値Qk (k=j+2,j+3,…)をピクチャーごとに変更して順次、圧縮符号化し、圧縮映像データVOUTとして出力する。
【0041】
以上説明したように、第1の実施形態に示した映像データ圧縮装置1によれば、短時間で非圧縮映像データVINの絵柄の難度を算出し、算出した難度に応じた圧縮率で適応的に非圧縮映像データVINを圧縮符号化することができる。つまり、第1の実施形態に示した映像データ圧縮装置1によれば、2パスエンコード方式と異なり、ほぼ実時間的に、非圧縮映像データVINの絵柄の難度に基づいて適応的に非圧縮映像データVINを圧縮符号化をすることができ、実況放送といった実時間性を要求される用途に応用可能である。
なお、第1の実施形態に示した他、本発明に係るデータ多重化装置1は、エンコーダ162が圧縮符号化した圧縮映像データのデータ量を、そのまま難度データとして用い、ホストコンピュータ20の処理の簡略化を図る等、種々の構成を採ることができる。
【0042】
第2実施形態
第1の実施形態に示した簡易2パスエンコード方式によれば、実時間かつ、絵柄の難度に応じた適応的な非圧縮映像データに対する圧縮符号化処理が可能である。しかしながら、第1の実施形態に示した簡易2パスエンコード方式を用いた場合、実時間性が厳しく要求される場合には、FIFOメモリ160の遅延時間を大きくすることができず、真に適切な目標データ量Tj の算出が難しく、圧縮映像データVOUTを伸長復号して得られる映像の品質が低下してしまう可能性がある。
【0043】
第2の実施形態においては、第1の実施形態に示した映像データ圧縮装置1(図1)を用い、ホストコンピュータ20の処理内容を変更して、FIFOメモリ160の遅延時間を長くしなくても適切な目標データ量Tj の値を得ることができるように、非圧縮映像データをLピクチャー分、予備的に圧縮符号化して得られた圧縮映像データの第j番目のピクチャー〜第(j+L−1)番目のピクチャーの実難度データDj 〜Dj+L-1 から、圧縮映像データの第(j+L)番目のピクチャー〜第(j+L+B)番目のピクチャー(Bは整数)の難度データ(予測難度データ)Dj+L 〜Dj+L+B を算出し、実際に得られた難度データDj 〜Dj+L-1 (実難度データ)および予測によって得られた難度データD’j+L 〜D’j+L+B に基づいて、第1の実施形態に示した簡易2パスエンコード方式よりも適切な目標データ量Tj の値を得ることができる圧縮符号化方式(予測簡易2パスエンコード方式)を説明する。
【0044】
まず、第2の実施形態で説明する予測簡易2パスエンコード方式を概念的に説明する。
予測簡易2パスエンコード方式は、徐々に絵柄が難しくなってゆく、つまり、徐々に圧縮符号化時のDCT処理後の高い周波数成分が多くなり、動きが速くなってゆく非圧縮映像データの絵柄は、さらに難しくなってゆき、逆に、徐々に絵柄が難しくなくなって(簡単になって)ゆく非圧縮映像データの絵柄は、さらに簡単になってゆくであろうと予測可能であることを前提する。
【0045】
つまり、予測簡易2パスエンコード方式は、ホストコンピュータ20が、この前提に基づいて、さらに絵柄が難しくなってゆくと予測される場合には、さらに絵柄が難しいピクチャーに備えて、その時点で圧縮符号化しているピクチャーに割り当てる目標データ量を節約し、逆に、さらに絵柄が簡単になってゆくと予測される場合には、その時点で圧縮符号化しているピクチャーに割り当てる目標データ量を増やすようにエンコーダ18に対する圧縮率の制御を行う。
【0046】
さらに、予測簡易2パスエンコード方式の概念的な説明を続ける。
映像データは、一般的に、時間方向および空間方向について相関性が高く、映像データの圧縮符号化は、これらの相関性に着目し、冗長性を除くことにより行われる。
時間方向について相関性が高いということは、現時点の非圧縮映像データのピクチャーの難度とそれ以降の非圧縮映像データのピクチャーの難度とが近いということを意味する。また、難度の増減の傾向も、現時点までの難度の増減の傾向がそれ以降も続くことが多い。
【0047】
具体例を挙げると、カメラが静止状態からゆっくりとカメラを水平方向に回し初め、最後に一定の回転速度で回転しながら、静止している物体を撮影する場合の非圧縮映像データの絵柄を考える。最初はカメラが停止状態であるため、静止映像が撮影され、絵柄の難度は低くなる。次に、カメラを回し始めて1〜2秒後に一定の回転速度になると仮定すると、カメラを回し始めて1〜2秒間は絵柄の難度は高くなる傾向を示す。この状態を、映像データ圧縮装置1側から見ると、数GOP分の圧縮映像データを生成する間、入力される非圧縮映像データの絵柄の難度が高くなる傾向が続くことになる。
【0048】
従って、この具体例に示したような場合には、非圧縮映像データの絵柄の難度が増大傾向を示した場合に、それ以降の絵柄の難度が増大傾向を示すと予測するのは妥当である。以下に説明する予測簡易2パスエンコード方式は、このような難度および難度の増減傾向の時間的相関性を積極的に利用して、圧縮映像データの各ピクチャーに対して、第1の実施形態に示した簡易2パスエンコード方式においてよりも適切な目標データ量の割り当てを行おうとするものである。
【0049】
以下、第2の実施形態における映像データ圧縮装置1の予測簡易2パスエンコードの動作を説明する。
図5(A)〜(C)は、第2の実施形態における映像データ圧縮装置1の予測簡易2パスエンコードの動作を示す図である。
エンコーダ制御部12は、第1の実施形態においてと同様に、映像データ圧縮装置1に入力された非圧縮映像データVINに対して、エンコーダ制御部12により符号化順にピクチャーを並べ替える等の前処理を行い、図5(A)に示すように映像データS12としてFIFOメモリ160およびエンコーダ162に対して出力する。
【0050】
FIFOメモリ160は、第1の実施形態においてと同様に、入力された映像データS12の各ピクチャーをLピクチャー分だけ遅延し、エンコーダ18に対して出力する。
エンコーダ162は、第1の実施形態においてと同様に、入力された映像データS12のピクチャーを予備的に順次、圧縮符号化し、第j(jは整数)番目のピクチャーを圧縮符号化して得られた圧縮符号化データのデータ量、DCT処理後の映像データのDC成分の値およびAC成分の電力値をホストコンピュータ20に対して出力する。ホストコンピュータ20は、エンコーダ162から入力されたこれらの値に基づいて、実難度データDj を順次、算出する。
【0051】
例えば、エンコーダ18に入力される遅延映像データS16は、FIFOメモリ160によりLピクチャーだけ遅延されているので、図5(B)に示すように、エンコーダ18が、遅延映像データS16の第j番目のピクチャー(図5(B)のピクチャーa)を圧縮符号化している際には、エンコーダ162は、第1の実施形態においてと同様に、映像データS12の第j番目のピクチャーからLピクチャー分先の第(j+L)番目のピクチャー(図5(B)のピクチャーb)を圧縮符号化していることになる。
【0052】
従って、エンコーダ18が遅延映像データS16の第j番目のピクチャーの圧縮符号化を開始する際には、エンコーダ162は映像データS12の第(j−A)番目〜第(j+L−1)番目のピクチャー(図5(B)の範囲c、但し、図5はA=0の場合を示す)の圧縮符号化を完了し、これらのピクチャーの圧縮符号化後のデータ量、および、DCT処理後の映像データのDC成分の値およびAC成分の電力値をホストコンピュータ20に対して出力している。ホストコンピュータ20は、エンコーダ162から入力されたこれらの値に基づいて、難度データ(実難度データ、図5(B)の範囲d)Dj-A ,Dj-A+1 ,…,Dj ,Dj+1,Dj+2 ,…,Dj+L-1 の算出を既に終了している。なお、Aは、難度データを予測するためのピクチャー範囲を特定する所定の整数であり、正負を問わない。
【0053】
ホストコンピュータ20は、実難度データDj-A ,Dj-a+1 ,…,Dj ,Dj+1 ,Dj+2 ,…,Dj+L-1 に基づいて、映像データS12の第(j+L)番目〜第(j+L+B)番目のピクチャーの圧縮符号化後の難度データ(予測難度データ、図5(B)の範囲e)D’j+L ,D’j+L+1 ,D’j+L+2 ,…,D’j+L+B を予測し、下に示す式4により、遅延映像データS16の第j番目のピクチャーの圧縮符号化後の目標データ量Tj を算出する。従って、遅延映像データS16の第j番目のピクチャーの圧縮符号化後の目標データ量Tj を算出するために、実難度データと予測難度データとを含めて、図5(B)の範囲cの(A+L+B+1)ピクチャー分の難度データを用いることになる。なお、予測難度データDj ’は、例えば、実難度データDj を直線近似し、近似により得られた直線を外挿する等の方法により算出されうる。
【0054】
【数4】
Figure 0003765129
【0055】
なお、式4の各記号は、式1の各記号に同じである。
エンコーダ18は、第1の実施形態と同様に、ホストコンピュータ20により量子化制御回路180に設定された目標データ量Tj に基づいて、目標データ量Tj に近いデータ量の圧縮映像データVOUTを生成して出力する。
さらに、ホストコンピュータ20は、図5(B)に示した動作と同様に、遅延映像データS16の第(j+1)番目のピクチャー(図5(C)のピクチャーa’)に対しても、映像データS12の第(j+L+1)番目のピクチャー(図5(C)のピクチャーb’)以前の図5(C)の範囲d’の実難度データDj-A+1 ,Dj-A+2 ,…,Dj ,Dj+1 ,Dj+2 ,…,Dj+L 、および、図5(C)の範囲e’に示す予測難度データ、D’j+L+1 ,D’j+L+2 ,D’j+L+3 ,…,D’j+L+B+1 、つまり、図5(C)の範囲c’に示す実難度データと予測難度データとに基づいて、遅延映像データS16の第(j+1)番目のピクチャーの圧縮符号化後の目標データ量Tj+1 を算出する。エンコーダ18は、ホストコンピュータ20が算出した目量データ量Tj+1 に基づいて、遅延映像データS16の第(j+1)番目のピクチャーを圧縮符号化し、目標データ量Tj+1 に近いデータ量の圧縮符号化データVOUTを生成する。
なお、以上の映像データ圧縮装置1の予測簡易2パスエンコード動作は、遅延映像データS16の第(j+1)番目のピクチャーに対しても同様である。
【0056】
以下、図6を参照して、第2の実施形態における映像データ圧縮装置1の動作を整理して説明する。
図6は、第2の実施形態における映像データ圧縮装置1(図1)の動作を示すフローチャートである。
図6に示すように、ステップ102(S102)において、ホストコンピュータ20は、式1等に用いられる数値j,R’1 を、j=−(L−1),R’1 =(Bit rate ×(L+B))/Picture rate として初期化する。
【0057】
ステップ104(S104)において、ホストコンピュータ20は、数値jが0より大きいか否かを判断する。数値jが0より大きい場合にはS106の処理に進み、小さい場合にはS110の処理に進む。
ステップ106(S106)において、エンコーダ162は、映像データS12の第(j+L)番目のピクチャーを圧縮符号化し、実難度データDj+L を生成する。
【0058】
ステップ108(S108)において、ホストコンピュータ20は数値jをインクリメントする(j=j+1)。
ステップ110(S110)において、ホストコンピュータ20は、遅延映像データS16に第j番目のピクチャーが存在するか否かを判断する。第j番目のピクチャーが存在する場合にはS112の処理に進み、存在しない場合には圧縮符号化処理を終了する。
【0059】
ステップ112(S112)において、ホストコンピュータ20は、数値jが数値Aよりも大きいか否かを判断する。数値jが数値Aよりも大きい場合にはS114の処理に進み、小さい場合にはS116の処理に進む。
ステップ114(S114)において、ホストコンピュータ20は、実難度データDj-A 〜Dj+L-1 に基づいて、予測難度データD’j+L 〜D’j+L+B を算出する。
ステップ116(S116)において、ホストコンピュータ20は実難度データD1 〜Dj+L-1 から、予測難度データD’j+L 〜D’j+L+B を算出する。
【0060】
ステップ118(S118)において、ホストコンピュータ20は、式4を用いて目標データ量Tj を算出し、エンコーダ18の量子化制御回路180に設定する。さらに、エンコーダ18は、量子化制御回路180に設定された目標データ量Tj に基づいて遅延映像データS16の第j番目のピクチャーを圧縮符号化し、第j番目のピクチャーから実際に得られた圧縮映像データのデータ量Sj をホストコンピュータ20に対して出力する。
ステップ120(S120)において、ホストコンピュータ20は、エンコーダ18からのデータ量Sj を記憶し、さらに、映像データS12の第(j+L)番目のピクチャーの実難度データDj+L を出力する。
【0061】
ステップ122(S122)において、エンコーダ18は、遅延映像データS16の第j番目を圧縮符号化して得られた圧縮映像データVOUTを外部に出力する。
ステップ124(S124)において、ホストコンピュータ20は、ピクチャータイプに応じて、式3中に用いられる数値Fj+L を算出する。
ステップ126(S126)において、ホストコンピュータ20は、式3に示した演算(R’j+1 =R’j −Sj +Fj+L )を行う。
【0062】
以上説明したように、第2の実施形態に示した映像データ圧縮装置1による予測簡易2パスエンコードによれば、短時間で非圧縮映像データVINの絵柄の難度を算出し、算出した難度に基づいて予測した難度をさらに用いて適応的に非圧縮映像データVINを圧縮符号化することができ、簡易2パスエンコード方式に比べて、より適切な目標データ量を圧縮映像データの各ピクチャーに割り当てることが可能である。従って、予測簡易2パスエンコード方式による圧縮映像データを伸長復号した場合、簡易2パスエンコード方式による圧縮映像データを伸長復号した場合に比べて、より高品質な映像を得ることができる。
【0063】
第3実施形態
以下、本発明の第3の実施形態を説明する。
第1の実施形態に示した簡易2パスエンコード方式、および、第2の実施形態に示した予測簡易2パスエンコード方式は、入力される非圧縮映像データに、ほぼ1GOP分(例えば、0.5秒)程度の遅延を与えるだけで圧縮符号化し、適切なデータ量の圧縮映像データを生成することができる優れた方式である。
【0064】
しかしながら、これらの方式は、エンコーダーを2つ必要とする。一般に、映像データを圧縮符号化するエンコーダーは大規模のハードウェアを必要とし、集積回路化しても非常に高価であり、しかも、サイズが大きい。従って、これらの方式がエンコーダーを2つ必要とすることは、これらの方式を実現する装置の低コスト化、小型化および省電力化を妨げる。また、圧縮符号化に要する時間遅延は、短ければ短いほど望ましいが、実難度データDj および予測難度データDj ’の算出処理および予備的な圧縮符号化処理そのものが数ピクチャー分の処理時間を要するので、これらの処理自体が、時間遅延の短縮化を妨げる原因となる。
【0065】
第3の実施形態は、かかる問題点を解決するためになされたものであって、1つのエンコーダを用いるのみで、簡易2パスエンコード方式および予測簡易2パスエンコード方式と同等に適切なデータ量の圧縮映像データを生成することができ、しかも、処理に要する時間遅延がより短い映像データ圧縮方式を提供することを目的とする。
【0066】
図7は、第3の実施形態における本発明に係る映像データ圧縮装置2の構成の概要を示す図である。
図8は、図7に示した映像データ圧縮装置2の圧縮符号化部24の詳細な構成を示す図である。
なお、図7および図8において、映像データ圧縮装置2の構成部分のうち、第1の実施形態および第2の実施形態において説明した映像データ圧縮装置1(図1,図2)の構成部分と同一のものには同一の符号を付して示してある。
【0067】
図7に示すように、映像データ圧縮装置2は、映像データ圧縮装置1(図1,図2)の圧縮符号化部10を、圧縮符号化部10からエンコーダ162を除いた圧縮符号化部24で置換し、エンコーダ制御部12をエンコーダ制御部22で置換し、バッファメモリ(buffer)182を付加した構成を採る。
図8に示すように、圧縮符号化部24は、映像並び替え回路220、走査変換・マクロブロック化回路222および統計量算出回路224から構成され、圧縮符号化部24の他の構成部分は、圧縮符号化部10と同一の構成を採る。
【0068】
エンコーダ制御部22は、エンコーダ制御部12と同様に、非圧縮映像データVINのピクチャーの有無をホストコンピュータ20に通知し、さらに、非圧縮映像データVINのピクチャーごとに圧縮符号化のための前処理を行う。
エンコーダ制御部22において、映像並び替え回路220は、入力された非圧縮映像データを符号化順に並べ替える。
【0069】
走査変換・マクロブロック化回路222は、ピクチャー・フィールド変換を行い、非圧縮映像データVINが映画の映像データである場合に3:2プルダウン処理等を行う。
統計量算出回路224は、映像並び替え回路220および走査変換・マクロブロック化回路222により処理され、Iピクチャーに圧縮符号化されるピクチャーからフラットネス(flatness)およびイントラAC(intra AC)等の統計量を算出する。
【0070】
映像データ圧縮装置2は、これらの構成部分により、非圧縮映像データの統計量(フラットネス,イントラAC)および動き予測の予測誤差量(ME残差)を非圧縮映像データVINの絵柄の難度の代わりに用いて、映像データ圧縮装置1(図1,図2)と同様に適応的に目標データ量Tj を算出して、高精度なフィードフォワード制御を行うことにより、非圧縮映像データVINを適切なデータ量の圧縮映像データに圧縮符号化する。
なお、映像データ圧縮装置2においては、動き検出器14およびエンコーダ制御部22の統計量算出回路224により、予め検出された指標データに基づいて目標データ量Tj が定めるられることから、以下、映像データ圧縮装置2における圧縮符号化方式を、フィード・フォワード・レート・コントロール(FFRC; feed foward rate control)方式と呼ぶことにする。
【0071】
なお、ME残差は、圧縮されるピクチャーと、参照ピクチャーの映像データとの差分値の絶対値和あるいは自乗値和として定義され、動き検出器14により、圧縮後にPピクチャーおよびBピクチャーとなるピクチャーから算出され、映像の動きの速さおよび絵柄の複雑さを表し、フラットネスと同様に、難度および圧縮後のデータ量と相関性を有する。
【0072】
Iピクチャーについては、他のピクチャーの参照なしに圧縮符号化されるため、ME残差を求めることができず、ME残差に代わるパラメータとして、フラットネスおよびイントラACを用いる。
また、フラットネスは、映像データ圧縮装置2を実現するために、映像の空間的な平坦さを表す指標として新たに定義されたパラメータであって、映像の複雑さを指標し、映像の絵柄の難しさ(難度)および圧縮後のデータ量と相関性を有する。
また、イントラACは、映像データ圧縮装置2を実現するために、MPEG方式におけるDCT処理単位のDCTブロックごとの映像データとの分散値の総和として新たに定義したパラメータであって、フラットネスと同様に、映像の複雑さを指標し、映像の絵柄の難しさおよび圧縮後のデータ量と相関性を有する。
【0073】
以下、ME残差、フラットネスおよびイントラACについて説明する。
第1の実施形態および第2の実施形態において説明した簡易2パスエンコード方式および予測簡易2パスエンコード方式において、実難度データDj は映像の絵柄の難しさを示し、目標データ量Tj は実難度データDj に基づいて算出される。
【0074】
また、エンコーダ18が生成する圧縮映像データのデータ量を、目標データ量Tj が示す値に近づけるために、量子化回路168(図2,図8)において量子化値Qj の制御が行われる。従って、映像データを圧縮符号化せずに得られ、実難度データDj と同様に映像データの絵柄の複雑さ(難しさ)を適切に示すパラメータを、エンコーダ18の量子化回路168における量子化処理以前に得ることができれば、エンコーダ162(図1)を省略し、処理遅延時間の短縮するという目的を達成することができる。ME残差、フラットネスおよびイントラACは、実難度データDj と強い相関を有するので、このような目的を達成するために適切である。
【0075】
ME残差と実難度データD j との関係
他のピクチャーを参照して圧縮符号化処理し、PピクチャーおよびBピクチャーを生成する際には、動き検出器14は、圧縮対象となるピクチャー(入力ピクチャー)の注目マクロブロックと、参照されるピクチャー(参照ピクチャー)との間の差分値の絶対値和あるいは自乗値和が最小となるようなマクロブロックを探し、動きベクトルを求める。ME残差は、このように、動きベクトルを求める際に、最小になった各マクロブロックの差分値の絶対和または自乗和を、ピクチャー全体について総和した値として定義される。
【0076】
図9は、映像データ圧縮装置1,2により、Pピクチャーを生成する際のME残差と実難度データDj との相関関係を示す図である。
図10は、映像データ圧縮装置1,2により、Bピクチャーを生成する際のME残差と実難度データDj との相関関係を示す図である。
なお、図9および図10においては、実難度データDj として、エンコーダ18が固定の量子化値を用いて圧縮符号化して得られた圧縮映像データのデータ量を用いており(以下、図12,図13において同じ)、図9および図10は、CCIRにより規格化された標準画像[cheer (cheer leaders), mobile (mobile and calender), tennis (table tennis), diva(diva with noise)] およびその他の画像(resort)を実際にMPEG2方式により圧縮符号化した場合に得られるME残差と実難度データDj との関係を示すグラフであり、図9および図10において、グラフの縦軸(difficulty)が実難度データDj を示し、横軸(me resid)がME残差を示す。
図9および図10を参照して分かるように、ME残差は実難度データDj と非常に強い相関関係を有する。従って、圧縮後にPピクチャーまたはBピクチャーとなるピクチャーの実難度データDj の代わりに、ME残差は、目標データ量Tj の生成に用いられ得る。
【0077】
フラットネスと実難度データD j との関係
図11は、フラットネスの計算方法を示す図である。
フラットネスは、まず、図11に示すように、MPEG方式においてDCT処理の単位となるDCTブロックそれぞれを、2画素×2画素の小ブロックに分割し、次に、これらの小ブロック内の対角の画素のデータ(画素値)の差分値を算出し、差分値を所定の閾値と比較し、さらに、差分値が閾値よりも小さくなる小ブロック総数をピクチャーごとに求めることにより算出される。
なお、フラットネスの値は、映像の絵柄が空間的に複雑であるほど小さくなり、平坦であれば大きくなる。
【0078】
図12は、映像データ圧縮装置1,2により、Iピクチャーを生成する際のフラットネスと実難度データDj との相関関係を示す図である。
なお、図12は、図9および図10と同様に、CCIRにより規格化された標準画像およびその他の画像を実際にMPEG2方式により圧縮符号化した場合に得られるフラットネスと実難度データDj との関係を示すグラフであり、図12において、グラフの縦軸(difficulty)が実難度データDj を示し、横軸(flatness)がフラットネスを示す。
図12に示すように、フラットネスと実難度データDj には、強い負の相関関係があり、実難度データDj は、フラットネスを一次関数に代入する等の方法により近似可能であることがわかる。
【0079】
イントラACと実難度データD j との関係
イントラACは、DCTブロックごとに、DCTブロック内の画素それぞれの画素値と、DCTブロック内の画素値の平均値との差分の絶対値の総和として算出される。つまり、イントラACは、下の式5により求めることができる。
【0080】
【数5】
Figure 0003765129
【0081】
図13は、映像データ圧縮装置1,2により、Iピクチャーを生成する際のイントラACと実難度データDj との相関関係を示す図である。
なお、図13は、図9および図10と同様に、CCIRにより規格化された標準画像およびその他の画像を実際にMPEG2方式により圧縮符号化した場合に得られるイントラACと実難度データDj との関係を示すグラフであり、図13において、グラフの縦軸(difficulty)が実難度データDj を示し、横軸(intra AC)がフラットネスを示す。
図13に示すように、イントラACと実難度データDj には、強い正の相関関係があり、実難度データDj は、イントラACを一次関数に代入する等の方法により近似可能であることがわかる。
【0082】
ここまでに説明したように、各指標データ(統計量)により実難度データDj を一次関数等により近似可能であることが分かる。従って、各ピクチャータイプの実難度データDj は、以下に示すように算出可能である。
【0083】
Pピクチャーについては下に示す式6により、Bピクチャーについては下に示す式7により、実難度データDj はME残差により近似される。また、Iピクチャーについては、式6,7と同様の近似式により実難度データDj は、フラットネスおよびイントラACまたはこれらのいずかにより近似される。
【0084】
【数6】
Figure 0003765129
【0085】
【数7】
Figure 0003765129
【0086】
さらに、第1の実施形態に示した簡易2パスエンコード方式においては、これらの近似により得られた実難度データDj を、式1に代入することにより目標データ量Tj が算出される。
あるいは、第2の実施形態に示した予測簡易2パスエンコード方式においては、これらの近似により得られた実難度データDj から予測難度データDj ’が算出され、実難度データDj および予測難度データDj ’を式4に代入することにより目標データ量Tj が算出される。
【0087】
以下、実難度データDj をME残差、フラットネスおよびイントラACで近似し、簡易2パスエンコード方式により非圧縮映像データを圧縮符号化する場合を例に、映像データ圧縮装置2の動作を説明する。
エンコーダ制御部22において、映像並び替え回路220は、非圧縮映像データVINを符号化順にピクチャーを並べ替え、走査変換・マクロブロック化回路222は、ピクチャー・フィールド変換等を行い、統計量算出回路224は、Iピクチャーに圧縮符号化されるピクチャーに対して、図11および式5に示した演算処理を行い、フラットネスおよびイントラAC等の統計量を算出する。
【0088】
動き検出器14は、PピクチャーおよびBピクチャーに圧縮符号化されるピクチャーについて動きベクトルを生成し、さらに、ME残差を算出する。
FIFOメモリ160は、入力された映像データをLピクチャー分だけ遅延する。
【0089】
ホストコンピュータ20は、動き検出器14が生成したME残差に対して式6および式7に示した演算処理を行って実難度データDj を近似し、式6および式7と同様な演算処理を行って、フラットネスおよびイントラACにより実難度データDj を近似する。
さらに、ホストコンピュータ20は、近似した実難度データDj を式1に代入し、目標データ量Tj を算出し、算出した目標データ量Tj をエンコーダ18の量子化制御回路180に設定する。
【0090】
エンコーダ18のDCT回路166は、遅延した映像データの第j番目のピクチャーをDCT処理する。
量子化回路168は、DCT回路166から入力された第j番目のピクチャーの周波数領域のデータを、量子化制御回路180が目標データ量Tj に基づいて調節する量子化値Qj により量子化する。
可変長符号化回路170は、量子化回路168から入力された第j番目のピクチャーの量子化データを可変長符号化して、ほぼ、目標データ量Tj に近いデータ量の圧縮映像データVOUTを生成して、バッファメモリ182を介して外部に出力する。
【0091】
なお、MPEGの圧縮アルゴリズムとして知られるTM5方式等においては、マクロブロックの量子化値(MQUANT)を算出するために、下の式8に示すアクティビティ(activity)という統計量が用いられる。アクティビティは、フラットネスおよびイントラACと同様に、実難度データDj と強い相関関係を有するので、これらパラメータの代わりにアクティビティを用いて、実難度データDj を近似し、圧縮符号化を行うように映像データ圧縮装置2を構成してもよい。
【0092】
【数8】
Figure 0003765129
【0093】
また、以上、第1の実施形態に示した簡易2パスエンコードを行う場合を例に、映像データ圧縮装置2の動作を説明したが、映像データ圧縮装置2は、予測簡易2パスエンコードを行いうることはいうまでもない。
また、第3の実施形態に示した映像データ圧縮装置2に対しても、第1の実施形態および第2の実施形態に示した映像データ圧縮装置1に対してと同様の変形が可能である。
【0094】
第4実施形態
以下、本発明の第4の実施形態を説明する。
第3の実施形態に示したFFRC方式においては、統計的に求められた指標データ(統計量)、つまり、ME残差、フラットネス、イントラACおよびアクティビティを、式6および式7等の一次関数に代入して実難度データDj を近似する。
これらの指標データと難度データDj とは、図9、図10、図12および図13に示したように、強い相関関係を有するが、映像データの絵柄によっては、上記一次関数から若干の誤差が生じる。
【0095】
第4の実施形態における映像データ圧縮装置2の処理は、かかる問題点を解決するためになされたものであり、映像データの絵柄等に応じて、式6および式7等に示した重み付け係数ap ,aB 等を、適応的に刻一刻と調節して、第3の実施形態においてより高い精度で実難度データDj を指標データで近似することができ、より高い品質の圧縮映像データを生成することができるように改良されている。
【0096】
以下、第4の実施形態における映像データ圧縮装置2の処理の概要を説明する。
映像データ圧縮装置2(図8)のエンコーダ18が、1ピクチャー分の圧縮符号化を終了するたびに、ホストコンピュータ20には、生成した圧縮映像データの1ピクチャー分のデータ量が判明し、さらに、圧縮符号化時の量子化値Qj の平均値、および、以下に説明するグローバルコンプレクシティ(global complexity) を算出することができる。
グローバルコンプレクシティは、MPEGのTM5において、圧縮映像データのデータ量と量子化値Qj とを乗算した値として、下の式9−1〜式9−3に示すように定義され、映像の絵柄の複雑さを示す。
【0097】
【数9】
Figure 0003765129
【0098】
なお、式9−1〜式9−3において、Si ,Sb ,Sp は、それぞれIピクチャー、BピクチャーおよびPピクチャーのデータ量を示し、Qi ,Qb ,Qp は、それぞれIピクチャー、BピクチャーおよびPピクチャーを生成する際の量子化値Qj の平均値を示し、Xi ,Xb ,Xp は、それぞれIピクチャー、BピクチャーおよびPピクチャーのグローバルコンプレクシティを示す。
式9−1〜9−3に示したグローバルコンプレクシティは、実難度データDj とは必ずしも一致しないが、量子化値Qj の平均値が極端に大きかったり小さかったりしない限り、実難度データDj とほぼ一致する。
【0099】
ここで、Iピクチャー、PピクチャーおよびBピクチャーの指標データ、例えばイントラAC(他のパラメータでも可)およびME残差(ME_resid)と、グローバルコンプレクシティとが比例関係にあるとすると、これらの指標データとグローバルコンプレクシティとの比例係数ε,ε,εは、下の式10−1〜式10−3により算出できる。
【0100】
【数10】
Figure 0003765129
【0101】
各ピクチャータイプの実難度データDj は、式10−1〜式10−3により算出した比例係数εI ,εP ,εB を用いて、下の式11−1〜式11−3に示すように算出される。
【0102】
【数11】
Figure 0003765129
【0103】
ホストコンピュータ20が、数10−1〜数10−3に示したように、比例係数εI ,εP ,εB を、エンコーダ18がピクチャーを1枚圧縮符号化するたびに算出して最適化し、式11−1〜式11−3により各ピクチャータイプの実難度データDj の値を求めることにより、映像データの絵柄に関わらず、指標データにより実難度データDj を、常に最適に近似することができる。
【0104】
ホストコンピュータ20は、式10および式11に示したように近似された実難度データDj に対して、式1に示した演算処理を行って目標データ量Tj を算出する。
なお、MPEGのTM5におけるように、実難度データDj に基づいて定める値に対して、意図的に、実際に算出する目標データ量Tj の値を一定の比率で変更する場合には、下の式12−1〜式12−3により、目標データ量Tj を算出することができる。
【0105】
【数12】
Figure 0003765129
【0106】
なお、式12−1〜式12−3全ての分母において、DI,P,Bは、エンコーダ18に入力される前のFIFOメモリ160にバッファリングされているLピクチャー分の非圧縮映像データから生成された指標データにより近似された実難度データDj を示し、Rj は、第j番目のピクチャー以降のL枚のピクチャーに割り当てることができるデータ量の平均値を示す。 およびK は、所定の重み付け係数である。
【0107】
以下、図14を参照して、第4の実施形態における映像データ圧縮装置2の動作を説明する。
図14は、第4の実施形態における映像データ圧縮装置2(図8)の圧縮符号化動作を示す図である。
エンコーダ制御部22は、第3の実施形態においてと同様に、非圧縮映像データVINを符号化順にピクチャーを並べ替え、ピクチャー・フィールド変換等を行い、Iピクチャーに圧縮符号化される第j+L番目のピクチャーからフラットネスおよびイントラAC等の統計量を算出する(図14a)。
【0108】
動き検出器14は、第1の実施形態〜第3の実施形態においてと同様に、PピクチャーおよびBピクチャーに圧縮符号化される第j+L番目のピクチャーについて動きベクトルを生成し、さらに、ME残差を算出する(図14a)。
FIFOメモリ160は、第1の実施形態〜第3の実施形態においてと同様に、入力された映像データをLピクチャー分だけ遅延する。
ホストコンピュータ20は、動き検出器14が生成したME残差に対して式11−1,11−2に示した演算処理を行って実難度データDj を近似し、式11−3に示した演算処理を行って、イントラAC等により実難度データDj を近似する(図14b)。
さらに、ホストコンピュータ20は、近似した実難度データDj を式1あるいは式12−1〜12−3に代入し、目標データ量Tj を算出して、エンコーダ18の量子化制御回路180に設定する(図14c)。
【0109】
エンコーダ18のDCT回路166は、第1の実施形態〜第3の実施形態においてと同様に、遅延した映像データの第j番目のピクチャーをDCT処理する。量子化回路168は、DCT回路166から入力された第j番目のピクチャーの周波数領域のデータを、量子化制御回路180が目標データ量Tj に基づいて調節する量子化値Qj により量子化するとともに、第j番目のピクチャーの圧縮符号化に用いた量子化値Qj の平均値を算出し、ホストコンピュータ20に対して出力する。
可変長符号化回路170は、第1の実施形態〜第3の実施形態においてと同様に、量子化回路168から入力された第j番目のピクチャーの量子化データを可変長符号化して、ほぼ、目標データ量Tj に近いデータ量の圧縮映像データVOUTを生成し、バッファメモリ182を介して出力する。
【0110】
エンコーダ18が、第j番目のピクチャーの圧縮符号化を終了すると、ホストコンピュータ20は、量子化制御回路180から入力される第j番目のピクチャーに対する量子化値Qj の平均値と、圧縮符号化された第j番目のピクチャーのデータ量とに基づいて、式9−1〜式9−3に示したようにグローバルコンプレクシティを算出する(図14d)。
さらに、ホストコンピュータ20は、算出したグローバルコンプレクシティにより、式10−1〜式10−3に示したように比例係数ε,ε,εを更新する(図14e)。更新された比例係数ε,ε,εは、次のピクチャーの圧縮符号化の際の変換式(式11−1〜式11−3)に反映される(図14f)
【0111】
図15を参照して、第4の実施形態におけるホストコンピュータ20の処理内容をさらに説明する。
図15は、第4の実施形態における映像データ圧縮装置2のホストコンピュータ20(図8)の処理内容を示す図である。
図15に示すように、ステップ300(S300)において、ホストコンピュータ20は、第j+L番目のME残差あるいはイントラAC等の指標データ(統計量)をエンコーダ制御部22または動き検出器14から取り込む。
【0112】
ステップ302(S302)において、ホストコンピュータ20は、第j+1番目のピクチャーがいずれのピクチャータイプに圧縮符号化されるかを判断する。第j+1番目のピクチャーがIピクチャーに圧縮符号化される場合にはS304の処理に進み、Pピクチャーに圧縮符号化される場合にはS306の処理に進み、Bピクチャーに圧縮符号化される場合にはS308の処理に進む。
【0113】
ステップ304(S304)、ステップ306(S306)およびステップ308(S308)それぞれにおいて、ホストコンピュータ20は、式11−1〜式11−3により実難度データDj を近似する。
ステップ310(S310)において、ホストコンピュータ20は、近似した実難度データDj を用いて、式1あるいは式12−1〜式12−3により、目標データ量Tj を算出する。
ステップ312(S312)において、エンコーダ18は、第j番目のピクチャーを圧縮符号化する。
【0114】
ステップ314(S314)において、ホストコンピュータ20は、エンコーダ18が圧縮した第j番目のピクチャーのデータ量、および、量子化制御回路180が量子化回路168に設定する量子化値Qj の平均値から、グローバルコンプレクシティXi ,Xb ,Xp 〔X(I,B,P)〕を算出する。
【0115】
ステップ316(S316)において、ホストコンピュータ20は、第j+1番目のピクチャーがいずれのピクチャータイプに圧縮符号化されるかを判断する。第j+1番目のピクチャーがIピクチャーに圧縮符号化される場合にはS318の処理に進み、Pピクチャーに圧縮符号化される場合にはS320の処理に進み、Bピクチャーに圧縮符号化される場合にはS320の処理に進む。
ステップ318(S318)、ステップ320(S320)およびステップ322(S322)それぞれにおいて、ホストコンピュータ20は、式10−1〜式10−3により比例係数εI ,εP ,εB を更新する。
ステップ324(S324)において、ホストコンピュータ20は、数値jをインクリメントする。
【0116】
なお、第3の実施形態に述べたように、例えば、実難度データDと、比例係数ε,ε,εと指標データとの乗算値との間にオフセット(δ)が存在する場合がある。このような場合には、グローバルコンプレクシティX,X,Xからオフセット値δ,δ,δを減算した値を指標データで除算することにより、比例係数ε,ε,εを算出することができる。
また、第4の実施形態に示した映像データ圧縮装置2の動作についても、第3の実施形態等に示したものと同様な変形が可能である。
【0117】
以上述べたように、第4の実施形態における映像データ圧縮装置2の動作によれば、第3の実施形態に示した映像データ圧縮装置2の動作と同じ効果を得られる他、第3の実施形態におけるよりもさらに正確な目標データ量Tj が算出でき、この結果、圧縮映像データの品質を向上させることができる。
【0118】
【発明の効果】
以上説明したように、本発明に係る映像データ圧縮装置およびその方法によれば、2パスエンコードによらずに、所定のデータ量以下に音声・映像データを圧縮符号化することができる。
また、本発明に係る映像データ圧縮装置およびその方法によれば、ほぼ実時間的に映像データを圧縮符号化することができ、しかも、伸長復号後に高品質な映像を得ることができる。
また、本発明に係る映像データ圧縮装置およびその方法によれば、2パスエンコードによらずに、圧縮符号化後のデータ量を見積もって圧縮率を調節し、圧縮符号化処理を行うことができる。
【図面の簡単な説明】
【図1】本発明に係る映像データ圧縮装置の構成を示す図である。
【図2】図1に示した簡易2パス処理部のエンコーダの構成を示す図である。
【図3】図1に示したエンコーダの構成を示す図である。
【図4】(A)〜(C)は、第1の実施形態における映像データ圧縮装置の簡易2パスエンコードの動作を示す図である。
【図5】(A)〜(C)は、第2の実施形態における映像データ圧縮装置の予測簡易2パスエンコードの動作を示す図である。
【図6】第2の実施形態における映像データ圧縮装置(図1)の動作を示すフローチャートである。
【図7】第3の実施形態における本発明に係る映像データ圧縮装置の構成の概要を示す図である。
【図8】図7に示した映像データ圧縮装置の圧縮符号化部の詳細な構成を示す図である。
【図9】図1および図7に示した映像データ圧縮装置により、Pピクチャーを生成する際のME残差と実難度データDj との相関関係を示す図である。
【図10】図1および図7に示した映像データ圧縮装置により、Bピクチャーを生成する際のME残差と実難度データDj との相関関係を示す図である。
【図11】フラットネスの計算方法を示す図である。
【図12】図1および図7に示した映像データ圧縮装置により、Iピクチャーを生成する際のフラットネスと実難度データDj との相関関係を示す図である。
【図13】図1および図7に映像データ圧縮装置により、Iピクチャーを生成する際のフラットネスと実難度データDj との相関関係を示す図である。
【図14】第4の実施形態における映像データ圧縮装置(図8)の圧縮符号化動作を示す図である。
【図15】第4の実施形態における映像データ圧縮装置2のホストコンピュータ(図8)の処理内容を示す図である。
【符号の説明】
1,2…映像データ圧縮装置、10…圧縮符号化部、12,22…エンコーダ制御部、14…動き検出器、16…簡易2パス処理部、160…FIFOメモリ、162,18…エンコーダ、164…加算回路、166…DCT回路、168…量子化回路、170…可変長符号化回路、172…逆量子化回路、174…逆DCT回路、176…加算回路、178…動き補償回路、180…量子化制御回路、182…バッファメモリ、20…ホストコンピュータ。

Claims (5)

  1. 映像データを符号化処理する符号化装置において、
    上記映像データから、上記映像データの絵柄の難度及び上記映像データの符号化処理後のデータ量と相関性を有する統計量をピクチャ毎に算出する統計量算出手段と、
    上記映像データを所定ピクチャ分遅延させる遅延手段と、
    上記統計量算出手段により算出された上記統計量を用いて上記映像データの実難度データをピクチャ毎に近似することにより算出された近似難度データと上記遅延手段により遅延された上記映像データの複数ピクチャ分の上記近似難度データの総和との比に従って、上記遅延手段より遅延された上記映像データを符号化処理する際に割り当てる目標符号量をピクチャ毎に算出する目標符号量算出手段と、
    上記目標符号量算出手段により算出された上記目標符号量となるように、上記遅延手段より遅延された上記映像データをピクチャ毎に符号化処理する符号化手段と
    を備えたことを特徴とする、符号化装置。
  2. 上記近似難度データは、上記統計量算出手段により算出された上記統計量の値を、上記統計量と上記映像データの実難度データとの相関関係から得られる所定の一次関数に代入することによって算出される
    請求項1に記載の符号化装置。
  3. 上記統計量算出手段は、上記符号化手段がIピクチャとして符号化処理する上記映像データのピクチャから、フラットネス又はイントラACを上記統計量として算出する
    請求項1に記載の符号化装置。
  4. 上記統計量算出手段は、上記符号化手段がPピクチャ又はBピクチャとして符号化処理する上記映像データのピクチャから、ME残差を前記統計量として算出する
    請求項1に記載の符号化装置。
  5. 映像データを符号化処理する符号化方法において、
    上記映像データから、上記映像データの絵柄の難度及び上記映像データの符号化処理後のデータ量と相関性を有する統計量をピクチャ毎に算出する統計量算出工程と、
    上記映像データを所定ピクチャ分遅延させる遅延工程と、
    上記統計量算出工程により算出された上記統計量を用いて上記映像データの実難度データをピクチャ毎に近似することにより算出された近似難度データと上記遅延手段により遅延された上記映像データの複数ピクチャ分の上記近似難度データの総和との比に従って、上記遅延工程より遅延された上記映像データを符号化処理する際に割り当てる目標符号量をピクチャ毎に算出する目標符号量算出工程と、
    上記目標符号量算出工程により算出された上記目標符号量となるように、上記遅延工程より遅延された上記映像データをピクチャ毎に符号化処理する符号化手段と
    を備えたことを特徴とする、符号化装置。
JP21470796A 1996-08-14 1996-08-14 符号化装置および符号化方法 Expired - Lifetime JP3765129B2 (ja)

Priority Applications (9)

Application Number Priority Date Filing Date Title
JP21470796A JP3765129B2 (ja) 1996-08-14 1996-08-14 符号化装置および符号化方法
US08/909,448 US6337879B1 (en) 1996-08-14 1997-08-11 Video data compression apparatus and method of same
EP05075396A EP1538846A3 (en) 1996-08-14 1997-08-12 Video compression with feedback update of parameters used in complexity estimation for rate control
EP05075397A EP1538847A3 (en) 1996-08-14 1997-08-12 Video encoder with scene change detector for rearranging pictures before compression
EP97306113A EP0825782A3 (en) 1996-08-14 1997-08-12 Video data compression apparatus and method
KR1019970038972A KR100512389B1 (ko) 1996-08-14 1997-08-14 영상데이터의 압축장치 및 그 방법
US10/045,576 US7050495B2 (en) 1996-08-14 2001-03-20 Video data compression apparatus and method of same
US11/223,162 US7881373B2 (en) 1996-08-14 2005-09-08 Video data compression apparatus and method of same
US12/967,551 US20110080943A1 (en) 1996-08-14 2010-12-14 Video data compression apparatus and method of same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP21470796A JP3765129B2 (ja) 1996-08-14 1996-08-14 符号化装置および符号化方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2005351361A Division JP2006136010A (ja) 2005-12-05 2005-12-05 映像データ圧縮装置およびその方法

Publications (2)

Publication Number Publication Date
JPH1066067A JPH1066067A (ja) 1998-03-06
JP3765129B2 true JP3765129B2 (ja) 2006-04-12

Family

ID=16660287

Family Applications (1)

Application Number Title Priority Date Filing Date
JP21470796A Expired - Lifetime JP3765129B2 (ja) 1996-08-14 1996-08-14 符号化装置および符号化方法

Country Status (1)

Country Link
JP (1) JP3765129B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7881373B2 (en) 1996-08-14 2011-02-01 Sony Corporation Video data compression apparatus and method of same

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4203707B2 (ja) 2001-01-31 2009-01-07 日本電気株式会社 事前解析を用いた動画像符号化装置、動画像符号化方法、及びそのプログラム。

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7881373B2 (en) 1996-08-14 2011-02-01 Sony Corporation Video data compression apparatus and method of same

Also Published As

Publication number Publication date
JPH1066067A (ja) 1998-03-06

Similar Documents

Publication Publication Date Title
JP3864461B2 (ja) 映像データ圧縮装置およびその方法
US7881373B2 (en) Video data compression apparatus and method of same
KR100756596B1 (ko) 비디오 데이터 부호화 장치 및 비디오 데이터 부호화 방법
EP1445958A1 (en) Quantization method and system, for instance for video MPEG applications, and computer program product therefor
EP0833522A2 (en) Video signal encoding method and apparatus employing an adaptive quantization technique
WO2002085031A1 (en) Dynamic complexity prediction and regulation of mpeg2 decoding in a media processor
JPH10191343A (ja) 映像データ圧縮装置およびその方法
JP4081727B2 (ja) 画像符号化装置および画像符号化方法、並びに記録装置および記録方法
JP3765129B2 (ja) 符号化装置および符号化方法
KR100394014B1 (ko) 영상 변환 부호화 장치
JP3765130B2 (ja) 符号化装置および符号化方法
JP3879134B2 (ja) 符号化装置およびその方法
JP3918208B2 (ja) 映像データ圧縮装置およびその方法
JP3800965B2 (ja) データレート変換装置
JPH10108197A (ja) 画像符号化装置、画像符号化制御方法および画像符号化制御用プログラムを記録した媒体
JP2006136010A (ja) 映像データ圧縮装置およびその方法
JP2007053788A (ja) 映像データ圧縮装置およびその方法
JPH1066092A (ja) 映像データ圧縮装置およびその方法
JP3934772B2 (ja) 可変転送レート符号化方法および装置
JPH1075444A (ja) 映像データ圧縮装置およびその方法
JP3922581B2 (ja) 可変転送レート符号化方法および装置
JPH1066082A (ja) 映像データ圧縮装置およびその方法
JP2006148953A (ja) 映像データ圧縮装置およびその方法
JPH07203458A (ja) 動画像符号化装置
JPH1075452A (ja) 映像データ圧縮装置およびその方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050118

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050322

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051004

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051205

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060104

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060117

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100203

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100203

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110203

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120203

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130203

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140203

Year of fee payment: 8

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term