JP3521794B2 - データ符号化方法及び装置 - Google Patents

データ符号化方法及び装置

Info

Publication number
JP3521794B2
JP3521794B2 JP06735799A JP6735799A JP3521794B2 JP 3521794 B2 JP3521794 B2 JP 3521794B2 JP 06735799 A JP06735799 A JP 06735799A JP 6735799 A JP6735799 A JP 6735799A JP 3521794 B2 JP3521794 B2 JP 3521794B2
Authority
JP
Japan
Prior art keywords
data
code amount
encoding
unit
target code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP06735799A
Other languages
English (en)
Other versions
JP2000269820A (ja
Inventor
隆幸 菅原
順三 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP06735799A priority Critical patent/JP3521794B2/ja
Priority to US09/467,862 priority patent/US6567554B1/en
Priority to EP19990125505 priority patent/EP1037472B1/en
Priority to DE1999620166 priority patent/DE69920166T2/de
Publication of JP2000269820A publication Critical patent/JP2000269820A/ja
Priority to US10/386,445 priority patent/US6888967B2/en
Application granted granted Critical
Publication of JP3521794B2 publication Critical patent/JP3521794B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、例えば符号化した
オーディオ及びビデオデータをそれぞれ所定時間内に再
生されるべきパック列としてユニット内に格納するデー
タ符号化方法及び装置に関し、特に、オーディオ及びビ
デオデータの符号化に先行して、それらの符号化データ
の符号量に相当する値から算出されるデータ長や開始ア
ドレスなどのナビゲーションデータを記述するような符
号化において、画質を安定に保ちながら実現することが
できるデータ符号化方法及び装置に関する。
【0002】
【従来の技術】近年は、動画に対するデータ圧縮方式が
MPEG(Moving Picture Image Coding Expert Grou
p)方式として国際標準化されるに至っている。このM
PEG方式は、映像データを可変圧縮する方式として知
られている。このMPEG方式には、MPEG1(MP
EGフェーズ1)やMPEG2(MPEGフェーズ2)
と呼ばれる圧縮方式が規定されている。
【0003】具体的には、MPEGは、幾つかの技術を
組み合わせて作成されており、先ず、入力画像信号から
動き補償器で復号化した画像信号を差し引くことで時間
冗長部分の削減を行う。
【0004】予測の方法には、基本的なモードとして、
過去の画像からの予測を行うモードと、未来の画像から
の予測を行うモードと、過去と未来の両方の画像からの
予測を行うモードとの3モードが存在する。またこれら
のモードは、16画素×16画素のマクロブロック(M
B:Macroblock)毎に切り替えて使用できる。予測方法
は、入力画像に与えられたピクチャタイプ(Picture_T
ype)によって決定される。ピクチャタイプには、片方
向ピクチャ間予測符号化画像(Pピクチャ:P-pictur
e)と、双方向ピクチャ間予測符号化画像(Bピクチ
ャ:B-Picture)と、ピクチャ内独立符号化画像(Iピ
クチャ:I-picture)がある。過去の画像から予測を行
って符号化するモードと予測をしないでそのマクロブロ
ックを独立に符号化するモードとの2つのモードが存在
するのが、Pピクチャ(片方向ピクチャ間予測符号化画
像)である。また、未来の画像からの予測を行うモード
と、過去の画像からの予測を行うモードと、過去と未来
の両方の画像からの予測を行うモードと、予測をしない
で独立に符号化するモードの4つのモードが存在するの
が、Bピクチャ(双方向ピクチャ間予測符号化画像)で
ある。そして、全てのマクロブロックを独立に符号化す
るのが、Iピクチャ(ピクチャ内独立符号化画像)であ
る。なお、Iピクチャはイントラピクチャと呼ばれ、こ
のため、片方向ピクチャ間予測符号化画像と双方向ピク
チャ間予測符号化画像は非イントラピクチャということ
ができる。
【0005】動き補償では、動き領域をマクロブロック
毎にパターンマッチングすることによってハーフペル精
度で動きベクトルを検出し、その検出した動きベクトル
の動き分だけマクロブロックをシフトしてから予測す
る。動きベクトルは、水平方向と垂直方向の動きベクト
ルが存在し、何処からの予測かを示すMC(Motion Com
pensation)モードとともにマクロブロックの付加情報
として伝送される。
【0006】Iピクチャから次のIピクチャの前のピク
チャまではGOP(Group Of Picture)と呼ばれ、蓄積
メディアなどで使用される場合には、一般に約15ピク
チャ程度が1GOPとして使用される。
【0007】図8には、MPEGが適用されるオーディ
オビデオ符号化装置のうち、ビデオエンコーダの基本的
な構成を示している。
【0008】この図8において、入力端子101には入
力画像信号が供給され、この入力画像信号は演算器10
2と後述する動き補償予測器111に送られる。
【0009】演算器102では、動き補償予測器111
にて復号化した画像信号と入力画像信号との差分が求め
られ、その差分画像信号がDCT器103に送られる。
【0010】DCT器103では、供給された差分画像
信号を直交変換する。ここでDCT(Discrete Cosine
Transform)とは、余弦関数を積分核とした積分変換を
有限空間への離散変換とする直交変換である。MPEG
ではマクロブロックを4分割した8×8のDCTブロッ
クに対して、2次元DCTを行う。なお、一般に、ビデ
オ信号は低域成分が多く、高域成分が少ないため、DC
Tを行うと係数が低域に集中する。このDCT器103
でのDCTによって得られたデータ(DCT係数)は、
量子化器104に送られる。
【0011】量子化器104では、DCT器103から
のDCT係数を量子化する。この量子化器104におけ
る量子化では、量子化マトリックスという8×8の2次
元周波数を視覚特性で重み付けした値と、その全体をス
カラー倍する量子化スケールという値で乗算した値とを
量子化値として、DCT係数をその量子化値で除算す
る。なお、当該ビデオエンコーダにて符号化された後の
符号化データを、後にデコーダ(ビデオ復号装置)で復
号して逆量子化するときは、そのビデオエンコーダにて
使用した量子化値で乗算を行うことにより、元のDCT
係数に近似している値を得ることができる量子化器10
4にて量子化されたデータは、可変長符号化器(VL
C)105に送られる。
【0012】VLC105は、量子化器104からの量
子化データを可変長符号化する。このVLC105で
は、量子化された値のうち、直流(DC)成分に対して
は、予測符号化の一つであるDPCM(differential p
ulse code modulation)を使用して符号化する。一方、
交流(AC)成分に対しては、低域から高域に向けてい
わゆるジグザグスキャン(zigzag scan)を行い、ゼロ
のラン長及び有効係数値を1つの事象とし、出現確率の
高いものから符号長の短い符号を割り当てていく、いわ
ゆるハフマン符号化を行う。また、このVLC105に
は、動き補償予測器111から動きベクトルと予測モー
ドの情報も供給され、当該VLC105は、可変長符号
化データと共に、これら動きベクトルと予測モードの情
報をマクロブロックの付加情報として出力する。VLC
105にて可変長符号化されたデータは、バッファメモ
リ106に送られる。
【0013】バッファメモリ106では、VLC105
からの可変長符号化データを一時蓄える。その後、この
バッファメモリ106から所定の転送レートで読み出さ
れた符号化データ(符号化ビットストリーム)は、出力
端子113から出力されることになる。
【0014】また、その出力される符号化データにおけ
るマクロブロック毎の発生符号量情報は、後述する符号
量制御器112に送信される。この符号量制御器112
は、マクロブロック毎の発生符号量と目標符号量との差
分である誤差符号量を求め、当該誤差符号量に応じた符
号量制御信号を生成して量子化器104にフィードバッ
クすることにより、発生符号量制御を行う。当該符号量
制御のために量子化器104にフィードバックされる符
号量制御信号は、量子化器104における量子化スケー
ルを制御するための信号である。
【0015】一方、量子化器104にて量子化された画
像データは、逆量子化器107にも送られる。
【0016】この逆量子化器107では、量子化器10
4からの量子化データを逆量子化する。この逆量子化に
より得られたDCT係数データは、逆DCT器108に
送られる。
【0017】逆DCT器108は、逆量子化器107か
らのDCT係数データを逆DCTした後、演算器109
に送る。
【0018】演算器109では、逆DCT器108の出
力信号に動き補償予測器111からの予測差分画像を加
算する。これにより、画像信号が復元される。
【0019】この復元された画像信号は、画像メモリ1
10に一時蓄えられた後、読み出されて動き補償予測器
111に送られる。
【0020】画像メモリ110から動き補償予測器11
1に送られた画像信号は、演算器102にて差分画像を
計算するためのリファレンスの復号化画像を生成するた
めに使用される。
【0021】動き補償予測器111では、入力画像信号
から動きベクトルを検出し、その検出した動きベクトル
の動き分だけ画像をシフトしてから予測を行う。この予
測によりえられた予測差分画像信号が、演算器102及
び109に送られることになる。また、動き補償予測器
111にて検出された動きベクトルは、予測モード(M
Cモード)の情報と共に、VLC105に送られる。
【0022】なお、上述のように差分画像信号の符号化
を行うのはPピクチャ及びBピクチャの場合であり、I
ピクチャの場合には入力画像信号をそのまま符号化す
る。
【0023】図9には、図8に示したビデオエンコーダ
にて符号化された符号化データを復号するビデオデコー
ダの基本的な構成を示す。
【0024】この図9において、入力端子121には符
号化データが供給される。この符号化データは、可変長
復号化器(VLD)122に送られる。このVLD12
2は、図8のVLC105における可変長符号化の逆処
理である可変長復号化を行う。当該可変長復号により得
られるデータは、図8のVLC105への入力である量
子化データに、動きベクトル及び予測モードの情報が付
加されたものに相当する。VLD122での可変長復号
化により得られた量子化データは、逆量子化器123に
送られる。
【0025】逆量子化器123では、VLD122から
の量子化データを逆量子化する。当該逆量子化されたデ
ータは、図8の量子化器104への入力であるDCT係
数データに相当する。この逆量子化器123での逆量子
化により得られたDCT係数データは、逆DCT器12
4に送られる。また、動きベクトル及び予測モードの情
報は、当該逆量子化器123から動き補償予測器127
に送られる。
【0026】逆DCT器124では、逆量子化器123
からのDCT係数を逆DCTする。当該逆DCT器12
4にて逆DCTされたデータは、図8のDCT器103
への入力である差分画像信号に相当する。この逆DCT
器124にて逆DCTされた差分画像信号は、演算器1
25に送られる。
【0027】演算器125では、逆DCT器124から
の差分画像信号に、動き補償予測器127からの予測差
分画像を加算する。これにより、復号化データすなわち
画像信号が復元される。この復元された画像信号は、図
8の入力端子101への入力画像信号に略々相当する。
当該復元された画像信号(復号化データ)は、出力端子
128から出力されると同時に、一時、画像メモリ12
6に蓄えられた後、動き補償予測器127に送られる。
【0028】動き補償予測器127では、動きベクトル
及び予測モードに基づいて、画像メモリ126から供給
された画像信号から予測差分画像を生成し、この予測差
分画像を演算器125に送る。
【0029】MPEG2では、前述したように、ビデオ
データ及びオーディオデータを同期して転送、且つ再生
できるように、それぞれのデータを基準時刻を用いて表
現した転送開始時刻と再生時刻を設定することが規定さ
れているが、これらの転送開始時刻や再生開始時刻の情
報だけでは、通常再生には問題がないものの、早送りや
巻き戻し再生、ランダム再生等の特殊再生や、インタラ
クティブ性をシステムに持たせる等の再生処理が困難で
あることが指摘されている。
【0030】このようなことから、特開平8−2733
04号公報に開示されているように、MPEGにて符号
化されたオーディオ及びビデオデータを所定時間内に再
生されるべきパック列としてビデオオブジェクトユニッ
ト内に格納し、さらに、このユニットを再生するための
再生情報及びサーチをするためのサーチ情報を、当該パ
ック列の先頭にナビゲーションデータとして記録したよ
うなアプリケーションが存在する。
【0031】ビデオオブジェクトユニット及びナビゲー
ションデータについては特開平8−273304号公報
にて既に開示及び詳述されているため、その詳細な説明
は省略するが、図10に示すように、ビデオオブジェク
トユニット85は複数集まってセル84を構成し、また
セル84は複数集まってビデオオブジェクト83を構成
し、さらに、このビデオオブジェクト83が複数集まっ
てビデオオブジェクトセット82を構成している。
【0032】ビデオオブジェクトユニット85は、1つ
のナビゲーションパック86を先頭に有するパック列と
して定義されている。また、このビデオオブジェクトユ
ニット85内には、MPEG規格に定められたビデオパ
ック88、副映像パック90及びオーディオパック91
が配置される。また、ビデオオブジェクトユニット85
には再生順序に従った番号が付されており、当該ビデオ
オブジェクトユニット85の再生時間はビデオオブジェ
クトユニット85中に含まれる単数又は複数個のGOP
から構成されるビデオデータの再生時間に相当する。
【0033】ナビゲーションパック86には、ビデオオ
ブジェクトユニット85を再生するための再生制御情報
及びサーチをするためのサーチ情報等が、ナビゲーショ
ンデータとして配されている。再生制御情報は、ビデオ
オブジェクトユニット85内のビデオデータの再生状態
に同期してプレゼンテーションするため、つまり表示の
内容を変更するためのナビゲーションデータである。す
なわち再生制御情報は、プレゼンテーションデータの状
態に従って再生条件を決定するための情報であり、デー
タストリーム上に分散配置されたリアルタイム制御デー
タである。また、サーチ情報は、ビデオオブジェクトユ
ニット85のサーチを実行する為のナビゲーションデー
タである。すなわち、当該サーチ情報は、順早送り/逆
早戻し再生とシームレス再生のための情報であり、デー
タストリーム上に分散配置されたリアルタイム制御デー
タである。
【0034】特に、ビデオオブジェクトユニット85を
サーチするためのサーチ情報には、セル84内の先頭ア
ドレスを特定する為の情報が記述される。すなわち、ビ
デオオブジェクトユニット85のサーチ情報には、当該
サーチ情報を含むビデオオブジェクトユニット85を基
準の第0番とし、再生順序に従って順方向に再生するた
めのアドレス(フォワードアドレス)として、第1番
(+1)から第20番(+20)、第60番(+6
0)、第120番(+120)及び第240番(+24
0)までのビデオオブジェクトユニット85の番号(ス
タートアドレス)が記載される。同様に、ビデオオブジ
ェクトユニット85のサーチ情報には、当該サーチ情報
を含むビデオオブジェクトユニット85を基準の第0番
とし、再生順序とは逆方向に再生するためのアドレス
(バックワードアドレス)として第1番(−1)から第
20番(−20)、第60番(−60)、第120番
(−120)及び第240番(−240)までのビデオ
オブジェクトユニット85のスタートアドレスが記載さ
れる。
【0035】
【発明が解決しようとする課題】ところで、上述のよう
なビデオオブジェクトユニットを再生するための再生制
御情報及びサーチをするためのサーチ情報を含むナビゲ
ーションデータを、MPEG符号化を開始する前に、ナ
ビゲーションパック内に記述するためには、記憶容量の
大きなメモリが必要であり、さらに当該符号化が終了し
た後に、その符号化結果(符号量)を観測して、所定の
再生情報情報を算出して、ナビゲーションデータを生成
しなければならない。
【0036】また、特開平8−273304号公報に記
載されているように、そのビデオオブジェクトユニット
を再生順序で第0番とし、そのビデオオブジェクトユニ
ットを基準として、少なくともその再生順序で前後15
番まで再生されるビデオオブジェクトユニットのアドレ
ス、再生順序において第20番、第30番、第60番、
第120番、及び第240番までのビデオオブジェクト
ユニットのアドレスを記述しようとした場合、基本的に
MPEGビデオの符号化データが可変長符号化によるも
のであるため、いわゆる2パスによる符号化などのよう
に、全部のビデオ符号化データが揃ってからでないと、
ビデオオブジェクトユニットのアドレスを算出すること
ができず、したがって、リアルタイムな符号化とナビゲ
ーションデータの記録が出来ない。
【0037】本発明は、上述の課題に鑑みてなされたも
のであり、最小限の容量のメモリで、ビデオオブジェク
トユニットを再生するための再生制御情報及びサーチを
するためのサーチ情報を記述するナビゲーションデータ
を、符号化が開始される前に記述することを可能とし、
また、どのような符号化レートであっても最適な画質を
維持したまま、リアルタイムな符号化とナビゲーション
データの記載とを可能とするデータ符号化方法及び装置
の提供を目的とする。
【0038】
【課題を解決するための手段】請求項1記載の本発明に
係るデータ符号化方法は、上述の課題を解決するため
に、所定単位の入力データを符号化する際に、符号化レ
ートを決定し、復号時の復号バッファに相当する仮想バ
ッファのバッファ占有量の推移を求めながら、符号化時
点での前記仮想バッファのバッファ占有量を所定の値に
収束するように符号化するデータ符号化方法において、
前記符号化レートに対応して前記所定単位毎の目標符号
量を求め、前記入力データのうち所定のリファレンスデ
ータについては、前記仮想バッファのバッファ占有量を
収束させる前記所定の値に基づいて設定された目標符号
量となるように符号化し、前記符号化された符号化デー
タを所定時間内に再生されるべきパック列としてユニッ
ト内に格納し、サーチのための基準ユニット及び当該基
準ユニットの少なくとも前後に再生される所定数のユニ
ットのアドレスと、当該ユニット内の前記所定のリファ
レンスデータの終了アドレスとを、前記符号化レートに
基づいて求め、前記ユニットのアドレス及び前記ユニッ
ト内の所定のリファレンスデータの終了アドレスを当該
ユニットの先頭に記述することを特徴とするものであ
【0039】請求項2記載の本発明に係るデータ符号化
方法は、上述の課題を解決するために、請求項1記載の
データ符号化方法において、前記ユニット内の所定のリ
ファレンスデータの符号化の際には、前記仮想バッファ
のバッファ占有量を収束させる前記所定の値に基づいて
設定された目標符号量に対して所定量だけ低く設定した
仮目標符号量を求め、当該仮目標符号量での符号化によ
る発生符号量と前記設定された目標符号量との差を無効
ビットで調整して符号化を行うことを特徴とするもので
ある
【0040】請求項3記載の本発明に係るデータ符号化
装置は、上述の課題を解決するために、所定単位の入力
データを符号化する際に、符号化レートを決定し、復号
時の復号バッファに相当する仮想バッファのバッファ占
有量の推移を求めながら、符号化時点での前記仮想バッ
ファのバッファ占有量を所定の値に収束するように符号
化するデータ符号化装置において、前記符号化レートに
対応して前記所定単位毎の目標符号量を求める目標符号
量計算手段と、前記入力データのうち所定のリファレン
スデータについては、前記仮想バッファのバッファ占有
量を収束させる前記所定の値に基づいて前記目標符号量
を設定する目標符号量設定手段と、前記目標符号量設定
手段からの前記目標符号量となるように前記所定のリフ
ァレンスデータを符号化する符号化手段と、前記符号化
された符号化データを所定時間内に再生されるべきパッ
ク列としてユニット内に格納するユニット化手段と、サ
ーチのための基準ユニット及び当該基準ユニットの少な
くとも前後に再生される所定数のユニットのアドレス
と、前記ユニット内の所定のリファレンスデータの終了
アドレスとを、前記符号化レートに基づいて求めるアド
レス決定手段と、前記ユニットのアドレス及び前記ユニ
ット内の所定のリファレンスデータの終了アドレスを当
該ユニットの先頭に記述する記述手段とを有することを
特徴とするものである
【0041】請求項4記載の本発明に係るデータ符号化
装置は、上述の課題を解決するために、請求項3記載の
データ符号化装置において、前記符号化制御手段は、前
記ユニット内の所定のリファレンスデータの符号化の際
に、前記仮想バッファのバッファ占有量を収束させる前
記所定の値に基づいて設定された目標符号量に対して所
定量だけ低く設定した仮目標符号量を求め、当該仮目標
符号量での符号化による発生符号量と前記設定された目
標符号量との差を無効ビットで調整するよう符号化を制
御することを特徴とするものである
【0042】
【0043】
【0044】
【発明の実施の形態】以下、図面を参照して本発明の実
施の形態の説明を行う。
【0045】図1には、本発明のデータ符号化方法及び
装置が適用される第1の実施の形態のオーディオビデオ
符号化装置の概略的な構成を示す。なお、図1には、ビ
デオデータの符号化を行うビデオエンコーダの構成を主
に示しており、オーディオデータの符号化を行うオーデ
ィオエンコーダの構成については図示を省略している。
【0046】この図1において、入力端子1には入力画
像信号が供給され、この入力画像信号は演算器2と動き
補償予測器11に送られる。
【0047】演算器2では、動き補償予測器11にて復
号化した画像信号と入力画像信号との差分を求め、その
差分画像信号をDCT器3に送る。なお、差分画像信号
の符号化を行うのはPピクチャ及びBピクチャの場合で
あり、Iピクチャの場合には入力画像信号をそのまま符
号化するが、以下の説明では差分画像信号を符号化する
場合を例に挙げて説明する。
【0048】DCT器3では、演算2から供給された
差分画像信号を直交変換する。このDCT器3でのDC
T処理によって得られたデータ(DCT係数)は、量子
化器4に送られる。
【0049】量子化器4では、DCT器3からのDCT
係数を量子化し、その量子化データを可変長符号化(V
LC)器5に送る。
【0050】VLC器5では、量子化器4からの量子化
データを可変長符号化する。また、このVLC器5に
は、動き補償予測器11から動きベクトルと予測モード
の情報も供給され、当該VLC器5は、可変長符号化デ
ータと共に、これら動きベクトルと予測モードの情報を
マクロブロックの付加情報として出力する。当該VLC
器5にて可変長符号化されたデータは、一時、バッファ
メモリ6に蓄えられた後、このバッファメモリ6から所
定の転送レートで読み出され、ビデオ符号化データとし
て後述するユニット化器17に送られる。
【0051】また、バッファメモリ6から出力されるビ
デオ符号化データにおけるマクロブロック毎の発生符号
量は、VBVバッファ制御器40に送信される。このV
BVバッファ制御器40は、詳細については後述する
が、復号時に復号バッファ占有量がオーバーフローやア
ンダーフローしないように、MPEGにおいてVBVバ
ッファと呼ばれている仮想的な復号バッファを設定し、
このVBVバッファの占有量に基づいて実際の符号化に
よる発生符号量を制御するものである。当該VBVバッ
ファ制御器40は、符号化の際の発生符号量制御のため
の符号量制御信号を発生し、量子化器4にフィードバッ
クする。この量子化器4にフィードバックされる符号量
制御信号は、量子化器4における量子化スケールを制御
するための信号である。
【0052】一方、量子化された画像データは、逆量子
化器7にも送られる。
【0053】逆量子化器7では、量子化器4からの量子
化データを逆量子化する。この逆量子化により得られた
DCT係数データは、逆DCT器8に送られる。
【0054】逆DCT器8では、逆量子化器7からのD
CT係数データを逆DCT処理した後、演算器9に送
る。
【0055】演算器9では、動き補償予測器11からの
予測差分画像と逆DCT器8からの信号とを加算する。
これにより、画像信号が復元される。この復元された画
像信号は、一時、画像メモリ10に蓄えられた後、動き
補償予測器11に送られる。当該画像メモリ10から動
き補償予測器11に送られた画像信号は、演算器2にて
差分画像を計算するためのリファレンスの復号化画像を
生成するために使用される。
【0056】動き補償予測器11では、入力画像信号か
ら動きベクトルを検出し、その検出した動きベクトルの
動き分だけ画像をシフトしてから予測を行う。この予測
により得られた予測差分画像信号が、演算器2及び演算
器9に送られることになる。また、動き補償予測器11
にて検出された動きベクトルは、予測モード(MCモー
ド)の情報と共に、VLC器5に送られる。
【0057】ここまでの構成は前述した図8と略々同様
であるが、本発明の第1の実施の形態のオーディオビデ
オ符号化装置では、更に以下のような構成を有してい
る。
【0058】オーディオビデオ符号化レート決定器13
では、これから符号化しようとするオーディオ及びビデ
オの符号化レートが決定される。なお、このオーディオ
及びビデオの符号化レートは、ユーザが決定しても、ま
た、自動的に設定されても良い。当該オーディオビデオ
符号化レート決定器13にて決定された符号化レート情
報は、VBVバッファ制御器40及びユニットアドレス
計算器15に送られる。
【0059】ここで、当該第1の実施の形態のオーディ
オビデオ符号化装置のVBVバッファ制御器40での処
理を、図2を用いて以下に説明する。
【0060】この図2において、VBVバッファ制御器
40の端子53には、バッファメモリ6からのマクロブ
ロック毎の発生符号量情報が入力される。また、端子5
2には、オーディオビデオ符号化レート決定器13にて
決定された符号化レート情報が入力され、端子51から
は、量子化器4に対する符号量制御信号(量子化スケー
ルを制御するための信号、すなわち量子化値)が出力さ
れる。
【0061】端子52に入力された符号化レート情報
は、目標符号量計算器56とVBVバッファ推移観測器
57とに送られる。目標符号量計算器56は、符号化レ
ート情報に基づいてピクチャ単位で目標となる符号量
(目標符号量)を計算する。
【0062】以下に、VBVバッファ制御器40におけ
るピクチャ単位での目標符号量の計算から発生符号量の
制御までの流れについて説明する。
【0063】例えば、ビデオオブジェクトユニットの目
標符号量をT(U)とし、また、1ビデオオブジェクトユ
ニットを1GOP、1GOPを15フレームとする。こ
の1ビデオオブジェクトユニットは時間にして0.5秒
に相当するので、当該ビデオオブジェクトユニット(1
GOPの15ピクチャ分)の目標符号量T(U)の計算式
は、例えば以下の式(1)のようになる。ただし、式中
のNは転送レート(Mbps)である。
【0064】 T(U)=N/2 (Mビット) (1) 目標符号量計算器56では、当該式(1)の計算によっ
て、ビデオオブジェクトユニット毎の目標符号量を求め
る。
【0065】次に、目標符号量計算器56では、こうし
て決定したビデオオブジェクトユニットの目標符号量に
基づいて、以下に説明するように、第1のステップによ
り各ピクチャ毎の目標符号量の設定(符号量配分)を行
う。
【0066】具体的に説明すると、VBVバッファ制御
器40の目標符号量計算器56では、当該第1のステッ
プとして、GOP内の各ピクチャに対する目標符号量
を、符号化対象のピクチャを含めGOP内で未だ符号化
されていないピクチャに対する目標符号量Rを基にして
配分する、この配分をGOP内の符号化ピクチャ順に繰
り返す。その際、以下のような2つの仮定を用いて各ピ
クチャへの目標符号量を設定する。
【0067】第1の仮定として、各ピクチャを符号化す
る際に用いる平均量子化スケールと発生符号量との積
は、画面が変化しない限りピクチャタイプ毎に一定値と
なると仮定する。各ピクチャを符号化した後、各ピクチ
ャタイプ毎に所定の重み付けパラメータ(例えば画面の
複雑さを示す重み付けパラメータ)Xi,Xp,Xb
を、以下の式(2)〜式(4)により更新する。
【0068】Xi=Si×Qi (2) Xp=Sp×Qp (3) Xb=Sb×Qb (4) なお、これら式中のiはIピクチャを、pはPピクチャ
を、bはBピクチャを表す。また、これら式中のSi,
Sp,Sbは各ピクチャの一つ前の同ピクチャタイプの
符号化結果の発生符号量であり、Qi,Qp,Qbは各
ピクチャの符号化時の平均量子化スケールである。すな
わち、重み付けパラメータXi,Xp,Xbは、これら
式(2)〜式(4)から、一つ前の同ピクチャタイプの
符号化結果の発生符号量Sと平均量子化スケールQの積
で定義される。
【0069】また、第2の仮定として、独立符号化され
るIピクチャの量子化スケールQiを基準とし、このI
ピクチャの量子化スケールQiとPピクチャの量子化ス
ケールQpとの比率KpがKp=1.0、Iピクチャの
量子化スケールQiとBピクチャの量子化スケールQb
との比率KbがKb=1.4となるときに、常に全体の
画質が最適化される(理想的な画質が達成される)と仮
定する。
【0070】これら第1,第2の仮定の元で、目標符号
量計算器40では、例えば以下の式(5)〜(7)によ
り、Iピクチャの目標符号量Ti、Pピクチャの目標符
号量Tp、Bピクチャの目標符号量Tbを求める。
【0071】
【数1】 ただし、これら式(5)〜式(7)中のNp,NbはG
OP内のPピクチャやBピクチャの未符号化ピクチャ枚
数である。
【0072】すなわち、先ず、GOP内の未符号化ピク
チャのうち、符号化対象となるピクチャとピクチャタイ
プの異なるピクチャについては、上述した画質最適化条
件のもとで、そのピクチャの発生する符号量が、符号化
対象ピクチャの発生符号量の何倍となるか推定する。
【0073】次に、未符号化ピクチャ全体で発生する推
定符号量が、符号化対象ピクチャの何枚分の符号量に相
当するかを求める。符号化対象ピクチャに対する目標符
号量は、未符号化ピクチャに対する目標符号量Rを、こ
の枚数で割ることによって与えられる。このようにして
求めた目標符号量を基にして、各ピクチャタイプを符号
化する毎に、GOP内の未符号化ピクチャに対する目標
符号量Rを、下記式(8)〜式(10)のように更新す
る。
【0074】R=R−Si (8) R=R−Sp (9) R=R−Sb (10) 次に、VBVバッファ制御器40では、目標符号量発生
符号量比較器55において、目標符号量計算器56の第
1のステップで求められた各ピクチャに対する目標符号
量Ti,Tp,Tbと、図2の端子53を介してバッフ
ァメモリ6から供給された実際の発生符号量とを比較
し、各ピクチャの目標符号量に対する発生符号量との誤
差符号量を生成する。この誤差符号量情報は、フィード
バック量子化値決定器54に送られる。
【0075】当該フィードバック量子化値決定器4で
は、第2のステップとして、各ピクチャに対する目標符
号量Ti,Tp,Tbと実際の発生符号量とを一致させ
るために、各ピクチャタイプ毎に独立に設定した3種類
の仮想バッファの容量を元に、量子化スケールをマクロ
ブロック単位のフィードバック制御で求める。
【0076】すなわち、先ず、例えばj番目のマクロブ
ロックの符号化に先立ち、仮想バッファの占有量を、下
記式(11)〜(13)にて求める。
【0077】
【数2】 これら式中のd0i,d0p,d0bは各ピクチャタイプ
毎の仮想バッファの初期占有量で、Bjはピクチャの先
頭からj番目のマクロブロックまでの発生ビット量、M
B_cntはIピクチャ内のマクロブロック数である。
【0078】次に、j番目のマクロブロックに対する量
子化スケールQjを下記式(14)により計算する。
【0079】Qj=dj×31/r (14) なお、式中のrはフィードバックの応答速度を決定する
パラメータであり、当該rは下記式(15)で与えられ
る。
【0080】 r=2×bit_rate/picture_rata (15) 上述したアルゴリズムは、MPEG標準化で使用された
テストモデルTM5に記載されており、1995年テレ
ビジョン学会誌vol49、No.4、P455〜456にも掲載
されている。
【0081】ここで、本発明の第1の実施の形態のオー
ディオビデオ符号化装置の場合、VBVバッファ制御器
40では、前述したように目標符号量計算器56が第1
のステップとして各ピクチャの目標符号量を計算した時
点で、VBVバッファ推移観測器57において、前記V
BVバッファの推移をその目標符号量で符号化したと仮
定した場合のVBVバッファ値を予め予想し、その予想
値の基づいて目標符号量を設定するようにしている。す
なわち、VBVバッファ推移観測器57では、端子53
を介してバッファメモリ6から供給される発生符号量
と、端子52を介してオーディオビデオ符号化レート決
定器13から供給される符号化レートとに基づいて、V
BVバッファ量を監視し、そのVBVバッファ量に基づ
いて、目標符号量計算器56が第1のステップにて設定
した目標符号量を設定するようにしている。
【0082】ところで、一般的なMPEGにおけるVB
Vバッファ制御器は、本来は、図3に示すように、復号
装置において復号を行ったとした場合に復号バッファ
(符号化装置におけるVBVバッファ)の占有値がどの
ように推移しているかを予想しながら符号量を制御する
ものである。当該予想に用いるバッファ(VBVバッフ
ァ)はあくまで仮想バッファであるが、MPEGではC
BR(constant bit rate)の場合に、当該VBVバッ
ファの最大容量(MaxValue値)をオーバーフローしない
ように、また、最小容量(0)をアンダーフローしない
ように制御しながら符号化を行わなければならない。な
お、図3の縦軸はこの仮想的な復号装置の復号バッファ
(すなわちVBVバッファ)の占有量を表し、横軸は時
間を表している。また、バッファ占有量の変化を表す傾
きは、転送レートすなわち符号化レートに相当する。
【0083】この図3では、標準テレビジョン放送方式
のNTSC(National TelevisionSystem Committee)
に対応したビデオ信号を符号化した場合を例に上げてお
り、したがって、各ピクチャの復号タイミングは1/2
9.97秒単位で行われることになる。すなわち、復号
バッファ(VBVバッファ)には、ビデオオブジェクト
ユニットの第1番目のピクチャであるIピクチャの12
0Kビットの圧縮データが初期値として溜められ、その
後、この120Kビット分のデータが読み出されて復号
されることになる。ただし、当該VBVバッファにおけ
る復号は仮想的な復号であり、MPEGで規定したモデ
ルでは時間0で一瞬にして復号されることになるため、
このときのVBVバッファ(復号バッファ)からは12
0Kビットのデータが一瞬に抜き取られる。次に、1/
29.97秒かけて第2番目のピクチャであるPピクチ
ャの80Kビット分の圧縮データが当該復号バッファ
(VBVバッファ)に入力され、その後、当該Pピクチ
ャの復号のためにその80Kビットの圧縮データが一瞬
にして抜き取られる。次に、1/29.97秒かけて第
3番目のピクチャであるBピクチャの40Kビット分の
圧縮データが当該復号バッファ(VBVバッファ)に入
力され、その後、当該Bピクチャの復号のためにその4
0Kビットの圧縮データが一瞬にして抜き取られる。以
下、各ピクチャについて上述同様のデータ入力と抜き取
り処理がなされる。
【0084】このように、MPEGにおける一般的なV
BVバッファ制御は、復号バッファ(VBVバッファ)
に入力される圧縮データの転送レート、すなわち図3の
グラフの直線の傾きに相当する符号化レートに依存す
る。
【0085】これに対し、本発明の第1の実施の形態の
オーディオビデオ符号化装置では、VBVバッファ制御
器40のVBVバッファ推移観測器57において、端子
53を介してバッファメモリ6から供給される発生符号
量と、端子52を介してオーディオビデオ符号化レート
決定器13から供給される符号化レートとに基づいてV
BVバッファ量を監視し、図3と同様に表記する図4に
示すように、ビデオオブジェクトユニット内で最初に他
の画像の復号のために参照されることになる第1のリフ
ァレンス画像の符号化時点(すなわち独立符号化される
画像データであるIピクチャの符号化時点)では、当該
VBVバッファ占有値を図中VBV値1に収束するよう
にし、次に、他の画像の復号のために参照されることに
なる第2のリファレンス画像の復号化時点(すなわち最
初のPピクチャの符号化時点)では、VBVバッファ占
有値を図中VBV値2に収束するように、さらに次に、
他の画像の復号のために参照されることになる第3のリ
ファレンス画像の復号化時点(すなわち次のPピクチャ
の符号化時点)では、VBVバッファ占有値を図中VB
V値3に収束するようにする処理を繰り返し、ビデオオ
ブジェクトユニットの最後の画像符号化時点(すなわち
最後のBピクチャの符号化時点)のVBVバッファ占有
値を図中VBV値Eに収束するように、目標符号量計算
器56が第1のステップにて設定した目標符号量を設定
するようにしている。
【0086】このように、VBVバッファ制御器40に
おいて、独立符号化されるIピクチャと、復号時に他の
画像の参照画像となるPピクチャと、ビデオオブジェク
トユニットの最後のBピクチャの目標符号量とを設定
ることにより、後述するユニットアドレス計算器15に
おいて、サーチのための基準ユニット及び当該基準ユニ
ットの少なくとも前後に再生される所定数のユニットの
アドレスと、当該ユニット内のデータのうち前記独立符
号化されるIピクチャ、及び復号時に他のデータの参照
データとなされるPピクチャ、及びビデオオブジェクト
ユニットの最後のBピクチャの各終了アドレスの計算が
非常に容易となり、予め指定したアドレス値に簡単に制
御することが可能となる。
【0087】図1に戻り、ユニットアドレス計算器15
では、図4にて説明したのと同様のVBV値1〜VBV
値Eと転送レート情報(符号化レート情報)とを用い、
以下に説明する各式によって、図5に示すようにビデオ
オブジェクトユニット内で最初に他の画像の復号のため
に参照されることになる第1のリファレンス画像(独立
符号化される画像データであるIピクチャ)の終了アド
レス1EAを計算し、他の画像の復号のために参照され
ることになる第2のリファレンス画像(最初のPピクチ
ャ)の終了アドレス2EAを計算し、次に他の画像の復
号のために参照されることになる第3のリファレンス画
像(次のPピクチャ)の終了アドレス3EAを計算し、
以下同様に、各リファレンス画像の終了アドレスを計算
し、さらに、ビデオオブジェクトユニットの最後の画像
(最後のBピクチャ)の終了アドレスTEAを計算す
る。
【0088】ここで、オーディオビデオ符号化レート決
定器13からの符号化レート情報のうち、ビデオデータ
の符号化レートをVideoRate(kbps)とし、オーデ
ィオデータの符号化レートをAudioRate(kbps)と
すると、ビデオオブジェクトユニットの最後の画像(B
ピクチャ)の終了アドレスTEAは、次式(16)のよ
うに算出される。
【0089】 TEA=(VideoRate+AudioRate)×15/29.97 (16) また、VBVバッファに予め設定した最大容量をMaxVal
ueとし、図5に示したように、ビデオオブジェクトユニ
ット内のIピクチャの終了アドレスを1EAとし、ビデ
オオブジェクトユニット内の最初のPピクチャの終了ア
ドレスを2EA、ビデオオブジェクトユニット内の次の
Pピクチャの終了アドレスを3EAとすると、これら終
了アドレス1EA〜3EAは、下記式(17)〜式(1
9)のように算出される。
【0090】 1EA =(MaxValue-VBV値1)+(AudioRate)×1/29.97 (17) 2EA =(MaxValue-VBV値1)+(VideoRate)×3/29.97-(VBV値2-VBV値1) +(AudioRate)×4/29.97 (18) 3EA =(MaxValue-VBV値1)+(VideoRate)×6/29.97-(VBV値3-VBV値1) +(AudioRate)×7/29.97 (19) 但し、これら式(16)〜式(19)において単位はk
ビット、ビデオオブジェクトユニットは15フレームで
丁度1GOP、IピクチャやPピクチャの間にあるBピ
クチャは2枚であることが分かっていると仮定する。ま
た、オーディオデータは固定転送レートと仮定し、単位
時間当たりのサンプル数を固定としているが、オーディ
オデータの符号化が可変長符号化であれば、ビデオデー
タに対応した位置の(ビデオデータが出力される時間に
対応する)オーディオデータの符号量を考慮して計算す
ればよい。また、このようなことは、目標符号量計算器
56、後述する目標符号量メモリをオーディオ用に装備
することにより実現可能である。
【0091】上述したように、本実施の形態のオーディ
オビデオ符号化装置によれば、VBVバッファ制御器4
0において、独立符号化されるIピクチャと復号時に他
の画像の参照画像となるPピクチャとビデオオブジェク
トユニットの最後のBピクチャの目標符号量とを設定
ると共に、それら目標符号量に合うように発生符号量を
制御し、また、ユニットアドレス計算器15において、
サーチのための基準ユニット及び当該基準ユニットの少
なくとも前後に再生される所定数のユニットのアドレス
と当該ユニット内のデータのうち前記独立符号化される
Iピクチャ、及び復号時に他のデータの参照データとな
されるPピクチャ、ビデオオブジェクトユニットの最後
のBピクチャの各終了アドレスを計算することにより、
図10に示したようなビデオオブジェクトユニットを再
生するためのサーチ情報を記録するナビゲーションデー
タ、すなわち、サーチのためにそのビデオオブジェクト
ユニットを基準として少なくとも前後に再生される所定
数のユニットのアドレス(TEA)と、独立符号化され
た画像(Iピクチャ)を構成できるデータの終了アドレ
ス(第1のリファレンス画像の終了アドレス1EA)、
及び第2,第3,・・・のリファレンス画像までの各終
了アドレス(2EA,3EA,・・・)を、予め指定し
た値に簡単に制御することが可能となる。
【0092】このユニットアドレス計算器15にて求め
られた情報は、ナビゲーションデータ生成器16に送ら
れる。
【0093】ナビゲーションデータ生成器16は、その
ビデオオブジェクトユニットを再生順序で第0番とし
て、そのビデオオブジェクトユニットを基準として少な
くともその再生順序で前後15番まで再生されるビデオ
オブジェクトユニット、再生順序において第20番、第
30番、第60番、第120番、及び第240番までの
ビデオオブジェクトユニットのアドレスなどを、必要に
応じてアドレスをスカラー倍することで計算し、所定の
順番にレイアウトして、ユニット化器17へ送信する。
【0094】ユニット化器17では、端子19から供給
されたオーディオ符号化データと、バッファメモリ6か
ら供給されたビデオ符号化データと、ナビゲーションデ
ータ生成器16から供給されたナビゲーションデータと
を用いて、図10にて説明したようなビデオオブジェク
トユニットを生成し、そのユニット化された符号化デー
タを出力する。すなわち当該ユニット化器17では、送
信されてきたナビゲーションデータをパケット化(パッ
ク化)すると共にビデオ符号化データとオーディオ符号
化データなどをパケット化(パック化)し、さらにナビ
ゲーションデータのパケット(ナビゲーションパック)
を先頭に配置し、その後にビデオデータのパケット(ビ
デオパック)とオーディオデータのパケット(オーディ
オパック)などを配置して、所定の1つのビデオオブジ
ェクトユニットを生成し、この1つのビデオオブジェク
トユニットを送信する。当該1つのビデオオブジェクト
ユニットを送信し終わると、次のビデオオブジェクトユ
ニットのためのナビゲーションデータを受け取って同様
にユニット化する。これらのユニット化された符号化デ
ータは出力端子18から出力される。
【0095】上述したように本発明の第1の実施の形態
のオーディオビデオ符号化装置においては、余分なメモ
リを持たずに、ビデオオブジェクトユニットを再生する
ための再生制御情報及びサーチをするためのサーチ情報
を記述するナビゲーションデータを、符号化が開始され
る前に、記録することが可能となる。
【0096】次に、図6には、本発明の第2の実施の形
態のオーディオビデオ符号化装置の概略構成を示す。な
お、この図6に示すオーディオビデオ符号化装置におい
て、図1と同一の構成要素には同じ指示符号を付し、そ
れらの説明は省略し、図1とは異なる構成要素について
のみ説明する。
【0097】この図6に示す第2の実施の形態のオーデ
ィオビデオ符号化装置では、VLC器5とバッファメモ
リ6との間に後述する無効ビット付加器22を設けると
共に、VBVバッファ制御器41が図7ような構成を有
している。なお、図7において、前述した図2と同一の
構成要素には同じ指示符号を付し、それらの説明は省略
し、図2と異なる構成要素についてのみ説明する。
【0098】図7に示すVBVバッファ制御器41にお
いて、端子53を介してバッファメモリ6から供給され
た発生符号量情報は、目標符号量発生符号量比較器55
に送られると同時に、無効ビット計算器68にも送られ
る。
【0099】目標符号量計算器56は前述同様であり符
号化レート情報に基づいて各ピクチャの目標符号量を求
める。また、この第2の実施の形態においても、VBV
バッファ推移観測器57によって、VBVバッファの占
有量を前述したVBV値1〜VBV値Eの値に収束させ
るべきタイミングは、それぞれ、独立符号化される画像
である第1リファレンス画像(Iピクチャ)及び、第2
リファレンス画像(最初のPピクチャ)、第3リファレ
ンス画像(次のPピクチャ)、・・・、及びビデオオブ
ジェクトユニットの最終画像(最後のBピクチャ)の符
号化時点である。なお、以下の説明では、これらのVB
Vバッファの値がVBV値1〜VBV値Eに収束される
各画像を収束点画像と呼ぶとする。
【0100】目標符号量メモリ67は、目標符号量計算
器56から供給された目標符号量情報を一時蓄積し、そ
の後読み出して仮目標符号量設定器66と無効ビット計
算器68に供給する。
【0101】仮目標符号量設定器66は、目標符号量メ
モリ67から供給された目標符号量の値の約10%程度
低めの値を、仮目標符号量として設定する。
【0102】ここで、上述した各収束点画像の目標符号
量は、当該仮目標符号量設定器66において、上記目標
符号量計算器56にて算出された目標符号量の約10%
程度低めに設定される。この仮目標符号量は、目標符号
量発生符号量比較器55に送られる。
【0103】したがって、この図7の場合、目標符号量
発生符号量比較器55は、端子53を介してバッファメ
モリ6から供給された発生符号量と、仮目標符号量設定
器66にて設定された仮目標符号量とを比較し、仮目標
符号量に対する発生符号量との誤差符号量を生成する。
この誤差符号量情報は、フィードバック量子化値決定器
54に送られる。これにより、発生符号量は、仮目標符
号量に制御される。
【0104】一方、無効ビット計算器68では、1ピク
チャ分の符号化が終了した時点で、予めバッファメモリ
6から入力されたマクロブロック毎の発生符号量を加算
して、1ピクチャの総発生符号量とピクチャの目標符号
量との差を計算し、ピクチャの目標符号量に足りない分
の符号量を、無効ビット符号量情報として出力する。こ
の無効ビット符号量情報は、端子59を介して図6の無
効ビット付加器22に送られる。
【0105】図6の無効ビット付加器22では、VLC
器5からの符号化データに、VBVバッファ制御器4
からの無効ビット符号量情報に対応した無効ビットを付
加する。これにより、当該無効ビット付加器22から出
力されるデータは、目標符号量に合うように正確に制御
されたデータとなり、この符号化データがバッファメモ
リ6に送られる。
【0106】また、無効ビット計算器68からの無効ビ
ット符号量情報は、VBVバッファ推移観測器57にも
送信される。VBVバッファ推移観測器57では、当該
無効ビット符号量の値も前述の収束点画像の符号量とし
てカウントする。
【0107】なお、収束点画像のみでは、収束不可能な
場合も考えられる。すなわち、収束点画像以前のピクチ
ャが大きな符号量を発生してしまう可能性である。した
がって、本実施の形態では、ある画像に対して多くの符
号量を割り当てたい場合であっても、下記式(20)に
適合するように、その画像に対する符号量を配分するこ
とが望ましい。
【0108】 (収束点画像nから次の収束点画像n+1までの画像の枚数)×(VideoRate/29.9 7)−(VBV値n−VBV値n-1) (20) この第2の実施の形態のオーディオビデオ符号化装置に
よれば、第1の実施の形態のオーディオビデオ符号化装
置と同様の効果を有するだけでなく、符号量を1バイト
の誤差も含まずに非常に正確に制御できるので、ナビゲ
ーションデータの内容と実際の符号化データとが矛盾す
る可能性を非常に低くすることが可能である。
【0109】
【発明の効果】請求項1記載の本発明に係るデータ符号
化方法は、所定単位の入力データを符号化する際に、符
化レートを決定し、復号時の復号バッファに相当する
仮想バッファのバッファ占有量の推移を求めながら、符
号化時点での前記仮想バッファのバッファ占有量を所定
の値に収束するように符号化するデータ符号化方法にお
いて、前記符号化レートに対応して前記所定単位毎の目
標符号量を求め、前記入力データのうち所定のリファレ
ンスデータについては、前記仮想バッファのバッファ占
有量を収束させる前記所定の値に基づいて設定された目
標符号量となるように符号化し、前記符号化された符号
化データを所定時間内に再生されるべきパック列として
ユニット内に格納し、サーチのための基準ユニット及び
当該基準ユニットの少なくとも前後に再生される所定数
のユニットのアドレスと、当該ユニット内の前記所定の
リファレンスデータの終了アドレスとを、前記符号化レ
ートに基づいて求め、前記ユニットのアドレス及び前記
ユニット内の所定のリファレンスデータの終了アドレス
を当該ユニットの先頭に記述することにより、最小限の
容量のメモリを用いて、例えばユニットを再生するため
の再生制御情報及びサーチをするためのサーチ情報を記
述するためのアドレスを、符号化が開始される前に記録
することが可能であり、また、符号化レート値に対応す
る目標符号量を決定できるので、符号化を行うに当っ
て、それらの値を統計的にもっとも信号品質が良くなる
値にすることで、どのような符号化レートでも最適な信
号品質を維持したまま、符号化を行うことが可能とな
る。
【0110】請求項2記載の本発明に係るデータ符号化
方法は、請求項1記載のデータ符号化方法において、前
記ユニット内の所定のリファレンスデータの符号化の際
には、前記仮想バッファのバッファ占有量を収束させる
前記所定の値に基づいて設定された目標符号量に対して
所定量だけ低く設定した仮目標符号量を求め、当該仮目
標符号量での符号化による発生符号量と前記設定された
目標符号量との差を無効ビットで調整して符号化を行う
ことにより、符号量を非常に正確に制御でき、実際の符
号化データとアドレスとが矛盾する可能性を非常に低く
することが可能である。
【0111】請求項3記載の本発明に係るデータ符号化
装置は、所定単位の入力データを符号化する際に、符号
化レートを決定し、復号時の復号バッファに相当する仮
想バッファのバッファ占有量の推移を求めながら、符号
化時点での前記仮想バッファのバッファ占有量を所定の
値に収束するように符号化するデータ符号化装置におい
て、前記符号化レートに対応して前記所定単位毎の目標
符号量を求める目標符号量計算手段と、前記入力データ
のうち所定のリファレンスデータについては、前記仮想
バッファのバッファ占有量を収束させる前記所定の値に
基づいて前記目標符号量を設定する目標符号量設定手段
と、前記目標符号量設定手段からの前記目標符号量とな
るように前記所定のリファレンスデータを符号化する符
号化手段と、前記符号化された符号化データを所定時間
内に再生されるべきパック列としてユニット内に格納す
るユニット化手段と、サーチのための基準ユニット及び
当該基準ユニットの少なくとも前後に再生される所定数
のユニットのアドレスと、前記ユニット内の所定のリフ
ァレンスデータの終了アドレスとを、前記符号化レート
に基づいて求めるアドレス決定手段と、前記ユニットの
アドレス及び前記ユニット内の所定のリファレンスデー
タの終了アドレスを当該ユニットの先頭に記述する記述
手段とを有することにより、最小限の容量のメモリで、
例えばユニットを再生するための再生制御情報及びサー
チをするためのサーチ情報を記述するためのアドレス
を、符号化が開始される前に記録することが可能であ
り、また、符号化レート値に対応する目標符号量を決定
できるので、符号化を行うに当って、それらの値を統計
的にもっとも信号品質が良くなる値にすることで、どの
ような符号化レートでも最適な信号品質を維持したま
ま、符号化を行うことが可能となる。
【0112】請求項4記載の本発明に係るデータ符号化
装置は、請求項3記載のデータ符号化装置において、前
記符号化制御手段は、前記ユニット内の所定のリファレ
ンスデータの符号化の際に、前記仮想バッファのバッフ
ァ占有量を収束させる前記所定の値に基づいて設定され
た目標符号量に対して所定量だけ低く設定した仮目標符
号量を求め、当該仮目標符号量での符号化による発生符
号量と前記設定された目標符号量との差を無効ビットで
調整するよう符号化を制御することにより、符号量を非
常に正確に制御でき、実際の符号化データとアドレスと
が矛盾する可能性を非常に低くすることが可能である。
【0113】
【0114】
【図面の簡単な説明】
【図1】本発明の第1の実施の形態のオーディオビデオ
符号化装置の概略構成を示すブロック図である。
【図2】本発明の第1の実施の形態のオーディオビデオ
符号化装置のVBVバッファ制御器の具体的構成をブロ
ック図である。
【図3】符号化の際の一般的な仮想復号バッファ(VB
Vバッファ)占有量制御の説明に用いる図である。
【図4】本発明の実施の形態のオーディオビデオ符号化
装置による符号化の際の仮想復号バッファ(VBVバッ
ファ)占有量のバッファ制御タイミングと収束値の説明
に用いる図である。
【図5】ユニットアドレス計算器の計算内容の説明に用
いる図である。
【図6】本発明の第2の実施の形態のオーディオビデオ
符号化装置の概略構成を示すブロック図である。
【図7】本発明の第2の実施の形態のオーディオビデオ
符号化装置のVBVバッファ制御器の具体的構成をブロ
ック図である。
【図8】従来のビデオエンコーダの概略構成を示すブロ
ック図である。
【図9】従来のビデオデコーダの概略構成を示すブロッ
ク図である。
【図10】ビデオオブジェクトユニットとナビゲーショ
ンデータが配されるビデオオブジェクトセットの構成説
明に用いる図である。
【符号の説明】
1…画像信号の入力端子、2、9…演算器、3…DCT
器、4…量子化器、5…VLC、6…バッファメモリ、
7…逆量子化器、8…逆DCT器、10…画像メモリ、
11…動き補償予測器、13…オーディオビデオ符号化
レート決定器(符号化レート決定手段)、15…ユニッ
トアドレス計算器(アドレス決定手段)、16…ナビゲ
ーションデータ生成器(記述手段)、17…ユニット化
器(ユニット化手段)、18…出力端子、19…オーデ
ィオ符号化のデータ入力端子、22…無効ビット付加
器、40,41…VBVバッファ制御器(符号量制御手
段)、51…符号量制御信号の出力端子、52…符号化
レート情報の入力端子、53…発生符号量の入力端子、
54…フィードバック量子化値決定器、55…目標符号
量発生符号量比較器、56…目標符号量計算器(目標符
号量計算手段)、57…VBVバッファ推移観測器(バ
ッファ推移観測手段)、66…仮目標符号量設定器、6
7…目標符号量メモリ、68…無効ビット計算器、59
…無効ビット符号量情報の出力端子
フロントページの続き (56)参考文献 特開 平7−284097(JP,A) 特開 平11−74799(JP,A) 特開2000−23096(JP,A) 特開2000−83255(JP,A) 国際公開97/039588(WO,A1) (58)調査した分野(Int.Cl.7,DB名) H03M 3/00 - 11/00 H04N 7/24

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】 所定単位の入力データを符号化する
    に、符号化レートを決定し、復号時の復号バッファに相
    当する仮想バッファのバッファ占有量の推移を求めなが
    ら、符号化時点での前記仮想バッファのバッファ占有量
    を所定の値に収束するように符号化するデータ符号化方
    法において、 前記符号化レートに対応して前記所定単位毎の目標符号
    量を求め、 前記入力データのうち所定のリファレンスデータについ
    ては、前記仮想バッファのバッファ占有量を収束させる
    前記所定の値に基づいて設定された目標符号量となるよ
    うに符号化し、 前記符号化された符号化データを所定時間内に再生され
    るべきパック列としてユニット内に格納し、 サーチのための基準ユニット及び当該基準ユニットの少
    なくとも前後に再生される所定数のユニットのアドレス
    と、当該ユニット内の前記所定のリファレンスデータの
    終了アドレスとを、前記符号化レートに基づいて求め、 前記ユニットのアドレス及び前記ユニット内の所定のリ
    ファレンスデータの終了アドレスを当該ユニットの先頭
    に記述 することを特徴とするデータ符号化方法。
  2. 【請求項2】 前記ユニット内の所定のリファレンスデ
    ータの符号化の際には、前記仮想バッファのバッファ占
    有量を収束させる前記所定の値に基づいて設定された目
    標符号量に対して所定量だけ低く設定した仮目標符号量
    を求め、当該仮目標符号量での符号化による発生符号量
    と前記設定された目標符号量との差を無効ビットで調整
    して符号化を行うことを特徴とする請求項1記載のデー
    タ符号化方法。
  3. 【請求項3】 所定単位の入力データを符号化する際
    に、符号化レートを決定し、復号時の復号バッファに相
    当する仮想バッファのバッファ占有量の推移を求めなが
    ら、符号化時点での前記仮想バッファのバッファ占有量
    を所定の値に収束するように符号化するデータ符号化装
    置において、 前記符号化レートに対応して前記所定単位毎の目標符号
    量を求める目標符号量計算手段と、 前記入力データのうち所定のリファレンスデータについ
    ては、前記仮想バッファのバッファ占有量を収束させる
    前記所定の値に基づいて前記目標符号量を設定する目標
    符号量設定手段と、 前記目標符号量設定手段からの前記目標符号量となるよ
    うに前記所定のリファレンスデータを符号化する符号化
    手段と、 前記符号化された符号化データを所定時間内に再生され
    るべきパック列としてユニット内に格納するユニット化
    手段と、 サーチのための基準ユニット及び当該基準ユニットの少
    なくとも前後に再生される所定数のユニットのアドレス
    と、前記ユニット内の所定のリファレンスデータの終了
    アドレスとを、前記符号化レートに基づいて求めるアド
    レス決定手段と、 前記ユニットのアドレス及び前記ユニット内の所定のリ
    ファレンスデータの終了アドレスを当該ユニットの先頭
    に記述する記述手段とを有する ことを特徴とするデータ
    符号化装置
  4. 【請求項4】 前記符号化制御手段は、前記ユニット内
    の所定のリファレンスデータの符号化の際に、前記仮想
    バッファのバッファ占有量を収束させる前記所定の値に
    基づいて設定された目標符号量に対して所定量だけ低く
    設定した仮目標符号量を求め、当該仮目標符号量での符
    号化による発生符号量と前記設定された目標符号量との
    差を無効ビットで調整するよう符号化を制御することを
    特徴とする請求項3記載のデータ符号化装置。
JP06735799A 1999-03-12 1999-03-12 データ符号化方法及び装置 Expired - Lifetime JP3521794B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP06735799A JP3521794B2 (ja) 1999-03-12 1999-03-12 データ符号化方法及び装置
US09/467,862 US6567554B1 (en) 1999-03-12 1999-12-20 Data coding method and apparatus therefor
EP19990125505 EP1037472B1 (en) 1999-03-12 1999-12-21 Data coding method and apparatus therefor
DE1999620166 DE69920166T2 (de) 1999-03-12 1999-12-21 Datencodierungsverfahren und -vorrichtung
US10/386,445 US6888967B2 (en) 1999-03-12 2003-03-13 Data coding method and apparatus therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP06735799A JP3521794B2 (ja) 1999-03-12 1999-03-12 データ符号化方法及び装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2003428093A Division JP3852442B2 (ja) 2003-12-24 2003-12-24 データ符号化方法及び装置

Publications (2)

Publication Number Publication Date
JP2000269820A JP2000269820A (ja) 2000-09-29
JP3521794B2 true JP3521794B2 (ja) 2004-04-19

Family

ID=13342694

Family Applications (1)

Application Number Title Priority Date Filing Date
JP06735799A Expired - Lifetime JP3521794B2 (ja) 1999-03-12 1999-03-12 データ符号化方法及び装置

Country Status (1)

Country Link
JP (1) JP3521794B2 (ja)

Also Published As

Publication number Publication date
JP2000269820A (ja) 2000-09-29

Similar Documents

Publication Publication Date Title
EP1372113B1 (en) Variable bit rate video encoding method and device
US7418037B1 (en) Method of performing rate control for a compression system
EP1515563A2 (en) Systems and methods for selecting a macroblock mode in a video encoder
US6229849B1 (en) Coding device and method
JP4273207B2 (ja) ディジタルビデオデータを符号化又は復号化する方法及び装置
JP2003018603A (ja) 動画像符号化方法及び装置
US6567554B1 (en) Data coding method and apparatus therefor
EP1086593A1 (en) Sequence adaptive bit allocation for pictures encoding
JP3259702B2 (ja) 動画像可変ビットレート符号化装置および方法
US20100172410A1 (en) Encoding device, method for adjusting target amount of code and record medium
JP3508916B2 (ja) 動画像可変ビットレート符号化方法および装置
US6580755B1 (en) Apparatus and method for encoding
US20030174771A1 (en) Method, apparatus, and program for variable bit rate encoding
JP4171934B2 (ja) 画像処理装置および方法、並びに記録媒体
JP2008263443A (ja) 情報処理装置および方法、並びにプログラム
JP3646849B2 (ja) ステレオ動画像用符号化装置
JP3521794B2 (ja) データ符号化方法及び装置
JPH10336586A (ja) 画像処理装置および画像処理方法
JP3651302B2 (ja) データ符号化方法及び装置
JP3852442B2 (ja) データ符号化方法及び装置
JP4747109B2 (ja) 演算量調整装置
JP3934772B2 (ja) 可変転送レート符号化方法および装置
JPH1023432A (ja) 画像の圧縮符号化装置
JP3922581B2 (ja) 可変転送レート符号化方法および装置
JP4239734B2 (ja) 符号化装置、および、符号化方法、並びに、プログラム

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20031224

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040120

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040202

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090220

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090220

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100220

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110220

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120220

Year of fee payment: 8

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120220

Year of fee payment: 8

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120220

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130220

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130220

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140220

Year of fee payment: 10

EXPY Cancellation because of completion of term