JPH09261631A - 目標符号量制御方法 - Google Patents

目標符号量制御方法

Info

Publication number
JPH09261631A
JPH09261631A JP7285596A JP7285596A JPH09261631A JP H09261631 A JPH09261631 A JP H09261631A JP 7285596 A JP7285596 A JP 7285596A JP 7285596 A JP7285596 A JP 7285596A JP H09261631 A JPH09261631 A JP H09261631A
Authority
JP
Japan
Prior art keywords
bit amount
image
data
picture
target code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7285596A
Other languages
English (en)
Other versions
JP3767007B2 (ja
Inventor
Kanji Mihara
寛司 三原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP07285596A priority Critical patent/JP3767007B2/ja
Priority to US08/820,007 priority patent/US6100931A/en
Priority to DE69740013T priority patent/DE69740013D1/de
Priority to EP97301871A priority patent/EP0797359B1/en
Publication of JPH09261631A publication Critical patent/JPH09261631A/ja
Priority to US09/201,518 priority patent/US6324214B2/en
Priority to US09/201,517 priority patent/US6198769B1/en
Application granted granted Critical
Publication of JP3767007B2 publication Critical patent/JP3767007B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

(57)【要約】 【課題】 適切なビット量の割り当てを実現して、復元
時における画像の画質を向上させることを目的とする。 【解決手段】 入力画像データを第1エンコーダでエン
コードすると共に、この入力画像データをFIFOで遅
延させその出力を第2エンコーダに供給し、第1エンコ
ーダにおけるエンコードにより求められるディフィカル
ティデータに基いてターゲットビット量データを求め、
上記FIFOからの画像データを第2エンコーダでエン
コードするときにターゲットビット量となるよう制御す
る際、1枚分の画像の符号化の都度、以降のL枚の画像
のディフィカルティの合算値に対する符号化する画像の
ディフィカルティの比率に、L枚の画像に割り当てられ
る平均ビット量データを乗じてターゲットビット量デー
タを得る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、例えばディジタル
・ビデオ・ディスク(DVD)等のオーサリングシステ
ムや、ディジタル放送(Digital Video
Broadcasting:DVB)ディジタルデータ
の伝送システム等に適用して好適な目標符号量制御方法
及びその装置に関する。
【0002】
【従来の技術】映像や音声信号をディジタルデータに変
換し、当該ディジタルデータに対して変換符号化処理を
施すことにより、記録時におけるディジタルデータのデ
ータ量を減らす技術は、MPEG(Moving Pi
ctures ExpertGroup)により、標準
化されている。映像データはマクロブロック毎にインタ
ー若しくはイントラ符号化のための処理が施された後
に、符号化処理が施される。上記インター符号化のため
の処理とは、現在のフレームの画像データと過去のフレ
ームの画像データとの差分を取り、その差分に対して符
号化処理を施すことである。つまり、既に過去のフレー
ムの画像データが送られているのならば、その差だけ送
れば現在のフレームの当該画像データの復元は簡単に行
うことができるのである。
【0003】差分をとるために必要な処理が、動き検出
と動き補償である。動き検出は、現在のフレームの注目
マクロブロックとの画素値の差分絶対値和が最も小さい
マクロブロックが、過去の参照フレームのどの位置にあ
るのかを検出する処理である。この検出は、現在のフレ
ームの注目マクロブロックの位置から、X及びY方向に
何画素分移動すれば現在のフレームの注目マクロブロッ
クと参照フレームの画素値の差分絶対値和が最小となる
のかを見ることにより実現される。通常、このX及びY
方向への画素単位の移動量データを動きベクトルデータ
と称している。
【0004】動き補償は、過去の参照フレーム上におい
て、注目マクロブロックの位置から、上記動きベクトル
データの指し示す位置を求め、その位置のマクロブロッ
クデータを抽出する処理を言う。そして、抽出された過
去の参照マクロブロックと、現在の注目マクロブロック
との差分、即ち、動き予測誤差が求められる。尚、ここ
で用いられる過去の参照フレームとしては、局部復号器
(Local Decoder)からの出力フレームが
用いられる。
【0005】動き予測誤差信号は、空間方向の相関性を
取り除くために、例えば離散余弦変換(Discret
e Cosine Transform:以下単にDC
Tと称する)に代表されるような、直交変換をあるブロ
ック単位で施す。変換されたDCT係数は、ある量子化
ステップで割算する、量子化と呼ばれる処理で微小な信
号の切り捨てを行い、その商の整数値のみを、量子化イ
ンデックスと共に出力する。このようにして、量子化さ
れたDCT係数、量子化インデックス、及び上記動きベ
クトルデータは、可変長符号化(Valiable L
ength Coding:VLC)されて出力され
る。
【0006】一方、イントラ符号化処理においては、上
述したような動き検出や動き補償処理が施されず、画素
値がそのままブロック単位に直交変換され、同様に量子
化、VLCが施されて出力される。
【0007】以上説明したような処理により、画像デー
タの時間方向、及び空間方向の冗長性を取り除くことに
よって、情報量の圧縮が実現されるのである。
【0008】尚、MPEG等において、1枚のイントラ
符号化されたフレーム、即ち、I(Intra)ピクチ
ャと、複数の、インター符号化されたフレーム、即ち、
P(Predictive)ピクチャやB(Bidir
ectionaly Predictive)ピクチャ
との組み合わせでGOP(Group of Pict
ure)を構成する。
【0009】このような画像圧縮技術は、例えばDVD
(Digital Video Disk)等では、画
像及び音声データが1枚の光ディスクに記録できるよう
に、或いは、通信回線や衛星回線を用いた画像音声の伝
送においては、回線容量の中で動画像と音声データを伝
送できるように用いられているのである。
【0010】ところで、例えばDVDをROMディスク
で構成する場合などのオーサリングにおいては、圧縮符
号化された画像データが、ディスクの容量内に収まる必
要があるのは勿論のこと、その符号量の範囲内で、最も
高い画質が実現するような符号量配分が行われる、可変
レート符号化という手法がしばしば用いられる。この方
法は、画像データの時間及び空間方向の相関の強さが常
に変動することにより、画像圧縮にとっての難しさが時
間的に変動することを利用するものである。
【0011】例えば、時間方向の相関性の変動について
例をあげて説明する。動画像中の移動体の移動パターン
は、単なる平行移動にとどまらず、例えば移動体の移動
速度、移動方向、移動体の形状の変化等のように複雑な
移動パターンが存在し、このような場合は、上述したよ
うな動き補償では、動き予測誤差データが増大する。ま
た、或いは、ランダムノイズのような完全に時間方向に
相関がないような動画像データにおいては、動き補償に
よる圧縮効果が全く失われ、現フレームからのデータ量
と大差ないほどの動き予測誤差データを発生する場合が
ある。このような画像圧縮にとっての難易度(以下、デ
ィフィカルティと称する)の変動は、フレーム単位のみ
ならず、GOP単位、マクロブロック単位等でも当然存
在する。
【0012】このように、ディフィカルティが変動する
ようなデータを、単位時間あたりに均一のビットレート
(以下目標符号レート)で圧縮符号化しようとすると、
ディフィカルティが高いような、即ち、時間空間方向の
相関性が低く、圧縮効果が現れにくい映像データについ
ては、上記DCT係数を大きめの量子化ステップで粗く
量子化して発生符号レートが目標符号レートに近づける
必要があり、結果として、量子化誤差が増大し、符号伸
長したときの符号化歪が顕著に現れる。一方、ディフィ
カルティが低いような、即ち、相関性が高いデータにつ
いては、DCT係数は低周波数成分側に集中するから、
目標符号量に近づけるためには、これを小さめの量子化
ステップで細かく量子化することが可能になり、結果と
して、符号伸長後の歪が少なくなる。
【0013】そこで、DVDオーサリング等において
は、このような、画像の符号化歪が時間単位で変動し、
結果として画質の劣化が瞬間的に顕著になるような弊害
を回避するために、予め、固定の量子化ステップで全て
の画像データを圧縮符号化し、その際に発生した符号量
を、ディフィカルティデータと定義して、一旦記憶し
(1パス目)、次に、そのディフィカルティデータに基
いて2回目に圧縮符号化するときに、難しい画像データ
のところには多めに符号量を割り当てるといった、いわ
ゆる2パスエンコードを用いた、可変長符号化が用いら
れていた。尚、ディフィカルティデータという言葉は、
ある一定の画質を実現するのに必要なデータ量に比例す
る量であると定義する。
【0014】さて、しかしながら、このような2パスエ
ンコードは、全ての映像データを一旦エンコードし終わ
って始めて、実際のエンコードが始められるので、間断
なく供給される画像や音声データに対して、このような
制御を行うことは、殆ど不可能に近い。従って、上記制
御は、通信時におけるエンコードや、無限に長いデータ
を間断なく、しかも実時間的にエンコードしなくてはな
らないような放送のような用途には適応することができ
なかった。
【0015】そこで、FIFO(First In F
irst Out)構造のメモリを通ったデータをエン
コードする第1のエンコーダと、FIFO構造のメモリ
を通らない第2のエンコーダの2つ目のエンコーダを用
いることが提案された。以下、この2パスエンコード
を、予め全てのディフィカルティを求めておく上記2パ
スエンコードと区別するために、「簡易な2パスエンコ
ード」と称する。この簡易な2パスエンコードは、最初
のパスでディフィカルティを求め、次のパスで求めたデ
ィフィカルティを用いてエンコードを行う方法である。
【0016】提案されている簡易2パスエンコードは、
2種類ある。1つは、数GOP分のディフィカルティに
基いて、各GOPの目標ビット量を決定する。GOP単
位のレートコントロールである。もう1つは、更に、上
記GOPの中で各ピクチャ単位の目標ビット量を制御す
るピクチャ単位のレートコントロールである。
【0017】
【発明が解決しようとする課題】ところで、上記簡易2
パスエンコードは、参照しているK個のGOPの中でデ
ィフィカルティの情報が完結してしまうので、K個のG
OPの前後の絵柄の情報が全く生かされない。K個のG
OPの前後の絵柄の情報が全く生かされないでエンコー
ドが行われると、問題が生じる。これについて図5A〜
図5Dを参照して説明する。
【0018】図5は、各レートコントロール方式による
ビット量割り当てについて説明するための説明図であ
る。図5Aは、入力素材のディフィカルティの一例を示
す説明図、図5Bは理想的なビット量が割り当てられた
状態を示す説明図、図5Cは簡易2パスエンコードによ
るGOP単位のビット量の割り当てを示す説明図、図5
Dは、簡易2パスエンコードによるピクチャ単位のビッ
ト量の割り当てを示す説明図である。図5においては、
ディフィカルティデータを予め測定する長さ、即ち、F
IFOメモリの容量が、2GOPである場合の例を示し
ている。
【0019】入力素材のディフィカルティが、図5Aに
示す通りであることを前提とする。ここで、縦軸はディ
フィカルティ、横軸は時間(単位は1GOPである)で
ある。この図5Aに示されているように、入力素材のデ
ィフィカルティは、最初の2GOP分の期間においては
徐々に上昇して最高の値となり、次の2GOP分の期間
の先頭で最も低くなり、以降、この期間内では同じ値と
なり、更に次の2GOP分の期間に入ってから最高の値
となり、以降、徐々に低い値となっている。尚、図5に
おいてはピクチャタイプによるディフィカルティの差
は、簡単のために無視している。
【0020】この図5Aに示すようなディフィカルティ
の分布を有する入力素材に対しては、図5Bに示すよう
に、図5Aに示されるディフィカルティの分布に比例し
たビット量が与えられるべきである。つまり、難しい絵
柄には多くのビット量を与え、簡単な絵柄にはビット量
を少なく与えることが、画質劣化を招くことなくエンコ
ードできるからである。参考までに、図5Bにおいて
は、平均レートを破線で示す。
【0021】図5Cは、簡易な2パスエンコードによる
GOP単位のビット量の割り当てを示している。この図
5Cに示されているビット量の割り当ては、殆ど平坦で
あり、図5Aに示されるディフィカルティの分布に正確
に比例していないことが分かる。これは、GOP単位で
ビット量の割り当てが行われるからである。つまり、ビ
ット量は、1つのGOP内では一定となるからである。
【0022】図5Dは、簡易な2パスエンコードによる
ピクチャ単位のビット量の割り当てを示している。この
図5Dに示されているビット量の割り当ては、図5Aに
示されるディフィカルティの分布に正確に比例している
ことが分かる。ピクチャ単位でビット量の割り当てが行
われるからである。しかしながら、図5Bに示されてい
るビット量よりも少ない。これは、割り当てることので
きるビット量が2GOP単位で決まっているからであ
る。割り当てることのできるビット量が2GOP単位で
決まっていると、難しい絵柄の続く2GOP内では、割
り当てるべきビット量が足りなくなり、簡単な絵柄の続
く2GOP内では、割り当てるべきビット量が余剰にな
るからである。
【0023】以上の説明から分かるように、簡易な2パ
スエンコードは、予め全てのディフィカルティを求めて
おく2パスエンコードと比較して、入力素材に対するビ
ット量の割り当ての適切さの点についてはかなり劣る。
【0024】本発明はこのような点を考慮してなされた
もので、簡易な2パスエンコードを用いても、入力素材
に対するビット量の割り当てを適切とでき、復元画像の
画質を劣化させない目標符号量制御方法及びその装置を
提案しようとするものである。
【0025】
【課題を解決するための手段】本発明は、入力映像デー
タを第1の符号化手段で符号化すると共に、上記入力映
像データを遅延手段で遅延させて当該遅延出力を第2の
符号化手段に供給し、上記第1の符号化手段における符
号化により求められる映像データの難しさを示すディフ
ィカルティデータに基いて目標符号量を求め、上記遅延
手段からの映像データを上記第2の符号化手段で符号化
するときに上記目標符号量となるよう制御する目標符号
量制御方法であって、1枚分の画像の符号化の都度、以
降のL枚の画像の難しさを示すディフィカルティの和に
対する上記符号化する画像のディフィカルティの比率
に、L枚の画像に割り当てられる平均ビット量を乗じて
目標符号量を決定するものである。上述せる本発明によ
れば、1枚分の画像の符号化の都度、以降のL枚の画像
の難しさを示すディフィカルティの和に対する上記符号
化する画像のディフィカルティの比率に、L枚の画像に
割り当てられる平均ビット量を乗じて目標符号量を決定
する。
【0026】
【発明の実施の形態】以下に、図1〜図4を順次参照し
て本発明の実施の形態について詳細に説明する。
【0027】先ず、図1を参照して、本発明目標符号量
制御方法及びその装置の概念について説明する。図1
は、本発明目標符号量制御方法及びその装置の概念を説
明するための説明図である。既に説明したように、予め
ディフィカルティを検出しておくための第1エンコーダ
と、第1エンコーダで検出されたディフィカルティに基
いて実際のエンコード処理を行う第2エンコーダとが用
いられることを前提とする。図1Aは、上記第1エンコ
ーダの入力を、図1Bは、第1エンコーダで検出された
ディフィカルティデータを、図1Cは、ターゲットビッ
ト量(目標符号量)データを得るための数式を、図1D
は、図1Cに示される数式により得られるターゲットビ
ット量データを、図1Eは、上記第2エンコーダの出力
を、図1Fは、第2エンコーダによりエンコードされた
ときの発生ビット量データを夫々示している。
【0028】第1エンコーダ入力は、図1Aに示す通り
である。画像データV1、V2、・・・・は、順次第1
エンコーダに入力される。ここで、各画像データV1、
V2、・・・・は、夫々、上述したピクチャに相当す
る。第1エンコーダにおいては、所定の量子化ステップ
サイズにより、エンコード処理が行われる。ここでいう
エンコードは、既に説明したように、インター若しくは
イントラ符号化のための処理と、この処理の後に行われ
る、DCT、量子化、可変長符号化等の処理を意味す
る。
【0029】第1エンコーダにより画像データV1、V
2、・・・・に対して順次エンコード処理が施される
と、図1Bに示すように、ディフィカルティデータD
1、D2、・・・・が得られる。1GOPが15ピクチ
ャで構成されている場合、図1Cに示されるように、デ
ィフィカルティデータD1〜D15、ディフィカルティ
データD2〜D16、・・・・のように、1ピクチャず
つずらされ、且つ、15ピクチャ分ずつディフィカルテ
ィデータが用いられて演算が行われる。そして、その結
果、図1Dに示されるように、ターゲットビット量デー
タT1、T2、・・・・が得られる。例えばディフィカ
ルティデータD1〜D15が用いられて演算された結果
得られるターゲットビット量データは、図1Dに示され
る“T1”である。また、ディフィカルティデータD2
〜D16が用いられて演算された結果得られるターゲッ
トビット量データは、図1Dに示される“T2”であ
る。
【0030】この図1Dに示されるターゲットビット量
データT1、T2、・・・・は、順次第2エンコーダに
供給される。図1Aに示される画像データV1、V2、
・・・・は、FIFOを介して、第2エンコーダに供給
される。よって、第2エンコーダにおいては、図1Aに
示される画像データV1、V2、・・・・が、図1Dに
示されるターゲットビット量データに基いてエンコード
される。この結果は、図1Eに示す通りであり、発生ビ
ット量データは、図1Fに示される通りである。
【0031】発生ビット量データS1、S2、・・・・
は、図1Cに示される演算で用いられる。例えば発生ビ
ット量データS1は、ディフィカルティデータD2〜D
16を用いてターゲットビット量データT2を得るため
の演算に用いられ、発生ビット量データS2は、ディフ
ィカルティデータD3〜D17を用いてターゲットビッ
ト量データT3を得るための演算に用いられる。尚、図
1Dに示されるターゲットビット量データT1を得るた
めの演算(図1C参照)においては、発生ビット量デー
タは用いられない。
【0032】ここで、図1Cに示される演算について説
明する。図1Cにおいて、R1、R2、・・・・は15
ピクチャ分のシーケンスに割り当てることのできる平均
のビット量を示す平均ビット量データである。但し、R
1は先頭であるから、このR1だけは初期値となり、R
2以降は、1つ前の平均ビット量データを用いる。平均
ビット量データR1は、1秒分のビット量であるところ
のビットレートBrと、1秒分のピクチャ数であるとこ
ろのピクチャレートPrの比にGOPのピクチャ枚数で
あるところの15を乗じることによって得られる。ま
た、平均ビット量データR2から後の平均ビット量デー
タは、1つ前の平均ビット量データR1、R2、・・・
・から、1つ前に発生した発生ビット量データS1、S
2、・・・・を減算し、この結果に、フレームあたりの
ビット量データF16、F17、・・・・を加算するこ
とによって得られる。このフレームあたりのビット量デ
ータF16、F17、・・・・は、新たにディフィカル
ティを求めているピクチャについて、平均ビット量をそ
のピクチャのピクチャタイプによって割り振ることによ
り得られる。
【0033】以上のようにして、平均ビット量データR
1、R2、・・・・が順次求められる。そして、これら
平均ビット量データR1、R2、・・・・に対し、処理
対象であるところのピクチャのディフィカルティと、1
5枚分のピクチャの各ディフィカルティの合計との比が
乗じられる。例えば、初期値であるとことの平均ビット
量データR1に対しては、ピクチャV1のディフィカル
ティD1と、ピクチャV1〜V15までのディフィカル
ティD1〜D15の合計との比が乗じられる。また、平
均ビット量データR2に対しては、ピクチャV2のディ
フィカルティD2と、ピクチャV2〜V16までのディ
フィカルティD2〜D16の合計との比が乗じられる。
【0034】第1エンコーダのエンコード結果から、上
述のような演算を行ってターゲットビット量データT
1、T2、・・・・を得、このターゲットビット量デー
タT1、T2、・・・・に基いて第2エンコードでエン
コードを行うようにしているので、結果的に、リアルタ
イム性の重視される素材に対応することができる。以
下、より具体的な例を、実施の形態として説明する。
【0035】〔第1の実施の形態〕図1は、第1の実施
の形態としてのエンコーダの構成を示す構成図である。
【0036】この図1に示すエンコーダは、入力端子1
を介して供給される映像データViの動き予測を行う動
き予測回路2と、エンコーダコントローラ3と、動き予
測回路2からエンコーダコントローラ3を介して供給さ
れる動き予測処理後の映像データをエンコードする第1
エンコーダ4と、全体の制御を司るホストコンピュータ
5と、上記映像データを遅延させるためのFIFO(F
irst In First Out)メモリ6と、F
IFOメモリ6から読み出された映像データをホストコ
ンピュータ5からのターゲットビット量データTjに基
いてエンコードし、エンコードした映像データを、出力
端子8から出力する第2エンコーダ7とで構成される。
【0037】ここで、上記動き予測回路2は、エンコー
ダコントローラ3からのピクチャタイプデータIBPに
基いて、入力端子1を介して供給される映像データの
内、B及びPピクチャに対し、上述した動き検出及び動
き補償処理を施す。エンコーダコントローラ3は、ピク
チャタイプデータIBPを、動き予測回路2、ホストコ
ンピュータ5に供給する他、Iピクチャはそのまま出力
し、Bピクチャ及びPピクチャの場合には、前の映像デ
ータとの差分をとりその差分信号を出力する。
【0038】また、エンコーダコントローラ3からの映
像データは、上記FIFOメモリ6により所定時間だけ
遅延される。この所定時間は、第1エンコーダ4でディ
フィカルティデータDkが得られ、このディフィカルテ
ィデータDkを用いてホストコンピュータ5が演算を行
ってターゲットビット量データTjを得、このターゲッ
トビット量データTjを、第2エンコーダ7に供給する
までの時間に略等しい。
【0039】また、上記ホストコンピュータ5は、第1
エンコーダ4からのディフィカルティデータDkと、第
2エンコーダ7からの発生ビット量データSjとに基い
て、上述した演算を行い、ターゲットビット量データT
jを求め、このターゲットビット量データTjを、第2
エンコーダ7に供給する。
【0040】この第1の実施の形態においては、Lピク
チャ分(Lは任意の整数)のディフィカルティデータを
用いてターゲットビット量データを求め、このターゲッ
トビット量データに基いて1つのピクチャを符号化す
る。つまり、ビット量のフィード・フォワード制御が行
われる。1ピクチャのターゲットビット量を示すターゲ
ットビット量データは、Lピクチャ分として許容できる
ビット量に対し、これから符号化するピクチャのディフ
ィカルティと、Lピクチャ分のディフィカルティの和と
の比率を乗じることで求められる。1ピクチャの符号化
が終了すると、次のピクチャの符号化のために、Lピク
チャで使用可能なビット量から、発生ビット量が減じら
れ、更に、そのピクチャタイプに応じた平均ビット量が
加算される。尚、Lは例えば“15”等である。以下、
上記ホストコンピュータ5が行う演算について詳細に説
明する。
【0041】映像シーケンス全体の中のj番目のピクチ
ャのターゲットビット量データTjは、次の数1で表す
ことができる。
【0042】
【数1】
【0043】ここで、Lは、ディフィカルティデータを
予め測定するピクチャの数であり、通常はフレームメモ
リの容量と1フレームの映像データのデータ量で決ま
る。Djは、ピクチャjのディフィカルティである。R
jは、ピクチャjからLピクチャ分のシーケンスに割り
当てることのできる平均ビット量を示す平均ビット量デ
ータである。この数1から、ディフィカルティの変化の
仕方によっては、ピクチャに対して平均ビット量データ
Rjが示すビット量よりも多くのビット量が割り当てら
れる場合と、少なく割り当てられる場合とがあることが
分かる。平均ビット量データRjの初期値であるところ
の平均ビット量データR1は、平均のビット量のLフレ
ーム分である。これを数2で表す。
【0044】
【数2】
【0045】但し、Brは1秒あたりのビット量、Pr
は1秒あたりのピクチャ数である。初期値としての平均
ビット量データR1以外の平均ビット量データRj+1
(但し、jは1、2、3、・・・・)は、数3で表され
る。
【0046】
【数3】
【0047】ここで、Sjは、ピクチャjが、図2に示
した第2エンコーダ7でエンコードされたときに発生し
たビット量を示す発生ビット量データ、Fj+Lは、第
1エンコーダ4で新たにディフィカルティが求められて
いるピクチャj+Lについて、平均ビット量を、ピクチ
ャj+Lのピクチャタイプに応じて割り振ったときの、
フレームあたりのビット量である。
【0048】次に、図3及び図4を参照して、図2に示
したエンコーダのホストコンピュータの制御動作を中心
に説明する。
【0049】ステップS1では、ホストコンピュータ5
が、フラグFLGに“0”をセットする。
【0050】ステップS2では、ホストコンピュータ5
が、エンコーダコントローラ3からのピクチャタイプデ
ータIBPの受付及び記憶を開始する。
【0051】ステップS3では、ホストコンピュータ5
が、変数i及びjに夫々“1”をセットする。
【0052】ステップS4では、ホストコンピュータ5
が、エンコード処理が終了か否かを判断し、「YES」
であれば終了し、「NO」であればステップS5に移行
する。
【0053】ステップS5では、ホストコンピュータ5
が、第1エンコーダ4からディフィカルティデータDi
が供給されたか否かを判断し、「YES」であればステ
ップS6に移行し、「NO」であれば再びステップS4
に移行する。
【0054】ステップS6では、ホストコンピュータ5
が、ディフィカルティデータDiを記憶する。
【0055】ステップS7では、ホストコンピュータ5
が、変数iに“1”を加算する。
【0056】ステップS8では、ホストコンピュータ5
が、変数iが“L”よりも大きいか否かを判断し、「Y
ES」であれば図4に示すステップS16に移行し、
「NO」であれば再びステップS4に移行する。
【0057】ステップS9では、ホストコンピュータ5
が、フラグFLGが“0”か否かを判断し、「YES」
であればステップS10に移行し、「NO」であればス
テップS16に移行する。ステップS10〜ステップS
12までは、最初のピクチャを第2エンコーダ7で符号
化するときに通るステップであり、ステップS16〜S
19までは、2番目以降のピクチャを第2エンコーダ7
で符号化するときに通るステップである。これで分かる
ように、上記フラグFLGは、最初のピクチャと、2番
目以降のピクチャとで処理経路を変えるためのものであ
る。
【0058】ステップS10では、ホストコンピュータ
5が、1秒あたりのビット量とピクチャ数の比にLを乗
じて得られる初期値としての平均ビット量データRjを
読み出す。この平均ビット量データRjは、数3に示し
た式により求められる。
【0059】ステップS11では、ホストコンピュータ
5が、上記平均ビット量データR1に、符号化するフレ
ームのディフィカルティDjの値と、映像データVj〜
Vj+l−1の各ディフィカルティDj〜Dj+l−1
の合算値との比を乗じ、ターゲットビット量データTj
を得る。
【0060】ステップS12では、ホストコンピュータ
5が、フラグFLGに“1”をセットする。
【0061】ステップS13では、ホストコンピュータ
5が、ターゲットビット量データTjを、第2エンコー
ダ7に供給する。第2エンコーダ7は、上記ターゲット
ビット量データTjに基いて、FIFO6から供給され
る映像データVjをエンコードする。第2エンコーダ7
は、エンコードによって発生した発生ビット量を示す発
生ビット量データSjを、ホストコンピュータ5に供給
する。
【0062】ステップS14では、ホストコンピュータ
5が、第2エンコーダ7から発生ビット量データSjが
供給されたか否かを判断し、「YES」であればステッ
プS15に移行する。
【0063】ステップS15では、ホストコンピュータ
5が、第2エンコーダ7から供給された発生ビット量デ
ータSjを記憶する。
【0064】ステップS16では、ホストコンピュータ
5が、次に第2エンコーダ7で符号化するフレームの映
像データについて、フレームあたりのビット量データF
j+Lを求める。
【0065】ステップS17では、ホストコンピュータ
5が、1つ前の平均ビット量データRjから、1フレー
ム前に第2エンコーダ7で符号化により発生した発生ビ
ット量データSjを減じ、この減算結果に、フレームあ
たりのビット量データFj+Lを加算し、次の平均ビッ
ト量データRj+1を求める。
【0066】ステップS18では、ホストコンピュータ
5が、変数jに“1”を加算する。
【0067】ステップS19では、ホストコンピュータ
5が、平均ビット量データRjに対し、第2エンコーダ
7で符号化するフレームのディフィカルティDjの値
と、ディフィカルティの合算値Dkとの比を乗じてター
ゲットビット量データTjを得る。そしてステップS1
3に移行する。
【0068】〔第1の実施の形態における効果〕以上説
明したように、本形態においては、図2に示したよう
に、エンコーダは、動き予測回路2、エンコーダコント
ローラ3、第1エンコーダ4、ホストコンピュータ5、
FIFOメモリ6及び第2エンコーダ7で構成される。
そして、第1エンコーダ4が予めLピクチャ分のエンコ
ードを行い、各ディフィカルティデータをホストコンピ
ュータ5に与え、以降、1ピクチャずつディフィカルテ
ィデータをホストコンピュータ5に与える。ホストコン
ピュータ5は、既に説明したように、第1エンコーダ4
からのピクチャjのディフィカルティデータDjと、L
ピクチャ分のディフィカルティデータDkとの比にピク
チャjからLピクチャ分のシーケンスに対して割り当て
ることのできる平均ビット量を示す平均ビット量データ
Rjを乗算し、ターゲットビット量データTjを求め、
当該ターゲットビット量データTjを、第2エンコーダ
7に供給する。これにより、第2エンコーダ7は、上記
ターゲットビット量データTjとなるようにエンコード
処理を行う。従って、フィードフォワードの利点を生か
しながら、より適切なビット量の割り当てを行うことに
より、復元画像の画質を良好とできるといった効果があ
る。図5Eに示されるように、図5Cや図5Dに示され
る従来のビット量の割り当て結果と比較して、格段に適
切なビット量の割り当てを行うことができる。この図5
Eから分かるように、本形態によるビット量の配分は、
図5Aに示したディフィカルティの分布に比例し、しか
も、最大限にビット量が配分されている。
【0069】〔第2の実施の形態〕上記フレームあたり
のビット量データFj+Lを、ピクチャタイプによら
ず、一律にフレームあたりの平均ビット量データとする
ことが考えられる。即ち、数4で表されているように、
1秒あたりのビット量を、1秒あたりのピクチャ数で除
することにより、1ピクチャあたりの平均ビット量を
得、これを上記Fj+Lとするのである。
【0070】
【数4】
【0071】しかしながら、通常、発生ビット量は、I
ピクチャが最も多く、これにP、Bが続く。従って、上
記ビット量データFj+Lを、ピクチャタイプに応じて
変えた方が得策である。つまり、より適切なビット配分
を実現できる。もしもビット量データFj+Lを一定に
してしまうと、問題が発生する。例えば、ディフィカル
ティを新たに求めたピクチャj+LがIピクチャの場合
で考える。この場合、ディフィカルティの値は非常に大
きくなるので、数1の分母、即ち、Dkが大きくなる。
しかしながら、平均ビット量データRj+1は大きくな
らないので、ピクチャj+1のターゲットビット量デー
タTj+1の値が小さくなってしまう。これは、数1を
参考にすれば一目瞭然であろう。
【0072】そこで、この第2の実施の形態では、各ピ
クチャタイプに対し、或固定の比率でFj+Lを与える
ようにする。即ち、I:P:Bピクチャの1ピクチャあ
たりのビット量の比率を、或固定の比率i:p:bであ
るものとし、各ピクチャについてビット量データFj+
Lを、次の数5、数6、数7に示す式で示される演算に
より決定する。数5は、jがIピクチャのとき、数6
は、jがPピクチャのとき、数7は、jがBピクチャの
ときのフレームあたりのビット量を夫々求めるための式
である。
【0073】
【数5】
【0074】
【数6】
【0075】
【数7】
【0076】ここで、Nは、GOPあたりのピクチャの
枚数(Iピクチャの間隔)、MはPピクチャの間隔であ
る。GOPあたりのPピクチャの枚数は、N/M−1、
Bピクチャの枚数は、N(1−1/M)である。
【0077】〔第2の実施の形態における効果〕第1の
実施の形態に加え、本形態においては、ピクチャタイプ
によらず、一律にフレームあたりの平均ビットレートを
Fjとし、更に、より適切なビット量の配分を実現する
ために、数5〜数7に示されるように、固定の比率で各
ピクチャタイプに対してフレームあたりのビット量Fj
+Lを決定するようにした。よって、各ピクチャタイプ
毎に決まったビット量が加算されるので、例えばIピク
チャのディフィカルティデータの値が大きいことに起因
して、ターゲットビット量データTjの値が小さくな
り、よって、発生ビット量が少なくエンコードされ、復
元画像が劣化するといった不都合を回避することができ
る。
【0078】〔第3の実施の形態〕ところで、各ピクチ
ャタイプ毎のビット量の比率は、絵柄によってかなり変
動する。よって、より理想的なビット量の配分を実現す
るためには、第1エンコーダ4において、これからディ
フィカルティを求めようとしているピクチャのピクチャ
タイプ別のビット量の比率を用いることが望ましい。即
ち、上述したi:p:bの比率を、絵柄によってダイナ
ミックに変更するのである。より具体的には、ディフィ
カルティを求めようとしているGOPのビット量の比率
は確定していないのであるから、その1つ前のGOPの
ピクチャタイプ別のビット量の比率を用いる。前のGO
PのIピクチャ、Pピクチャ、Bピクチャの発生ビット
量を夫々SI-picture 、SP-Picture 、SB-Picture
すると、フレームあたりのビット量Fjは、jがIピク
チャのとき、Pピクチャのとき、Bピクチャのときで夫
々数8、数9、数10で示す式により求められる。
【0079】
【数8】
【0080】
【数9】
【0081】
【数10】
【0082】〔第3の実施の形態における効果〕第2の
実施の形態に加え、本形態においては、数8〜数10に
示されるように、i:p:bの比率を、絵柄に応じて変
えるようにした。よって、より適切にビット量の配分を
行うことができる。
【0083】〔第4の実施の形態〕尚、上記形態におい
ては、同一シーン内でのピクチャタイプ別の発生ビット
量の相関性を利用した場合について説明した。しかしな
がら、シーンが変わった場合には、前後の絵柄の相関性
はなくなる。そこで、シーンチェンジを検出し、その結
果を積極的に利用する。この方法としては、2つの方法
がある。
【0084】1つの方法は、シーンチェンジを検出した
ときに、シーンチェンジ前後の数ピクチャのビット量
は、局所的に大きくなっているので、その部分をピクチ
ャタイプ別のビット量比率の計算に入れない方法であ
る。もう1つの方法は、シーンチェンジの後の絵柄とそ
の前の絵柄とは相関性がないのであるから、シーンチェ
ンジ以降のピクチャのみについてビット量の比率を計算
に用いる方法である。上記方法のどちらを採用しても、
より理想的なビット量の配分に近づけることができるこ
とは明かであろう。
【0085】〔変形例〕尚、上記数3に示した式におい
て、発生ビット量データSjを用いずに、略その値に近
い、ターゲットビット量データTjを用いるようにして
も良い。この場合、第2エンコーダからの発生ビット量
データSjをホストコンピュータ5に戻さなくても良い
ので、ホストコンピュータ5だけでビット量の制御を行
うことができるといったメリットがある。
【0086】
【発明の効果】上述せる本発明によれば、1枚分の画像
の符号化の都度、以降のL枚の画像の難しさを示すディ
フィカルティの和に対する上記符号化する画像のディフ
ィカルティの比率に、L枚の画像に割り当てられる平均
ビット量を乗じて目標符号量を決定するので、限られた
範囲内においてディフィカルティを参照して符号化を行
う場合と比較して、より、適切なビット量の割り当てを
実現できるので、復元時における画像の画質を向上させ
ることができるという効果がある。
【図面の簡単な説明】
【図1】本発明目標符号量制御方法及びその装置の概念
を説明するための説明図である。
【図2】一実施の形態を示すオーサリングシステムや伝
送システムのエンコーダの構成図である。
【図3】図2に示したエンコーダの動作を説明するため
のフローチャートである。
【図4】図2に示したエンコーダの動作を説明するため
のフローチャートである。
【図5】本発明及び従来の2パスエンコードを説明する
ための説明図である。 〔図5A〕 入力素材のディフィカルティのモデルを示
す説明図である。 〔図5B〕 図5Bに示したディフィカルティの分布を
有する入力素材に対して最も適切にビット量が与えられ
た場合を示す説明図である。 〔図5C〕 GOP単位でビット量を与える簡易な2パ
スエンコードにより、図5Aに示したディフィカルティ
の分布を有する入力素材に対してエンコード処理を施し
たときのビット量の分布を示す説明図である。 〔図5D〕 ピクチャ単位でビット量を与える簡易な2
パスエンコードにより、図5Aに示したディフィカルテ
ィの分布を有する入力素材に対してエンコード処理を施
したときのビット量の分布を示す説明図である。 〔図5E〕 本発明目標符号量制御方法及びその装置に
より、図5Aに示したディフィカルティの分布を有する
入力素材に対してエンコード処理を施したときのビット
量の分布を示す説明図である。
【符号の説明】
2 エンコーダコントローラ、3 動き予測回路、4
第1エンコーダ、5ホストコンピュータ、6 FIF
O、7 第2エンコーダ

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 入力映像データを第1の符号化手段で符
    号化すると共に、上記入力映像データを遅延手段で遅延
    させて当該遅延出力を第2の符号化手段に供給し、上記
    第1の符号化手段における符号化により求められる映像
    データの難しさを示すディフィカルティデータに基いて
    目標符号量を求め、上記遅延手段からの映像データを上
    記第2の符号化手段で符号化するときに上記目標符号量
    となるよう制御する目標符号量制御方法であって、 1枚分の画像の符号化の都度、以降のL枚の画像の難し
    さを示すディフィカルティの和に対する上記符号化する
    画像のディフィカルティの比率に、L枚の画像に割り当
    てられる平均ビット量を乗じて目標符号量を決定するこ
    とを特徴とする目標符号量決定方法。
  2. 【請求項2】 上記1枚分の画像の符号化が終了した後
    に、L枚の画像の割り当てられる平均ビット量から、上
    記第2の符号化手段における符号化により発生する発生
    ビット量を減じ、該減算結果に対し、上記第1の符号化
    手段において新たに符号化された画像の符号化ピクチャ
    タイプに応じて、該画像に割り当てるべき平均ビット量
    を加算することを特徴とする請求項1記載の目標符号量
    決定方法。
  3. 【請求項3】 上記1枚分の画像の符号化が終了した後
    に、L枚の画像の割り当てられる平均ビット量から、過
    去に求められた目標符号量を減じ、該減算結果に対し、
    上記第1の符号化手段において新たに符号化された画像
    のタイプに応じて、該画像に割り当てるべき平均ビット
    量を加算することを特徴とする請求項1記載の目標符号
    量決定方法。
  4. 【請求項4】 上記平均ビット量を、画像毎の固定のビ
    ット量の割合で求めることを特徴とする請求項2記載の
    目標符号量決定方法。
  5. 【請求項5】 上記平均ビット量を、上記第2の符号化
    手段において符号化しようとしている画像の直前若しく
    は周辺の画像のタイプ別の発生ビット量の比率によって
    決定することを特徴とする請求項2記載の目標符号量決
    定方法。
  6. 【請求項6】 上記画像のタイプ別の発生ビット量の比
    率の決定にあたり、シーンチェンジを検出したときに
    は、当該シーンチェンジの直前、直後の画像を、上記発
    生ビット量の比率の決定に用いないことを特徴とする請
    求項5記載の目標符号量決定方法。
  7. 【請求項7】 上記画像のタイプ別の発生ビット量の比
    率の決定にあたり、シーンチェンジを検出したときに
    は、当該シーンチェンジ後の画像の発生ビット量のみか
    ら上記発生ビット量の比率を決定することを特徴とする
    請求項5記載の目標符号量決定方法。
JP07285596A 1996-03-19 1996-03-27 符号化装置および符号化方法 Expired - Fee Related JP3767007B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP07285596A JP3767007B2 (ja) 1996-03-27 1996-03-27 符号化装置および符号化方法
US08/820,007 US6100931A (en) 1996-03-19 1997-03-18 Method and apparatus for controlling a target amount of code and for compressing video data
DE69740013T DE69740013D1 (de) 1996-03-19 1997-03-19 Kodierung und/oder Komprimierung von Videodaten
EP97301871A EP0797359B1 (en) 1996-03-19 1997-03-19 Encoding and/or compressing video data
US09/201,518 US6324214B2 (en) 1996-03-19 1998-11-30 Method and apparatus for controlling a target amount of code and for compressing video data
US09/201,517 US6198769B1 (en) 1996-03-19 1998-11-30 Method and apparatus for controlling a target amount of code and for compressing video data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP07285596A JP3767007B2 (ja) 1996-03-27 1996-03-27 符号化装置および符号化方法

Publications (2)

Publication Number Publication Date
JPH09261631A true JPH09261631A (ja) 1997-10-03
JP3767007B2 JP3767007B2 (ja) 2006-04-19

Family

ID=13501402

Family Applications (1)

Application Number Title Priority Date Filing Date
JP07285596A Expired - Fee Related JP3767007B2 (ja) 1996-03-19 1996-03-27 符号化装置および符号化方法

Country Status (1)

Country Link
JP (1) JP3767007B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003533951A (ja) * 2000-05-12 2003-11-11 トムソン ライセンシング ソシエテ アノニム デバイス相互運用性向上のための装置および方法
JP2007134880A (ja) * 2005-11-09 2007-05-31 Canon Inc 映像信号処理装置
WO2008053557A1 (en) * 2006-11-02 2008-05-08 Pioneer Corporation Moving picture re-encoding device, moving picture re-encoding method, moving picture re-encoding program, and recording medium containing the moving picture re-encoding program

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003533951A (ja) * 2000-05-12 2003-11-11 トムソン ライセンシング ソシエテ アノニム デバイス相互運用性向上のための装置および方法
JP4851675B2 (ja) * 2000-05-12 2012-01-11 トムソン ライセンシング デバイス相互運用性向上のための装置および方法
JP2007134880A (ja) * 2005-11-09 2007-05-31 Canon Inc 映像信号処理装置
US8229004B2 (en) 2005-11-09 2012-07-24 Canon Kabushiki Kaisha Image signal processing apparatus with code amount control for inter-frame and intra-frame encoding
WO2008053557A1 (en) * 2006-11-02 2008-05-08 Pioneer Corporation Moving picture re-encoding device, moving picture re-encoding method, moving picture re-encoding program, and recording medium containing the moving picture re-encoding program
JPWO2008053557A1 (ja) * 2006-11-02 2010-02-25 パイオニア株式会社 動画像再符号化装置、動画像再符号化方法、動画像再符号化プログラムおよび動画像再符号化プログラムを格納した記録媒体

Also Published As

Publication number Publication date
JP3767007B2 (ja) 2006-04-19

Similar Documents

Publication Publication Date Title
KR100253931B1 (ko) 디지탈 영상 시퀀스의 디코딩 방법 및 장치
US5438374A (en) System and method for filtering video signals
KR100246168B1 (ko) 격행비디오를 위한 계층적 움직임 추정
US5751358A (en) Video encoder with quantization controlled by inter-picture correlation
US6181742B1 (en) Single pass target allocation for video encoding
KR100756596B1 (ko) 비디오 데이터 부호화 장치 및 비디오 데이터 부호화 방법
US6100931A (en) Method and apparatus for controlling a target amount of code and for compressing video data
US8098729B2 (en) Implementing B-picture scene changes
JPH11346362A (ja) リアルタイム単一パス可変ビット・レ―ト制御方法及び符号器
JPH08237669A (ja) 画像信号処理装置、画像信号処理方法および画像信号復号化装置
JPH11262018A (ja) 動き補償符号化装置、動き補償符号化方法、及び動き補償符号記録媒体
US7373004B2 (en) Apparatus for constant quality rate control in video compression and target bit allocator thereof
US6188730B1 (en) Highly programmable chrominance filter for 4:2:2 to 4:2:0 conversion during MPEG2 video encoding
JP3911035B2 (ja) 動画像符号化方法及び動画像符号化装置
KR100227298B1 (ko) 부호화 화상의 부호량 제어 방법
JPH08275158A (ja) 保証されたビット発生限界を有する動画像圧縮システム
JPH10191343A (ja) 映像データ圧縮装置およびその方法
US7254176B2 (en) Apparatus for variable bit rate control in video compression and target bit allocator thereof
JP3200199B2 (ja) 動画像圧縮符号化方法
US7133448B2 (en) Method and apparatus for rate control in moving picture video compression
JP3767007B2 (ja) 符号化装置および符号化方法
JP4073541B2 (ja) 動画像再符号化装置
JPH10108197A (ja) 画像符号化装置、画像符号化制御方法および画像符号化制御用プログラムを記録した媒体
JPH07131793A (ja) 映像信号高能率符号化装置
JPH0514876A (ja) 動画像符号化方式

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050118

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050322

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051004

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051205

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060110

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060123

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100210

Year of fee payment: 4

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100210

Year of fee payment: 4

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110210

Year of fee payment: 5

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110210

Year of fee payment: 5

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120210

Year of fee payment: 6

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120210

Year of fee payment: 6

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130210

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees