JPH1198514A - 画像符号化装置および方法 - Google Patents

画像符号化装置および方法

Info

Publication number
JPH1198514A
JPH1198514A JP25495997A JP25495997A JPH1198514A JP H1198514 A JPH1198514 A JP H1198514A JP 25495997 A JP25495997 A JP 25495997A JP 25495997 A JP25495997 A JP 25495997A JP H1198514 A JPH1198514 A JP H1198514A
Authority
JP
Japan
Prior art keywords
picture
encoding
coding
frame
difficulty
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP25495997A
Other languages
English (en)
Other versions
JP3951152B2 (ja
Inventor
Masaaki Isozaki
正明 五十崎
Masaki Nakagawa
昌己 中川
Takao Suzuki
隆夫 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP25495997A priority Critical patent/JP3951152B2/ja
Publication of JPH1198514A publication Critical patent/JPH1198514A/ja
Application granted granted Critical
Publication of JP3951152B2 publication Critical patent/JP3951152B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/004Predictors, e.g. intraframe, interframe coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

(57)【要約】 【課題】 符号化する素材中の画像の時間的または空間
的な相関が悪い部分における符号化効率を向上させて、
限られた割り当て符号量に対して、画質を改善できるよ
うにする。 【解決手段】 ビデオエンコーダ制御装置24のビット
配分部25は、予備的な符号化によって得られたピクチ
ャ毎の符号化難易度を取得し、GOP内のBピクチャの
符号化難易度の平均値とIピクチャの符号化難易度の比
率が第1の所定値を越える区間を、Bピクチャによる予
測が難しい区間として検出し、その区間内のBピクチャ
のうち、ピクチャの符号化難易度とそのピクチャが属す
るGOPのIピクチャの符号化難易度の比率が第2の所
定値を越え、且つピクチャの符号化難易度が第3の所定
値を越えたものについて、ピクチャタイプを、予測方向
の数がより少ないフレーム間予測符号化ピクチャである
Pピクチャに変更する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、画像データを符号
化する画像符号化装置および方法に関する。
【0002】
【従来の技術】近年、大容量のディジタルデータを記録
可能な光ディスクであるDVD(ディジタル・バーサタ
イル・ディスクまたはディジタル・ビデオ・ディスク)
が実用化されている。DVDのうち、ビデオデータ等を
記録するDVDビデオでは、MPEG(Moving Picture
Experts Group)2規格で圧縮された画像データを記録
するようになっている。
【0003】MPEG2規格では、符号化方式として、
動き補償を併用した双方向予測符号化方式を採用してい
る。この符号化方式では、DCT(離散コサイン変換)
と画像の時間的および空間的な相関を用いて空間方向の
冗長度および時間方向の冗長度の除去を行うことによっ
て、効率の良い圧縮符号化を可能としている。双方向予
測符号化方式では、フレーム(ピクチャ)内だけで符号
化するフレーム内符号化、過去のフレームから現在のフ
レームを予測することによって符号化するフレーム間順
方向予測符号化、過去および未来のフレームから現在の
フレームを予測することによって符号化する双方向予測
符号化の3つのタイプの符号化が行われる。この符号化
方式では、フレーム内符号化によって符号化されるピク
チャをIピクチャ(intra coded picture )、フレーム
間順方向予測符号化によって符号化されるピクチャをP
ピクチャ(predictive coded picture)、双方向予測符
号化によって符号化されるピクチャをBピクチャ(bidi
rectionally predictive coded picture)と呼ぶ。ま
た、必ずIピクチャを一つ以上含むようにI,P,Bの
各ピクチャを適切に組み合わせて、ランダムアクセスの
単位となるGOP(Group of picture)が構成される。
【0004】ここで、図16を参照して、GOPの構造
について説明する。図16において、I,P,Bは、そ
れぞれIピクチャ、Pピクチャ、Bピクチャを表してい
る。なお、他の図においても同様である。図16(a)
は、GOPの構成の一例を表示順に示したものである。
この例では、15枚のピクチャによってGOPが構成さ
れ(GOPを構成するピクチャ数N=15)、1GOP
内に1枚のIピクチャが含まれ、IピクチャまたはPピ
クチャの現れる周期(M)は3であり、隣り合うIまた
はPピクチャ間に2つのBピクチャが挿入されている。
表示順では、GOPの先頭は、Iピクチャの前の最初の
PピクチャまたはIピクチャの次のピクチャであり、G
OPの最後は、次のIピクチャの前の最初のPピクチャ
である。図16(a)において、矢印は、予測方向を表
している。図16(b)は、同じGOPの構成を、符号
化順に示したものである。このように、符号化の際に
は、Bピクチャの符号化の前に、Bピクチャの予測の際
に参照するIピクチャまたはPピクチャが符号されるよ
うに、ピクチャの並べ替えが行われる。
【0005】ところで、圧縮された画像情報を、DV
D、ビデオCD(コンパクト・ディスク)等のパッケー
ジメディアに蓄積させる符号化システムでは、一般に、
いわゆる2パスエンコーディング方式が採用されてい
る。この2パスエンコーディング方式では、最初に、予
備的な符号化を行って、符号化する素材の画像の符号化
の難易度を表す符号化難易度を測定し、その符号化難易
度に基づいて、与えられた符号量に収まるように、各ピ
クチャごとに符号量の配分を行って正式な符号化を行
う。
【0006】
【発明が解決しようとする課題】ところで、MPEG2
規格で採用している動き補償を併用した双方向予測符号
化方式によって生成されるデータには、実際のDCT係
数に関わる符号化データと、動き補償のための動きベク
トルデータとが含まれる。
【0007】ところが、この動き補償を併用した双方向
予測符号化方式では、符号化する素材中の画像の時間的
または空間的な相関が悪い部分においては、予測が当た
らないため、実際のDCT係数に関わる符号化データの
データ量に比べて、非常に多くの動きベクトルデータが
発生する。特に、Bピクチャにおいて時間的に前後(過
去および未来)のピクチャを参照した場合には、順方向
予測の場合の約2倍のデータ量の動きベクトルデータが
発生する。そのため、動きベクトルデータのデータ量
が、そのピクチャにおける全データ量の半分以上となる
こともある。そのような部分では、限られた割り当て符
号量(データ量)の中で、実際のDCT係数に関わる符
号化データのデータ量が抑えられてしまうため、符号化
効率が著しく低下し、その結果、画質が劣化するという
問題点があった。
【0008】本発明はかかる問題点に鑑みてなされたも
ので、その目的は、符号化する素材中の画像の時間的ま
たは空間的な相関が悪い部分における符号化効率を向上
させて、限られた割り当て符号量に対して、画質を改善
できるようにした画像符号化装置および方法を提供する
ことにある。
【0009】
【課題を解決するための手段】本発明の画像符号化装置
は、入力画像データを、フレーム内符号化によって符号
化されるべきフレーム内符号化ピクチャと、動き補償を
併用し、予測方向が1方向以上のフレーム間予測符号化
によって符号化されるべき1種類以上のフレーム間予測
符号化ピクチャとを含む複数のピクチャタイプに分け、
入力画像データをピクチャ毎にピクチャタイプに応じた
符号化方法によって符号化して、符号化データと動き補
償のための動きベクトルデータとを生成する符号化手段
と、この符号化手段によって符号化を行う前のピクチャ
の符号化の難易度を表す符号化難易度を取得し、この符
号化難易度に基づいて、少なくとも1種類のフレーム間
予測符号化ピクチャに関して、符号化難易度が所定の条
件を満たすか否かを判断し、符号化難易度が所定の条件
を満たす場合に、ピクチャタイプをフレーム内符号化ピ
クチャまたは予測方向の数がより少ないフレーム間予測
符号化ピクチャに変更させるように、符号化手段を制御
する符号化制御手段とを備えたものである。
【0010】本発明の画像符号化方法は、入力画像デー
タを、フレーム内符号化によって符号化されるべきフレ
ーム内符号化ピクチャと、動き補償を併用し、予測方向
が1方向以上のフレーム間予測符号化によって符号化さ
れるべき1種類以上のフレーム間予測符号化ピクチャと
を含む複数のピクチャタイプに分け、入力画像データを
ピクチャ毎にピクチャタイプに応じた符号化方法によっ
て符号化して、符号化データと動き補償のための動きベ
クトルデータとを生成する画像符号化方法であって、符
号化を行う前のピクチャの符号化の難易度を表す符号化
難易度を取得する符号化難易度取得手順と、この符号化
難易度取得手順によって取得した符号化難易度に基づい
て、少なくとも1種類のフレーム間予測符号化ピクチャ
に関して、符号化難易度が所定の条件を満たすか否かを
判断し、符号化難易度が所定の条件を満たす場合には、
ピクチャタイプをフレーム内符号化ピクチャまたは予測
方向の数がより少ないフレーム間予測符号化ピクチャに
変更させる処理を行うピクチャタイプ変更処理手順と、
このピクチャタイプ変更処理手順による処理の実行後の
ピクチャタイプに従って、入力画像データを符号化する
符号化手順と含むものである。
【0011】本発明の画像符号化装置では、符号化制御
手段によって、符号化を行う前のピクチャの符号化の難
易度を表す符号化難易度が取得され、この符号化難易度
に基づいて、少なくとも1種類のフレーム間予測符号化
ピクチャに関して、符号化難易度が所定の条件を満たす
か否かが判断され、符号化難易度が所定の条件を満たす
場合には、ピクチャタイプをフレーム内符号化ピクチャ
または予測方向の数がより少ないフレーム間予測符号化
ピクチャに変更させるように、符号化手段が制御され、
符号化手段によって、入力画像データがピクチャ毎にピ
クチャタイプに応じた符号化方法によって符号化され、
符号化データと動き補償のための動きベクトルデータと
が生成される。
【0012】本発明の画像符号化方法では、符号化難易
度取得手順によって、入力画像データの符号化が行われ
る前の符号化難易度が取得され、ピクチャタイプ変更処
理手順によって、符号化難易度に基づいて、少なくとも
1種類のフレーム間予測符号化ピクチャに関して、符号
化難易度が所定の条件を満たすか否かを判断し、符号化
難易度が所定の条件を満たす場合には、ピクチャタイプ
をフレーム内符号化ピクチャまたは予測方向の数がより
少ないフレーム間予測符号化ピクチャに変更させる処理
が行われ、この処理の実行後のピクチャタイプに従っ
て、符号化手順によって、入力画像データが符号化され
る。
【0013】
【発明の実施の形態】以下、本発明の一実施の形態につ
いて図面を参照して詳細に説明する。図2は、本実施の
形態に係る画像符号化装置としてのビデオエンコード装
置を含むDVD用のオーサリング装置の構成を示すブロ
ック図である。このオーサリング装置10は、ビデオ
(画像)データを入力し、圧縮符号化するビデオエンコ
ード装置11と、オーディオデータを入力し、圧縮符号
化するオーディオエンコード装置12と、字幕等の静止
画像データを入力し、符号化するサブピクチャエンコー
ド装置13と、メニュー画面のビデオデータを符号化す
るメニューエンコード装置14と、これらの符号化され
たデータをDVD規格に即した順序で多重化するマルチ
プレクサ15と、多重化処理後のデータをディスク製造
工程に渡すために所定の記録媒体に記録するストリーマ
16と、各エンコード装置11〜14、マルチプレクサ
15およびストリーマ16に接続された、例えばRAI
D(Redundant Array of Inexpensive Disks)構成のハ
ードディスク装置(HDD)17と、ネットワーク19
を介して、上記各構成要素に接続され、これらの動作を
管理するスーパバイザ18とを備えている。
【0014】ここで、上述のオーサリング装置10の動
作の概略について説明する。スーパバイザ18は、ビデ
オエンコード装置11、オーディオエンコード装置1
2、サブピクチャエンコード装置13およびメニューエ
ンコード装置14に符号化処理の開始を指示する。各エ
ンコード装置11〜14は、この指示により符号化処理
を開始する。その結果得られるデータは、スーパバイザ
18から指示されたハードディスク装置17の記憶領域
に順次格納される。各エンコーダ装置11〜14におけ
る符号化処理が終了すると、マルチプレクサ15におい
て多重化処理を行う。
【0015】マルチプレクサ15は、スーパバイザ18
の指示により、ハードディスク装置17の記憶領域か
ら、符号化によって得られたデータを読み出し、これを
DVD規格に即した順序で多重化し、その結果得られる
多重化データを、スーパバイザ18に指示されたハード
ディスク装置17の記憶領域に順次格納する。また、ス
トリーマ16は、ディスク製造工程に多重化処理後のデ
ータを渡すために、スーパバイザ18の指示によりハー
ドディスク装置17の記憶領域から多重化データを読み
出し、これを所定のテープ状の記録媒体に順次記録す
る。スーパバイザ18は、ストリーマ16から記録終了
の通知を受信すると、記録処理が終了したとして記録用
データの作成を終了する。
【0016】図1は、本実施の形態に係る画像符号化装
置としてのビデオエンコード装置11の構成を示すブロ
ック図である。このビデオエンコード装置11は、例え
ばVTR(ビデオテープレコーダ)21にケーブル20
aを介して接続されると共に、ハードディスク装置17
に例えばSCSI(Small Computer System Interface
)を用いたケーブル20bを介して接続され、VTR
21より出力されるビデオデータS1 を、MPEG2規
格による動き補償を併用した双方向予測符号化方式によ
って圧縮符号化して、圧縮画像データS2 をハードディ
スク装置17に出力する符号化手段としてのビデオエン
コーダ22と、このビデオエンコーダ22にケーブル2
0cを介して接続され、ビデオエンコーダ22による圧
縮処理結果を表示するためのモニタ装置23と、ネット
ワーク19を介してスーパバイザ18に接続されると共
に、VTR21、ビデオエンコーダ22にそれぞれ、例
えばRS−422規格のケーブル20d、例えばイーサ
ネットを用いたケーブル20eを介して接続され、VT
R21およびビデオエンコーダ22を制御する符号化制
御手段としてのビデオエンコーダ制御装置24とを備え
ている。なお、VTR21からビデオエンコーダ22に
対しては、ビデオデータS1 と共に、タイムコードと同
期信号も送られるようになっている。
【0017】ビデオエンコーダ制御装置24は、符号化
処理におけるビット配分計算を行うビット配分部25
と、ビデオエンコーダ22を制御するエンコーダコント
ロール部26と、VTR21を制御するVTRコントロ
ール部27と、ユーザインタフェースの制御を行うと共
に、ネットワーク19を介してスーパバイザ18に接続
され、ビット配分部25とVTRコントロール部27を
管理するグラフィカルユーザインタフェース(以下、G
UI(Graphical User Interface)という。)部28と
を有している。なお、ビット配分部25、エンコーダコ
ントロール部26、VTRコントロール部27およびG
UI部28は、それぞれ所定のプログラムによって実現
されるようになっている。
【0018】図1において、スーパバイザ18およびビ
デオエンコーダ制御装置24は、それぞれコンピュータ
によって実現される。
【0019】図1に示した構成において、スーパバイザ
18は、DVDのオーサリングシステム全体の管理を行
い、ビデオ、オーディオ、サブピクチャおよびメニュー
用の各エンコード装置11〜14に符号化条件を与え
て、各エンコード装置11〜14より符号化結果の報告
を受けるようになっている。図1に示した例では、スー
パバイザ18は、ビデオエンコーダ制御装置24のGU
I部28に対して、ファイルv.enc によってビデオデー
タの符号化条件を指定し、ビデオエンコーダ制御装置2
4のGUI部28は、スーパバイザ18に対して、符号
化結果のビットストリームが書き込まれたハードディス
ク装置17上のアドレスを示すアドレスデータv.adr
と、ビットストリームを多重化する際に必要な多重化用
データvxxx.auiを報告するようになっている。
【0020】ビデオエンコーダ制御装置24内におい
て、GUI部28は、ビット配分部25に対してファイ
ルv.enc を与え、ビット配分部25は、GUI部28に
対してアドレスデータv.adr および多重化用データvxx
x.auiを与えるようになっている。GUI部28は、ビ
ット配分部25に対して、更に、後述するカスタマイズ
におけるビット配分のための重み付けファイルweight.t
xtを与えるようになっている。
【0021】ビット配分部25は、エンコーダコントロ
ール部26に対して、ビット配分計算の結果に基づくビ
デオエンコーダ22の制御条件を、コントロールファイ
ルCTL fileとして与え、エンコーダコントロール部26
は、ビット配分部25に対して、後述する符号化難易度
を表す符号化難易度データdifficultyを与えるようにな
っている。
【0022】GUI部28は、VTRコントロール部2
7に対して、VTR21を動作させるための各種コマン
ドcommand を与え、VTRコントロール部27は、GU
I部28に対して、VTR21の各種の状態を表すステ
ータスデータstate とVTR21の異常を表すエラーデ
ータerror を与えるようになっている。
【0023】図3は、ビデオエンコーダ22の構成の一
例を示すブロック図である。この図に示したビデオエン
コーダ22は、入力ビデオデータS1 を入力し、符号化
する順番に従ってピクチャ(Iピクチャ,Pピクチャ,
Bピクチャ)の順番を並べ替える画像並べ替え回路31
と、この画像並べ替え回路31の出力データを入力し、
フレーム構造かフィールド構造かを判別し、判別結果に
応じた走査変換および16×16画素のマクロブロック
化を行う走査変換・マクロブロック化回路32と、この
走査変換・マクロブロック化回路32の出力データに基
づいて、符号化の対象となるピクチャの注目マクロブロ
ックと、参照されるピクチャにおいて注目マクロブロッ
クとの間の画素値の差分の絶対値和あるいは自乗和が最
小となるマクロブロックを探して、動きベクトルを検出
して、動きベクトルデータを出力する動き検出回路33
とを備えている。
【0024】ビデオエンコーダ22は、更に、走査変換
・マクロブロック化回路32の出力データと予測画像デ
ータとの差分をとる減算回路34と、この減算回路34
の出力データに対して、DCTブロック単位でDCTを
行い、DCT係数を出力するDCT回路35と、このD
CT回路35の出力データを量子化する量子化回路36
と、この量子化回路36の出力データを可変長符号化し
て符号化データを生成する共に、この符号化データと動
き検出回路33より出力される動きベクトルデータ等の
付帯データとを多重化して出力する可変長符号化回路3
7と、この可変長符号化回路37の出力データを一旦保
持し、ビットストリームからなる圧縮画像データS2
して出力するバッファメモリ38と、量子化回路36の
出力データを逆量子化する逆量子化回路39と、この逆
量子化回路39の出力データに対して逆DCTを行う逆
DCT回路40と、この逆DCT回路40の出力データ
と予測画像データとを加算して出力する加算回路41
と、この加算回路41の出力データを保持し、動き検出
回路33より出力される動きベクトルデータに応じて動
き補償を行って予測画像データを減算回路34および加
算回路41に出力する動き補償回路42と、量子化回路
36における量子化特性値に対応する量子化インデック
スを決定し、量子化回路36に与える量子化インデック
ス決定部43とを備えている。
【0025】画像並べ替え回路31は、エンコーダコン
トロール部26からピクチャタイプの情報S3 を受け取
り、この情報S3 に従ってピクチャの順番を並べ替える
ようになっている。バッファメモリ38は、発生ビット
量の情報S5 をエンコーダコントロール部26と量子化
インデックス決定部43とに出力するようになってい
る。量子化インデックス決定部43は、エンコーダコン
トロール部26から各ピクチャへの割り当てビット量の
情報S4 を受け取り、この情報S4 とバッファメモリ3
8からの発生ビット量の情報S5 とに基づいて、発生ビ
ット量が割り当てビット量に近づくように量子化インデ
ックスを決定するようになっている。
【0026】ここで、図3に示したビデオエンコーダ2
2の動作について簡単に説明する。入力ビデオデータS
1 は、まず、画像並べ替え回路31に入力され、この画
像並べ替え回路31によって、ピクチャタイプの情報S
3 に従ってピクチャタイプを決定して、符号化する順番
に従ってピクチャ(Iピクチャ,Pピクチャ,Bピクチ
ャ)の順番を並べ替える。画像並べ替え回路31の出力
データは、走査変換・マクロブロック化回路32に入力
される。走査変換・マクロブロック化回路32は、フレ
ーム構造かフィールド構造かを判別し、判別結果に応じ
た走査変換およびマクロブロック化を行う。走査変換・
マクロブロック化回路32の出力データは、動き検出回
路33および減算回路34に送られる。動き検出回路3
3は、動きベクトルを検出して、動きベクトルデータを
動き補償回路42および可変長符号化回路37に送る。
【0027】Iピクチャの場合には、減算回路34にお
いて予測画像データとの差分をとることなく、走査変換
・マクロブロック化回路32の出力データをそのままD
CT回路35に入力してDCTを行い、量子化回路36
によってDCT係数を量子化し、可変長符号化回路37
によって量子化回路36の出力データを可変長符号化
し、バッファメモリ38によって可変長符号化回路37
の出力データを一旦保持し、ビットストリームからなる
圧縮画像データS2 として出力する。また、逆量子化回
路39によって量子化回路36の出力データを逆量子化
し、逆DCT回路40によって逆量子化回路39の出力
データに対して逆DCTを行い、逆DCT回路40の出
力データを加算回路41を介して動き補償回路42に入
力して保持させる。
【0028】Pピクチャの場合には、動き補償回路42
によって、保持している過去のIピクチャまたはPピク
チャに対応する画像データと動き検出回路33からの動
きベクトルデータとに基づいて予測画像データを生成
し、予測画像データを減算回路34および加算回路41
に出力する。また、減算回路34によって、走査変換・
マクロブロック化回路32の出力データと動き補償回路
42からの予測画像データとの差分をとり、DCT回路
35によってDCTを行い、量子化回路36によってD
CT係数を量子化し、可変長符号化回路37によって量
子化回路36の出力データを可変長符号化すると共に動
きベクトルデータを多重化し、バッファメモリ38によ
って可変長符号化回路37の出力データを一旦保持し圧
縮画像データS2 として出力する。また、逆量子化回路
39によって量子化回路36の出力データを逆量子化
し、逆DCT回路40によって逆量子化回路39の出力
データに対して逆DCTを行い、加算回路41によって
逆DCT回路40の出力データと予測画像データとを加
算し、動き補償回路42に入力して保持させる。
【0029】Bピクチャの場合には、動き補償回路42
によって、保持している過去および未来のIピクチャま
たはPピクチャに対応する2つの画像データと動き検出
回路33からの2つの動きベクトルとに基づいて予測画
像データを生成し、予測画像データを減算回路34およ
び加算回路41に出力する。また、減算回路34によっ
て、走査変換・マクロブロック化回路32の出力データ
と動き補償回路42からの予測画像データとの差分をと
り、DCT回路35によってDCTを行い、量子化回路
36によってDCT係数を量子化し、可変長符号化回路
37によって量子化回路36の出力データを可変長符号
化すると共に動きベクトルデータを多重化し、バッファ
メモリ38によって可変長符号化回路37の出力データ
を一旦保持し圧縮画像データS2 として出力する。な
お、Bピクチャは動き補償回路42に保持させない。
【0030】バッファメモリ38は、発生ビット量の情
報S5 をエンコーダコントロール部26と量子化インデ
ックス決定部43とに出力する。量子化インデックス決
定部43は、エンコーダコントロール部26からの各ピ
クチャへの割り当てビット量の情報S4 とバッファメモ
リ38からの発生ビット量の情報S5 とに基づいて、発
生ビット量が割り当てビット量に近づくように量子化イ
ンデックスを決定し、量子化回路36に与える。
【0031】次に、図4を参照して、本実施の形態に係
る画像符号化装置としてのビデオエンコード装置11の
動作について説明する。なお、以下の説明は、本実施の
形態に係る画像符号化方法の説明を兼ねている。ここで
は、2パスエンコーディング方式によって符号化する場
合について説明する。2パスエンコーディング方式で
は、最初に、予備的な符号化処理を行って、符号化する
素材の画像の符号化の難易度を表す符号化難易度を測定
し、その符号化難易度に基づいて、与えられた符号量に
収まるように、各ピクチャごとに符号量の配分を行って
正式な符号化処理を行う。
【0032】ビデオエンコード装置11は、始めに、ビ
デオエンコーダ制御装置24のGUI部28によって、
ネットワーク19経由で、スーパバイザ18に対して、
DVD等のディスクの容量の中からビデオデータに割り
当てられたビット総量や最大ビットレート等の符号化条
件を取りに行く。この符号化条件は、ファイルv.encに
よって、スーパバイザ18よりGUI部28に与えら
れ、更に、ビット配分部25に与えられ、ビット配分部
25において符号化条件が設定される(ステップS10
1)。
【0033】次に、ビデオエンコード装置11は、予備
的な1パス目の符号化処理を行って、符号化難易度の測
定を行う(ステップS102)。この予備的な符号化処
理では、GUI部28がVTRコントロール部27にコ
マンドcommand を与え、このコマンドcommand に基づい
て、VTRコントロール部27がVTR21を制御し
て、磁気テープよりビデオデータS1 を再生させる。こ
のビデオデータS1 は、ビデオエンコーダ22に入力さ
れる。ビデオエンコーダ22は、エンコーダコントロー
ル部26の制御により、ビデオデータS1 の圧縮符号化
を行う。予備的な符号化処理では、ビデオエンコーダ2
2における符号化の際の量子化ステップ数を固定値に設
定した条件で符号化処理を行い、発生ビット量を測定す
る。動きが多く、高い周波数成分が多い画像では、発生
ビット量が大きくなり、静止画や平坦な部分が多い画像
では発生ビット量が少なくなる。従って、予備的な符号
化処理における発生ビット量は、符号化する素材の画像
の符号化の難易度を表すものと言える。そこで、本実施
の形態では、この発生ビット量を、符号化難易度として
測定する。なお、ビデオエンコーダ22における符号化
処理によって発生されるデータには、実際のDCT係数
に関わる符号化データ(以下、単に符号化データとも言
う。)と、動き補償のための動きベクトルデータとが含
まれる。従って、発生データ量は、符号化データのデー
タ量と動きベクトルデータのデータ量とを合わせたもの
となる。符号化難易度の情報は、発生ビット量の情報S
5 としてビデオエンコーダ22よりエンコーダコントロ
ール部26に与えられ、更に、符号化難易度データdiff
icultyとしてエンコーダコントロール部26よりビット
配分部25に与えられる。
【0034】次に、ビット配分部25は、与えられた符
号化条件を基に、各ピクチャの符号化難易度に応じて、
各ピクチャへ割り当てビット量を配分するためのビット
配分計算を行う(ステップS103)。ビット配分計算
については、後で詳しく説明する。ビット配分計算の結
果に基づくビデオエンコーダ22の制御条件は、コント
ロールファイルCTL fileとして、ビット配分部25より
エンコーダコントロール部26に与えられる。
【0035】次に、ビデオエンコード装置11は、ビッ
ト配分計算の結果に基づくビデオエンコーダ22の制御
条件に従って、プレビューの処理を行う(ステップS1
04)。このプレビューの処理は、使用者が任意の処理
範囲を指定してビデオデータを圧縮符号化し、得られた
データを、ハードディスク装置17に出力せずに、ビデ
オエンコーダ22内部のデコーダ(復号化器)によって
復号化してモニタ装置23によって表示させる処理であ
る。使用者は、このモニタ装置23に表示された画像の
画質を評価し(ステップS105)、画質に満足しない
場合(NG)には、カスタマイズ処理を行う(ステップ
S106)。このカスタマイズ処理は、画質に問題のあ
る部分のビットレートを上げたり、符号化の前に施す時
間的、空間的なフィルタのフィルタレベルを調整すると
いった部分的に符号化の条件を変更する処理である。ビ
デオエンコーダ制御装置24のGUI部28は、カスタ
マイズ処理における使用者の操作に応じて、符号化難易
度を補正する重み付けファイルweight.txtを作成し、ビ
ット配分部25に与える。ビット配分部25は、この重
み付けファイルweight.txtに基づいて、ビット配分を再
計算する(ステップS107)。ビット配分再計算後の
ビデオエンコーダ22の制御条件は、コントロールファ
イルCTL fileとして、ビット配分部25よりエンコーダ
コントロール部26に与えられる。そして、ビデオエン
コード装置11の動作は、ステップS104のプレビュ
ーの処理に戻る。
【0036】一方、使用者は、プレビューの処理の結
果、画質に満足した場合(OK)は、正式な符号化処理
の実行を指示し、これにより、正式な符号化処理が実行
される(ステップS108)。この符号化処理では、G
UI部28がVTRコントロール部27にコマンドcomm
and を与え、このコマンドcommand に基づいて、VTR
コントロール部27がVTR21を制御して、磁気テー
プよりビデオデータS1を再生させる。このビデオデー
タS1 は、ビデオエンコーダ22に入力される。ビデオ
エンコーダ22は、エンコーダコントロール部26の制
御により、ビデオデータS1 の圧縮符号化を行う。正式
な符号化処理では、ステップS103またはステップS
107によるビット配分計算後のビデオエンコーダ22
の制御条件に従って、エンコーダコントロール部26に
よって、ビデオエンコーダ22が制御されて、ビデオデ
ータS1 が圧縮符号化される。圧縮符号化によって得ら
れた圧縮画像データS2 は、ハードディスク装置17に
記録される。この圧縮符号化後、ビデオエンコーダ制御
装置24は、符号化処理結果(アドレスデータv.ad
rおよび多重化用データvxxx.aui)をネットワ
ーク19を介して、スーパバイザ18に報告する後処理
を行い(ステップS109)、ビデオエンコード装置1
1による符号化作業が終了する。
【0037】なお、図4に示した動作のうち、ステップ
S101,S103,S105,S106,107,1
09は、コンピュータ(ビデオエンコーダ制御装置2
4)上のオフライン処理である。
【0038】次に、図5を参照して、図4におけるビッ
ト配分計算(ステップS103)について詳細に説明す
る。このビット配分計算の概略は、スーパバイザ18よ
り与えられたビット総量QTY BYTES と最大ビットレート
MAXRATE とに基づいて、最大ビットレート以下になるよ
うに制限を加えた総ビット量USB BYTES を求め、この値
からGOPヘッダに必要なビット量TOTAL HEADERを引い
て、各ピクチャへの割り当てビット量の総和の目標値と
なるビット量SUPPLY BYTESを算出し、このビット量SUPP
LY BYTESの大きさの範囲内に収まるように、各ピクチャ
への割り当てビット量targetを配分することである。
【0039】具体的には、ビット配分部25は、始め
に、ファイルv.enc によって、GUI部28を介してス
ーパバイザ18より、ビット総量QTY BYTES 、最大ビッ
トレートMAXRATE 等の符号化条件を入力する(ステップ
S201)。次に、ビット配分部25は、エンコーダコ
ントロール部26より符号化難易度データdifficultyを
入力する(ステップS202)。
【0040】次に、ビット配分部25は、シーンチェン
ジ検出および処理を行う(ステップS203)。すなわ
ち、ビデオエンコーダ制御装置24は、符号化難易度を
測定する際に、各画像の直流(DC)成分の値や動きベ
クトルデータのデータ量の大きさ等のパラメータも併せ
て測定し、それらのパラメータの変化量から、シーンが
変化するポイントを見つけることが可能であり、ビット
配分部25は、これを用いてシーンチェンジの検出およ
びその処理を行う。
【0041】ここで、図6を参照して、シーンチェンジ
検出および処理について詳しく説明する。シーンチェン
ジとは、場面が切り換わることである。MPEG2規格
による動き補償を併用した双方向予測符号化方式によっ
て圧縮符号化処理を行う場合には、このシーンチェンジ
のフレームがPピクチャに設定されると画質が劣化す
る。そこで、シーンチェンジ検出および処理では、Pピ
クチャがシーンチェンジのフレームに設定されたことを
検出し、そのPピクチャをIピクチャに変更する処理を
行う。図6(a)は、GOPの構成の一例を表示順に示
したものであり、ここでは、符号60で示したPピクチ
ャがシーンチェンジのフレームに設定されている。その
ため、シーンチェンジ検出および処理では、図6(b)
に示したように、このPピクチャをIピクチャに変更す
る。
【0042】なお、シーンチェンジのフレームは、例え
ば、ビデオエンコーダ制御装置24によって、符号化難
易度の測定の際に、Iピクチャ、Pピクチャについて、
輝度レベルの直流レベル、動き補償で用いる差分データ
の加算値をビデオエンコーダ22から取得し、これら直
流レベルや差分データの加算値により検出することがで
きる。
【0043】また、シーンチェンジ検出および処理と同
様に、フラッシュの検出および処理を行うこともでき
る。ここで言うフラッシュとは、例えば写真撮影のフラ
ッシュが点灯したような場合で、フラッシュのフレーム
を間に挟んで、前後のフレームで連続性が維持されてい
る場合である。フラッシュの検出および処理では、この
フラッシュを検出し、フラッシュの次のフレームをIピ
クチャに変更する。
【0044】次に、ビット配分部25は、チャプタ処理
を行う(ステップS204)。DVDプレイヤでのチャ
プタサーチ時には、特定されないピクチャからチャプタ
へジャンプしてくるが、チャプタ処理は、その場合で
も、再生画像の乱れがないように、チャプタの位置が必
ずGOPの先頭になるようにピクチャタイプを変更する
処理である。
【0045】ここで、図7を参照して、チャプタ処理の
一例について説明する。図7(a)は、GOPの構成の
一例を表示順に示したものであり、ここでは、符号70
で示したPピクチャがチャプタのフレームに指定されて
いる。この場合、チャプタ処理では、Pピクチャ70を
Iピクチャに変更すると共に、チャプタの直前のBピク
チャ71をPピクチャに変更して、チャプタの前後のフ
レームにおいて、チャプタの前後に予測フレームが跨ら
ないようにBピクチャ、Pピクチャを設定する。
【0046】次に、ビット配分部25は、符号化難易度
に基づいて、少なくとも1種類のフレーム間予測符号化
ピクチャ(Pピクチャ,Bピクチャ)に関して、符号化
難易度が所定の条件を満たすか否かを判断し、符号化難
易度が所定の条件を満たす場合に、ピクチャタイプをフ
レーム内符号化ピクチャ(Iピクチャ)または予測方向
の数がより少ないフレーム間予測符号化ピクチャ(Pピ
クチャ)に変更するピクチャタイプの変更処理を行う
(ステップS205)。このピクチャタイプの変更処理
については、後で詳しく説明する。
【0047】なお、ステップS203ないしステップS
205の各処理によって決定されたピクチャタイプの情
報は、後に、エンコーダコントロール部26より、ピク
チャタイプの情報S3 として、ビデオエンコーダ22の
画像並べ替え回路31に与えられ、ビデオエンコーダ2
2では、ステップS203ないしステップS205の各
処理によって決定されたピクチャタイプに従って符号化
処理が行われることになる。
【0048】次に、ビット配分部25は、符号化難易度
の補間および補正処理を行う(ステップS206)。す
なわち、ステップS203ないしステップS205の各
処理によってピクチャタイプが変更されると、符号化難
易度を測定した際のピクチャタイプと正式な符号化処理
を行う際のピクチャタイプとが異なってしまうため、符
号化難易度の補間および補正処理では、ピクチャタイプ
が変更されたフレームに関して、例えば近接したフレー
ムの符号化難易度の値を利用して、符号化難易度の値が
変更後のピクチャタイプに応じた値となるように、符号
化難易度の補間または補正を行う。
【0049】次に、ビット配分部25は、補間および補
正処理後の符号化難易度と、スーパバイザ18より与え
られたビット総量QTY BYTES 等に基づいて、各ピクチャ
への割り当てビット量targetを計算する(ステップS2
07)。次に、ビット配分部25は、計算した割り当て
ビット量targetに基づいて、圧縮画像データを記録する
ハードディスク装置17上のアドレスを計算し(ステッ
プS208)、更に、この計算したアドレスと割り当て
ビット量targetとを順次記述して、ビデオエンコーダ2
2用のコントロールファイルCTL fileを作成し(ステッ
プS209)、ビット配分計算の処理を終了し、ビデオ
エンコード装置11の動作は、図4におけるステップS
104へ進む。
【0050】以下、ステップS207における割り当て
ビット量targetの計算方法の一例について説明する。こ
の例では、まず、スーパバイザ18より与えられたビッ
ト総量QTY BYTES と最大ビットレートMAXRATE とに基づ
いて、次の式(1)により、最大ビットレート以下にな
るように制限を加えた総ビット量USB BYTES を求める。
【0051】 USB BYTES =min(QTY BYTES,MAXRATE ×KT×total frame number) …(1)
【0052】式(1)において、KTは定数であり、NT
SC方式の場合はKT=1/8(bits)/30(Hz)、P
AL方式の場合はKT=1/8(bits)/25(Hz)であ
る。total frame numberは、符号化する素材のフレーム
総数である。min(s,t)は、sとtのうちで小さい方を選
択する関数である。
【0053】次に、式(2)で示すように、式(1)で
求めたUSB BYTES から、GOPヘッダに必要なビット量
TOTAL HEADERを引いて、各ピクチャへの割り当てビット
量の総和の目標値となるビット量SUPPLY BYTESを算出す
る。
【0054】 SUPPLY BYTES=USB BYTES −TOTAL HEADER …(2)
【0055】本例では、式(2)で求まったビット量SU
PPLY BYTESを、まず、GOP単位に配分し、その後、各
GOP内で各ピクチャの符号化難易度に応じて配分する
ものとする。ここでは、各GOP毎の符号化難易度の和
gop diffに応じて、符号化する際のGOP単位のビット
割当量gop targetを配分している。図8は、この符号化
難易度の和gop diffとGOP単位のビット割当量gop ta
rgetとを変換する関数の一例を示したものである。この
例では、Yをgop target、Xをgop diffとして、Y=A
X+Bという評価関数を用いている。この評価関数を用
いて、割り当てビット量targetを以下のようにして求め
る。
【0056】まず、次の式(3)により、全てのピクチ
ャの符号化難易度の総和DIFFICULTYSUMを求める。な
お、difficultyは、各ピクチャの符号化難易度である。
【0057】DIFFICULTY SUM=Σdifficulty …(3)
【0058】ここで、評価関数Y=AX+Bより、次の
式(4)が成り立つ。
【0059】ΣY=A×ΣX+B×n …(4)
【0060】ここで、ΣY=SUPPLY BYTES、ΣX=DIFF
ICULTY SUMであり、nはGOPの総数である。また、B
を、GOP単位のビット割り当て量の最小値gop minbyt
esとする。
【0061】従って、式(4)により、Aは次の式
(5)で表される。
【0062】 A=(SUPPLY BYTES−gop minbytes×n)/DIFFICULTY SUM …(5)
【0063】GOP単位のビット割り当て量gop target
は上述の評価関数より、次の式(6)で表される。
【0064】gop target=A×gop diff+B …(6)
【0065】この式(6)中のAは式(5)で与えら
れ、Bはgop minbytesである。
【0066】次に、式(6)で求まったGOP単位のビ
ット割り当て量gop targetを、各GOP内で各ピクチャ
の符号化難易度に応じて配分する。GOP内での各ピク
チャへのビット配分を符号化難易度の大きさに比例させ
た場合には、各ピクチャの割り当てビット量targetは、
次の式(7)により求められる。
【0067】 target(k) =gop target×difficulty(k) /gop diff …(7)
【0068】なお、式(7)において、kはGOP内の
ピクチャ数を越えない任意の値とし、target(k) はk番
目のピクチャの割り当てビット量、difficulty(k) はk
番目のピクチャの符号化難易度を表す。
【0069】このようにして、各ピクチャの割り当てビ
ット量targetが計算されるが、素材の中に極端に難しい
(各GOPごとの符号化難易度の和gop diffの値が大き
くなる)ピクチャがあると、GOP単位のビット割り当
て量gop targetの値が非常に大きくなり、オーサリング
装置において許容されている最大ビットレートMAXRATE
を越えてしまうため、GOP単位のビット割り当て量go
p targetには、図7に示したように、GOP単位のビッ
ト割り当て量の最大値gop maxbytesといった固定値で制
限をかける必要がある。また、割り当てビット量target
の最小値は、前述のgop minbytesによって制限される。
【0070】以上のようにして求められた各ピクチャの
割り当てビット量targetは、更に、次のようにして修正
される。すなわち、MPEG2規格でビデオデータを符
号化するときには、デコーダ(復号化装置)における入
力バッファに対応する仮想的なバッファのバッファ残量
を考慮しながらビット配分をすることが義務づけられて
いる。この仮想的なバッファの残量の計算をVBV(Vi
deo buffering verifier)という。また、この仮想的な
バッファをVBVバッファともいう。ここで、図9を参
照して、VBVの計算方法について説明する。DVDの
場合、バッファサイズVBVMAX(例えば1.75Mbits )
に対して、k番目のピクチャにおけるバッファのスター
ト点をOccupancy up(k)、k番目のピクチャの割り当
てビット量をtargetを(k)とすると、ピクチャ再生の
ためにビットを供給した後のバッファ残量Occupancy do
wn(k)は以下の式(9)で表される。なお、バッファ
のスタート点の初期値Occupancy up(0)は例えば式
(8)で表される固定値とする。
【0071】 Occupancy up(0)=VBVMAX×2/3 …(8) Occupancy down(k)=Occupancy up(k)−target(k) …(9)
【0072】このバッファには、デコーダ側のピックア
ップから、ビデオデータのデータ量に応じたビットレー
トのデータ量SYSTEM SUPPLY が蓄積される。ここで、デ
ータ量SYSTEM SUPPLY は次の式(10)で表される。
【0073】 SYSTEM SUPPLY =MAXRATE ×TW …(10)
【0074】なお、TWは、ピクチャの周期であり、NT
SC方式の場合は1/29.97、PAL方式の場合は
1/25である。
【0075】このデータ量SYSTEM SUPPLY が供給された
後のバッファ残量Occupancy up(k+1)は次の式(1
1)で表される。
【0076】 Occupancy up(k+1)=Occupancy down(k)+SYSTEM SUPPLY …(11)
【0077】この供給されるデータ量SYSTEM SUPPLY
は、図9において、Occupancy down(k)とOccupancy
up(k+1)との間の変化量に相当する。従って、供給
されるデータのビットレートが大きいほど、Occupancy
down(k)からOccupancy up(k+1)への変化の傾き
は大きくなり、バッファにデータが蓄積されやすくな
る。バッファが飽和状態となった場合には、ピックアッ
プからバッファへの供給が停止するため、バッファのオ
ーバフローに関しては考慮する必要はない。これは、バ
ッファ残量の任意の設定値に厳密に制御する必要はな
く、任意の設定値以上になるように制御すればよいこと
を意味している。
【0078】一方、各ピクチャのデータ量が大きい場
合、バッファに蓄積されたデータは大きく減少する。従
って、バッファ残量が一定値以下にならないように割り
当てビット量targetを修正する必要がある。
【0079】ここで、図10および図11を参照して、
上述のようなVBVの制限による割り当てビット量targ
etの修正処理について説明する。図10(a)は、前述
の評価関数とGOP単位のビット割り当て量の最大値go
p maxbytesの制限を考慮して求めた割り当てビット量ta
rget、すなわち、式(7)によって求めた割り当てビッ
ト量targetの一例を示し、図10(b)は、図10
(a)に対応するVBVバッファ残量の変化を示してい
る。なお、図中、VBVMAXはVBVバッファ残量の上限
値、VBVMINはVBVバッファ残量の下限値である。この
例では、第1番目、第4番目、第7番目のピクチャで、
VBVバッファ残量は下限値VBVMINを下回っている。従
って、このままでは、デコーダ側において、連続したビ
デオデータの再生が一時途切れるおそれがある。
【0080】そこで、VBVの制限による割り当てビッ
ト量の修正処理では、下限値VBVMINを下回ったピクチャ
を含むGOPの割り当てビット量を削減する。具体的に
は、まず、GOP内でVBVバッファ残量による制限を
加える前の割り当てビット量を用いてVBV計算を実行
したときのバッファ残量の最小値をOcc Min として、調
整量rを、次の式(12)によって求める。なお、制限
を行うスタート点kstartは、Occupancy up(k)が基準
値VBVLINE (例えばVBVMAXの4分の3)以上となるとき
のkの値で、このときのOccupancy up(k)の値をOcc
start とする。また、VBVSTARTは、Occupancy up(0)
となる固定値である。
【0081】Occ Min <VBVMINのとき r=(Occ start −VBVMIN)/(VBVSTART−Occ min ) …(12)
【0082】次に、この調整量rを用いて、次の式(1
3)により、修正後の割り当てビット量targetを求め
る。
【0083】 target(j)=target′(j)×r …(13)
【0084】ただし、target′は、修正前の割り当てビ
ット量を表している。また、jは、kstart≦j≦k であ
る。
【0085】図11(a)は、式(13)に従って、V
BVの制限による割り当てビット量の修正処理を行った
後の割り当てビット量targetの一例を示し、図11
(b)は、図11(a)に対応するVBVバッファ残量
の変化を示している。このように、VBVの制限による
割り当てビット量の修正処理を行うことによって、図1
1(b)に示した調整区間(kstart≦j≦k の区間)R
Cにおいて、VBVバッファ残量は下限値VBVMINを上回
るようになる。
【0086】このようにして求められた割り当てビット
量targetを用いて作成されたコントロールファイルCTL
fileに基づいて、エンコーダコントロール部26よりビ
デオエンコーダ22の量子化インデックス決定部43に
割り当てビット量の情報S4を与えて、ビデオエンコー
ダ22において符号化処理を行うことにより、素材の画
像の難しさに応じた可変ビットレートの符号化が実行さ
れる。
【0087】次に、図5におけるステップS205のピ
クチャタイプの変更処理について詳しく説明する。な
お、以下の説明では、次のような記号を用いる。
【0088】1. gen bit (k) 予備的な符号化によって測定されたk番目のフレームの
符号化難易度の値であり、この値が大きいほど画像が難
しいことを表す。なお、kは0以上kend(GOPの最後
のk)以下の値とする。 2. i bits(j) j番目のGOP内のIピクチャの符号化難易度の値を表
す。 3. b bits(j) j番目のGOP内のBピクチャの符号化難易度の値の和
を表す。 4. b nb(j) j番目のGOP内のBピクチャの数を表す。 5. b rate(j) j番目のGOPのBピクチャの符号化難易度の平均値と
Iピクチャの符号化難易度の比率を表し、次の式(1
4)により求められる。なお、jは1以上で、GOPの
総数total gop nb以下の値とする。
【0089】 b rate=b bits/b nb/i bits …(14)
【0090】6. pict rate (k) k番目のフレームのピクチャの符号化難易度とそのフレ
ームが属するGOPのIピクチャの符号化難易度の比率
を表し、次の式(15)により求められる。
【0091】 pict rate =gen bit (k)/i bits(j) …(15)
【0092】7. total gop nb GOPの総数である。 8. gop start (k) k番目のフレームがGOPの先頭である場合は1とし、
それ以外は0となる。 9. p type(k) k番目のフレームのピクチャタイプ(I,B,P)を表
す。 10. B AVR LIMIT 符号化難易度が所定の条件を満たすか否かの判断のため
のb rateに対する規定値であり、本発明における第1の
所定値に対応するものである。ここでは、一例として、
B AVR LIMIT =55とする。 11. BP CHG LIMIT 符号化難易度が所定の条件を満たすか否かの判断のため
のpict rate に対する規定値であり、本発明における第
2の所定値に対応するものである。ここでは、一例とし
て、BP CHG LIMIT=65とする。 12. DIFF LIMIT 符号化難易度が所定の条件を満たすか否かの判断のため
のgen bit に対する規定値であり、本発明における第3
の所定値に対応するものである。ここでは、一例とし
て、DIFF LIMIT=3000とする。
【0093】次に、図12の流れ図を参照して、図5に
おけるステップS205のピクチャタイプの変更処理に
ついて具体的に説明する。なお、ビデオエンコーダ制御
装置24では、ピクチャタイプの変更処理が開始される
時点で既に各GOPのb rateおよびpict rate は算出さ
れているものとする。ピクチャタイプの変更処理では、
まず、ビデオエンコーダ制御装置24のビット配分部2
5は、初期設定値としてjおよびkの値を0とする(ス
テップS301)。次に、ビット配分部25は、gop st
art (k)の値が1か否かを判断することにより、k番
目のフレームがGOPの先頭か否かを判断する(ステッ
プS302)。
【0094】gop start (k)が1、すなわちk番目の
フレームがGOPの先頭である場合(ステップS30
2;Y)には、j+1を新たなjとすると共に、変数k
kをkとし(ステップS303)、j番目のGOPのb
rate(j)がB AVR LIMIT を越えているか否かを判断す
る(ステップS304)。b rateがB AVR LIMIT を越え
ている場合(ステップS304;Y)は、kk番目のフ
レームのピクチャタイプp type(kk)がBピクチャで
あり、且つkk番目のフレームのpict rate (kk)が
BP CHG LIMITを越えており、且つkk番目のフレームの
gen bit (kk)がDIFF LIMITを越えているか否かを判
断する(ステップS305)。kk番目のフレームがB
ピクチャで、且つpict rate (kk)がBP CHG LIMITを
越えており、且つgen bit (kk)がDIFF LIMITを越え
ている場合(ステップS305;Y)は、ピクチャタイ
プをBピクチャからPピクチャに変更し(ステップS3
06)、kk+1を新たなkkとし(ステップS30
7)、gop start (kk)の値が1、すなわちkk番目
のフレームがGOPの先頭であるか、あるいはkkがke
ndを越えているか否かを判断する(ステップS30
8)。
【0095】kk番目のフレームがGOPの先頭ではな
く、且つkkがkendを越えていない場合(ステップS3
08;N)は、ステップS304に戻り、新たなkk番
目のフレームについて、ステップS304ないしステッ
プS308の処理を実行する。
【0096】kk番目のフレームがGOPの先頭である
か、あるいはkkがkendを越えている場合(ステップS
308;Y)は、k+1を新たなkとして(ステップS
309)、kがkendを越えているか否かを判断する(ス
テップS310)。kがkendを越えている、すなわち最
後のGOPまで処理を行った場合(ステップS310;
Y)、ピクチャタイプの変更の処理を終了する。kがke
ndを越えていない場合(ステップS310;N)は、ス
テップS302に戻り、次のGOPについて、ステップ
S302ないしステップS310の処理を実行する。
【0097】ステップS302において、gop start
(k)が1ではない、すなわちk番目のフレームがGO
Pの先頭ではない場合(N)、およびステップS304
において、b rate(j)がB AVR LIMIT を越えていない
場合(N)は、ステップS309に進む。また、ステッ
プS305において、kk番目のフレームがBピクチャ
ではない、あるいはpict rate (kk)がBP CHG LIMIT
を越えていない、あるいはgen bit (kk)がDIFF LIM
ITを越えていない場合(N)は、ステップS307に進
む。
【0098】以上のようなピクチャタイプの変更処理を
簡単に言うと、GOP内のBピクチャの符号化難易度の
平均値とIピクチャの符号化難易度の比率b rateによっ
て、Bピクチャによる予測が難しい区間を検出し、その
区間内のBピクチャのうち、そのピクチャの符号化難易
度とそのピクチャが属するGOPのIピクチャの符号化
難易度の比率pict rate が規定値BP CHG LIMITを越え、
且つそのピクチャの符号化難易度gen bit が規定値DIFF
LIMITを越えたものについて、ピクチャタイプを、予測
方向の数がより少ないフレーム間予測符号化ピクチャで
あるPピクチャに変更するというものである。このよう
な処理により、動きベクトルデータのデータ量を減少さ
せることができ、その結果、限られた割り当てデータ量
の中で、実際のDCT係数に関わる符号化データのデー
タ量を増加させて、画質を改善させることができる。
【0099】図13は、ピクチャタイプの変更処理の具
体例を示したものである。図13(a)は、予備的な符
号化によって測定された符号化難易度gen bit を表示順
に示したものである。なお、図13(a)には、gop st
art を併記している。図13(b)は、図13(a)で
示した符号化難易度に対して、GOP内のBピクチャの
符号化難易度の平均値とIピクチャの符号化難易度の比
率b rateを表したものである。このb rateが、規定値B
AVR LIMIT を越えた区間TCがピクチャタイプの変更対
象区間となる。図13(c)は、図13(a)と同様に
符号化難易度gen bit を表示順に示すと共に、変更対象
区間TC内のBピクチャのうち、ピクチャタイプの変更
処理によってPピクチャに変更したものを丸印を付して
示したものである。
【0100】図14は、時間的、空間的な相関が少ない
素材を、本実施の形態に係る画像符号化装置(ビデオエ
ンコード装置11)および画像符号化方法によって符号
化した場合のb rateを表したものである。図中、縦軸は
b rate、横軸はフレーム番号(Frame nb)×103 すな
わち時間を表している。平均的な素材では、b rateの値
は25程度になるが、このように相関が少ない素材で
は、極端にb rateが大きくなる部分が存在する。本実施
の形態では、極端にb rateが大きくなる範囲を、b rate
と規定値B AVR LIMIT との比較によって検出し、この範
囲について、ピクチャタイプの変更処理を行う。
【0101】図15は、図14で用いた素材に関して、
本実施の形態におけるピクチャタイプの変更処理を施し
て符号化した場合と従来の方式で符号化した場合とで、
GOP単位のフレーム毎の量子化ステップの平均値であ
る平均量子化数Average Qを比較して表したものであ
る。図中、縦軸は平均量子化数Average Q、横軸はフレ
ーム番号(Frame nb)×103 すなわち時間を表してい
る。図中、実線が本実施の形態におけるピクチャタイプ
の変更処理を施して符号化した場合を表し、破線が従来
の方式で符号化した場合を表している。同じビット量の
割り当てに対して、平均量子化数Average Qが小さいと
いうことは、より細かい情報まで符号化されていること
を意味し、これは符号化効率が良いことを示している。
図15から、本実施の形態におけるピクチャタイプの変
更処理を施して符号化した場合、従来の方式で符号化し
た場合に比べて、平均量子化数Average Qがかなり小さ
くなっていることが分かり、本実施の形態によって、画
質を改善できることが分かる。
【0102】以上説明したように本実施の形態によれ
ば、GOP内のBピクチャの符号化難易度の平均値とI
ピクチャの符号化難易度の比率b rateによって、Bピク
チャによる予測が難しい区間を検出し、その区間内のB
ピクチャのうち、そのピクチャの符号化難易度とそのピ
クチャが属するGOPのIピクチャの符号化難易度の比
率pict rate が規定値BP CHG LIMITを越え、且つそのピ
クチャの符号化難易度gen bit が規定値DIFF LIMITを越
えたものについて、ピクチャタイプをPピクチャに変更
するようにしたので、符号化する素材中の画像の時間的
または空間的な相関が悪い部分における動きベクトルデ
ータのデータ量を減少させることができ、その結果、限
られた割り当てデータ量の中で、実際のDCT係数に関
わる符号化データのデータ量を増加させて符号化効率を
向上させ、画質を改善させることができる。
【0103】なお、本発明は上記実施の形態に限定され
ず、例えば、実施の形態では、符号化難易度が所定の条
件を満たすBピクチャをPピクチャに変更するようにし
たが、符号化難易度が所定の条件を満たすBピクチャ
を、フレーム内符号化ピクチャであるIピクチャに変更
するようにしてもよい。
【0104】また、例えば、b rate,pict rate ,gen
bit に関する条件を、Pピクチャへの変更用とIピクチ
ャへの変更用の2種類設定し、b rate,pict rate ,ge
n bit がPピクチャへの変更用の条件を満たす場合には
BピクチャをPピクチャに変更し、b rate,pict rate
,gen bit がIピクチャへの変更用の条件を満たす場
合にはBピクチャをIピクチャに変更するようにしても
よい。
【0105】更に、Pピクチャに関しても、実施の形態
におけるBピクチャに関する条件と同様の条件を設定
し、その条件を満たすPピクチャをIピクチャに変更す
るようにしてもよい。具体的には、例えば、GOP内の
Pピクチャの符号化難易度の平均値とIピクチャの符号
化難易度の比率が第1の所定値を越える範囲を、Pピク
チャによる予測が難しい区間として検出し、その区間内
のPピクチャのうち、そのピクチャの符号化難易度とそ
のピクチャが属するGOPのIピクチャの符号化難易度
の比率が第2の所定値を越え、且つそのピクチャの符号
化難易度が第3の所定値を越えたものについて、ピクチ
ャタイプをIピクチャに変更するようにしてもよい。
【0106】また、ピクチャタイプを変更するための符
号化難易度の条件は、実施の形態で挙げた例に限らず,
適宜に設定可能である。
【0107】また、本発明は、実施の形態で挙げた2パ
スエンコーディング方式で符号化を行うシステムに限ら
ず、正式な符号化の直前に予備的な符号化を行って符号
化難易度を測定できるシステムや、正式な符号化の前に
予備的な符号化を行うことなく、入力ビデオデータに基
づいて符号化難易度を測定できるシステム等、正式な符
号化の前に符号化難易度を測定できるシステム全般につ
いて適用することができる。
【0108】また、符号化難易度は、実施の形態で挙げ
たように、予備的な符号化によって得られる符号化デー
タと動きベクトルデータとを合わせたデータのデータ量
に限らず、ピクチャの符号化の難易度を表すパラメータ
であればよく、例えば、予備的な符号化によって得られ
る符号化データと動きベクトルデータとを合わせたデー
タのデータ量に対する動きベクトルデータのデータ量の
比率や、予備的な符号化によって得られる動きベクトル
データのみのデータ量等でもよい。
【0109】
【発明の効果】以上説明したように本発明の画像符号化
装置または本発明の画像符号化方法によれば、入力画像
データの符号化が行われる前に符号化難易度を取得し、
この符号化難易度に基づいて、少なくとも1種類のフレ
ーム間予測符号化ピクチャに関して、符号化難易度が所
定の条件を満たすか否かを判断し、符号化難易度が所定
の条件を満たす場合には、ピクチャタイプをフレーム内
符号化ピクチャまたは予測方向の数がより少ないフレー
ム間予測符号化ピクチャに変更させて、入力画像データ
を符号化するようにしたので、符号化する素材中の画像
の時間的または空間的な相関が悪い部分における符号化
効率を向上させて、限られた割り当て符号量に対して、
画質を改善することが可能となるという効果を奏する。
【図面の簡単な説明】
【図1】本発明の一実施の形態に係る画像符号化装置と
してのビデオエンコード装置の構成を示すブロック図で
ある。
【図2】本発明の一実施の形態に係る画像符号化装置と
してのビデオエンコード装置を含むDVD用のオーサリ
ング装置の構成を示すブロック図である。
【図3】図1におけるビデオエンコーダの構成の一例を
示すブロック図である。
【図4】本発明の一実施の形態に係る画像符号化装置と
してのビデオエンコード装置の動作を示す流れ図であ
る。
【図5】図4におけるビット配分計算処理の詳細を説明
するための流れ図である。
【図6】図5におけるシーンチェンジ検出および処理を
説明するための説明図である。
【図7】図5におけるチャプタ処理を説明するための説
明図である。
【図8】図5における割り当てビット量の計算処理に用
いる評価関数を示す説明図である。
【図9】図5における割り当てビット量の計算処理に用
いるVBVの計算方法を説明するための説明図である。
【図10】図5における割り当てビット量の計算処理中
のVBVの制限による割り当てビット量の修正処理につ
いて説明するための説明図である。
【図11】図5における割り当てビット量の計算処理中
のVBVの制限による割り当てビット量の修正処理につ
いて説明するための説明図である。
【図12】図5におけるピクチャタイプの変更処理を説
明するための流れ図である。
【図13】図12に示したピクチャタイプの変更処理の
具体例を示す説明図である。
【図14】時間的、空間的な相関が少ない素材を本発明
の一実施の形態によって符号化した場合におけるBピク
チャの符号化難易度の平均値とIピクチャの符号化難易
度の比率の一例を示す説明図である。
【図15】図14で用いた素材に関して、本発明の一実
施の形態におけるピクチャタイプの変更処理を施して符
号化した場合と従来の方式で符号化した場合とで平均量
子化数を比較して表した説明図である。
【図16】GOPの構造を説明するための説明図であ
る。
【符号の説明】
11…ビデオエンコード装置、18…スーパバイザ、2
2…ビデオエンコーダ、24…ビデオエンコーダ制御装
置、25…ビット配分部、26…エンコーダコントロー
ル部、27…VTRコントロール部、28…GUI部。

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 入力画像データを、フレーム内符号化に
    よって符号化されるべきフレーム内符号化ピクチャと、
    動き補償を併用し、予測方向が1方向以上のフレーム間
    予測符号化によって符号化されるべき1種類以上のフレ
    ーム間予測符号化ピクチャとを含む複数のピクチャタイ
    プに分け、入力画像データをピクチャ毎にピクチャタイ
    プに応じた符号化方法によって符号化して、符号化デー
    タと動き補償のための動きベクトルデータとを生成する
    符号化手段と、 この符号化手段によって符号化を行う前のピクチャの符
    号化の難易度を表す符号化難易度を取得し、この符号化
    難易度に基づいて、少なくとも1種類のフレーム間予測
    符号化ピクチャに関して、符号化難易度が所定の条件を
    満たすか否かを判断し、符号化難易度が所定の条件を満
    たす場合に、ピクチャタイプをフレーム内符号化ピクチ
    ャまたは予測方向の数がより少ないフレーム間予測符号
    化ピクチャに変更させるように、前記符号化手段を制御
    する符号化制御手段とを備えたことを特徴とする画像符
    号化装置。
  2. 【請求項2】 前記フレーム間予測符号化ピクチャは、
    予測方向が過去のフレームからの1方向となる順方向予
    測符号化ピクチャと、予測方向が過去および未来のフレ
    ームからの2方向となる双方向予測符号化ピクチャとを
    含むことを特徴とする請求項1記載の画像符号化装置。
  3. 【請求項3】 前記符号化制御手段は、前記双方向予測
    符号化ピクチャに関して、符号化難易度が所定の条件を
    満たすか否かを判断し、符号化難易度が所定の条件を満
    たす場合に、ピクチャタイプをフレーム内符号化ピクチ
    ャまたは順方向予測符号化ピクチャに変更させるよう
    に、前記符号化手段を制御することを特徴とする請求項
    2記載の画像符号化装置。
  4. 【請求項4】 前記符号化制御手段は、フレーム内符号
    化ピクチャを含む所定枚数のピクチャを含む符号化処理
    単位のうち、双方向予測符号化ピクチャの符号化難易度
    の平均値とフレーム内符号化ピクチャの符号化難易度と
    の比率が第1の所定値を越えた符号化処理単位内におい
    て、双方向予測符号化ピクチャの符号化難易度とフレー
    ム内符号化ピクチャの符号化難易度との比率が第2の所
    定値を越え、且つ双方向予測符号化ピクチャの符号化難
    易度が第3の所定値を越えるという条件を満たす双方向
    予測符号化ピクチャを、フレーム内符号化ピクチャまた
    は順方向予測符号化ピクチャに変更させるように、前記
    符号化手段を制御することを特徴とする請求項3記載の
    画像符号化装置。
  5. 【請求項5】 前記符号化難易度は、前記符号化手段に
    よる正式な符号化を行う前の予備的な符号化によって得
    られることを特徴とする請求項1記載の画像符号化装
    置。
  6. 【請求項6】 入力画像データを、フレーム内符号化に
    よって符号化されるべきフレーム内符号化ピクチャと、
    動き補償を併用し、予測方向が1方向以上のフレーム間
    予測符号化によって符号化されるべき1種類以上のフレ
    ーム間予測符号化ピクチャとを含む複数のピクチャタイ
    プに分け、入力画像データをピクチャ毎にピクチャタイ
    プに応じた符号化方法によって符号化して、符号化デー
    タと動き補償のための動きベクトルデータとを生成する
    画像符号化方法であって、 符号化を行う前のピクチャの符号化の難易度を表す符号
    化難易度を取得する符号化難易度取得手順と、 この符号化難易度取得手順によって取得した符号化難易
    度に基づいて、少なくとも1種類のフレーム間予測符号
    化ピクチャに関して、符号化難易度が所定の条件を満た
    すか否かを判断し、符号化難易度が所定の条件を満たす
    場合には、ピクチャタイプをフレーム内符号化ピクチャ
    または予測方向の数がより少ないフレーム間予測符号化
    ピクチャに変更させる処理を行うピクチャタイプ変更処
    理手順と、 このピクチャタイプ変更処理手順による処理の実行後の
    ピクチャタイプに従って、入力画像データを符号化する
    符号化手順と含むことを特徴とする画像符号化方法。
  7. 【請求項7】 前記フレーム間予測符号化ピクチャは、
    予測方向が過去のフレームからの1方向となる順方向予
    測符号化ピクチャと、予測方向が過去および未来のフレ
    ームからの2方向となる双方向予測符号化ピクチャとを
    含むことを特徴とする請求項6記載の画像符号化方法。
  8. 【請求項8】 前記ピクチャタイプ変更処理手順は、双
    方向予測符号化ピクチャに関して、符号化難易度が所定
    の条件を満たすか否かを判断し、符号化難易度が所定の
    条件を満たす場合に、ピクチャタイプをフレーム内符号
    化ピクチャまたは順方向予測符号化ピクチャに変更させ
    ることを特徴とする請求項7記載の画像符号化方法。
  9. 【請求項9】 前記ピクチャタイプ変更処理手順は、フ
    レーム内符号化ピクチャを含む所定枚数のピクチャを含
    む符号化処理単位のうち、双方向予測符号化ピクチャの
    符号化難易度の平均値とフレーム内符号化ピクチャの符
    号化難易度との比率が第1の所定値を越えた符号化処理
    単位内において、双方向予測符号化ピクチャの符号化難
    易度とフレーム内符号化ピクチャの符号化難易度との比
    率が第2の所定値を越え、且つ双方向予測符号化ピクチ
    ャの符号化難易度が第3の所定値を越えるという条件を
    満たす双方向予測符号化ピクチャを、フレーム内符号化
    ピクチャまたは順方向予測符号化ピクチャに変更させる
    ことを特徴とする請求項8記載の画像符号化方法。
  10. 【請求項10】 前記符号化難易度は、前記符号化手段
    による正式な符号化を行う前の予備的な符号化によって
    得られることを特徴とする請求項6記載の画像符号化方
    法。
JP25495997A 1997-09-19 1997-09-19 画像符号化装置および方法 Expired - Fee Related JP3951152B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP25495997A JP3951152B2 (ja) 1997-09-19 1997-09-19 画像符号化装置および方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP25495997A JP3951152B2 (ja) 1997-09-19 1997-09-19 画像符号化装置および方法

Publications (2)

Publication Number Publication Date
JPH1198514A true JPH1198514A (ja) 1999-04-09
JP3951152B2 JP3951152B2 (ja) 2007-08-01

Family

ID=17272252

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25495997A Expired - Fee Related JP3951152B2 (ja) 1997-09-19 1997-09-19 画像符号化装置および方法

Country Status (1)

Country Link
JP (1) JP3951152B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000064187A1 (en) * 1999-04-19 2000-10-26 Sony Corporation Image encoding device and its method
US7050499B2 (en) 2002-09-26 2006-05-23 Kabushiki Kaisha Toshiba Video encoding apparatus and method and video encoding mode converting apparatus and method
JP2008004983A (ja) * 2006-06-20 2008-01-10 Sony Corp 画像理装置および方法、プログラム、並びに記録媒体
JP2011239255A (ja) * 2010-05-12 2011-11-24 Nippon Telegr & Teleph Corp <Ntt> 映像符号化方法,映像符号化装置および映像符号化プログラム
WO2011155376A1 (ja) * 2010-06-09 2011-12-15 ソニー株式会社 符号化装置および符号化方法
US10652549B2 (en) 2017-07-19 2020-05-12 Fujitsu Limited Video coding device, video coding method, video decoding device, and video decoding method

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000064187A1 (en) * 1999-04-19 2000-10-26 Sony Corporation Image encoding device and its method
US7050499B2 (en) 2002-09-26 2006-05-23 Kabushiki Kaisha Toshiba Video encoding apparatus and method and video encoding mode converting apparatus and method
JP2008004983A (ja) * 2006-06-20 2008-01-10 Sony Corp 画像理装置および方法、プログラム、並びに記録媒体
JP2011239255A (ja) * 2010-05-12 2011-11-24 Nippon Telegr & Teleph Corp <Ntt> 映像符号化方法,映像符号化装置および映像符号化プログラム
WO2011155376A1 (ja) * 2010-06-09 2011-12-15 ソニー株式会社 符号化装置および符号化方法
JP2011259197A (ja) * 2010-06-09 2011-12-22 Sony Corp 符号化装置および符号化方法
CN102934442A (zh) * 2010-06-09 2013-02-13 索尼公司 编码装置和编码方法
CN102934442B (zh) * 2010-06-09 2017-04-26 索尼公司 编码装置和编码方法
US9826227B2 (en) 2010-06-09 2017-11-21 Sony Corporation Motion picture encoding apparatus and motion picture encoding method based on bit rate
US10652549B2 (en) 2017-07-19 2020-05-12 Fujitsu Limited Video coding device, video coding method, video decoding device, and video decoding method

Also Published As

Publication number Publication date
JP3951152B2 (ja) 2007-08-01

Similar Documents

Publication Publication Date Title
JP4123567B2 (ja) 画像信号処理装置及び方法
US7313283B2 (en) Image coding apparatus
JP4480671B2 (ja) ビデオ・エンコーダのモード選択によるレート歪みトレードオフの制御方法および装置
JP2000278692A (ja) 圧縮データ処理方法及び処理装置並びに記録再生システム
JP2001189940A (ja) 映像データフォーマット装置及び映像データストレージ装置
US20020031178A1 (en) Video encoding method and apparatus, recording medium, and video transmission method
JP2008283432A (ja) 画像記録再生装置
JP3956394B2 (ja) 音声・映像データ符号化装置およびその方法
JP4958713B2 (ja) 動画像符号化装置及びその制御方法
JP3837889B2 (ja) エンコード方法およびエンコード装置
JP3951152B2 (ja) 画像符号化装置および方法
JP4650454B2 (ja) 符号化装置及び符号化方法
JP2007142809A (ja) 映像記録装置
JP4462643B2 (ja) 画像符号化方法及び画像符号化装置
JP4288897B2 (ja) 符号化装置及び方法、プログラム、記録媒体
JPH10304372A (ja) 画像符号化方法および装置、画像伝送方法
JP4605183B2 (ja) 画像信号処理装置及び方法
JP3660514B2 (ja) 可変レート動画像符号化方法および動画像編集システム
JPH0888854A (ja) 動画像符号化方式
JP2004180345A (ja) 撮影画像記録装置
JP4759360B2 (ja) 画像処理装置
JP4423216B2 (ja) 画像処理装置
JP3307367B2 (ja) 可変転送レート符号化装置
JPH1198499A (ja) 画像符号化装置および画質予測方法
JP4765961B2 (ja) デジタル動画像記録装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040416

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060920

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061012

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061204

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070329

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070411

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100511

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110511

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120511

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees