JPH1198499A - 画像符号化装置および画質予測方法 - Google Patents

画像符号化装置および画質予測方法

Info

Publication number
JPH1198499A
JPH1198499A JP25496097A JP25496097A JPH1198499A JP H1198499 A JPH1198499 A JP H1198499A JP 25496097 A JP25496097 A JP 25496097A JP 25496097 A JP25496097 A JP 25496097A JP H1198499 A JPH1198499 A JP H1198499A
Authority
JP
Japan
Prior art keywords
encoding
picture
difficulty
coding
code amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP25496097A
Other languages
English (en)
Inventor
Masaaki Isozaki
正明 五十崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP25496097A priority Critical patent/JPH1198499A/ja
Publication of JPH1198499A publication Critical patent/JPH1198499A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Signal Processing For Recording (AREA)
  • Closed-Circuit Television Systems (AREA)

Abstract

(57)【要約】 【課題】 早い時点で、与えられた符号化条件による符
号化後の画質を予測し、符号化条件の評価および符号化
作業の効率化を可能にする。 【解決手段】 ビデオエンコーダ制御装置24のビット
配分部25は、予備的な符号化によって得られたピクチ
ャ毎の符号化難易度を取得し、この符号化難易度とスー
パバイザ18より与えられた符号化条件とに基づいて、
正式な符号化の際の各ピクチャ毎の割り当てビット量を
決定する。ビット配分部25は、符号化難易度とと割り
当てビット量とに基づいて、正式な符号化の際の量子化
特性を推定し、与えられた符号化条件による符号化後の
画質を予測する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、画像データを符号
化する画像符号化装置および符号化後の画質を予測する
画質予測方法に関する。
【0002】
【従来の技術】近年、大容量のディジタルデータを記録
可能な光ディスクであるDVD(ディジタル・バーサタ
イル・ディスクまたはディジタル・ビデオ・ディスク)
が実用化されている。DVDのうち、ビデオデータ等を
記録するDVDビデオでは、MPEG(Moving Picture
Experts Group)2規格で圧縮された画像データを記録
するようになっている。
【0003】MPEG2規格では、符号化方式として、
動き補償を併用した双方向予測符号化方式を採用してい
る。この符号化方式では、DCT(離散コサイン変換)
と画像の時間的および空間的な相関を用いて空間方向の
冗長度および時間方向の冗長度の除去を行うことによっ
て、効率の良い圧縮符号化を可能としている。双方向予
測符号化方式では、フレーム(ピクチャ)内だけで符号
化するフレーム内符号化、過去のフレームから現在のフ
レームを予測することによって符号化するフレーム間順
方向予測符号化、過去および未来のフレームから現在の
フレームを予測することによって符号化する双方向予測
符号化の3つのタイプの符号化が行われる。この符号化
方式では、フレーム内符号化によって符号化されるピク
チャをIピクチャ(intra coded picture )、フレーム
間順方向予測符号化によって符号化されるピクチャをP
ピクチャ(predictive coded picture)、双方向予測符
号化によって符号化されるピクチャをBピクチャ(bidi
rectionally predictive coded picture)と呼ぶ。ま
た、必ずIピクチャを一つ以上含むようにI,P,Bの
各ピクチャを適切に組み合わせて、ランダムアクセスの
単位となるGOP(Group of picture)が構成される。
【0004】ここで、図15を参照して、GOPの構造
について説明する。図15において、I,P,Bは、そ
れぞれIピクチャ、Pピクチャ、Bピクチャを表してい
る。なお、他の図においても同様である。図15(a)
は、GOPの構成の一例を表示順に示したものである。
この例では、15枚のピクチャによってGOPが構成さ
れ(GOPを構成するピクチャ数N=15)、1GOP
内に1枚のIピクチャが含まれ、IピクチャまたはPピ
クチャの現れる周期(M)は3であり、隣り合うIまた
はPピクチャ間に2つのBピクチャが挿入されている。
表示順では、GOPの先頭は、Iピクチャの前の最初の
PピクチャまたはIピクチャの次のピクチャであり、G
OPの最後は、次のIピクチャの前の最初のPピクチャ
である。図15(a)において、矢印は、予測方向を表
している。図15(b)は、同じGOPの構成を、符号
化順に示したものである。このように、符号化の際に
は、Bピクチャの符号化の前に、Bピクチャの予測の際
に参照するIピクチャまたはPピクチャが符号されるよ
うに、ピクチャの並べ替えが行われる。
【0005】ところで、圧縮された画像情報を、DV
D、ビデオCD(コンパクト・ディスク)等のパッケー
ジメディアに蓄積させる符号化システムでは、一般に、
いわゆる2パスエンコーディング方式が採用されてい
る。この2パスエンコーディング方式では、最初に、予
備的な符号化を行って、符号化する素材の画像の符号化
の難易度を表す符号化難易度を測定し、その符号化難易
度に基づいて、与えられた符号量に収まるように、各ピ
クチャごとに符号量の配分を行って正式な符号化を行
う。
【0006】
【発明が解決しようとする課題】ところで、DVDのよ
うなディスクの作成のための符号化作業では、オーディ
オ、ビデオ、サブタイトル、メニュー等について並行し
て行われるため、平均ビットレートや最大ビットレート
制限等の符号化の条件は、作成されるディスクの条件
(演奏時間、オーディオへのビット配分等)に応じて、
全体を管理するスーパバイザより与えられる。
【0007】ところが、スーパバイザ側では、ビデオ素
材の符号化の難しさを判別する方法がないため、スーパ
バイザによって与えられた符号化条件によって満足のい
く画質が得られるかどうかは、符号化の結果を見るしか
なかった。そのため、符号化条件が適切か否かの判定が
遅れることとなる。ビデオデータの符号化条件に修正が
必要となった場合には、ディスク全体の仕様変更が伴う
ため、ビデオ以外の工程(例えば、オーディオデータの
符号化条件)にも影響が及ぶ。そのため、ビデオ工程従
事者の単独の作業時間の無駄だけでなく、並行して作業
しているオーディオ工程従事者のそれまでの作業をやり
直すケースも発生する等、ディスク作成の作業全体とし
て大幅な作業時間の無駄が発生する。また、ビデオデー
タの符号化条件が適切か否かの判定が遅れれば遅れるほ
ど、作業のやり直しに伴う多くの無駄な工数および作業
時間がかかってしまう。このように、従来は、与えられ
たビデオデータの符号化条件の評価が遅れることによ
り、ビデオデータの符号化作業のみならずディスク作成
の作業全体に無駄が発生するという問題点があった。
【0008】本発明はかかる問題点に鑑みてなされたも
ので、その目的は、早い時点で、与えられた符号化条件
による符号化後の画質を予測でき、その結果、符号化条
件の評価および符号化作業の効率化を可能とした画像符
号化装置および画質予測方法を提供することにある。
【0009】
【課題を解決するための手段】本発明の画像符号化装置
は、量子化を含む符号化処理によって入力画像データを
符号化すると共に、割り当て符号量に応じて量子化特性
を変化させることの可能な符号化手段と、この符号化手
段に対して、量子化特性を固定して、正式な符号化を行
う前の予備的な符号化を行わせ、得られるデータに基づ
いて各ピクチャ毎に符号化の難易度を表す符号化難易度
を測定する符号化難易度測定手段と、与えられた符号化
条件に基づいて、正式な符号化の際の各ピクチャ毎の割
り当て符号量を決定する割り当て符号量決定手段と、符
号化難易度測定手段によって測定された符号化難易度と
割り当て符号量決定手段によって決定された割り当て符
号量とに基づいて、正式な符号化の際の量子化特性を推
定する量子化特性推定手段とを備えたものである。
【0010】本発明の画質予測方法は、量子化を含む符
号化処理によって入力画像データを符号化すると共に、
割り当て符号量に応じて量子化特性を変化させることの
可能な符号化手段に対して、量子化特性を固定して、正
式な符号化を行う前の予備的な符号化を行わせ、得られ
るデータに基づいて各ピクチャ毎に符号化の難易度を表
す符号化難易度を測定する符号化難易度測定手順と、与
えられた符号化条件に基づいて、正式な符号化の際の各
ピクチャ毎の割り当て符号量を決定する割り当て符号量
決定手順と、符号化難易度測定手順によって測定された
符号化難易度と割り当て符号量決定手順によって決定さ
れた割り当て符号量とに基づいて、正式な符号化の際の
量子化特性を推定することによって、与えられた符号化
条件による符号化後の画質を予測する画質予測手順と含
むものである。
【0011】本発明の画像符号化装置では、符号化難易
度測定手段によって、量子化特性を固定した予備的な符
号化によって得られるデータに基づいて各ピクチャ毎に
符号化難易度が測定され、割り当て符号量決定手段によ
って、与えられた符号化条件に基づいて、正式な符号化
の際の各ピクチャ毎の割り当て符号量が決定され、量子
化特性推定手段によって、符号化難易度と割り当て符号
量とに基づいて、正式な符号化の際の量子化特性が推定
される。
【0012】本発明の画質予測方法では、符号化難易度
測定手順によって、量子化特性を固定した予備的な符号
化によって得られるデータに基づいて各ピクチャ毎に符
号化難易度が測定され、割り当て符号量決定手順によっ
て、与えられた符号化条件に基づいて、正式な符号化の
際の各ピクチャ毎の割り当て符号量が決定され、画質予
測手段によって、符号化難易度と割り当て符号量とに基
づいて、正式な符号化の際の量子化特性を推定すること
によって、与えられた符号化条件による符号化後の画質
が予測される。
【0013】
【発明の実施の形態】以下、本発明の一実施の形態につ
いて図面を参照して詳細に説明する。図2は、本実施の
形態に係る画像符号化装置としてのビデオエンコード装
置を含むDVD用のオーサリング装置の構成を示すブロ
ック図である。このオーサリング装置10は、ビデオ
(画像)データを入力し、圧縮符号化するビデオエンコ
ード装置11と、オーディオデータを入力し、圧縮符号
化するオーディオエンコード装置12と、字幕等の静止
画像データを入力し、符号化するサブピクチャエンコー
ド装置13と、メニュー画面のビデオデータを符号化す
るメニューエンコード装置14と、これらの符号化され
たデータをDVD規格に即した順序で多重化するマルチ
プレクサ15と、多重化処理後のデータをディスク製造
工程に渡すために所定の記録媒体に記録するストリーマ
16と、各エンコード装置11〜14、マルチプレクサ
15およびストリーマ16に接続された、例えばRAI
D(Redundant Array of Inexpensive Disks)構成のハ
ードディスク装置(HDD)17と、ネットワーク19
を介して、上記各構成要素に接続され、これらの動作を
管理するスーパバイザ18とを備えている。
【0014】ここで、上述のオーサリング装置10の動
作の概略について説明する。スーパバイザ18は、ビデ
オエンコード装置11、オーディオエンコード装置1
2、サブピクチャエンコード装置13およびメニューエ
ンコード装置14に符号化処理の開始を指示する。各エ
ンコード装置11〜14は、この指示により符号化処理
を開始する。その結果得られるデータは、スーパバイザ
18から指示されたハードディスク装置17の記憶領域
に順次格納される。各エンコーダ装置11〜14におけ
る符号化処理が終了すると、マルチプレクサ15におい
て多重化処理を行う。
【0015】マルチプレクサ15は、スーパバイザ18
の指示により、ハードディスク装置17の記憶領域か
ら、符号化によって得られたデータを読み出し、これを
DVD規格に即した順序で多重化し、その結果得られる
多重化データを、スーパバイザ18に指示されたハード
ディスク装置17の記憶領域に順次格納する。また、ス
トリーマ16は、ディスク製造工程に多重化処理後のデ
ータを渡すために、スーパバイザ18の指示によりハー
ドディスク装置17の記憶領域から多重化データを読み
出し、これを所定のテープ状の記録媒体に順次記録す
る。スーパバイザ18は、ストリーマ16から記録終了
の通知を受信すると、記録処理が終了したとして記録用
データの作成を終了する。
【0016】図1は、本実施の形態に係る画像符号化装
置としてのビデオエンコード装置11の構成を示すブロ
ック図である。このビデオエンコード装置11は、例え
ばVTR(ビデオテープレコーダ)21にケーブル20
aを介して接続されると共に、ハードディスク装置17
に例えばSCSI(Small Computer System Interface
)を用いたケーブル20bを介して接続され、VTR
21より出力されるビデオデータS1 を、MPEG2規
格による動き補償を併用した双方向予測符号化方式によ
って圧縮符号化して、圧縮画像データS2 をハードディ
スク装置17に出力する符号化手段としてのビデオエン
コーダ22と、このビデオエンコーダ22にケーブル2
0cを介して接続され、ビデオエンコーダ22による圧
縮処理結果を表示するためのモニタ装置23と、ネット
ワーク19を介してスーパバイザ18に接続されると共
に、VTR21、ビデオエンコーダ22にそれぞれ、例
えばRS−422規格のケーブル20d、例えばイーサ
ネットを用いたケーブル20eを介して接続され、VT
R21およびビデオエンコーダ22を制御するビデオエ
ンコーダ制御装置24とを備えている。なお、VTR2
1からビデオエンコーダ22に対しては、ビデオデータ
1 と共に、タイムコードと同期信号も送られるように
なっている。ビデオエンコーダ制御装置24は、本発明
における符号化難易度測定手段、割り当て符号量決定手
段および量子化特性推定手段に対応する。
【0017】ビデオエンコーダ制御装置24は、符号化
処理におけるビット配分計算を行うビット配分部25
と、ビデオエンコーダ22を制御するエンコーダコント
ロール部26と、VTR21を制御するVTRコントロ
ール部27と、ユーザインタフェースの制御を行うと共
に、ネットワーク19を介してスーパバイザ18に接続
され、ビット配分部25とVTRコントロール部27を
管理するグラフィカルユーザインタフェース(以下、G
UI(Graphical User Interface)という。)部28と
を有している。なお、ビット配分部25、エンコーダコ
ントロール部26、VTRコントロール部27およびG
UI部28は、それぞれ所定のプログラムによって実現
されるようになっている。
【0018】図1において、スーパバイザ18およびビ
デオエンコーダ制御装置24は、それぞれコンピュータ
によって実現される。
【0019】図1に示した構成において、スーパバイザ
18は、DVDのオーサリングシステム全体の管理を行
い、ビデオ、オーディオ、サブピクチャおよびメニュー
用の各エンコード装置11〜14に符号化条件を与え
て、各エンコード装置11〜14より符号化結果の報告
を受けるようになっている。図1に示した例では、スー
パバイザ18は、ビデオエンコーダ制御装置24のGU
I部28に対して、ファイルv.enc によってビデオデー
タの符号化条件を指定し、ビデオエンコーダ制御装置2
4のGUI部28は、スーパバイザ18に対して、符号
化結果のビットストリームが書き込まれたハードディス
ク装置17上のアドレスを示すアドレスデータv.adr
と、ビットストリームを多重化する際に必要な多重化用
データvxxx.auiを報告するようになっている。
【0020】ビデオエンコーダ制御装置24内におい
て、GUI部28は、ビット配分部25に対してファイ
ルv.enc を与え、ビット配分部25は、GUI部28に
対してアドレスデータv.adr および多重化用データvxx
x.auiを与えるようになっている。GUI部28は、ビ
ット配分部25に対して、更に、後述するカスタマイズ
におけるビット配分のための重み付けファイルweight.t
xtを与えるようになっている。
【0021】ビット配分部25は、エンコーダコントロ
ール部26に対して、ビット配分計算の結果に基づくビ
デオエンコーダ22の制御条件を、コントロールファイ
ルCTL fileとして与え、エンコーダコントロール部26
は、ビット配分部25に対して、後述する符号化難易度
を表す符号化難易度データdifficultyを与えるようにな
っている。
【0022】GUI部28は、VTRコントロール部2
7に対して、VTR21を動作させるための各種コマン
ドcommand を与え、VTRコントロール部27は、GU
I部28に対して、VTR21の各種の状態を表すステ
ータスデータstate とVTR21の異常を表すエラーデ
ータerror を与えるようになっている。
【0023】図3は、ビデオエンコーダ22の構成の一
例を示すブロック図である。この図に示したビデオエン
コーダ22は、入力ビデオデータS1 を入力し、符号化
する順番に従ってピクチャ(Iピクチャ,Pピクチャ,
Bピクチャ)の順番を並べ替える画像並べ替え回路31
と、この画像並べ替え回路31の出力データを入力し、
フレーム構造かフィールド構造かを判別し、判別結果に
応じた走査変換および16×16画素のマクロブロック
化を行う走査変換・マクロブロック化回路32と、この
走査変換・マクロブロック化回路32の出力データに基
づいて、符号化の対象となるピクチャの注目マクロブロ
ックと、参照されるピクチャにおいて注目マクロブロッ
クとの間の画素値の差分の絶対値和あるいは自乗和が最
小となるマクロブロックを探して、動きベクトルを検出
して、動きベクトルデータを出力する動き検出回路33
とを備えている。
【0024】ビデオエンコーダ22は、更に、走査変換
・マクロブロック化回路32の出力データと予測画像デ
ータとの差分をとる減算回路34と、この減算回路34
の出力データに対して、DCTブロック単位でDCTを
行い、DCT係数を出力するDCT回路35と、このD
CT回路35の出力データを量子化する量子化回路36
と、この量子化回路36の出力データを可変長符号化し
て符号化データを生成する共に、この符号化データと動
き検出回路33より出力される動きベクトルデータ等の
付帯データとを多重化して出力する可変長符号化回路3
7と、この可変長符号化回路37の出力データを一旦保
持し、ビットストリームからなる圧縮画像データS2
して出力するバッファメモリ38と、量子化回路36の
出力データを逆量子化する逆量子化回路39と、この逆
量子化回路39の出力データに対して逆DCTを行う逆
DCT回路40と、この逆DCT回路40の出力データ
と予測画像データとを加算して出力する加算回路41
と、この加算回路41の出力データを保持し、動き検出
回路33より出力される動きベクトルデータに応じて動
き補償を行って予測画像データを減算回路34および加
算回路41に出力する動き補償回路42と、量子化回路
36における量子化特性値に対応する量子化インデック
スを決定し、量子化回路36に与える量子化インデック
ス決定部43とを備えている。
【0025】画像並べ替え回路31は、エンコーダコン
トロール部26からピクチャタイプの情報S3 を受け取
り、この情報S3 に従ってピクチャの順番を並べ替える
ようになっている。バッファメモリ38は、発生ビット
量の情報S5 をエンコーダコントロール部26と量子化
インデックス決定部43とに出力するようになってい
る。量子化インデックス決定部43は、エンコーダコン
トロール部26から各ピクチャへの割り当てビット量
(割り当て符号量)の情報S4 を受け取り、この情報S
4 とバッファメモリ38からの発生ビット量の情報S5
とに基づいて、発生ビット量が割り当てビット量に近づ
くように量子化インデックスを決定するようになってい
る。
【0026】ここで、図3に示したビデオエンコーダ2
2の動作について簡単に説明する。入力ビデオデータS
1 は、まず、画像並べ替え回路31に入力され、この画
像並べ替え回路31によって、ピクチャタイプの情報S
3 に従ってピクチャタイプを決定して、符号化する順番
に従ってピクチャ(Iピクチャ,Pピクチャ,Bピクチ
ャ)の順番を並べ替える。画像並べ替え回路31の出力
データは、走査変換・マクロブロック化回路32に入力
される。走査変換・マクロブロック化回路32は、フレ
ーム構造かフィールド構造かを判別し、判別結果に応じ
た走査変換およびマクロブロック化を行う。走査変換・
マクロブロック化回路32の出力データは、動き検出回
路33および減算回路34に送られる。動き検出回路3
3は、動きベクトルを検出して、動きベクトルデータを
動き補償回路42および可変長符号化回路37に送る。
【0027】Iピクチャの場合には、減算回路34にお
いて予測画像データとの差分をとることなく、走査変換
・マクロブロック化回路32の出力データをそのままD
CT回路35に入力してDCTを行い、量子化回路36
によってDCT係数を量子化し、可変長符号化回路37
によって量子化回路36の出力データを可変長符号化
し、バッファメモリ38によって可変長符号化回路37
の出力データを一旦保持し、ビットストリームからなる
圧縮画像データS2 として出力する。また、逆量子化回
路39によって量子化回路36の出力データを逆量子化
し、逆DCT回路40によって逆量子化回路39の出力
データに対して逆DCTを行い、逆DCT回路40の出
力データを加算回路41を介して動き補償回路42に入
力して保持させる。
【0028】Pピクチャの場合には、動き補償回路42
によって、保持している過去のIピクチャまたはPピク
チャに対応する画像データと動き検出回路33からの動
きベクトルデータとに基づいて予測画像データを生成
し、予測画像データを減算回路34および加算回路41
に出力する。また、減算回路34によって、走査変換・
マクロブロック化回路32の出力データと動き補償回路
42からの予測画像データとの差分をとり、DCT回路
35によってDCTを行い、量子化回路36によってD
CT係数を量子化し、可変長符号化回路37によって量
子化回路36の出力データを可変長符号化すると共に動
きベクトルデータを多重化し、バッファメモリ38によ
って可変長符号化回路37の出力データを一旦保持し圧
縮画像データS2 として出力する。また、逆量子化回路
39によって量子化回路36の出力データを逆量子化
し、逆DCT回路40によって逆量子化回路39の出力
データに対して逆DCTを行い、加算回路41によって
逆DCT回路40の出力データと予測画像データとを加
算し、動き補償回路42に入力して保持させる。
【0029】Bピクチャの場合には、動き補償回路42
によって、保持している過去および未来のIピクチャま
たはPピクチャに対応する2つの画像データと動き検出
回路33からの2つの動きベクトルとに基づいて予測画
像データを生成し、予測画像データを減算回路34およ
び加算回路41に出力する。また、減算回路34によっ
て、走査変換・マクロブロック化回路32の出力データ
と動き補償回路42からの予測画像データとの差分をと
り、DCT回路35によってDCTを行い、量子化回路
36によってDCT係数を量子化し、可変長符号化回路
37によって量子化回路36の出力データを可変長符号
化すると共に動きベクトルデータを多重化し、バッファ
メモリ38によって可変長符号化回路37の出力データ
を一旦保持し圧縮画像データS2 として出力する。な
お、Bピクチャは動き補償回路42に保持させない。
【0030】バッファメモリ38は、発生ビット量の情
報S5 をエンコーダコントロール部26と量子化インデ
ックス決定部43とに出力する。量子化インデックス決
定部43は、エンコーダコントロール部26からの各ピ
クチャへの割り当てビット量の情報S4 とバッファメモ
リ38からの発生ビット量の情報S5 とに基づいて、発
生ビット量が割り当てビット量に近づくように量子化イ
ンデックスを決定し、量子化回路36に与える。
【0031】次に、図4を参照して、本実施の形態に係
る画像符号化装置としてのビデオエンコード装置11の
動作について説明する。なお、以下の説明は、本実施の
形態に係る画質予測方法の説明を兼ねている。本実施の
形態では、2パスエンコーディング方式によって、ビデ
オデータを符号化する。2パスエンコーディング方式で
は、最初に、予備的な符号化処理を行って、符号化する
素材の画像の符号化の難易度を表す符号化難易度を測定
し、その符号化難易度に基づいて、与えられた符号量に
収まるように、各ピクチャごとに符号量の配分を行って
正式な符号化処理を行う。
【0032】ビデオエンコード装置11は、始めに、ビ
デオエンコーダ制御装置24のGUI部28によって、
ネットワーク19経由で、スーパバイザ18に対して、
DVD等のディスクの容量の中からビデオデータに割り
当てられたビット総量や最大ビットレート等の符号化条
件を取りに行く。この符号化条件は、ファイルv.encに
よって、スーパバイザ18よりGUI部28に与えら
れ、更に、ビット配分部25に与えられ、ビット配分部
25において符号化条件が設定される(ステップS10
1)。
【0033】次に、ビデオエンコード装置11は、予備
的な1パス目の符号化処理を行って、符号化難易度の測
定を行う(ステップS102)。この予備的な符号化処
理では、GUI部28がVTRコントロール部27にコ
マンドcommand を与え、このコマンドcommand に基づい
て、VTRコントロール部27がVTR21を制御し
て、磁気テープよりビデオデータS1 を再生させる。こ
のビデオデータS1 は、ビデオエンコーダ22に入力さ
れる。ビデオエンコーダ22は、エンコーダコントロー
ル部26の制御により、ビデオデータS1 の圧縮符号化
を行う。予備的な符号化処理では、ビデオエンコーダ2
2における符号化の際の量子化ステップ数を固定値に設
定した条件で符号化処理を行い、発生ビット量を測定す
る。動きが多く、高い周波数成分が多い画像では、発生
ビット量が大きくなり、静止画や平坦な部分が多い画像
では発生ビット量が少なくなる。従って、予備的な符号
化処理における発生ビット量は、符号化する素材の画像
の符号化の難易度を表すものと言える。そこで、本実施
の形態では、この発生ビット量を、符号化難易度として
測定する。なお、ビデオエンコーダ22における符号化
処理によって発生されるデータには、実際のDCT係数
に関わる符号化データと、動き補償のための動きベクト
ルデータとが含まれる。従って、発生データ量は、符号
化データのデータ量と動きベクトルデータのデータ量と
を合わせたものとなる。符号化難易度の情報は、発生ビ
ット量の情報S5 としてビデオエンコーダ22よりエン
コーダコントロール部26に与えられ、更に、符号化難
易度データdifficultyとしてエンコーダコントロール部
26よりビット配分部25に与えられる。
【0034】次に、ビット配分部25は、与えられた符
号化条件を基に、各ピクチャの符号化難易度に応じて、
各ピクチャへ割り当てビット量を配分するためのビット
配分計算を行う(ステップS103)。ビット配分計算
については、後で詳しく説明する。ビット配分計算の結
果に基づくビデオエンコーダ22の制御条件は、コント
ロールファイルCTL fileとして、ビット配分部25より
エンコーダコントロール部26に与えられる。
【0035】次に、ビデオエンコード装置11は、ビッ
ト配分計算の結果に基づくビデオエンコーダ22の制御
条件に従って、プレビューの処理を行う(ステップS1
04)。このプレビューの処理は、使用者が任意の処理
範囲を指定してビデオデータを圧縮符号化し、得られた
データを、ハードディスク装置17に出力せずに、ビデ
オエンコーダ22内部のデコーダ(復号化器)によって
復号化してモニタ装置23によって表示させる処理であ
る。使用者は、このモニタ装置23に表示された画像の
画質を評価し(ステップS105)、画質に満足しない
場合(NG)には、カスタマイズ処理を行う(ステップ
S106)。このカスタマイズ処理は、画質に問題のあ
る部分のビットレートを上げたり、符号化の前に施す時
間的、空間的なフィルタのフィルタレベルを調整すると
いった部分的に符号化の条件を変更する処理である。ビ
デオエンコーダ制御装置24のGUI部28は、カスタ
マイズ処理における使用者の操作に応じて、符号化難易
度を補正する重み付けファイルweight.txtを作成し、ビ
ット配分部25に与える。ビット配分部25は、この重
み付けファイルweight.txtに基づいて、ビット配分を再
計算する(ステップS107)。ビット配分再計算後の
ビデオエンコーダ22の制御条件は、コントロールファ
イルCTL fileとして、ビット配分部25よりエンコーダ
コントロール部26に与えられる。そして、ビデオエン
コード装置11の動作は、ステップS104のプレビュ
ーの処理に戻る。
【0036】一方、使用者は、プレビューの処理の結
果、画質に満足した場合(OK)は、正式な符号化処理
の実行を指示し、これにより、正式な符号化処理が実行
される(ステップS108)。この符号化処理では、G
UI部28がVTRコントロール部27にコマンドcomm
and を与え、このコマンドcommand に基づいて、VTR
コントロール部27がVTR21を制御して、磁気テー
プよりビデオデータS1を再生させる。このビデオデー
タS1 は、ビデオエンコーダ22に入力される。ビデオ
エンコーダ22は、エンコーダコントロール部26の制
御により、ビデオデータS1 の圧縮符号化を行う。正式
な符号化処理では、ステップS103またはステップS
107によるビット配分計算後のビデオエンコーダ22
の制御条件に従って、エンコーダコントロール部26に
よって、ビデオエンコーダ22が制御されて、ビデオデ
ータS1 が圧縮符号化される。圧縮符号化によって得ら
れた圧縮画像データS2 は、ハードディスク装置17に
記録される。この圧縮符号化後、ビデオエンコーダ制御
装置24は、符号化処理結果(アドレスデータv.adrお
よび多重化用データvxxx.aui)をネットワーク19を介
して、スーパバイザ18に報告する後処理を行い(ステ
ップS109)、ビデオエンコード装置11による符号
化作業が終了する。
【0037】なお、図4に示した動作のうち、ステップ
S101,S103,S105,S106,107,1
09は、コンピュータ(ビデオエンコーダ制御装置2
4)上のオフライン処理である。
【0038】次に、図5を参照して、図4におけるビッ
ト配分計算(ステップS103)について詳細に説明す
る。このビット配分計算の概略は、スーパバイザ18よ
り与えられたビット総量QTY BYTES と最大ビットレート
MAXRATE とに基づいて、最大ビットレート以下になるよ
うに制限を加えた総ビット量USB BYTES を求め、この値
からGOPヘッダに必要なビット量TOTAL HEADERを引い
て、各ピクチャへの割り当てビット量の総和の目標値と
なるビット量SUPPLY BYTESを算出し、このビット量SUPP
LY BYTESの大きさの範囲内に収まるように、各ピクチャ
への割り当てビット量targetを配分することである。
【0039】具体的には、ビット配分部25は、始め
に、ファイルv.enc によって、GUI部28を介してス
ーパバイザ18より、ビット総量QTY BYTES 、最大ビッ
トレートMAXRATE 等の符号化条件を入力する(ステップ
S201)。次に、ビット配分部25は、エンコーダコ
ントロール部26より符号化難易度データdifficultyを
入力する(ステップS202)。
【0040】次に、ビット配分部25は、シーンチェン
ジ検出および処理を行う(ステップS203)。すなわ
ち、ビデオエンコーダ制御装置24は、符号化難易度を
測定する際に、各画像の直流(DC)成分の値や動きベ
クトルデータのデータ量の大きさ等のパラメータも併せ
て測定し、それらのパラメータの変化量から、シーンが
変化するポイントを見つけることが可能であり、ビット
配分部25は、これを用いてシーンチェンジの検出およ
びその処理を行う。
【0041】ここで、図6を参照して、シーンチェンジ
検出および処理について詳しく説明する。シーンチェン
ジとは、場面が切り換わることである。MPEG2規格
による動き補償を併用した双方向予測符号化方式によっ
て圧縮符号化処理を行う場合には、このシーンチェンジ
のフレームがPピクチャに設定されると画質が劣化す
る。そこで、シーンチェンジ検出および処理では、Pピ
クチャがシーンチェンジのフレームに設定されたことを
検出し、そのPピクチャをIピクチャに変更する処理を
行う。図6(a)は、GOPの構成の一例を表示順に示
したものであり、ここでは、符号60で示したPピクチ
ャがシーンチェンジのフレームに設定されている。その
ため、シーンチェンジ検出および処理では、図6(b)
に示したように、このPピクチャをIピクチャに変更す
る。
【0042】なお、シーンチェンジのフレームは、例え
ば、ビデオエンコーダ制御装置24によって、符号化難
易度の測定の際に、Iピクチャ、Pピクチャについて、
輝度レベルの直流レベル、動き補償で用いる差分データ
の加算値をビデオエンコーダ22から取得し、これら直
流レベルや差分データの加算値により検出することがで
きる。
【0043】また、シーンチェンジ検出および処理と同
様に、フラッシュの検出および処理を行うこともでき
る。ここで言うフラッシュとは、例えば写真撮影のフラ
ッシュが点灯したような場合で、フラッシュのフレーム
を間に挟んで、前後のフレームで連続性が維持されてい
る場合である。フラッシュの検出および処理では、この
フラッシュを検出し、フラッシュの次のフレームをIピ
クチャに変更する。
【0044】次に、ビット配分部25は、チャプタ処理
を行う(ステップS204)。DVDプレイヤでのチャ
プタサーチ時には、特定されないピクチャからチャプタ
へジャンプしてくるが、チャプタ処理は、その場合で
も、再生画像の乱れがないように、チャプタの位置が必
ずGOPの先頭になるようにピクチャタイプを変更する
処理である。
【0045】ここで、図7を参照して、チャプタ処理の
一例について説明する。図7(a)は、GOPの構成の
一例を表示順に示したものであり、ここでは、符号70
で示したPピクチャがチャプタのフレームに指定されて
いる。この場合、チャプタ処理では、Pピクチャ70を
Iピクチャに変更すると共に、チャプタの直前のBピク
チャ71をPピクチャに変更して、チャプタの前後のフ
レームにおいて、チャプタの前後に予測フレームが跨ら
ないようにBピクチャ、Pピクチャを設定する。
【0046】次に、ビット配分部25は、符号化難易度
に基づいて、少なくとも1種類のフレーム間予測符号化
ピクチャ(Pピクチャ,Bピクチャ)に関して、符号化
難易度が所定の条件を満たすか否かを判断し、符号化難
易度が所定の条件を満たす場合に、ピクチャタイプをフ
レーム内符号化ピクチャ(Iピクチャ)または予測方向
の数がより少ないフレーム間予測符号化ピクチャ(Pピ
クチャ)に変更するピクチャタイプの変更処理を行う
(ステップS205)。このピクチャタイプの変更処理
は、具体的には、例えば、GOP内のBピクチャの符号
化難易度の平均値とIピクチャの符号化難易度の比率が
第1の所定値を越える区間を、Bピクチャによる予測が
難しい区間として検出し、その区間内のBピクチャのう
ち、ピクチャの符号化難易度とそのピクチャが属するG
OPのIピクチャの符号化難易度の比率が第2の所定値
を越え、且つピクチャの符号化難易度が第3の所定値を
越えたものについて、ピクチャタイプを、予測方向の数
がより少ないフレーム間予測符号化ピクチャであるPピ
クチャに変更するという処理である。このようなピクチ
ャタイプの変更処理により、符号化する素材中の画像の
時間的または空間的な相関が悪い部分における動きベク
トルデータのデータ量を減少させることができ、その結
果、限られた割り当てデータ量の中で、実際のDCT係
数に関わる符号化データのデータ量を増加させて、画質
を改善させることができる。
【0047】なお、ステップS203ないしステップS
205の各処理によって決定されたピクチャタイプの情
報は、後に、エンコーダコントロール部26より、ピク
チャタイプの情報S3 として、ビデオエンコーダ22の
画像並べ替え回路31に与えられ、ビデオエンコーダ2
2では、ステップS203ないしステップS205の各
処理によって決定されたピクチャタイプに従って符号化
処理が行われることになる。
【0048】次に、ビット配分部25は、符号化難易度
の補間および補正処理を行う(ステップS206)。す
なわち、ステップS203ないしステップS205の各
処理によってピクチャタイプが変更されると、符号化難
易度を測定した際のピクチャタイプと正式な符号化処理
を行う際のピクチャタイプとが異なってしまうため、符
号化難易度の補間および補正処理では、ピクチャタイプ
が変更されたフレームに関して、例えば近接したフレー
ムの符号化難易度の値を利用して、符号化難易度の値が
変更後のピクチャタイプに応じた値となるように、符号
化難易度の補間または補正を行う。
【0049】次に、ビット配分部25は、補間および補
正処理後の符号化難易度と、スーパバイザ18より与え
られたビット総量QTY BYTES 等に基づいて、各ピクチャ
への割り当てビット量targetを計算する(ステップS2
07)。次に、ビット配分部25は、計算した割り当て
ビット量targetに基づいて、圧縮画像データを記録する
ハードディスク装置17上のアドレスを計算する(ステ
ップS208)。
【0050】次に、ビット配分部25は、符号化難易度
と割り当てビット量とに基づいて、正式な符号化の際の
量子化特性を推定するために、tg ratioの算出処理を行
う(ステップS209)。このtg ratioの算出処理につ
いては、後で詳しく説明する。
【0051】次に、ビット配分部25は、ステップS2
08で計算したアドレスとステップS207で計算した
割り当てビット量targetとを順次記述して、ビデオエン
コーダ22用のコントロールファイルCTL fileを作成す
る(ステップS210)。
【0052】次に、ビット配分部25は、画質の予測、
判別処理を実行して(ステップS211)、ビット配分
計算の処理を終了し、ビデオエンコード装置11の動作
は、図4におけるステップS104へ進む。なお、画質
の予測、判別処理については、後で詳しく説明する。
【0053】以下、ステップS207における割り当て
ビット量targetの計算方法の一例について説明する。こ
の例では、まず、スーパバイザ18より与えられたビッ
ト総量QTY BYTES と最大ビットレートMAXRATE とに基づ
いて、次の式(1)により、最大ビットレート以下にな
るように制限を加えた総ビット量USB BYTES を求める。
【0054】 USB BYTES =min(QTY BYTES,MAXRATE ×KT×total frame number) …(1)
【0055】式(1)において、KTは定数であり、NT
SC方式の場合はKT=1/8(bits)/30(Hz)、P
AL方式の場合はKT=1/8(bits)/25(Hz)であ
る。total frame numberは、符号化する素材のフレーム
総数である。min(s,t)は、sとtのうちで小さい方を選
択する関数である。
【0056】次に、式(2)で示すように、式(1)で
求めたUSB BYTES から、GOPヘッダに必要なビット量
TOTAL HEADERを引いて、各ピクチャへの割り当てビット
量の総和の目標値となるビット量SUPPLY BYTESを算出す
る。
【0057】 SUPPLY BYTES=USB BYTES −TOTAL HEADER …(2)
【0058】本例では、式(2)で求まったビット量SU
PPLY BYTESを、まず、GOP単位に配分し、その後、各
GOP内で各ピクチャの符号化難易度に応じて配分する
ものとする。ここでは、各GOP毎の符号化難易度の和
gop diffに応じて、符号化する際のGOP単位のビット
割当量gop targetを配分している。図8は、この符号化
難易度の和gop diffとGOP単位のビット割当量gop ta
rgetとを変換する関数の一例を示したものである。この
例では、Yをgop target、Xをgop diffとして、Y=A
X+Bという評価関数を用いている。この評価関数を用
いて、割り当てビット量targetを以下のようにして求め
る。
【0059】まず、次の式(3)により、全てのピクチ
ャの符号化難易度の総和DIFFICULTYSUMを求める。な
お、difficultyは、各ピクチャの符号化難易度である。
【0060】 DIFFICULTY SUM=Σdifficulty …(3)
【0061】ここで、評価関数Y=AX+Bより、次の
式(4)が成り立つ。
【0062】ΣY=A×ΣX+B×n …(4)
【0063】ここで、ΣY=SUPPLY BYTES、ΣX=DIFF
ICULTY SUMであり、nはGOPの総数である。また、B
を、GOP単位のビット割り当て量の最小値gop minbyt
esとする。
【0064】従って、式(4)により、Aは次の式
(5)で表される。
【0065】 A=(SUPPLY BYTES−gop minbytes×n)/DIFFICULTY SUM …(5)
【0066】GOP単位のビット割り当て量gop target
は上述の評価関数より、次の式(6)で表される。
【0067】gop target=A×gop diff+B …(6)
【0068】この式(6)中のAは式(5)で与えら
れ、Bはgop minbytesである。
【0069】次に、式(6)で求まったGOP単位のビ
ット割り当て量gop targetを、各GOP内で各ピクチャ
の符号化難易度に応じて配分する。GOP内での各ピク
チャへのビット配分を符号化難易度の大きさに比例させ
た場合には、各ピクチャの割り当てビット量targetは、
次の式(7)により求められる。
【0070】 target(k) =gop target×difficulty(k) /gop diff …(7)
【0071】なお、式(7)において、kはGOP内の
ピクチャ数を越えない任意の値とし、target(k) はk番
目のピクチャの割り当てビット量、difficulty(k) はk
番目のピクチャの符号化難易度を表す。
【0072】このようにして、各ピクチャの割り当てビ
ット量targetが計算されるが、素材の中に極端に難しい
(各GOPごとの符号化難易度の和gop diffの値が大き
くなる)ピクチャがあると、GOP単位のビット割り当
て量gop targetの値が非常に大きくなり、オーサリング
装置において許容されている最大ビットレートMAXRATE
を越えてしまうため、GOP単位のビット割り当て量go
p targetには、図7に示したように、GOP単位のビッ
ト割り当て量の最大値gop maxbytesといった固定値で制
限をかける必要がある。また、割り当てビット量target
の最小値は、前述のgop minbytesによって制限される。
【0073】以上のようにして求められた各ピクチャの
割り当てビット量targetは、更に、次のようにして修正
される。すなわち、MPEG2規格でビデオデータを符
号化するときには、デコーダ(復号化装置)における入
力バッファに対応する仮想的なバッファのバッファ残量
を考慮しながらビット配分をすることが義務づけられて
いる。この仮想的なバッファの残量の計算をVBV(Vi
deo buffering verifier)という。また、この仮想的な
バッファをVBVバッファともいう。ここで、図9を参
照して、VBVの計算方法について説明する。DVDの
場合、バッファサイズVBVMAX(例えば1.75Mbits )
に対して、k番目のピクチャにおけるバッファのスター
ト点をOccupancy up(k)、k番目のピクチャの割り当
てビット量をtargetを(k)とすると、ピクチャ再生の
ためにビットを供給した後のバッファ残量Occupancy do
wn(k)は以下の式(9)で表される。なお、バッファ
のスタート点の初期値Occupancy up(0)は例えば式
(8)で表される固定値とする。
【0074】 Occupancy up(0)=VBVMAX×2/3 …(8) Occupancy down(k)=Occupancy up(k)−target(k) …(9)
【0075】このバッファには、デコーダ側のピックア
ップから、ビデオデータのデータ量に応じたビットレー
トのデータ量SYSTEM SUPPLY が蓄積される。ここで、デ
ータ量SYSTEM SUPPLY は次の式(10)で表される。
【0076】 SYSTEM SUPPLY =MAXRATE ×TW …(10)
【0077】なお、TWは、ピクチャの周期であり、NT
SC方式の場合は1/29.97、PAL方式の場合は
1/25である。
【0078】このデータ量SYSTEM SUPPLY が供給された
後のバッファ残量Occupancy up(k+1)は次の式(1
1)で表される。
【0079】 Occupancy up(k+1)=Occupancy down(k)+SYSTEM SUPPLY …(11) この供給されるデータ量SYSTEM SUPPLY は、図9におい
て、Occupancy down(k)とOccupancy up(k+1)と
の間の変化量に相当する。従って、供給されるデータの
ビットレートが大きいほど、Occupancy down(k)から
Occupancy up(k+1)への変化の傾きは大きくなり、
バッファにデータが蓄積されやすくなる。バッファが飽
和状態となった場合には、ピックアップからバッファへ
の供給が停止するため、バッファのオーバフローに関し
ては考慮する必要はない。これは、バッファ残量の任意
の設定値に厳密に制御する必要はなく、任意の設定値以
上になるように制御すればよいことを意味している。
【0080】一方、各ピクチャのデータ量が大きい場
合、バッファに蓄積されたデータは大きく減少する。従
って、バッファ残量が一定値以下にならないように割り
当てビット量targetを修正する必要がある。
【0081】ここで、図10および図11を参照して、
上述のようなVBVの制限による割り当てビット量targ
etの修正処理について説明する。図10(a)は、前述
の評価関数とGOP単位のビット割り当て量の最大値go
p maxbytesの制限を考慮して求めた割り当てビット量ta
rget、すなわち、式(7)によって求めた割り当てビッ
ト量targetの一例を示し、図10(b)は、図10
(a)に対応するVBVバッファ残量の変化を示してい
る。なお、図中、VBVMAXはVBVバッファ残量の上限
値、VBVMINはVBVバッファ残量の下限値である。この
例では、第1番目、第4番目、第7番目のピクチャで、
VBVバッファ残量は下限値VBVMINを下回っている。従
って、このままでは、デコーダ側において、連続したビ
デオデータの再生が一時途切れるおそれがある。
【0082】そこで、VBVの制限による割り当てビッ
ト量の修正処理では、下限値VBVMINを下回ったピクチャ
を含むGOPの割り当てビット量を削減する。具体的に
は、まず、GOP内でVBVバッファ残量による制限を
加える前の割り当てビット量を用いてVBV計算を実行
したときのバッファ残量の最小値をOcc Min として、調
整量rを、次の式(12)によって求める。なお、制限
を行うスタート点kstartは、Occupancy up(k)が基準
値VBVLINE (例えばVBVMAXの4分の3)以上となるとき
のkの値で、このときのOccupancy up(k)の値をOcc
start とする。また、VBVSTARTは、Occupancy up(0)
となる固定値である。
【0083】 Occ Min <VBVMINのとき r=(Occ start −VBVMIN)/(VBVSTART−Occ min ) …(12)
【0084】次に、この調整量rを用いて、次の式(1
3)により、修正後の割り当てビット量targetを求め
る。
【0085】 target(j)=target′(j)×r …(13)
【0086】ただし、target′は、修正前の割り当てビ
ット量を表している。また、jは、kstart≦j≦k であ
る。
【0087】図11(a)は、式(13)に従って、V
BVの制限による割り当てビット量の修正処理を行った
後の割り当てビット量targetの一例を示し、図11
(b)は、図11(a)に対応するVBVバッファ残量
の変化を示している。このように、VBVの制限による
割り当てビット量の修正処理を行うことによって、図1
1(b)に示した調整区間(kstart≦j≦k の区間)R
Cにおいて、VBVバッファ残量は下限値VBVMINを上回
るようになる。
【0088】このようにして求められた割り当てビット
量targetを用いて作成されたコントロールファイルCTL
fileに基づいて、エンコーダコントロール部26よりビ
デオエンコーダ22の量子化インデックス決定部43に
割り当てビット量の情報S4を与えて、ビデオエンコー
ダ22において符号化処理を行うことにより、素材の画
像の難しさに応じた可変ビットレートの符号化が実行さ
れる。
【0089】次に、図5におけるステップS209のtg
ratioの算出処理およびステップS211の画質の予
測、判別処理による正式な符号化の際の量子化特性の推
定と与えられた符号化条件による符号化後の画質の予測
について詳しく説明する。なお、以下の説明では、次の
ような記号を用いる。
【0090】1. gen bit (k) 予備的な符号化によって測定されたk番目のフレームの
符号化難易度の値であり、この値が大きいほど画像が難
しいことを表す。なお、kは0以上kend(GOPの最後
のk)以下の値とする。 2. target(k) 符号化条件に従ってビット配分されたk番目のフレーム
の割り当てビット量の値であり、この値が大きいほど画
像が難しいことを表す。 3. gop start (k) k番目のフレームがGOPの先頭である場合は1とし、
それ以外は0となる。 4. index (k) k番目のフレームのインデックス情報であり、特に、1
のときはチャプタポイントであることを表し、9のとき
は画質チェックポイントであることを表す。 5. total gop nb GOPの総数である。 6. gop gen bits(j) j番目のGOP内の符号化難易度の和を表す。なお、j
は0以上total gop nb未満の値とする。 7. gop target(j) j番目のGOP内の割り当てビット量の和を表す。 8. tg ratio(j) j番目のGOP内の符号化難易度の和と割り当てビット
量の和の比率を表し、次の式(14)により求められ
る。
【0091】 tg ratio(j)=gop gen bits(j)/gop target(j) …(14)
【0092】9. sum tg ratio 全GOPにおけるtg ratioの総和を表し、次の式(1
5)により求められる。 sum tg ratio=Σtg ratio(j) …(15)
【0093】10. avr tg ratio 全GOPにおけるtg ratioの平均値を表し、次の式(1
6)により求められる。
【0094】 avr tg ratio=sum tg ratio/total gop nb …(16)
【0095】11. max tg ratio 全GOPにおけるtg ratioの最大値を表し、次の式(1
7)により求められる。なお、MAX ()は、()のうち
の最大値をとる関数である。
【0096】 max tg ratio=MAX (tg ratio(j)) …(17)
【0097】12. func() 正式な符号化の際の量子化ステップ数を予測するための
予測関数である。 13. gop Quant (j) j番目のGOPの符号化結果の平均量子化ステップ数の
予測値を表し、次の式(18)により求められる。
【0098】 gop Quant (j)=func(tg ratio(j)) …(18)
【0099】14. avr Quant 全GOPの符号化結果の平均量子化ステップ数の予測値
を表し、次の式(19)により求められる。
【0100】 avr Quant =func(avr tg ratio) …(19)
【0101】15. max Quant 全GOPの符号化結果の最大量子化ステップ数の予測値
を表し、次の式(20)により求められる。
【0102】 max Quant =func(max tg ratio) …(20)
【0103】16. AVR Q LIMIT 符号化後の画質を予測、判別するためのavr Quant に対
する閾値である。 17. MAX Q LIMIT 符号化後の画質を予測、判別するためのmax Quant に対
する閾値である。 18. GOP Q LIMIT 符号化後の画質を予測、判別するためのgop Quant に対
する閾値である。
【0104】本実施の形態において、予備的な符号化に
おける符号化難易度の測定では、符号化の際の量子化ス
テップ数を固定値に設定した条件で、発生ビット量を測
定し、その発生ビット量を符号化難易度の値とみなして
いる。従って、そのときの符号化難易度の値の平均値と
ビット配分によって与えられた割り当てビット量の平均
値との関係から、正式な符号化の際の平均量子化ステッ
プ数を推定することができる。
【0105】図12は、本実施の形態におけるシステム
を用いて、様々な素材および符号化条件で、予備的な符
号化および正式な符号化を行った結果におけるavr tg r
atioと実際の平均量子化ステップ数との関係を示したも
のである。なお、量子化ステップ数は、小さいほど、細
かい情報を符号化することとなるため、相対的に画質の
向上を意味する。図12から、avr tg ratioと実際の平
均量子化ステップ数は、増加関数の関係にあることが分
かる。従って、適切な予測関数を用いれば、実際に正式
な符号化を行う前に、avr tg ratioから、実際の平均量
子化ステップ数を予測することが可能である。
【0106】ここでは、図12の関係に基づいて、一例
として、予測関数func()を、次の式(21)で定義す
る。また、この予測関数を、図12において、符号80
で示す。
【0107】func(x)=9.5x+5 …(21)
【0108】また、一例として、各閾値を次のように設
定する。 AVR Q LIMIT =12 MAX Q LIMIT =30 GOP Q LIMIT =24
【0109】次に、図13の流れ図を参照して、図5に
おけるステップS209のtg ratioの算出処理について
説明する。なお、ビデオエンコーダ制御装置24では、
tg ratioの算出処理が開始される時点で既に各GOPの
gop gen bits、gop targetおよびtotal gop nbは算出さ
れているものとする。tg ratioの算出処理では、まず、
ビデオエンコーダ制御装置24のビット配分部25は、
初期設定値としてjおよびkの値を0とすると共に、su
m tg ratioおよびmax tg ratioも0とする(ステップS
301)。次に、ビット配分部25は、gop start
(k)の値が1か否かを判断することにより、k番目の
フレームがGOPの先頭か否かを判断する(ステップS
302)。
【0110】gop start (k)が1、すなわちk番目の
フレームがGOPの先頭である場合(ステップS30
2;Y)には、j+1を新たなjとし、式(14)より
tg ratio(j)を求め、sum tg ratio+tg ratio(j)
を新たなsum tg ratioとする(ステップS303)。
【0111】次に、tg ratio(j)がmax tg ratioを越
えているか否かを判断する(ステップS304)。tg r
atio(j)がmax tg ratioを越えている場合(ステップ
S304;Y)は、tg ratio(j)を新たなmax tg rat
ioとする(ステップS305)。次に、式(18)よ
り、gop Quant (j)を求める(ステップS306)。
次に、gop Quant (j)がGOP Q LIMIT を越えているか
否かを判断する(ステップS307)。gop Quant
(j)がGOP Q LIMIT を越えている場合(ステップS3
07;Y)は、index (k)を、画質チェックポイント
であることを示す9とする(ステップS308)。次
に、k+1を新たなkとして(ステップS309)、k
がkendを越えているか否かを判断する(ステップS31
0)。kがkendを越えている、すなわち最後のGOPま
で処理を行った場合(ステップS310;Y)、tg rat
ioの算出処理を終了する。kがkendを越えていない場合
(ステップS310;N)は、ステップS301に戻
り、次のGOPについて、ステップS301ないしステ
ップS310の処理を実行する。
【0112】ステップS302において、gop start
(k)が1ではない、すなわちk番目のフレームがGO
Pの先頭ではない場合(N)、およびステップS307
において、gop Quant (j)がGOP Q LIMIT を越えてい
ない場合(N)は、ステップS309に進む。また、ス
テップS304において、tg ratio(j)がmax tg rat
ioを越えていない場合(N)は、ステップS306に進
む。
【0113】以上のようなtg ratioの算出処理を簡単に
言うと、GOP内の符号化難易度の和と割り当てビット
量の和からtg ratioを求め、このtg ratioから、予測関
数func()を用いて、GOPの符号化結果の平均量子化
ステップ数の予測値gop Quant を求め、この予測値gop
Quant が閾値GOP Q LIMIT を越えた場合には、インデッ
クス情報index (k)を画質チェックポイントであるこ
とを示す9とするいうものである。
【0114】次に、図14の流れ図を参照して、図5に
おけるステップS211の画質の予測、判別処理につい
て説明する。画質の予測、判別処理では、まず、ビデオ
エンコーダ制御装置24のビット配分部25は、式(1
6)よりavr tg ratioを求め、このavr tg ratioから式
(19)を用いてavr Quant を求め、図13のステップ
S305で求めたmax tg ratioから式(20)を用いて
max Quant を求める(ステップS401)。次に、ビッ
ト配分部25は、avr Quant がAVR Q LIMIT を越えてい
るか否かを判断する(ステップS402)。avr Quant
がAVR Q LIMITを越えている場合(ステップ
S402;Y)には、スーパバイザ18より与えられた
ビット総量QTY BYTES が不足している旨の警
告を示す情報をGUI部28に出す(ステップS40
3)。
【0115】次に、ビット配分部25は、max Quant が
MAX Q LIMIT を越えているか否かを判断する(ステップ
S404)。max Quant がMAX Q LIMIT を越えている場
合(ステップS404;Y)には、スーパバイザ18よ
り与えられた最大ビットレートMAXRATE が不足している
旨の警告を示す情報をGUI部28に出して(ステップ
S405)、画質の予測、判別処理を終了する。
【0116】ステップS402において、avr Quant が
AVR Q LIMIT を越えていない場合(N)は、ステップS
404に進む。また、ステップS404において、max
Quant がMAX Q LIMIT を越えていない場合(N)は、画
質の予測、判別処理を終了する。
【0117】GUI部28は、ステップS403または
ステップS405によって出力される情報に従って、ユ
ーザインタフェースを用いて警告を出す。
【0118】以上のような画質の予測、判別処理を簡単
に言うと、avr tg ratioとmax tg ratioから、それぞれ
予測関数func()を用いて、全GOPの符号化結果の平
均量子化ステップ数の予測値avr Quant と全GOPの符
号化結果の最大量子化ステップ数の予測値max Quant と
を求めることによって画質を予測し、予測値avr Quant
、max Quant を、それぞれ閾値AVR Q LIMIT 、MAX Q L
IMIT と比較することで、画質を判別し、予測値avr Qua
nt が閾値AVR Q LIMIT を越えている場合にはビット総
量QTY BYTES が不足している旨の警告を示す情報(与え
られた符号化条件が不適切である旨の情報)を出し、予
測値max Quant が閾値MAX Q LIMIT を越えている場合に
は最大ビットレートMAXRATE が不足している旨の警告を
示す情報(与えられた符号化条件が不適切である旨の情
報)を出すというものである。
【0119】以上説明したように本実施の形態によれ
ば、正式な符号化処理を行う前に、与えられた符号化条
件による符号化後の画質を予測することが可能となる。
具体的には、予測値avr Quant と閾値AVR Q LIMIT を用
いることで、与えられた符号化条件による符号化後の画
質に対する警告(画質の劣化の制限)を行うことが可能
となる。avr Quant が大き過ぎるということは、スーパ
バイザ18より与えられた符号化条件のうち、素材の符
号化難易度に対してビデオデータに割り当てられたビッ
ト総量QTY BYTES が不十分であることを意味するため、
スーパバイザ18に対してビット総量QTY BYTES を増や
してもらうように提言することになる。
【0120】また、同様に、予測値max Quant と閾値MA
X Q LIMIT を用いることで、難しい画像に対する警告
(画質の劣化の制限)を行うことが可能となる。max Qu
ant が大き過ぎるということは、スーパバイザ18より
与えられた符号化条件のうち、素材の難しい箇所の符号
化難易度の分布に対して最大ビットレートMAXRATE が不
十分であることを意味するため、スーパバイザ18に対
して最大ビットレートMAXRATE を増やしてもらうように
提言することになる。
【0121】このようなビデオデータの符号化条件の変
更は、ディスク全体の仕様変更が伴うため、できるだけ
早い時点で判断できないと、大幅な作業時間の無駄を招
く。従来の方法では、正式な符号化が終了した時点での
画質評価の結果が出るまで、符号化条件の変更の判断が
できなかったため、符号化条件の変更によって、ビデオ
工程従事者の単独の作業時間の無駄だけでなく、並行し
て作業しているオーディオ工程従事者のそれまでの作業
をやり直すケースも発生する等、ディスク作成の作業全
体として大幅な作業時間の無駄が発生していた。これに
対し、本実施の形態によれば、正式な符号化を行う前の
比較的早い時点で、与えられた符号化条件による符号化
後の画質を予測でき、符号化条件の変更が必要か否かを
判断できるため、作業時間の短縮が可能となる。
【0122】また、本実施の形態では、GOPの符号化
結果の平均量子化ステップ数の予測値gop Quant が閾値
GOP Q LIMIT を越えた場合には、インデックス情報inde
x (k)を画質チェックポイントであることを示す9と
している。インデックス情報index (k)は、それが特
定の値の場合には、図5におけるステップS210でコ
ントロールファイルCTL fileを作成する際に、時間情報
であるタイムコードと対応付けられて、インデックス情
報ファイルとして記録される。使用者は、GUI部28
を介して、このインデックス情報ファイルを利用するこ
とができる。
【0123】以下に、インデックス情報ファイルの一例
を示す。なお、この例では、ロール番号も併記されてい
る。
【0124】
【0125】このように、予測値gop Quant が閾値GOP
Q LIMIT を越えた場合に、その旨を、GOPの時間情報
等と共にインデックス情報として記録することにより、
使用者が、画質に問題がありそうな箇所の数や場所を瞬
時に把握することが可能となる。このようなインデック
ス情報により、その場所を重点的にチェックしたり、カ
スタマイズしたりすることが可能となるため、作業効率
を大幅に向上させることが可能となる。例えば、インデ
ックス情報を用いることで、カスタマイズやプレビュー
が何度か繰り返される場合に、処理の開始点や終了点の
タイムコードの指定を迅速に行うことが可能となる。ま
た、符号化の前に施す時間的、空間的なフィルタの変化
点だけをサーチするといった内容を指定して検索するこ
とも可能となる。
【0126】以上説明したように、本実施の形態によれ
ば、早い時点で、与えられた符号化条件による符号化後
の画質を予測でき、その結果、符号化条件の評価および
符号化作業の効率化が可能となる。
【0127】なお、本発明は上記実施の形態に限定され
ず、例えば、実施の形態では、正式な符号化の際の量子
化特性を推定するためのパラメータとして、GOP内の
符号化難易度の和と割り当てビット量の和の比率tg rat
ioや、tg ratioの総和sum tgratioや、tg ratioの平均
値avr tg ratioや、tg ratioの最大値max tg ratioを用
いたが、正式な符号化の際の量子化特性を推定するため
のパラメータとしては、これらに限らず、例えば、符号
化難易度と割り当てビット量の比率の分散値等を用いて
もよい。
【0128】また、予測関数は、式(21)のような一
次関数に限らず、より精度の高い関数を用いてもよい。
【0129】また、与えられた符号化条件が適切か否か
を判断するための条件は、実施の形態で挙げた例に限ら
ず、適宜に設定可能である。
【0130】また、符号化難易度は、実施の形態で挙げ
たように、予備的な符号化によって得られる発生ビット
量に限らず、ピクチャの符号化の難易度を表すパラメー
タであればよい。
【0131】
【発明の効果】以上説明したように本発明の画像符号化
装置によれば、符号化難易度測定手段によって、量子化
特性を固定した予備的な符号化によって得られるデータ
に基づいて各ピクチャ毎に符号化難易度を測定し、割り
当て符号量決定手段によって、与えられた符号化条件に
基づいて、正式な符号化の際の各ピクチャ毎の割り当て
符号量を決定し、量子化特性推定手段によって、符号化
難易度と割り当て符号量とに基づいて、正式な符号化の
際の量子化特性を推定するようにしたので、早い時点
で、与えられた符号化条件による符号化後の画質を予測
でき、その結果、符号化条件の評価および符号化作業の
効率化が可能となるという効果を奏する。
【0132】また、本発明の画質予測方法によれば、量
子化特性を固定した予備的な符号化によって得られるデ
ータに基づいて各ピクチャ毎に符号化難易度を測定し、
与えられた符号化条件に基づいて、正式な符号化の際の
各ピクチャ毎の割り当て符号量を決定し、符号化難易度
と割り当て符号量とに基づいて、正式な符号化の際の量
子化特性を推定することによって、与えられた符号化条
件による符号化後の画質を予測するようにしたので、早
い時点で、与えられた符号化条件による符号化後の画質
を予測でき、その結果、符号化条件の評価および符号化
作業の効率化が可能となるという効果を奏する。
【図面の簡単な説明】
【図1】本発明の一実施の形態に係る画像符号化装置と
してのビデオエンコード装置の構成を示すブロック図で
ある。
【図2】本発明の一実施の形態に係る画像符号化装置と
してのビデオエンコード装置を含むDVD用のオーサリ
ング装置の構成を示すブロック図である。
【図3】図1におけるビデオエンコーダの構成の一例を
示すブロック図である。
【図4】本発明の一実施の形態に係る画像符号化装置と
してのビデオエンコード装置の動作を示す流れ図であ
る。
【図5】図4におけるビット配分計算処理の詳細を説明
するための流れ図である。
【図6】図5におけるシーンチェンジ検出および処理を
説明するための説明図である。
【図7】図5におけるチャプタ処理を説明するための説
明図である。
【図8】図5における割り当てビット量の計算処理に用
いる評価関数を示す説明図である。
【図9】図5における割り当てビット量の計算処理に用
いるVBVの計算方法を説明するための説明図である。
【図10】図5における割り当てビット量の計算処理中
のVBVの制限による割り当てビット量の修正処理につ
いて説明するための説明図である。
【図11】図5における割り当てビット量の計算処理中
のVBVの制限による割り当てビット量の修正処理につ
いて説明するための説明図である。
【図12】本実施の形態において符号化難易度の値の平
均値と割り当てビット量の平均値との関係から正式な符
号化の際の平均量子化ステップ数を推定する方法につい
て説明するための特性図である。
【図13】図5におけるtg ratioの算出処理を説明する
ための流れ図である。
【図14】図5における画質の予測、判別処理を説明す
るための流れ図である。
【図15】GOPの構造を説明するための説明図であ
る。
【符号の説明】
11…ビデオエンコード装置、18…スーパバイザ、2
2…ビデオエンコーダ、24…ビデオエンコーダ制御装
置、25…ビット配分部、26…エンコーダコントロー
ル部、27…VTRコントロール部、28…GUI部。

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 量子化を含む符号化処理によって入力画
    像データを符号化すると共に、割り当て符号量に応じて
    量子化特性を変化させることの可能な符号化手段と、 この符号化手段に対して、量子化特性を固定して、正式
    な符号化を行う前の予備的な符号化を行わせ、得られる
    データに基づいて各ピクチャ毎に符号化の難易度を表す
    符号化難易度を測定する符号化難易度測定手段と、 与えられた符号化条件に基づいて、正式な符号化の際の
    各ピクチャ毎の割り当て符号量を決定する割り当て符号
    量決定手段と、 前記符号化難易度測定手段によって測定された符号化難
    易度と前記割り当て符号量決定手段によって決定された
    割り当て符号量とに基づいて、正式な符号化の際の量子
    化特性を推定する量子化特性推定手段とを備えたことを
    特徴とする画像符号化装置。
  2. 【請求項2】 前記量子化特性推定手段は、前記符号化
    難易度と前記割り当て符号量との比率に基づいて、正式
    な符号化の際の量子化特性を推定することを特徴とする
    請求項1記載の画像符号化装置。
  3. 【請求項3】 前記量子化特性推定手段は、推定した量
    子化特性が所定の条件を満たす場合に、与えられた符号
    化条件が不適切である旨の情報を出力することを特徴と
    する請求項1記載の画像符号化装置。
  4. 【請求項4】 前記量子化特性推定手段は、推定した量
    子化特性が所定の条件を満たすピクチャを示す情報を記
    録することを特徴とする請求項1記載の画像符号化装
    置。
  5. 【請求項5】 前記割り当て符号量決定手段は、与えら
    れた符号化条件と前記符号化難易度測定手段によって測
    定された符号化難易度とに基づいて、正式な符号化の際
    の各ピクチャ毎の割り当て符号量を決定することを特徴
    とする請求項1記載の画像符号化装置。
  6. 【請求項6】 量子化を含む符号化処理によって入力画
    像データを符号化すると共に、割り当て符号量に応じて
    量子化特性を変化させることの可能な符号化手段に対し
    て、量子化特性を固定して、正式な符号化を行う前の予
    備的な符号化を行わせ、得られるデータに基づいて各ピ
    クチャ毎に符号化の難易度を表す符号化難易度を測定す
    る符号化難易度測定手順と、 与えられた符号化条件に基づいて、正式な符号化の際の
    各ピクチャ毎の割り当て符号量を決定する割り当て符号
    量決定手順と、 前記符号化難易度測定手順によって測定された符号化難
    易度と前記割り当て符号量決定手順によって決定された
    割り当て符号量とに基づいて、正式な符号化の際の量子
    化特性を推定することによって、与えられた符号化条件
    による符号化後の画質を予測する画質予測手順とを含む
    ことを特徴とする画質予測方法。
  7. 【請求項7】 前記画質予測手順は、前記符号化難易度
    と前記割り当て符号量との比率に基づいて、正式な符号
    化の際の量子化特性を推定することを特徴とする請求項
    6記載の画質予測方法。
  8. 【請求項8】 前記画質予測手順は、推定した量子化特
    性が所定の条件を満たす場合に、与えられた符号化条件
    が不適切である旨の情報を出力することを特徴とする請
    求項6記載の画質予測方法。
  9. 【請求項9】 前記画質予測手順は、推定した量子化特
    性が所定の条件を満たすピクチャを示す情報を記録する
    ことを特徴とする請求項6記載の画質予測方法。
  10. 【請求項10】 前記割り当て符号量決定手順は、与え
    られた符号化条件と前記符号化難易度測定手順によって
    測定された符号化難易度とに基づいて、正式な符号化の
    際の各ピクチャ毎の割り当て符号量を決定することを特
    徴とする請求項6記載の画質予測方法。
JP25496097A 1997-09-19 1997-09-19 画像符号化装置および画質予測方法 Pending JPH1198499A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP25496097A JPH1198499A (ja) 1997-09-19 1997-09-19 画像符号化装置および画質予測方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP25496097A JPH1198499A (ja) 1997-09-19 1997-09-19 画像符号化装置および画質予測方法

Publications (1)

Publication Number Publication Date
JPH1198499A true JPH1198499A (ja) 1999-04-09

Family

ID=17272265

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25496097A Pending JPH1198499A (ja) 1997-09-19 1997-09-19 画像符号化装置および画質予測方法

Country Status (1)

Country Link
JP (1) JPH1198499A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111915590A (zh) * 2020-07-31 2020-11-10 标旗(武汉)信息技术有限公司 雾炮车喷雾次数统计方法、系统及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111915590A (zh) * 2020-07-31 2020-11-10 标旗(武汉)信息技术有限公司 雾炮车喷雾次数统计方法、系统及存储介质
CN111915590B (zh) * 2020-07-31 2022-12-20 标旗(武汉)信息技术有限公司 雾炮车喷雾次数统计方法、系统及存储介质

Similar Documents

Publication Publication Date Title
JP4123567B2 (ja) 画像信号処理装置及び方法
JP3825615B2 (ja) 動画像符号化装置および動画像符号化方法およびプログラムを記録した媒体
JPH06153152A (ja) 動画像符号化装置および方法
JP3911768B2 (ja) 画像符号化方法及び画像符号化装置
JP3740813B2 (ja) 画像符号化方法および画像符号化装置
JP2008283432A (ja) 画像記録再生装置
JP3837889B2 (ja) エンコード方法およびエンコード装置
JP3956394B2 (ja) 音声・映像データ符号化装置およびその方法
JP3592025B2 (ja) 撮影画像記録装置
JP3951152B2 (ja) 画像符号化装置および方法
JP4650454B2 (ja) 符号化装置及び符号化方法
JP4462643B2 (ja) 画像符号化方法及び画像符号化装置
JPH1198499A (ja) 画像符号化装置および画質予測方法
JP4605183B2 (ja) 画像信号処理装置及び方法
JP4759360B2 (ja) 画像処理装置
JPH10304372A (ja) 画像符号化方法および装置、画像伝送方法
JP4423216B2 (ja) 画像処理装置
JP3660514B2 (ja) 可変レート動画像符号化方法および動画像編集システム
JP2004180345A (ja) 撮影画像記録装置
JP3307367B2 (ja) 可変転送レート符号化装置
JP4423214B2 (ja) 画像処理装置
JP4423215B2 (ja) 画像処理装置
JPH114444A (ja) 画像符号化装置および方法
JPH08331556A (ja) 画像符号化装置および画像符号化方法
JP4765961B2 (ja) デジタル動画像記録装置