JPH11196375A

JPH11196375A - エンコード方法およびエンコード装置

Info

Publication number: JPH11196375A
Application number: JP36926497A
Authority: JP
Inventors: Masaaki Isozaki; 正明五十崎
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 1997-12-29
Filing date: 1997-12-29
Publication date: 1999-07-21
Anticipated expiration: 2017-12-29
Also published as: JP3837889B2; US6356178B1

Abstract

(57)【要約】【課題】複数の記録領域（層）に亘って記録される圧
縮ビデオデータへのビット配分時に、与えられたエンコ
ード条件で各記録領域間の画質に許容できない差を生じ
ないビット配分の可否を評価し、最適条件を提示できる
エンコード方法および装置を提供する。【解決手段】変更後のピクチャタイプに応じて補正さ
れた符号化難易度およびエンコード素材全体に与えられ
たビット数「SUPPLY_BYTES」に応じてエンコードユニッ
ト毎にビット配分され、各記録領域間の配分量のばらつ
きが検出されて許容できるかどうか評価される。許容で
きない場合はワーニングが表示され、許容できる場合は
補正後の符号化難易度と「SUPPLY_BYTES」に応じてピク
チャ毎のターゲットビット数が計算されてエンコーダ用
コントロールファイルが作成される。当初の条件でエン
コードしない場合はビット配分量等の適正値が提示され
る。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、画像／音声信号を
圧縮して記録媒体に記録するためのエンコード方法およ
び装置に関し、特に画像／音声信号をディジタルビデオ
ディスク（ＤＶＤ）などのいわゆるパッケージメディア
に蓄積するために好適なエンコード方法および装置に関
する。

【０００２】

【従来の技術】ビデオ情報を圧縮符号化してディジタル
ビデオディスク（Digital Video Disk：ＤＶＤ）やビデ
オＣＤのようないわゆるパッケージメディアに蓄積する
エンコードシステムでは、まず、ビデオ素材の画像の符
号化難易度（Difficulty）を測定し、次に、その符号化
難易度に基づいてパッケージメディアの記録容量の範囲
内の与えられたバイト数に収まるように、各ビデオ情報
のフレームごとにビット配分（Bit assign）処理を行う
方法が一般に採用されている。以下では、このような２
段階のエンコード処理を２パスエンコードという。

【０００３】図２０は、ビデオ情報を圧縮符号化してデ
ィジタルビデオディスク（ＤＶＤ）などのオーサリング
に用いられるオーサリングシステムの基本的な構成を例
示している。

【０００４】このオーサリングシステムは、ビデオエン
コーダ２２，オーディオエンコーダ２１，サブタイトル
エンコーダ２３，メニューエンコーダ２４，エミュレー
タ２６，マルチプレクサ２５等の各エンコード作業工程
のための装置と、エンコード結果が書き込まれるハード
ディスクアレイ（ＲＡＩＤ）４と、これらの動作を統括
管理するスーパーバイザ３とが、ネットワーク２で相互
に接続されている。

【０００５】このようなオーサリングシステムは、ビデ
オやオーディオなどの各パートのエンコード作業が同時
並列的に行えるため、作業効率が非常に良い。

【０００６】図２１は、図２０に例示したオーサリング
システムにおける、従来のビデオエンコードシステムの
構成例を示している。

【０００７】スーパーバイザ１０３は、ビデオエンコー
ドシステムの全体を管理するものであり、ビデオ，オー
ディオ，メニューなどの各エンコードシステムにエンコ
ード条件を与え、エンコード結果の報告を受ける。この
例では、ファイル「v.enc 」によってビデオエンコード
条件が指定され、ビデオエンコーダ側からはエンコード
結果のビットストリームが書き込まれたＲＡＩＤ１０４
上のアドレス「v.adr」と、ビットストリームをマルチ
プレックスする際に必要なデータ「vxxx.aui」が報告さ
れる。

【０００８】主コントローラ１１１は、ネットワーク１
０２を介して接続されるスーパーバイザ１０３との間の
通信により、このビデオエンコードシステム全体の動作
を制御する。

【０００９】具体的には、主コントローラ１１１は、グ
ラフィカルユーザーインターフェース（ＧＵＩ：Graphi
cal User Interface）部１１４の管理により、スーパー
バイザ１０３からの制御を受け付けると共に、オペレー
タの操作を受け付け、このＧＵＩ部１１４により管理さ
れるビットアサイン部１１５，エンコーダコントロール
部１１６，ＶＴＲコントロール部１１７により、エンコ
ーダ１１２，ビデオテープレコーダ（ＶＴＲ）１１０の
動作を制御する。これにより主コントローラ１１１は、
スーパーバイザ１０３から通知されたエンコード条件に
従って処理対象の素材を符号化処理し、その処理結果を
スーパーバイザ１０３に通知する。さらに、主コントロ
ーラ１１１は、ＧＵＩ部１１４を介してオペレータの設
定を受け付けて、上記の符号化の詳細な条件を変更でき
るようにされている。

【００１０】上記の主コントローラ１１１のＧＵＩ部１
１４は、ビットアサイン部１１５のビット配分プログラ
ム「BIT_ASSIGN」，エンコーダコントロール部１１６の
エンコーダコントロールプログラム「CTRL_ENC」および
ＶＴＲコントロール部１１７のＶＴＲコントロールプロ
グラムの３つのプログラムを管理している。

【００１１】また、ビットアサイン部１１５は、スーパ
ーバイザ１０３から通知されるエンコード条件のファイ
ル「v.enc 」に従って符号化処理の条件をフレーム単位
で決定し、この条件による制御データをファイル形式
「CTL file」によりコントロール部１１６に通知する。

【００１２】このとき、ビットアサイン部１１５は、符
号化処理におけるビット配分（ビットアサイン）を設定
し、さらに設定された条件をオペレータの操作に応じて
変更する。さらに、ビットアサイン部１１５は、データ
圧縮されたビデオデータＤ２がＲＡＩＤ１０４に記録さ
れると、そのビデオデータＤ２が書き込まれたＲＡＩＤ
１０４上のアドレスのデータ「v.adr 」を、後段におけ
る多重化処理に必要なデータ量等の情報「vxxx.aui」と
共にスーパーバイザ１０３に通知する。

【００１３】エンコーダコントロール部１１６は、ビッ
トアサイン部１１５から通知される制御ファイル「CTL
file」に従ってエンコーダ１１２の動作を制御する。さ
らに、エンコーダコントロール部１１６は、符号化処理
に要する符号化難易度「Difficulty」のデータをフレー
ム単位でビットアサイン部１１５に通知し、ＲＡＩＤ１
０４にビデオデータＤ２が記録されると、その記録アド
レスのデータ「v.adr」，後の多重化処理に必要なデー
タ「vxxx．aui 」をビットアサイン部１１５に通知す
る。

【００１４】ＶＴＲコントロール部１１７は、スーパー
バイザ３から通知される編集リストに従ってビデオテー
プレコーダ（ＶＴＲ）１１０の動作を制御し、所望の編
集対象の素材を再生する。

【００１５】ビデオテープレコーダ（ＶＴＲ）１１０
は、主コントローラ１１１を介してスーパーバイザ１０
３から通知される編集リストに従って、磁気テープに記
録されたビデオデータＤ１を再生してエンコーダ１１２
に出力する。

【００１６】エンコーダ１１２は、スーパーバイザ１０
３から主コントローラ１１１を介して通知される条件に
従って動作を切り換え、ＶＴＲ１１０から出力されるビ
デオデータＤ１を、ＭＰＥＧ（Moving Picture Experts
Group）の手法により圧縮符号化する。

【００１７】このとき、エンコーダ１１２は、符号化処
理の結果を主コントローラ１１１に通知し、主コントロ
ーラ１１１は、そのデータ圧縮における符号化の条件を
制御し、発生するビット量を制御する。これにより、主
コントローラ１１１は、データ圧縮により発生するビッ
ト量をフレーム単位で把握できる。

【００１８】また、エンコーダ１１２は、２パスエンコ
ードにおける事前のエンコード条件設定の処理時（仮エ
ンコード時）には、単にビデオデータＤ１をデータ圧縮
して処理結果を主コントローラ１１１に通知するだけで
あるが、最終的なデータ圧縮処理時（本エンコード時）
には、圧縮処理されたビデオデータＤ２をＲＡＩＤ１０
４に記録し、さらにそのデータが記録されたアドレス，
データ量等を主コントローラ１１に通知する。

【００１９】モニタ装置１１３は、エンコーダ１１２に
よりデータ圧縮されたビデオデータＤ２をモニタできる
ように構成される。このビデオエンコードシステムで
は、モニタ装置１１３により、オペレータがデータ圧縮
処理の結果を必要に応じて確認する、いわゆるプレビュ
ーを行うことができる。そして、オペレータが、このプ
レビュー結果に基づいて主コントローラ１１１を操作し
て、符号化の条件を詳細に変更できるようにされてい
る。

【００２０】前述したように、いわゆるＤＶＤなどのパ
ッケージメディアには、ビデオデータの圧縮方式として
ＭＰＥＧ（Moving Picture Experts Group）が採用され
ている。

【００２１】ＭＰＥＧは、動き補償予測による時間方向
の冗長度を除去することによりデータ圧縮する方式であ
り、フレーム内だけで符号化されるＩ（Intra ）ピクチ
ャ，過去の画面から現在を予測して符号化されるＰ（Pr
edictive）ピクチャ，過去の画像と未来の画像とから現
在を予測して符号化されるＢ（Bidirectionally Predic
tive）ピクチャの３種類の符号化画像が用いられる。

【００２２】また、これらの画像は、Ｉピクチャを必ず
１つ含むまとまりであるＧＯＰ（Group of Pictures ）
とされる。

【００２３】次に、従来の２パスエンコード作業につい
て、図２０に例示したビデオエンコードシステムの構成
を参照しながら説明する。

【００２４】図２２は、図２１に例示した従来のビデオ
エンコードシステムにおける、２パスエンコードの基本
的な処理手順を示している。

【００２５】まず、ステップＳ５１で、スーパーバイザ
１０３からネットワーク１０２を経由して、ビデオ情報
に割り当てられるビット総量や最大レートなどのエンコ
ード条件「v.enc 」が与えられ、エンコーダコントロー
ル部１１６はこのエンコード条件に従って設定される。

【００２６】次に、ステップＳ５２で、エンコーダコン
トロール部１１６が、エンコーダ１１２を使ってエンコ
ード素材の符号化難易度（Difficulty）を測定する。こ
のとき、素材の各画素のＤＣ値や動きベクトル量ＭＥも
併せて測定される。そして、これらの測定結果に基づい
てファイルが作成される。

【００２７】符号化難易度の実際の測定は、以下のよう
に行われる。

【００２８】エンコード素材となるビデオ情報は、マス
ターテープであるディジタルビデオカセットからＶＴＲ
１１０により再生される。

【００２９】エンコーダコントロール部１１６は、エン
コーダ１１２を介して、ＶＴＲ１１０により再生された
ビデオ情報Ｄ１の符号化難易度を測定する。ここでは、
符号化の際に量子化ステップ数を固定値に設定して発生
ビット量が測定される。動きが多く、高い周波数成分が
多い画像では発生ビット量が多くなり、静止画や平坦な
部分が多い画像では発生ビット量が少なくなる。この発
生ビット量の大きさが符号化難易度とされる。

【００３０】次に、ステップＳ５３では、ステップＳ５
１で設定されたエンコード条件に従ってステップＳ５２
で測定された、各ピクチャの符号化難易度の大きさに応
じて、エンコーダコントロール部１１６が、ビットアサ
イン部１１５内のビット配分計算プログラム「BIT_ASSI
GN」を実行し、割り当てビット量（ターゲット量）の配
分計算を行う。

【００３１】そして、上記のビット配分計算の結果を使
って仮エンコードを行い、ステップＳ５４で、エンコー
ダ１１２に内蔵されているローカルデコーダ出力の画質
によって、本エンコードを実行するかどうかをオペレー
タに判断させるようにする。実際には、上記のビット配
分によるビットストリームをＲＡＩＤ４に出力しない
で、オペレータが任意の処理範囲を指定できるモードで
あるプレビユー（Preview ）モードで画質が確認され
る。

【００３２】そして、ステップＳ５５で、画質評価が行
われ、画質に問題がある場合（ＮＧ）にはステップＳ５
６に進み、問題がある部分のビットレートを上げたりフ
ィルターレベルを調整するといった画質調整のためのカ
スタマイズ作業が行われた後に、ステップＳ５７でビッ
ト配分再計算が実行される。

【００３３】その後、ステップＳ５４に戻り、カスタマ
イズされた部分がプレビューされ、ステップＳ５５で画
質が確認される。ここで、全ての部分の画質が良好であ
ればステップＳ５８に進み、エンコーダ１１２によっ
て、ステップＳ５７で再計算されたビット配分による素
材全体についての最終的なエンコード処理（本エンコー
ド）が実行される。

【００３４】一方、ステップＳ５５で、画質に問題がな
いと判断された場合には、そのままステップＳ５８に進
み、エンコーダ１１２により、ステップＳ５３で計算さ
れたビット配分による本エンコードが実行される。

【００３５】そして、ステップＳ５９で、エンコード結
果であるビットストリームがＳＣＳＩ（Small Computer
System Interface ）等を介してＲＡＩＤ１０４に書き
込まれる等の後処理が行われ、２パスエンコード処理が
終了する。

【００３６】ステップＳ５８におけるエンコードの実行
後、ビデオエンコーダコントロール部１１６は、上述し
たようなエンコード結果の情報をネットワーク１０２経
由でスーパーバイザ１０３に報告する。

【００３７】なお、この図２２の各ステップのうち、ス
テップＳ５２，ステップＳ５４およびステップＳ５８を
除く各ステップの処理は、オフラインで行われる。

【００３８】この一連の作業工程において、エンコード
素材を１本のビデオテープに記録し切れない場合には、
複数のロール（テープ）に亘って記録されることにな
る。このテープの入れ換え作業のため、連続してエンコ
ードを行うことができない。

【００３９】また、マルチアングルの場合には、その部
分のタイムコードはアングルブロック間で同じなので、
この場合も連続してエンコードすることができない。こ
のような、エンコード作業を一旦中断しなければならな
い処理単位をエンコードユニットＥＮＣＵ(Encode uni
t) と定義する。次に、上述したような２パスエンコー
ド作業におけるビット配分計算について説明する。

【００４０】まず、エンコード結果が蓄積されるパッケ
ージメディアの記録容量のうちのビデオに割り当てられ
たビット総量「QTY_BYTES 」と最大ビットレート「MAXR
ATE」とが、オーサリングシステムから指定される。こ
れに対して、最大ビットレート以下になるように制限を
加えられた総ビット数「USB_BYTES 」を求め、その値か
ら「GOP header」に必要なビット数「TOTAL_HEADER」を
引いた値と全体のフレーム総数から、ターゲット数の総
和の目標値となる「SUPPLY_BYTES」を算出する。そし
て、この「SUPPLY_BYTES 」の大きさに収まるように、
各ピクチャへの割り当てビット量（以下ターゲット(tar
get)量という。）が配分される。

【００４１】図２３は、図２２のステップＳ５３におけ
る、上記のビット配分計算の処理手順の一具体例を示し
ている。

【００４２】まず、ステップＳ６１で、上述したように
スーパーバイザから送られるビット総量「QTY_BYTES 」
と最大ビットレート「MAXRATE 」が入力される。

【００４３】次に、ステップＳ６２で、図２２のステッ
プＳ５２で作成された符号化難易度（Difficulty）の測
定結果のファイルが読み込まれる。

【００４４】次に、ステップＳ６３で、符号化難易度と
共に測定された各画像のＤＣ値や動きベクトル量ＭＥの
大きさのパラメータの変化量から、シーンが変化するポ
イントが検出される。

【００４５】図２４は、このようなシーンチェンジ指定
されたフレームの処理を示している。

【００４６】符号化難易度（Difficulty）測定の際に併
せて測定される、各画像のＤＣ値や動きベクトル量の大
きさなどのパラメータの変化量から、シーンが変化する
ポイントを見つけることが可能である。これにより、図
２４に示すように、シーンチェンジとして検出されたＰ
ピクチャをＩピクチャに変更して、画質改善を図ること
ができる。なお、ここではフレーム数Ｎ＝１５の場合を
例示している。

【００４７】次に、ステップＳ６４では、チャプター
（CHAPTER ）境界処理が行われる。ディスク再生装置で
のチャプターサーチ時には、再生されるピクチャが、特
定されないピクチャからジャンプしてくる。その場合で
も再生画像が乱れないようにするため、このチャプタ境
界処理によって、チャプターの位置が必ずＧＯＰの先頭
になるようにピクチャタイプが変更されたり、ＧＯＰ長
が制限される。

【００４８】図２５は、このようなチャプタ(CHAPTER )
指定されたフレームの処理、すなわち、セル（CELL）境
界の処理を示している。

【００４９】そして、ステップＳ６５では、上記の一連
の作業の結果として変更された、Ｉピクチャ，Ｐピクチ
ャ，Ｂピクチャなどのピクチャタイプに合わせて符号化
難易度（Difficulty）の値が補間／補正される。これ
は、いわゆるＤＶＤなどの記録媒体では、１ＧＯＰのデ
コード時に、表示される最大のフィールド数が制限され
ていることから、ピクチャタイプの変更に伴ってＧＯＰ
構造が変化したことにより１ＧＯＰの長さがこの制限を
越えることがあるためである。そのような場合には、制
限を満たすように、ＰピクチャをＩピクチャに変更して
ＧＯＰ長が短くされるＧＯＰ制約処理が行われる。

【００５０】次に、ステップＳ６６では、各エンコード
ユニット（ＥＮＣＵ）ごとに、ビット量が配分される。

【００５１】次に、ステップＳ６７では、ステップＳ６
５における補間／補正処理によって得られた符号化難易
度、およびエンコードされる素材全体に与えられたビッ
ト数「SUPPLY_BYTES」に応じて、まず各ＥＮＣＵごとに
ビットが配分(supply_bytes[encu_nb] )し、それがター
ゲットビット（Target bit）量の総和の目標値とされ
る。その後、各ＥＮＣＵごとに、その目標値に応じて各
ピクチャ単位のビット配分が実行される。

【００５２】そして、ステップＳ６８でエンコード結果
のビットストリームを書き込む際のＲＡＩＤのアドレス
（ADDRESS ）が計算された上で、ステップＳ６９でエン
コーダ用のコントロールファイルが作成されて一連の処
理が終了する。

【００５３】上記のような手順により、素材の符号化難
易度（Difficulty）および素材全体に与えられたビット
数「SUPPLY_BYTES」に応じて、各ピクチャごとのターゲ
ットビット数が計算され、エンコーダ用のコントロール
ファイルが作成される。

【００５４】以下では、このようなビット配分の手順に
ついて、図２６に示す、素材がいわゆるアングルブロッ
クを含む場合のビット配分例を参照しながら、さらに詳
しく説明する。なお、このマルチアングルについての詳
細は後述する。

【００５５】図２７は、シームレスアングル部分に対す
る重み係数が考慮されたビット配分の基本的な手順を示
している。

【００５６】まず、ステップＳ７１で、パッケージメデ
ィアの記録容量のうちのビデオに割り当てられたビット
総量「QTY_BYTES 」がスーパーバイザから取得される。

【００５７】次に、ステップＳ７２では、このビット総
量「QTY_BYTES 」に対して、エンコード条件として指定
された総ビット数「USB_BYTES 」が求められる。

【００５８】 USB_BYTES = min（QTY_BYTES，MAXRATE × KT × total_frame_number） ---- [1] ここで、ビデオ素材のフォーマットがＮＴＳＣ方式であ
る場合には KT = 1/8(bits)/30(Hz)，ＰＡＬ方式である
場合には KT = 1/8(bits)/25(Hz)である。また、「tota
l_frame_number」はエンコードされる素材のフレーム総
数，「min(s,t)」はｓ，ｔのうちの小さい方を選択する
関数である。

【００５９】次に、ステップＳ７３では、この「USB_BY
TES 」から「GOP header」に必要なビット数の総和「TO
TAL_HEADER 」を引いた値「ΣTOTAL_SUPPLY_BYTES 」が
求められる。なお、総和Σは、各記録層についての和を
意味している。

【００６０】また、ステップＳ７４では、全体のフレー
ム総数「total_framenb 」から、シームレスアングル部
分の「ALL_ANGLE_BYTES 」が計算される。ここで、最初
にシームレスアングルブロックにビット配分するのは、
シームレスアングルブロックには他の部分よりも厳しい
制約があり、より多くのビット量が必要なことと、対応
するシームレスアングルブロックに同一量のビットが割
り当てられることが必要なためである。

【００６１】各エンコードユニット（ＥＮＣＵ）のフレ
ーム数を「ENCU_frame[encu_nb] 」とすると、 supply_bytes[encu_nb] = (USB_BYTES - TOTAL_HEADER) × ENCU_frame[encu_nb] /total_framenb ---- [2] ALL_ANGLE_BYTES = Σsupply_bytes(Seamless Angle Block) ---- [3] このとき、対応するシームレスアングルブロックのフレ
ーム数は互いに同じであるため、各々の「supply_byte
s」も必ず同じになる。

【００６２】次に、ステップＳ７５では、「USB_BYTES
」から「ALL_ANGLE_BYTES 」を引いた値に対し、アン
グルブロックではない部分の各ＥＮＣＵの「supply_byt
es」、すなわち「ALL_SUPPLY_BYTES」が算出される。こ
のとき、単純にフレーム数の比率でビット分配すると、
ＥＮＣＵ間での画像の難しさにばらつきがある場合に最
適なビット割当ができないため、各ＥＮＣＵでの符号難
易度の総和「ENCU_diff[encu_nb]」を求めておき、ステ
ップＳ７６ではその比率でビット量が分配される。

【００６３】その際、ユーザーが、ＥＮＣＵ間のビット
配分を、素材の段階で意識的に操作したい場合がある。
例えば、映画素材の前にコマーシャルなどをいれる場合
に、その部分だけはビットレートを意識的に上げたい場
合などが考えられる。このような要求は、各ＥＮＣＵの
符号化難易度の総和に対して、重み係数「e_weight」を
設定することで実現される。

【００６４】この重み係数は、例えば、以下の表１に示
されるようなファイルで設定され、ビット計算の実行時
にロードされる。 DIFF_SUM = ΣENCU_diff[encu_nb] (シームレスアングル以外のENCU） ---- [4] ALL_SUPPLY_BYTES = USB_BYTES - TOTAL_HEADER - ALL_ANGLE_BYTES ---- [5] supply_bytes [encu_nb] = ALL_SUPPLY_BYTES * ENCU_diff[encu_nb]/ DIFF_SUM ---- [6]

【００６５】

【表１】以下では、ビット配分計算の例として、まずＧＯＰ単位
にビット量を配分し、その後に各ＧＯＰ内で各ピクチャ
の難しさ「GOP_DIFFICULTY」に応じたビット配分を行う
ものとして説明する。各ＧＯＰごとのDifficultyの和で
ある「GOP_diff」に応じて、エンコードする際のＧＯＰ
単位のビット割り当て量「GOP_target」が配分される。

【００６６】図２８は、ＧＯＰごとの符号化難易度の和
「gop_diff」とエンコード時のＧＯＰ単位のビット割当
て量「gop_target」とを変換するための、最も簡単な関
数の例を示している。

【００６７】この例では、「GOP_target」をY ，「GO
P_diff」をX とし、 DIFFICULTY_SUM = ENCU_diff[encu_nb] として、 Y = AX + B という形で表される評価関数が用いられる。また、全て
のピクチャの「Difficulty」の総和「ENCU_diff[encu_n
b]」が用られる。 B = GOP_MINBYTES ---- [7] Σy = A×Σx + B×n ここで、Σy = supply_bytes[encu_nb]，Σx = ENCU_di
ff[encu_nb]，ｎはＧＯＰの総数である。よって、 A = (supply_bytes[encu_nb] - B×n)/ ENCU_diff[encu
_nb] となる。

【００６８】 GOP_target = A × GOP_diff + B ---- [8] その後、各ＧＯＰ内で各ピクチャの符号化難易度「gen_
bit[k]」に応じたビット配分を行う。この「gen_bit
[k]」は、仮エンコードによって測定されたｋ番目のフ
レームの符号化難易度の値であり、大きいほど画像が難
しいことを表す。ＧＯＰ内での各ピクチャの配分は Dif
ficulty の大きさに比例させた場合には、各ピクチャの
ターゲット量は以下の式で求められる。

【００６９】 target(k) = GOP_TARGET × gen_bit[k]/GOP_diff ---- [9] (1 ≦ k ≦ GOP 内の picture 数）この場合、素材の中に極端に難しい（すなわち、「GOP_
diff」が大きい）ピクチャがあると、非常に大きい「go
p_target」量になってしまい、システムにおいて許容さ
れている最大レートを越えてしまうため、「GOP_MAXBYT
ES」といった固定量でリミッタをかけることが必要であ
る。また、最小のターゲット量も「GOP_MINBYTES」によ
り同様に制限される。

【００７０】ＭＰＥＧによるビデオのエンコード時に
は、仮想デコーダのバッファ残量を考慮しながらビット
配分することが義務付けられている。この仮想バッファ
残量の計算をＶＢＶ(Video buffering verifier) とい
う。

【００７１】以下に、この仮想バッファ残量の計算方法
について説明する。

【００７２】図２９は、ＶＢＶ計算方法を示している。

【００７３】記録媒体がいわゆるＤＶＤの場合、バッフ
ァサイズ「VBV MAX 」(1.75Mbits )に対して、ｋ番目の
ピクチャのバッファのスタート点を「Occupancy_up(k)
」，ｋ番目のピクチャのターゲット量を「target(k)
」とすると、ピクチャにビットを供給した後のバッフ
ァ残量「Occupancy_down(k) 」は[7] 式で表される。

【００７４】このバッファには、デコーダのピックアッ
プからビデオのデータ量に応じたビットレートのデータ
量「SYSTEM_SUPPLY 」が蓄積される。この供給後のバッ
ファ残量「Occupancy_up(k+1) 」は [8] 式で表され
る。

【００７５】この供給量は、図中の右上にあがる量に相
当する。供給されるビットレートが大きいほど傾きは大
きくなり、バッファにデータがたまりやすくなる。バッ
ファがいっぱいになった場合には、ピックアップからバ
ッファへの供給がストップするため、バッファのオーバ
ーフローに関しては考慮する必要はない。このことは、
ある設定値ちょうどに制御する必要はなく、設定値以上
になるように制御すれば良いことを意味している。

【００７６】逆に、各ピクチャのデータ量が大きいと、
バッファにたまったデータは減少する。このバッファ残
量が一定値以下にならないようにターゲットビット量を
計算する。この計算の最初の「Occupancy_up(0) 」は固
定値（この例ではVBV MAX×2/3 )からスタートする。

【００７７】以下の「Occupancy_up 」はグラフ上の各
ピクチャの上側のポイント、「Occupancy_down 」はグ
ラフ上の各ピクチャの下側のポイントを意味している。

【００７８】 Occupancy_up(0) = VBV MAX × 2/3 ---- [10] Occupancy_down(k) = Ouucpancy_up(k) - target(k) ---- [11] Occupancy_up(k+1) = Ouucpancy_down(k) + SYSTEM_SUPPLY ---- [12] SYSTEM_SUPPLY = MAXRATE(bps)×KT ---- [13] 次に、以上説明したような、ＧＯＰ単位でのターゲット
ビット配分計算を行った例を示す。

【００７９】図３０は、評価関数と「GOP_MAXRATE 」制
限を考慮して求めたターゲット量に対して、ＶＢＶバッ
ファ計算を行った場合のターゲットビット配分例を示し
ている。

【００８０】図３０中の１番目，４番目，７番目のピク
チャは、ＶＢＶバッファの下限である「VBV MIN 」の値
を下回っている。そこで、ＶＢＶが「VBV MIN 」を下回
ったピクチャを含むＧＯＰのターゲット量を削減させ
る。

【００８１】ＧＯＰ内でＶＢＶ制限を加える前のターゲ
ット量でＶＢＶ計算を実行したときの「Occupancy 」の
最小値を「Occ_min 」とすると、調整量は以下の式で表
される。ここで、制限を行うスタート点「kstart」は、
「Occupancy_up(k) 」が基準値「VBVLINE 」とされる。
この「VBVLINE 」は、例えば、 VBV MAX×(3/4) 以上の
ｋの値で、このときの「Occupancy_up(k) 」の値を「Oc
c_start 」とする。

【００８２】Occupancy_min ＜ VBV MIN の時 r = (Occ_start - VBV MIN)/(VBVSTART - Occ_min) ---- [14] 各ターゲットに対して target(j) = target(j) × r （kstart ≦ j ≦ k) とする。

【００８３】図３１は、上記のようなＶＢＶ制限処理を
行った後のターゲットビット配分例を示している。

【００８４】ＶＢＶ制限処理前には、ＶＢＶバッファの
下限である「VBV MIN 」の値を下回っていた１番目，４
番目，７番目のピクチャも、この下限値を下回らないよ
うに調整されている。

【００８５】このようにして求められたターゲット量を
用いて作成されたコントロールファイルによりエンコー
ド処理を行うことで、素材の画像の難しさに応じて、簡
単な画像には少ないビット量が割り当てられ、難しい画
像により多くのビット量が割り当られるようになるた
め、演奏時間の中で画質のばらつきが少ない可変レート
エンコーディングが実現される。

【００８６】

【発明が解決しようとする課題】ところで、ＤＶＤ（デ
ジタルビデオディスク）は、片面に２層の記録層を有す
るディスク、および両面に計４層の記録層を有するディ
スクのフォーマットが規定されている。

【００８７】各記録層に記録されるビデオデータに対し
て、どの程度のバイト数を割り当てるかは、ディスク全
体の構成に関わるため、スーパーバイザ側からエンコー
ド条件として指定される。スーパーバイザ側でエンコー
ド条件を決める際には、各記録層に記録される予定の素
材の画像の難しさの違いは分からないため、例えば、単
純に各記録層に記録されるフレーム数の比率を用いてバ
イト数を分配するしかない。

【００８８】しかし、実際のエンコードでは、各記録層
に記録される素材の画像にはばらつきがあるため、この
ようにバイト数が一律に配分された場合には、記録層の
間に画質の差が生じることになる。

【００８９】例えば、第１層の演奏時間と第２層の演奏
時間とが同じである場合には、同じ量のバイト数がエン
コード条件として指定される。ところが、第１層には簡
単な静止画像が多く含まれ、第２層には情報量の多い画
像が多く含まれる場合には、第１層の画質と第２層の画
質との間に大きな差が生じることとなり、ディスク再生
装置で記録層間を切替えて再生させた場合に違和感を生
じさせるという問題がある。

【００９０】図３２は、２層の記録層を有するいわゆる
ＤＶＤなどの記録媒体に対して、従来方式によりビット
配分された例を示している。

【００９１】エンコードユニットＥＮＣＵ１とＥＮＣＵ
３とは、符号化難易度の和およびフレーム数が全く同じ
であり、同じエンコード条件であるにも関わらず、各記
録層「Layer 1」と「layer 2」との間でのビット配分が
変わってしまっている。この条件でエンコードを実行す
ると、ＥＮＣＵ１とＥＮＣＵ３との間には明らかな画質
の差が生じてしまう。

【００９２】図３３は、図３２に示す例における各エン
コードユニット（ＥＮＣＵ）に対するビット配分結果を
まとめて示している。

【００９３】このような従来方式における記録層の間の
画質の差は、エンコード後の画質評価によって始めて確
認できるため、画質が望ましくないと判断された場合に
は、その時点でエンコード条件が変更されることにな
る。しかし、エンコード条件をどの程度調整してよいか
は分からないため、カットアンドトライによる作業とな
り、効率が非常に悪いという問題がある。

【００９４】次に、エンコード素材が、いわゆるアング
ルブロックを含む場合について説明する。

【００９５】ＤＶＤ（ディジタルビデオディスク）にお
けるアングル再生とは、図３４に示すように、デコーダ
（再生装置）側で、ユーザーが、同一の被写体の同じ時
間における画像を、複数の角度から再生できるようにす
るものであり、切替時に再生画像が一旦中断する（黒な
どが挿入される）ことを許すノンシームレスアングル
と、切替時に乱れることなく（シームレスに）つながる
シームレスアングルとがある。ここでは、３つの角度か
らの画像である「Angle 1」，「Angle 2」，「Angle
3」が切替られる場合を例示している。

【００９６】図３５は、アングルブロックを含むデータ
の一例を示している。

【００９７】この図中で、各エンコードユニットＥＮＣ
Ｕ２，ＥＮＣＵ４，ＥＮＣＵ５は、アングルの組合せを
意味している。シームレスアングルの場合には、アング
ルの組合せであるＥＮＣＵ２，ＥＮＣＵ４，ＥＮＣＵ５
において、ピクチャ数とＧＯＰ構造とが同じであるよう
にされる。

【００９８】再生時にアングルを切替えると、再生装置
の再生ピックアップが所定のアングルのデータの位置に
移動し、データの読み出しを開始する。再生時のアング
ル切替えにかかるディレイを少なくするためには、この
移動距離が小さいことが必要であるため、アングルブロ
ックのデータは、ディスク上での配置がインターリーブ
処理されている。インターリーブされる単位はＭ個のＧ
ＯＰ単位で、Ｍの値はエンコード条件によって異なる。

【００９９】図３６は、このインターリーブ処理の一例
を示している。

【０１００】このように、データをユニットごとにイン
ターリーブする作業は、個々のアングルごとのインター
リーブされるデータ量が異なる場合には、非常に複雑に
なり、アングル数が多いと処理時間も指数関数的に増加
するため問題となる。

【０１０１】そこで、図３６（ａ）に示すように、イン
ターリーブされる単位内の各アングルのデータ量が、エ
ンコード後の出力データの段階で同じになるようにビッ
トを割り当てれば、図３６（ｂ）に示すようなダミーデ
ータの挿入（スタッフィング）は不要となり、アングル
部分でのビデオレートを上げることができる。よって、
図３６（ｃ）に示すように、アングル部分のビット配分
時に対応する各ＧＯＰに同じターゲット量を割り当て
る。つまり、同一のシームレスアングルブロックには同
じビット量を割り当てることが望ましい。

【０１０２】図３７は、上記のようなシームレスアング
ルブロックの処理例を示している。

【０１０３】再生装置側でシームレスに再生するには、
ＶＢＶバッファ残量の境界での最後のピクチャのＶＢＶ
のバッファ残量の値と、次のスタート点のピクチャのＶ
ＢＶのバッファ残量の値が、一定値以上に（例えば、VB
V MAX * 2/3) なるように制御すればよい。

【０１０４】図３８（ａ）は、ＶＢＶバッファ残量の制
限を加えたエンコードを行った例を示している。また、
図３８（ｂ）は、このエンコード結果をデコーダ（再生
装置）で再生したときのバッファ残量を示している。

【０１０５】このように、デコーダでのバッファ残量
は、エンコード時のＶＢＶ計算値よりも必ず大きくな
る。デコーダでは、バッファがいっぱいになった場合に
は、ピックアップからバッファへの供給がストップする
ため、バッファのオーバーフローに関しては考慮する必
要はない。したがって、エンコード時にこのような条件
で制限を加えれば、切替時にバッファが破綻することが
ないため、シームレスな切替えが補償される。

【０１０６】また、シームレスアングルでは、ＧＯＰ単
位で相互に切替えられることを想定しているため、図３
９に示すように、全てのＧＯＰの最初と最後のＶＢＶの
値は、一定値以上になるように制御されることになる。

【０１０７】このように、シームレスアングルブロック
は、通常のブロックに対して制約が多いため、同じビッ
トレートを割り当てても同等の画質を得ることが困難で
ある。そこで、シームレスアングルブロックへのビット
配分を優先して行なうことが望ましい。

【０１０８】ところが、いわゆるＤＶＤなどの記録媒体
の複数の記録層に記録される、シームレスアングルブロ
ックを含むビデオデータに対して、各記録層ごとに閉じ
たビット配分が実行されると、記録層によってはシーム
レスアングルブロックに十分なレートが割り当てられな
い場合がでてくる。エンコード後に十分な画質が得られ
なかった場合には、条件を変更して、エンコード作業を
最初からやり直さなければならなくなる。

【０１０９】ＤＶＤのようなパッケージメディアのディ
スク作成のためのエンコード作業は、オーディオ、ビデ
オ、サブタイトル、メニューなどの各パートの作業が並
列して行われるため、ビデオのエンコード条件に修正が
必要になった場合には、例えばオーディオのエンコード
などのビデオ以外の工程にも影響が及ぶため、ビデオ以
外の工程も最初からやり直さなければならなくなる。こ
のように、ビット配分の適否の判定が遅れるほど、エン
コード作業のやり直しに伴う多くの無駄な工数がかかっ
てしまう。

【０１１０】本発明は、このような問題を解決するため
に行われたものであり、複数の記録領域に記録される圧
縮ビデオデータに対してビットの配分を行う際に、与え
られたエンコード条件下で、各記録領域の間の画質に大
きな差が無いようにビット配分できるかどうかを評価
し、画質が定められた条件を満たさない場合には、その
ばらつき量を最適もしくは許容できるようにするエンコ
ード条件の変更内容をオペレーターに提示できる機能を
有する２パスのエンコード方法および装置を提供するこ
とを目的とする。

【０１１１】

【課題を解決するための手段】上記の課題を解決するた
めに提案する本発明のエンコード方法は、ビデオ素材を
圧縮符号化して複数の記録領域に記録するエンコード方
法において、本エンコードに先立つプリエンコード工程
と、与えられたエンコード条件下で、各記録領域の間の
画質の差を許容できるビット配分の可否を評価する評価
工程と、上記各記録領域の間の画質の差が許容できるビ
ット配分の適正範囲を提示する提示工程とを有し、上記
与えられたエンコード条件または上記提示された適正範
囲のビット配分により本エンコードを行うことを特徴と
するものである。

【０１１２】また、上記の課題を解決するために提案す
る本発明の別のエンコード方法は、複数の記録領域にシ
ームレスアングルブロックを含むエンコードを行うエン
コード方法において、各記録領域ごとに与えられる上限
が考慮されたバイト数の総和および総フレーム数からエ
ンコードされた素材の平均レートを求める工程と、重み
係数を考慮したフレーム数の比率に従って、上記各記録
領域に記録されるべきシームレスアングルブロックに割
り当てられるバイト数を、上記各記録領域から確保する
工程と、上記シームレスアングルブロックに割り当てら
れるバイト数が差し引かれた残りのバイト数を、上記シ
ームレスアングルブロック以外のブロックに重み係数を
考慮した符号化難易度の和の比率で配分する工程とを有
することを特徴とするものである。

【０１１３】また、上記の課題を解決するために提案す
る本発明のエンコード装置は、ビデオ素材を圧縮符号化
して複数の記録領域に記録するエンコード装置におい
て、本エンコードに先立ってプリエンコードを行う手段
と、各記録領域の間の画質の差を許容できるビット配分
の可否を評価する評価手段と、上記各記録領域の間の画
質の差が許容できるビット配分の適正範囲を提示する提
示手段とを備え、上記与えられたエンコード条件または
上記提示された適正範囲のビット配分により本エンコー
ドを行うことを特徴とするものである。

【０１１４】また、上記の課題を解決するために提案す
る本発明の別のエンコード装置は、複数の記録領域にシ
ームレスアングルブロックを含むエンコードを行うエン
コード装置において、各記録領域ごとに与えられる上限
が考慮されたバイト数の総和および総フレーム数からエ
ンコードされた素材の平均レートを求める手段と、重み
係数を考慮したフレーム数の比率に従って、上記各記録
領域に記録されるべきシームレスアングルブロックに割
り当てられるバイト数を、上記各記録領域から確保する
手段と、上記シームレスアングルブロックに割り当てら
れるバイト数が差し引かれた残りのバイト数を、上記シ
ームレスアングルブロック以外のブロックに重み係数を
考慮した符号化難易度の和の比率で配分する手段とを備
えることを特徴とするものである。

【０１１５】上記の本発明によれば、複数の記録領域に
記録される圧縮ビデオデータに対してビットの配分を行
う場合に、各記録領域の間に画質の差が生じにくく、早
い時点でエンコード条件の見直しや変更を行うことがで
きるエンコード方法およびエンコード装置を提供でき
る。

【０１１６】

【発明の実施の形態】以下に、本発明の好ましい実施の
形態について図面を参照しながら説明する。

【０１１７】なお、本発明の具体的な説明に先だって、
以下の説明に用いる用語について説明する。

【０１１８】 encu_max ：ENCU の個数 layer_max ：記録層の個数 angle_num_max ：アングルブロックに含まれるアン
グル数 angle_block_max ：アングルブロック数 gen_bit[k] ：仮エンコードによって測定された
ｋ番目のフレームの符号化難易度（Difficulty）の値。
大きいほど画像が難しいことを示す。 ENCU_mode[encu_nb]：対象となるＥＮＣＵがシームレス
アングルであるかどうかを示す情報。シームレスアング
ルのとき「1」,それ以外のとき「0」。 ENCU_angle[encu_nb] ：対象となるＥＮＣＵがどのアン
グルブロックに属するかどうかを示す情報。シームレス
アングル以外のときは「0」となる。 ENCU_weight[encu_nb]：対象となるシームレスアングル
ブロックのビット配分時の重み係数 ANGLE_weight[angle_blk] ：対象となるシームレスアン
グルブロックのビット配分時の重み係数。同一のアング
ルブロックでのビット配分時の重みは同じ値にするた
め、該当するアングルブロックの「ENCU_weight 」の平
均値とする。（最大値、最小値でも良いが、この例では
平均値とする。） ANGLE_weight[ENCU_angle[encu_nb]] = (ENCU_angle の値が同じ ENCU の ENCU_weight の和)/angle_num ---- [15] ENCU_diff [encu_nb]：対象となるＥＮＣＵの符号難易
度(gen_bit[k])× ENCU_weight[encu_nb] の総和 ENCU_frame[encu_nb]：対象となるＥＮＣＵのフレーム
数の総和 ENCU_layer[encu_nb]：対象となるＥＮＣＵがどの記録
層に属するかを示す情報。 0 ≦ ENCU_layer[encu_nb]
≦ layer_max QTY_BYTES[layer_nb]：対象となる記録層のスーパーバ
イザから指定された利用可能なバイト数 USB_BYTES[layer_nb]：対象となる記録層での上限値を
考慮した利用可能なバイト数 QTY_change[layer_nb]：対象となる記録層で「QTY_BYTE
S 」が上限値を越えていたかどうかの情報。変更された
場合「１」，変更されていない場合「０」。

【０１１９】TOTAL_HEADER[layer_nb]：対象となる記録
層のＧＯＰヘッダーの総バイト数TOTAL_FRAME [layer_n
b]：対象となる記録層の総フレーム数 SUM_DIFF[layer_nb] ：対象となる記録層のシームレ
スアングル以外の重み係数を掛けた符号化難易度の総
和 (ENCU_mode[encu_nb] == layer_nb かつ ENCU_mode[enc
u_nb] == 0 ) を満たす encu_nb に対して SUM_DIFF[layer_nb] = ΣENCU_diff[encu_nb] ---- [16] ここで、「＝」は代入を意味しているのに対し、「==」
はＣ言語等で用いられるのと同様に等しいかどうかの条
件判定を意味するものである。

【０１２０】ANGLE_WFRAME[layer_nb]：対象となる記録
層の重み係数の反映されたシームレスアングルだけの総
フレーム量 (ENCU_mode[encu_nb] == layer_nb かつ ENCU_mode[enc
u_nb] > 0 ) を満たす「encu_nb」に対して ANGLE_WFRAME[layer_nb] = Σ(ENCU_frame[encu_nb] × ANGLE_weight[ENCU_angle[encu_nb]]) ---- [17] SUM_WFRAME：シームレスアングルの重み係数の反映された総フレーム量 SUM_WFRAME = ΣENCU_frame[encu_nb] (ただし、ENCU_mode[encu_nb] == 0 を満たす encu_nb) + ΣANGLE_WFRAME[layer_nb] ---- [18] CHECK_USB_ [layer_nb]：対象となる記録層での利用可
能なバイト数の適正値 CHECK_SUPPLY[layer_nb]：対象となる記録層でのシーム
レスアングル以外の利用可能なバイト数の適正値 CHECK_DIFF [layer_nb]：対象となる記録層のシームレ
スアングル以外の Difficulty の総和の適正値 CHECK_FRAME [layer_nb]：対象となる記録層でのシーム
レスアングル以外の総フレーム数の適正値 supply_bytes[encu_nb] ：対象となる ENCU に配分され
たバイト数まず、本発明の実施の形態に係るエンコード方法におけ
る、各エンコードユニット（ＥＮＣＵ）へのビット配分
方法について、複数の記録領域を有する記録媒体である
ＤＶＤなどの記録媒体の複数の記録層に記録される圧縮
ビデオデータに対してビット配分を行う場合を例として
説明する。

【０１２１】本発明の実施の形態に係るエンコードは、
従来の方式を拡張して「QTY_BYTES」を各記録層に分け
て管理する。

【０１２２】各記録層の最大バイト数を MAXBYTES = MAXRATE × KT × total_framenb[layer_nb] ---- [19] とすると、 USB_BYTES[layer_nb] = min (QTY_BYTES[layer_nb], MAXBYTES) (0 ≦ layer_nb ≦ 記録層の個数「layer_max」) ---- [20] TOTAL_SUPPLY_BYTES[layer_nb] = ΣUSB_BYTES[layer_nb] - ΣTOTAL_HEADER[layer_nb] ---- [21] ALL_ANGLE_BYTES[layer_nb] = ANGLE_WFRAME_frame[layer_nb] /SUM_WFRAME×ΣTOTAL_SUPPLY_BYTES[layer_nb] ---- [22] ALL_SUPPLY_BYTES[layer_nb] = USB_BYTES[layer_nb] - ALL_ANGLE_BYTES[layer_nb] ---- [23] 前述したように、シームレスアングルブロックでは、対
応するブロック間のビット配分量が、ほぼ同じにされな
ければならないため、「layer_nb」で示される記録層の
各エンコードユニットＥＮＣＵへのビット配分は、シー
ムレスアングルである場合と、それ以外である場合とで
分けて行われる。

【０１２３】すなわち、従来方式では各記録層ごとにシ
ームレスアングルのフレームの比率でビット配分が行わ
れていたが、本発明の実施の形態に係る方式では全ての
記録層の「TOTAL_SUPPLY_BYTES」に対して、フレーム数
に重み係数を考慮した比率でビット配分が行われる。

【０１２４】このようにすることで、全ての記録層にお
いてシームレスアングルブロックのレートを同じにでき
る。また、オペレータがレートを意識的にコントロール
したければ、重み係数を変えることにより実現できる。

【０１２５】（１）シームレスアングルブロックのＥＮ
ＣＵへのビット配分（ENCU_layer[encu_nb] == layer_nb かつ ENCU_angle
[encu_nb] == 1）を満たす「encu_nb 」に対して、 supply_bytes[encu_nb] = (ENCU_frame[encu_nb] × ANGLE_weight[ENCU_angle[encu_nb]]) /ANGLE_WFRAME[layer_nb] × ALL_ANGLE_BYTES[layer_nb] ---- [24] （２）シームレスアングルブロック以外のＥＮＣＵへの
ビット配分（ENCU_layer[encu_nb] == layer_nb かつ ENCU_angle
[encu_nb] == 0）を満たす「encu_nb 」に対して、 supply_bytes[encu_nb] = ENCU_diff[encu_nb] /SUM_DIFF[layer_nb]×ALL_SUPPLY_BYTES[layer_nb] ---- [25] 次に、本発明の具体的な実施例を示す。なお以下では、 Gr_min_limit = 0.9 Gr_max_limit = 1.1 とし、説明の簡略化のために ENCU_weight[encu_nb] = 1.0 とする。

【０１２６】図１は、いわゆるＤＶＤなどの記録媒体の
２つの記録層「Layer 0 」および「Layer 1 」に記録さ
れる、それぞれシームレスアングルブロックを含む圧縮
ビデオデータに対して、フレーム数の比率に応じてビッ
ト配分される例を示している。

【０１２７】ここで、「Layer 0 」のＥＮＣＵ（エンコ
ードユニット）２，ＥＮＣＵ４，ＥＮＣＵ５、および
「Layer 1 」のＥＮＣＵ７，ＥＮＣＵ９，ＥＮＣＵ１０
は、シームレスアングルからなるアングルブロック１お
よびアングルブロック２である。

【０１２８】図２は、図１に例示した２つの記録層から
なる記録媒体に記録される圧縮ビデオデータに対する、
ビット配分の一具体例を示している。

【０１２９】すなわち、エンコード素材から、オーディ
オデータやサブタイトルデータなどのデータ量を記録媒
体の記録容量から差し引いたデータ量である「QTY_BYTE
S[0]」および「QTY_BYTES[1]」が、スーパーバイザから
与えられる。

【０１３０】この「QTY_BYTES[0]」および「QTY_BYTES
[1]」は、ＤＶＤのフォーマットで規定されている最大
レート制限やＶＢＶ制限などの条件を満たさない場合が
ある。そこで、「QTY_BYTES[0]」および「QTY_BYTES
[1]」は、これらの制限を満足するようにレート制限さ
れて「USB_BYTES[0]」および「USB_BYTES[1]」とされ
る。

【０１３１】そして、「USB_BYTES[0]」および「USB_BY
TES[1]」のヘッダ領域「TOTAL_HEADER[0] 」および「TO
TAL_HEADER[1] 」が差し引かれたデータ量が、「TOTAL_
SUPPLY_BYTES[0] 」および「TOTAL_SUPPLY_BYTES[1] 」
とされる。

【０１３２】ここで、上記の「TOTAL_SUPPLY_BYTES[0]
」および「TOTAL_SUPPLY_BYTES[1]」ｊは、各記録層の
アングル部分に対してはフレーム数の比率で配分され、
アングル以外の部分には符号化難易度（Difficulty）の
和の比率で配分される。

【０１３３】つまり、「Layer 0 」のＥＮＣＵ２，ＥＮ
ＣＵ４，ＥＮＣＵ５、および「Layer 1 」のＥＮＣＵ
７，ＥＮＣＵ９，ＥＮＣＵ１０に対しては、「TOTAL_SU
PPLY_BYTES[0] 」および「TOTAL_SUPPLY_BYTES[1] 」が
フレーム数の比率で配分され、「Layer 0 」のＥＮＣＵ
１，ＥＮＣＵ３、および「Layer 1 」のＥＮＣＵ６，Ｅ
ＮＣＵ８に対しては、「TOTAL_SUPPLY_BYTES[0] 」およ
び「TOTAL_SUPPLY_BYTES[1] 」を符号化難易度（Diffic
ulty）の和の比率で配分される。このように配分された
ビットが、「SUPPLY_BYTES」とされる。

【０１３４】図３および図４は、比較のために従来方式
によるビット配分例を示している。以下では、この従来
方式を参照しながら、本発明によるビット配分方式につ
いてさらに説明する。

【０１３５】図３は、従来方式により、ＤＶＤなどの記
録媒体の２つの記録層「Layer 0 」および「Layer 1 」
に記録される、それぞれシームレスアングルを含む対し
て、フレーム数の比率に応じてビット配分される様子を
示している。

【０１３６】ここで、図３（ａ）中の「Layer 0 」のＥ
ＮＣＵ２，ＥＮＣＵ４、および「Layer 1 」のＥＮＣＵ
６，ＥＮＣＵ８は、シームレスアングルからなるアング
ルブロック１およびアングルブロック２とされる。

【０１３７】図３（ｂ）に示すように、これらの各記録
層ごとに、ヘッダ領域「TOTAL_HEADER[0] 」および「TO
TAL_HEADER[1] 」が差し引かれたデータ量が、「TOTAL_
SUPPLY_BYTES[0] 」および「TOTAL_SUPPLY_BYTES[1] 」
とされる。

【０１３８】ここで、上記の「TOTAL_SUPPLY_BYTES[0]
」および「TOTAL_SUPPLY_BYTES[1]」は、各記録層のア
ングル部分に対してはフレーム数の比率で配分され、ア
ングル以外の部分に対しては符号化難易度（Difficult
y）の和の比率で配分される。なお、ここでは説明の簡
略化のため、TOTAL_HEADER = 0 としている。

【０１３９】図４は、図３の例における各エンコードユ
ニット（ＥＮＣＵ）に対するビット配分結果をまとめて
示している。

【０１４０】この例では、アングルブロック１のレート
に対して、アングルブロック２のレートが不十分である
ことが分かる。このように、従来方式によるビット配分
では、シームレスアングルブロックにおいて、エンコー
ド制約が厳しいため、レートが低いと満足できる画質が
得られないことが非常に多い。

【０１４１】次に、上記のような問題点を解決するため
に提案された、本発明の実施の形態に係るビット配分方
式について説明する。図５は、本発明の実施の形態に係
る方式により、ＤＶＤの２つの記録層「Layer 0 」およ
び「Layer 1 」に記録される、それぞれシームレスアン
グルを含む圧縮ビデオデータに対して、フレーム数の比
率に応じてビット配分される様子を示している。

【０１４２】図５（ａ）中の、「Layer 0 」のＥＮＣＵ
２，ＥＮＣＵ４、および「Layer 1」のＥＮＣＵ６，Ｅ
ＮＣＵ８は、図３（ａ）と同様のシームレスアングルか
らなるアングルブロック１およびアングルブロック２と
される。

【０１４３】そして、図５（ｂ）に示すように、これら
の各記録層から、ヘッダ領域「TOTAL_HEADER[0] 」およ
び「TOTAL_HEADER[1] 」が差し引かれたデータ量が、
「TOTAL_SUPPLY_BYTES[0] 」および「TOTAL_SUPPLY_BYT
ES[1] 」とされる。

【０１４４】ここで、本発明の実施の形態に係るビット
配分方式においては、上記の「TOTAL_SUPPLY_BYTES[0]
」および「TOTAL_SUPPLY_BYTES[1] 」が、最初に、各
記録層のアングル部分に対して全体のレートからフレー
ム数の比率で配分され、次に、アングル以外の部分に対
しては符号化難易度（Difficulty）の和の比率で配分さ
れる。なお、ここでも説明の簡略化のため、TOTAL_HEAD
ER = 0 としている。

【０１４５】図６は、図５の例における、各エンコード
ユニット（ＥＮＣＵ）に対するビット配分結果をまとめ
て示している。

【０１４６】このように、本発明の実施の形態に係るビ
ット配分によれば、例えばＤＶＤの２つの記録層のどち
らのアングルブロックのレートも同じにすることが可能
となっている。

【０１４７】ところが、上記のような方法により複数の
記録層にビット配分すると、シームレスアングルでない
部分に、符号化難易度に応じて配分されるビット量にば
らつきが生じることがある。図５，図６に示したビット
配分の例でも、調整前の段階では、ＥＮＣＵ３のレート
とＥＮＣＵ７のレートとが大きく異なっている。

【０１４８】このような現象は、スーパーバイザから与
えられた「QTY_BYTES 」が適切でなかったために生じる
が、スーパーバイザがエンコード条件を決める際には、
素材の画像の難しさ（符号化難易度）の情報がまだ得ら
れていないため、最適なエンコード条件を発行できな
い。

【０１４９】そこで、このような状況においては、ビデ
オエンコードシステム側で、各記録層間のビット配分の
ばらつき量を計算し、所定の規定値を越えている場合に
は、警告を発し、エンコード条件の再発行を促すことが
必要となる。

【０１５０】図７は、上述した本発明の実施の形態に係
るビット配分計算の基本的な手順を示している。

【０１５１】まず、ステップＳ１でエンコード条件が入
力され、ステップＳ２で符号化難易度（Difficulty）パ
ラメータが入力さる。

【０１５２】次に、ステップＳ３で、符号化難易度と共
に測定された各画像のＤＣ値や動きベクトル量ＭＥの大
きさのパラメータの変化量から、シーンが変化するポイ
ントが検出され、画質改善のためのピクチャタイプの変
更処理などが行われる。

【０１５３】次に、ステップＳ４では、チャプター（CH
APTER ）境界処理が行われる。再生装置でのチャプター
サーチ時には、再生されるピクチャが、特定されないピ
クチャからジャンプしてくることになる。その場合でも
再生画像が乱れないようにするため、ステップＳ５で
は、このチャプタ境界処理によってチャプターの位置が
必ずＧＯＰの先頭になるようにピクチャタイプが変更さ
れたり、ＧＯＰ長が制限される。

【０１５４】次に、ステップＳ６では、上記の一連の作
業の結果として変更された、Ｉピクチャ，Ｐピクチャ，
Ｂピクチャなどのピクチャタイプに合わせて、符号化難
易度（Difficulty）の値が補間／補正される。

【０１５５】次に、ステップＳ７では、ステップＳ６に
おける補間／補正処理によって得られた符号化難易度、
およびエンコードされる素材全体に与えられたビット数
「SUPPLY_BYTES」に応じて、各エンコードユニットＥＮ
ＣＵごとにビット配分が行われる。

【０１５６】次に、ステップＳ８では、各記録層の間の
ビット配分量のばらつきが検出される。

【０１５７】そして、ステップＳ９で、ステップＳ８で
検出された記録層間のビット配分のばらつき量が許容で
きるかどうかが評価され、許容できない（Ｎｏ）場合に
はステップＳ１０でワーニング（警告）が表示され、ス
テップＳ１１でエンコードを続けるかどうかがオペレー
タにより判断される。そして、ステップＳ１１で、当初
のエンコード条件で処理を続けるとされた場合にはステ
ップＳ１２に進む。一方、ステップＳ９で、ステップＳ
８で評価された記録層間のばらつき量が許容できる（Ｙ
ｅｓ）場合にはそのままステップＳ１２に進む。

【０１５８】なお、ステップＳ１１でエンコードを続け
ないとされた場合には、ステップＳ１５で、ビット配分
量などの条件の適正値がオペレータに提示されて、処理
が終了される。この場合には、ステップＳ１で入力され
るエンコード条件等が見直されて、エンコード条件の適
否が評価される。

【０１５９】ステップＳ１２では、ステップＳ６におけ
る補間／補正処理によって得られた符号化難易度、およ
びエンコードされる素材全体に与えられたビット数「SU
PPLY_BYTES」に応じて、各ピクチャごとのターゲットビ
ット（Target bit）数が計算される。

【０１６０】次に、ステップＳ１３では、エンコード結
果が記録される記録媒体のアドレス（ADDRESS ）が計算
される。

【０１６１】そして、ステップＳ１４で、エンコーダ用
コントロールファイルが作成されて、ビット配分計算処
理が終了する。そして、このコントロールファイルによ
り最終的なエンコードである本エンコードが実行され
る。

【０１６２】次に、上述した各記録層の間でのビット配
分のばらつき量を計算するためのアルゴリズムについて
説明する。

【０１６３】いわゆるＤＶＤなどの記録媒体の各記録層
に配分されるビット量のばらつき量は、全体のシームレ
スアングルブロック以外のビット配分量と符号化難易度
（Difficulty）の総和の比「Gr_avr 」に対して、各記
録層の値が規定値以内であるかどうかにより評価され
る。

【０１６４】上記の規定値に入らない場合には、各記録
層に記録されるフレーム数はそのままにした場合に配分
されるバイト数（「QTY_BYTES 」から「USB_BYTES 」に
置き換えられている）の適正範囲が計算される。

【０１６５】また、これとは別に、ＤＶＤなどの記録媒
体の各記録層へのビット配分量を同じにした場合に、各
記録層に記録されるフレーム数の適正範囲が計算され
る。このことは、素材が記録される境界をずらすことを
意味している。

【０１６６】以下では、以上説明した本発明の実施の形
態に係るエンコード方法におけるビット配分計算につい
て、さらに具体的に説明する。

【０１６７】以下の説明では、複数層の場合でのフレー
ム数もしくはバイト数の適正値の計算は、最初の記録層
から順次実行される。

【０１６８】[STEP １] 「Gr_avr」の計算 Gr_avr = ΣALL_SUPPLY_BYTES[layer_nb]/ΣSUM_DIFF[layer_nb] (0 ≦ layer_nb ≦ layer_max) ---- [26]

【０１６９】[STEP ２] フレーム数固定条件での「USB_
BYTES」調整範囲の提示ループ初期化 CHECK_USB_[layer_nb] = USER_BYTES[layer_nb] ---- [27] CHECK_SUPPLY[layer_nb] = ALL_SUPPLY_BYTES[layer_nb] ---- [28] CHECK_DIFF [layer_nb] = SUM_DIFF[layer_nb] ---- [29] ただし、0 ≦ layer_nb ≦ layer_max) layer_nb = 0 とする。

【０１７０】[STEP ３] 「Gr_check」の計算 gr[layer_nb] = CHECK_SUPPLY[layer_nb]/SUM_DIFF[layer_nb] ---- [30] GR[layer_nb] = gr[layer_nb]/Gr_avr ---- [31] （１）Gr_min_limit ≦ GR[layer_nb] ≦ Gr_max_limit
の場合この記録層の画質の全体に対するばらつきは許容範囲で
ある。

【０１７１】Gcheck [layer_nb] = 0 （２）GR[layer_nb] < Gr_min_limit の場合 CHECK_SUPPLY[layer_nb] が CHECK_DIFF[layer_nb] に
対して不足している。

【０１７２】Gcheck [layer_nb] = 1 （３）Gr_max_limit < GR[layer_nb] の場合 CHECK_SUPPLY[layer_nb] が CHECK_DIFF[layer_nb] に
対して余裕がある。

【０１７３】 Gcheck [layer_nb] = 2 ---- [32]

【０１７４】[STEP ４] 調整範囲の提示「USB_BYTES 」調整後に、「USB_BYTES 」の最大バイト
数制限を越えないようにされなければならない。また、
すでに最大バイト数制限を受けている記録層については
「USB_BYTES 」の増加は許されない。

【０１７５】QTY_change[layer_nb] == 0かつ QTY_chan
ge[layer_nb+1] == 0かつ Gcheck[layer_nb] == 1 or 2
またはQTY_change[layer_nb] == 1かつ QTY_change[lay
er_nb+1] == 0かつ Gcheck[layer_nb] == 2または QTY_change[layer_nb] == 0 かつ QTY_change[layer_nb+1] == 1 かつ Gcheck[layer_nb] == 1 ---- [33] の条件を満たす「layer_nb」の記録層の「USB_BYTES 」
の調整量を提示する。

【０１７６】 MAXBYTES = MAXRATE×KT×total_framenb[layer_nb] ---- [34] Gr_min_limit×Gr_avr×CHECK_DIFF[layer_nb] ≦ CHECK_SUPPLY[layer_nb] かつ CHECK_SUPPLY[layer_nb] ≦ min（Gr_max_limit×Gr_avr×CHECK_DIFF[layer_nb], MAXBYTES - ALL_ANGLE_BYTES[layer_nb]） ---- [35] 仮に、 CHECK_SUPPLY[layer_nb] ＝ Gr_avr×CHECK_DIFF[layer
_nb] としたとすれば、次の「layer_nb」の「CHECK_SUPPLY」
は、以下のように修正される。

【０１７７】 CHECK_SUPPLY[layer_nb+1] = min（CHECK_SUPPLY[layer_nb] + CHECK_SUPPLY[layer_nb+1] -CHECK_SUPPLY[layer_nb]，MAXBYTES-ALL_ANGLE_BYTES[layer_nb+1]) ---- [36] CHECK_USB[layer_nb] = CHECK_SUPPLY[layer_nb] + ALL_ANGLE_BYTES[layer_nb] + TOTAL_HEADER[layer_nb] ---- [37] CHECK_USB[layer_nb+1] = CHECK_SUPPLY[layer_nb+1] + ALL_ANGLE_BYTES[layer_nb+1] + TOTAL_HEADER[layer_nb+1] ---- [38]

【０１７８】[STEP ５] layer_nb = layer_nb + 1 とし、「layer_nb」が「layer_max 」と同じ値でなけれ
ば[STEP 3]に戻る。

【０１７９】[STEP ６]「USB_BYTES」数固定条件での記
録層へのフレーム数調整範囲の提示ループ初期化 CHECK_USB_ [layer_nb] = USER_BYTES[layer_nb] CHECK_SUPPLY[layer_nb] = ALL_SUPPLY_BYTES[layer_n
b] CHECK_DIFF [layer_nb] = SUM_DIFF[layer_nb] CHECK_FRAME [layer_nb] = total_frame[layer_nb] ただし、0 ≦ layer_nb ≦ layer_max layer_nb = 0 とする。

【０１８０】[STEP ７] 「Gr_check」の計算 gr[layer_nb] = CHECK_SUPPLY[layer_nb]/CHECK_DIFF[l
ayer_nb] GR[layer_nb] = gr[layer_nb]/Gr_avr （１）Gr_min_limit ≦ GR[layer_nb] ≦ Gr_max_limit
の場合 Gcheck [layer_nb] = 0 （２）GR[layer_nb] < Gr_min_limit の場合 Gcheck [layer_nb] = 1 （３）Gr_max_limit < GR[layer_nb] の場合 Gcheck [layer_nb] = 2

【０１８１】[STEP ８] 調整範囲の提示フレーム数調整後に、「USB_BYTES 」の最大バイト数制
限を越えないようにされなければならない。また、すで
に最大バイト数制限を受けている記録層については、フ
レーム数の削減は許されない。

【０１８２】QTY_change[layer_nb] == 0かつ QTY_chan
ge[layer_nb+1] == 0かつ Gcheck[layer_nb] == 1 or 2
またはQTY_change[layer_nb] == 1かつ QTY_change[lay
er_nb+1] == 0かつ Gcheck[layer_nb] == 2またはQTY_c
hange[layer_nb] == 0かつ QTY_change[layer_nb+1] ==
1かつ Gcheck[layer_nb] == 1の条件を満たす「layer_
nb」の記録層のフレーム数の調整量が提示される。

【０１８３】CHECK_SUPPLY[layer_nb]/Gr_max_limit/Gr
_avr ≦ CHECK_DIFF[layer_nb] かつ CHECK_DIFF[layer_nb] ≦ CHECK_SUPPLY[layer_nb]/Gr_min_limit/Gr_avr ---- [40] また、 USB_BYTES[layer_nb] ≦ MAXRATE×KT×CHECK_FRAME[la
yer_nb] より CHECK_USB[layer_nb]/MAXRATE/ KT ≦ CHECK_FRAME[layer_nb] ---- [41] を満たすフレーム数の境界が検出される。

【０１８４】具体的には、 MAX_CHECK_DIFF = CHECK_SUPPLY[layer_nb]/Gr_min_lim
it/Gr_avr MIN_CHECK_DIFF = CHECK_SUPPLY[layer_nb]/Gr_max_lim
it/Gr_avr MIN_CHECK_FRAME = CHECK_USB[layer_nb]/MAXRATE/ KT また、layer_nb == layer_max -1 のとき、 MAX_CHECK_FRAME = CHECK_FRAME[layer_nb] + CHECK_FR
AME[layer_nb]- CHECK_USB[layer_nb+1]/MAXRATE/ KT の制約も考慮される。

【０１８５】 CHECK_FRAME[layer_nb] = CHECK_DIFF[layer_nb] = 0 とし、対象となる「layer_nb」で示される記録層のエン
コードユニット（ＥＮＣＵ）のうち、シームレスアング
ル以外のＥＮＣＵの gen_bit[k]×ENCU_weight[encu_nb] （0 ≦ k ≦ k_max : k フレーム目の Difficulty の大
きさ）を演奏時間の早い順から「CHECK_DIFF[layer_n
b]」に順次加算し、フレームのカウント数を「CHECK_FR
AME[layer_nb] 」に順次加算していくことで、上記の条
件を満たす k の範囲（フレームの範囲）を求めてい
く。

【０１８６】この際に、範囲内に境界として望ましいチ
ャプターポイントやシーンチェンジポイントがあれば、
その情報も提示される。仮に、 CHECK_DIFF[layer_nb] = CHECK_SUPPLY[layer_nb]/Gr_a
vr となるように境界を変更したとして、境界変更対象とな
る記録層の符号化難易度（Difficulty）の総和とフレー
ム数を変更する。

【０１８７】この結果、次の「layer_nb」の符号化難易
度の総和とフレーム数は、以下のように修正される。 CHECK_DIFF[layer_nb+1] = CHECK_DIFF[layer_nb] + CHECK_DIFF[layer_nb+1] - CHECK_DIFF[layer_nb] ---- [42] CHECK_FRAME[layer_nb+1] = CHECK_FRAME[layer_nb] + CHECK_FRAME[layer_nb+ 1] - CHECK_FRAME[layer_nb] ---- [43]

【０１８８】[STEP ９] layer_nb = layer_nb + 1 と
し、「layer_nb」が「layer_max 」と同じ値でなければ
[STEP 7] に戻る。

【０１８９】各記録層のフレーム数を変えるということ
は、素材の記録される場所を変えることを意味するた
め、素材の切れ目（シーンの切れ目）などの情報が非常
に重要になる。

【０１９０】図８は、以上説明した本発明の実施の形態
に係るエンコード方法の［STEP １]〜[STEP ５]の処理
の流れを示している。

【０１９１】ステップＳ２１では、各記録層へのビット
配分数「QTY_BYTES 」をスーパーバイザから受け取る。

【０１９２】次に、ステップＳ２２では、各記録層の最
大バイト数制限を考慮して「USB_BYTES 」が求められ
る。

【０１９３】次に、ステップＳ２３では、各記録層の
「USB_BYTES 」から「GOP_Header」のバイト数を除いた
ものの総和「ΣTOTAL_SUPPLY_BYTES」が求められる。

【０１９４】次に、ステップＳ２４では、各記録層のシ
ームレスアングルブロックの重み係数を考慮した総フレ
ーム量「ANGLE_WFRAME」が求められ、「ΣTOTAL_SUPPLY
_BYTES」がフレーム量「frame×weight」の比率で各ア
ングルブロックに配分される。

【０１９５】次に、ステップＳ２５では、各記録層の
「TOTAL_SUPPLY_BYTES」からシームレスアングルへの配
分ビット数の総和を引いて、「ALL_SUPPLY_BYTES」が求
められる。

【０１９６】次に、ステップＳ２６では、各記録層毎の
符号簡易度（Difficulty）の総和「SUM_DIFF」と、各Ｅ
ＮＣＵごとの重み係数を考慮した符号簡易度の総和「EN
CU_DIFF 」との比率から、「ALL_SUPPLY_BYTES」が各Ｅ
ＮＣＵブロックに配分される。

【０１９７】そして、ステップＳ２７では、各記録層ご
とのビット配分のばらつき量が計算される。このばらつ
き量が規定値を越えていたら、オペレータおよびスーパ
ーバイザに警告され、適正値が計算されて提示される。

【０１９８】以上の手順により、本発明の実施の形態に
係るエンコード方法の［STEP 1］〜［STEP 5］の処理が
終了する。

【０１９９】また、図９および図１０に、前述した本発
明の実施の形態に係るエンコード方法の[STEP ６]〜[ST
EP ９]の処理の流れを示す。これらの各ステップは、フ
レーム数固定の条件での USB_BYTES の調整範囲の提示
方法を示している。

【０２００】図９のステップＳ３１では、全体のビット
配分のばらつき度の平均値「Gr_avr」が計算される。

【０２０１】Gr_avr = ΣALL_SUPPLY_BYTES[layer_nb]
／ΣSUM_DIFF[layer_nb] 次に、ステップＳ３２では、フレーム数固定の条件での
「USB_BYTES 」調整範囲の提示用に値が初期化される。

【０２０２】 CHECK_USB_ [layer_nb] = USER_BYTES[layer_nb] CHECK_SUPPLY[layer_nb] = ALL_SUPPLY_BYTES[layer_n
b] CHECK_DIFF [layer_nb] = SUM_DIFF[layer_nb] CHECK_FRAME [layer_nb] = total_framenb[layer_nb] そして、ステップＳ３３で、layer_nb = 0 とされる。

【０２０３】次に、図１０のステップＳ３４で、ばらつ
き度が判定される。

【０２０４】Gr [layer_nb]= CHECK_SUPPLY[layer_nb]
／CHECK_DIFF[layer_nb]／Gr_avr （１）Gr_min_limit ≦ Gr [layer_nb] ≦ Gr_max_limi
t の場合 Gcheck[layer_nb] = 0 （２）Gr [layer_nb] ＜ Gr_min_limit の場合 Gcheck[layer_nb] = 1 （３）Gr_min_limit ＜ Gr [layer_nb]の場合 Gcheck[layer_nb] = 2 次に、ステップＳ３５で、以下の条件を満たす「layer_
nb」の記録層の「USB_BYTES 」の調整範囲が提示され
る。

【０２０５】QTY_change [layer_nb]== 0 かつ QTY_cha
nge [layer_nb+1]==0かつ Gcheck[layer_nb]==1 or 2ま
たはQTY_change [layer_nb]==1 かつ QTY_change [laye
r_nb+1]==0かつ Gcheck[layer_nb]==2またはQTY_change
[layer_nb]==0 かつ QTY_change [layer_nb+1]==1かつ
Gcheck[layer_nb]==1 適正範囲 Gr_min_limit × Gr_avr × CHECK_DIFF[layer_nb]≦ C
HECK_SUPPLY[layer_nb] かつ CHECK_SUPPLY[layer_nb]≦ min（Gr_min_limit×Gr_avr
×CHECK_DIFF[layer_nb]，MAXBYTE-ALL_ANGLE_BYTES[la
yer_nb]）次に、ステップＳ３６で、layer_nb = layer_nb + 1 と
される。

【０２０６】そして、ステップＳ３７で、layer_nb ＞
layer_max を満足するかどうかが判断され、この条件を
満足しないときにはステップＳ３４以降の手順が繰り返
される。一方、ステップＳ３７の条件を満足する場合に
は、図１１および図１２に示す、バイト数固定の条件で
のフレーム数の調整範囲の提示方法の処理手順に進む。

【０２０７】図１１のステップＳ３８で、USB_BYTES 数
固定の条件での記録層へのフレーム数の調整範囲の提示
用に値が初期化される。

【０２０８】 CHECK_USB_ [layer_nb] = USER_BYTES[layer_nb] CHECK_SUPPLY[layer_nb] = ALL_SUPPLY_BYTES[layer_n
b] CHECK_DIFF [layer_nb] = SUM_DIFF[layer_nb] CHECK_FRAME [layer_nb] = total_framenb[layer_nb] なお、ステップＳ３８に先立って、全体のビット配分の
ばらつき度の平均値「Gr_avr」が計算される必要がある
が、図９のステップＳ３１で得られた値を用いることが
できる。

【０２０９】そして、ステップＳ３９で、layer_nb = 0
とされる。

【０２１０】次に、図１２のステップＳ４０で、ビット
配分量のばらつき度が判定される。

【０２１１】 Gr [layer_nb] = CHECK_SUPPLY[layer_nb]／CHECK_DIFF[layer_nb]／Gr_avr Gr_min_limit ≦ Gr [layer_nb] ≦ Gr_max_limit の場合 Gcheck[layer_nb] = 0 Gr [layer_nb] ＜ Gr_min_limit の場合 Gcheck[layer_nb] = 1 Gr_min_limit ＜ Gr [layer_nb]の場合 Gcheck[layer_nb] = 2 次に、ステップＳ４１で、以下の条件を満たす「layer_
nb」の記録層のフレーム数の調整範囲が提示される。

【０２１２】QTY_change [layer_nb]== 0 かつ QTY_cha
nge [layer_nb+1]==0かつ Gcheck[layer_nb]==1 or 2ま
たはQTY_change [layer_nb]==1 かつ QTY_change [laye
r_nb+1]==0かつ Gcheck[layer_nb]==2またはQTY_change
[layer_nb]==0 かつ QTY_change [layer_nb+1]==1かつ
Gcheck[layer_nb]==1 適正範囲 MAX_CHECK_DIFF = CHECK_SUPPLY[layer_nb]／Gr_min_l
imit／Gr_avr MIN_CHECK_DIFF = CHECK_SUPPLY[layer_nb]／Gr_max_l
imit／Gr_avr MIN_CHECK_FRAME = CHECK_USB[layer_nb]／MAXRATE／kT とすると、 MIN_CHECK_DIFF ≦ CHECK_DIFF[layer_nb] ≦ MAX_CHEC
K_DIFF の条件を満たし、かつ MIN_FRAME = CHECK_DIFF = 0 とし、layer_nb 層のＥＮＣＵのうち、シームレスアン
グル以外のＥＮＣＵの Difficulty × ENCU_weight の大きさを、演奏時間の早い順から、「CHECK_DIFF」に
フレームのカウント数を、「CHECK_FRAME 」に、それぞ
れ順次加算していく。

【０２１３】この際に、範囲内に境界として望ましいチ
ャプターポイント、シーンチェンジポイントがあれば、
その情報も提示される。

【０２１４】次に、ステップＳ４２で、layer_nb = lay
er_nb + 1 とされる。

【０２１５】そして、ステップＳ４３で、layer_nb ＞
layer_max を満足するかどうかが判断され、この条件を
満足しないときにはステップＳ４０以降の手順が繰り返
される。一方、ステップＳ４３の条件を満足する場合に
は、以上の処理が終了する。

【０２１６】各記録層に割り当てるビット数やフレーム
数を変更すると、「MAX_BYTES 」条件によって新たに制
限を受けることになる。このことから、逆に、すでにそ
のような制限を受けている場合には、ビット数やフレー
ム数を変更できない場合があることが予想される。

【０２１７】図１３は、２層の記録層を有する、いわゆ
るＤＶＤなどの記録媒体において、「MAXBYTES」制限を
すでに受けている場合の処理の分類を示している。

【０２１８】また、図１４は、４層の記録層を有する記
録媒体において、上記の条件を適応させた場合の例を示
している。

【０２１９】以下に、２層の記録層を有するＤＶＤなど
のディスクに対して、ビット配分を行う場合を例とし
て、上記の処理の分類について説明する。なお、以下の
説明では、 Gr_min_limit = 0.9 Gr_max_limit = 1.1 とする。（１）GR[0] < 0.9 の場合 ALL_SUPPLY_BYTES[0] が SUM_DIFF[0] に対して不足し
ている。（２）1.1 < GR[0] の場合 ALL_SUPPLY_BYTES[1] が SUM_DIFF[1] に対して不足し
ている。（３）上記（１），（２）以外の場合処理を行なわない。

【０２２０】＜Ａ＞フレーム数固定の場合の USB_BYTES
の適正範囲「CHECK_USB」 0.9×Gr_avr×CHECK_DIFF[0]≦ CHECK_SUPPLY[0] ≦ 1.
1×Gr_avr×CHECK_DIFF[0] CHECK_USB[0]= CHECK_SUPPLY[0] + ALL_ANGLE_BYTES[0]
+ TOTAL_HEADER[0]

【０２２１】＜Ｂ＞「USB_BYTES」数固定の場合の記録
フレーム数の適正範囲「CHECK_FRAME」 CHECK_SUPPLY[0]/1.1/Gr_avr≦ CHECK_DIFF[0] ≦ CHEC
K_SUPPLY[0]/0.9/Gr_avr を満たす範囲を探す。

【０２２２】「layer 0 」のシームレスアングル以外の
ＥＮＣＵの gen_bit[k]×_ENCU_weight[encu_nb] を順次加算して「CHECK_DIFF[0] 」を再計算していく過
程で、上記の条件を満たすｋの範囲を求めていく。この
際に、範囲内に境界として望ましいチャプターポイント
やシーンチェンジポイントがあれば、その情報も提示す
る。このようにして適正範囲に修正して再度ビット配分
した例を、図１５〜図１８に示した。

【０２２３】どの例においても、符号簡易度（Difficul
ty）の和とビット配分量との関係が理想的になっている
ことが分かる。

【０２２４】次に、本発明の実施の形態に係るエンコー
ド装置について説明する。

【０２２５】図１９は、本発明の実施の形態に係るビデ
オエンコードシステムの構成例を示している。

【０２２６】このビデオエンコードシステムは、上述し
た本発明の実施の形態に係るエンコード方法を適用し
て、ディジタルビデオディスク（ＤＶＤ）用にビデオ情
報を圧縮符号化してオーサリングなどを行うために用い
ることができるものであり、その基本的な構成は図２１
に示した従来のビデオエンコードシステムの構成とほぼ
同様とすることができる。

【０２２７】主コントローラ１１は、このビデオエンコ
ードシステムに割り当てられた計算機により構成され、
ネットワーク２を介して接続されるスーパーバイザ３と
の間でデータ通信を行って、このビデオエンコードシス
テム全体の動作を制御する。

【０２２８】具体的には、主コントローラ１１は、グラ
フィカルユーザーインターフェース（ＧＵＩ：Graphica
l User Interface）部１４の管理により、スーパーバイ
ザ３からの制御を受け付けると共に、図示していないオ
ペレータの操作を受け付け、このＧＵＩ部１４により管
理されるビットアサイン部１５，エンコーダコントロー
ル部１６，ＶＴＲコントロール部１７により、エンコー
ダ１２，ビデオテープレコーダ（ＶＴＲ）１０の動作を
制御する。これにより、主コントローラ１１は、スーパ
ーバイザ３から通知されたエンコード条件に従って、処
理対象の素材を符号化処理し、その処理結果をスーパー
バイザ３に通知する。さらに、主コントローラ１１は、
ＧＵＩ部１４を介してオペレータの設定を受け付けて、
上記の符号化の詳細な条件を変更できるようにされてい
る。

【０２２９】具体的には、主コントローラ１１のＧＵＩ
部１４は、ビットアサイン部１５のビット配分プログラ
ム「BIT_ASSIGN」，エンコーダコントロール部１６のエ
ンコーダコントロールプログラム「CTRL_ENC」およびＶ
ＴＲコントロール部１７のＶＴＲコントロールプログラ
ムの３つのプログラムを管理している。

【０２３０】また、ビットアサイン部１５は、スーパー
バイザ３から通知される符号化ファイル「v.enc 」に従
って符号化処理の条件をフレーム単位で決定し、この条
件による制御データをファイル形式「CTL file」により
コントロール部１６に通知する。

【０２３１】このとき、ビットアサイン部１５は、符号
化処理におけるビット配分を設定し、さらに設定された
条件をオペレータの操作に応じて変更する。さらに、ビ
ットアサイン部１５は、データ圧縮されたビデオデータ
Ｄ２が、エンコーダ１２かあＳＣＳＩなどを介してＲＡ
ＩＤ４に記録されると、ＲＡＩＤ４上のアドレスデータ
「v.adr 」を、後段における多重化処理に必要なデータ
量等の情報「vxxx.aui」と共にスーパーバイザ３に通知
する。

【０２３２】エンコーダコントロール部１６は、ビット
アサイン部１５から通知される制御ファイル「CTL fil
e」に従って、イーサネットETHER などを介してエンコ
ーダ１２の動作を制御する。さらに、エンコーダコント
ロール部１６は、符号化処理に要する符号化難易度（di
fficulty）のデータをフレーム単位でビットアサイン部
１５に通知し、ビデオデータＤ２が記録されたＲＡＩＤ
４の記録アドレスのデータ「v.adr 」，後の多重化処理
に必要なデータ「vxxx．aui 」をビットアサイン部１５
に通知する。

【０２３３】ＶＴＲコントロール部１７は、スーパーバ
イザ１０３から通知される編集リストに従って、ＲＳ−
４２２（９ピンリモート）などを介してビデオテープレ
コーダ（ＶＴＲ）１０の動作を制御し、所望の編集対象
の素材を再生する。

【０２３４】ビデオテープレコーダ（ＶＴＲ）１０は、
主コントローラ１１を介してスーパーバイザ３から通知
される編集リストに従って、磁気テープに記録されたビ
デオデータＤ１を再生して、処理対象の「SDI 」，「RE
F V 」，「TIME CODE 」をエンコーダ１２に出力する。
このＶＴＲ１０としては、通常はディジタルＶＴＲが用
いられる。

【０２３５】エンコーダ１２は、スーパーバイザ３から
主コントローラ１１を介して通知される条件に従って動
作を切り換え、ＶＴＲ１０から出力されるビデオデータ
Ｄ１を、ＭＰＥＧ（Moving Picture Experts Group）の
手法により圧縮符号化する。

【０２３６】このとき、エンコーダ１２は、符号化処理
の結果を主コントローラ１１に通知し、主コントローラ
１１は、そのデータ圧縮における符号化の条件を制御
し、発生するビット量を制御する。これにより、主コン
トローラ１１は、データ圧縮により発生するビット量を
フレーム単位で把握できる。

【０２３７】また、エンコーダ１２は、２パスエンコー
ドにおける事前のエンコード条件設定の処理時（仮エン
コード時）には、ＶＴＲ１０からはビデオデータを単に
データ圧縮して処理結果を主コントローラ１１に通知す
るだけであるが、最終的なデータ圧縮処理時（本エンコ
ード時）には、圧縮処理されたビデオデータＤ２をＲＡ
ＩＤ４に記録し、さらにそのデータが記録されたアドレ
ス，データ量等を主コントローラ１１に通知する。

【０２３８】モニタ装置１３は、エンコーダ１２により
データ圧縮されたビデオデータＤ２をモニタできるよう
に構成される。このモニタ装置１３ににより、このビデ
オエンコードシステムでは、オペレータがデータ圧縮処
理の結果を必要に応じて確認する、いわゆるプレビュー
を行うことができる。そして、オペレータが、このプレ
ビュー結果に基づいて主コントローラ１１を操作して、
符号化の条件を詳細に変更できるようにされている。

【０２３９】また、モニタ装置１３には、仮エンコード
時に測定された符号化難易度に基づいて、与えられたエ
ンコード条件によるビット配分が、記録層間に許容でき
ない程の画質の差を生じることの警告や、適正とされる
ビット配分などの条件が表示される。

【０２４０】以上のように、本発明の実施の形態に係る
エンコード方法およびエンコード装置によれは、ビデオ
の２パスエンコード方式の場合に、スーパーバイザから
与えられたエンコード条件による複数の記録層または記
録領域の画質のばらつき量を本エンコードの実行前に予
測し評価できる。

【０２４１】なお、ここでは、ＤＶＤの複数層のビット
配分について説明したが、必ずしも記録層間ではなく、
同一記録層内に固定された、パーティションが設けられ
た複数の記録領域間に亘って記録されるデータに対する
ビット配分にも適応可能である。

【０２４２】また、ここでは、複数の記録層を有する記
録媒体に記録されるビデオデータのエンコードについて
説明したが、本発明の実施の形態に係る処理の基本的な
アルゴリズムは、２パス可変ビットレートエンコードを
行うオーディオ処理システムで、オーディオデータを複
数の固定された記録領域に対して、音質のばらつきを少
なくなるようにビット配分するシステムに対しても適応
可能である。

【０２４３】

【発明の効果】本発明によれば、２パスエンコード方式
の場合に、本エンコードの実行前にスーパーバイザから
与えられたエンコード条件による複数の記録層または記
録領域の画質のばらつき量を予測評価できるようにした
ため、早い時点でスーパーバイザへの条件の見直しを促
すことができ、ＤＶＤなどのパッケージメディアのディ
スク作成のためのエンコード作業工数を削減することが
できる。

【図面の簡単な説明】

【図１】２つの記録領域に記録されるシームレスアング
ルブロックを含むデータに対して、フレーム数の比率に
応じてビット配分される様子を説明するための図であ
る。

【図２】上記のビット配分の詳細を示す図である。

【図３】２つの記録領域に記録されるシームレスアング
ルブロックを含むデータに対して、従来方式によりビッ
ト配分される様子を説明するための図である。

【図４】上記の例における各エンコードユニット（ＥＮ
ＣＵ）に対するビット配分結果をまとめて示す図であ
る。

【図５】２つの記録領域に記録されるシームレスアング
ルブロックを含むデータに対して、本発明の実施の形態
に係る方式によりビット配分される様子を説明するため
の図である。

【図６】上記の例における、各エンコードユニット（Ｅ
ＮＣＵ）に対するビット配分結果をまとめて示す図であ
る。

【図７】本発明の実施の形態に係るビット配分計算の基
本的な手順を示すフローチャートである。

【図８】本発明の実施の形態に係るエンコード方法の[S
TEP １]〜[STEP ５]における処理の流れを示すフローチ
ャートである。

【図９】本発明の実施の形態に係るエンコード方法の[S
TEP ６]〜[STEP ９]における、フレーム数固定の条件で
の「USB_BYTES 」の調整範囲の提示方法についての処理
の流れを示すフローチャートである。

【図１０】本発明の実施の形態に係るエンコード方法の
[STEP ６]〜[STEP ９]における、フレーム数固定の条件
での「USB_BYTES 」の調整範囲の提示方法についての処
理の流れを示す、図９に続くフローチャートである。

【図１１】本発明の実施の形態に係るエンコード方法に
おける、バイト数固定の条件でのフレーム数の調整範囲
の提示方法についての処理の流れを示すフローチャート
である。

【図１２】本発明の実施の形態に係るエンコード方法に
おける、バイト数固定の条件でのフレーム数の調整範囲
の提示方法についての処理の流れを示す、図１１に続く
フローチャートである。

【図１３】２つの記録層を有する記録媒体において「MA
XBYTES」制限をすでに受けている場合の処理の分類を示
す図である。

【図１４】上記の条件を４つの記録層を有する記録媒体
に適応した場合の処理例を説明するための図である。

【図１５】適正範囲に修正して再度ビット配分した例を
示す図である。

【図１６】適正範囲に修正して再度ビット配分した例を
示す図である。

【図１７】適正範囲に修正して再度ビット配分した例を
示す図である。

【図１８】適正範囲に修正して再度ビット配分した例を
示す図である。

【図１９】本発明の実施の形態に係るビデオエンコード
システムの構成例を示す図である。

【図２０】エンコード装置の一形態を示す図である。

【図２１】従来のビデオエンコードシステムの構成例を
示す図である。

【図２２】従来のエンコード作業の流れを示すフローチ
ャートである。

【図２３】従来のエンコード作業における、ビット配分
計算処理の手順の一具体例を示すフローチャートであ
る。

【図２４】従来のエンコード作業における、シーンチェ
ンジの検出／処理について説明するための図である。

【図２５】従来のエンコード作業における、チャプタ(C
HAPTER )指定されたフレームの処理について説明するた
めの図である。

【図２６】本発明の実施の形態における、各エンコード
ユニット（ＥＮＣＵ）へのビット配分例を示す図であ
る。

【図２７】シームレスアングル部分に対する重み係数が
考慮された、本発明の実施の形態に係るビット配分の基
本的な手順を示すフローチャートである。

【図２８】ＧＯＰごとの符号化難易度の和「gop_diff」
とエンコード時のＧＯＰ単位のビット割当て量「gop_ta
rget」とを変換するための、最も簡単な関数の例を示す
図である。

【図２９】ＶＢＶ(Video buffering verifier)計算方法
について説明するための図である。

【図３０】評価関数と「GOP_MAXRATE 」制限を考慮して
求めたターゲット量に対して、ＶＢＶバッファ計算を行
った場合のターゲットビット配分例を示す図である。

【図３１】ＶＢＶ制限処理後のターゲットビット配分例
を示す図である。

【図３２】２つの記録層を有する記録媒体に対して、従
来方式によりビット配分した例を示す図である。

【図３３】２つの記録層を有する記録媒体に対して、従
来方式によりビット配分した例を示す図である。

【図３４】いわゆるＤＶＤ（ディジタルビデオディス
ク）におけるアングルブロックおよびアングル再生につ
いて説明するための図である。

【図３５】素材がアングルブロックを含む場合について
説明するための図である。

【図３６】インターリーブ処理について説明するための
図である。

【図３７】シームレスアングルブロックの処理について
説明するための図である。

【図３８】ＶＢＶバッファ残量の制限を加えたエンコー
ドおよびデコードを行った場合の例を示す図である。

【図３９】シームレスアングルで、全てのＧＯＰの最初
と最後のＶＢＶの値が一定値以上になるように制御され
る様子を説明するための図である。

【符号の説明】

２ネットワーク、３スーパーバイザ、４ＲＡ
ＩＤ、１０ビデオテープレコーダ（ＶＴＲ）、１
１主コントローラ、１２エンコーダ、１４ＧＵ
Ｉ（グラフィカルユーザインターフェース）部、１５
ビットアサイン部、１６エンコーダコントロール
部、１７ＶＴＲコントロール部

Claims

【特許請求の範囲】

【請求項１】ビデオ素材を圧縮符号化して複数の記録
領域に記録するエンコード方法において、本エンコードに先立つプリエンコード工程と、与えられたエンコード条件下で、各記録領域の間の画質
の差を許容できるビット配分の可否を評価する評価工程
と、上記各記録領域の間の画質の差が許容できるビット配分
の適正範囲を提示する提示工程とを有し、上記与えられ
たエンコード条件または上記提示された適正範囲のビッ
ト配分により本エンコードを行うことを特徴とするエン
コード方法。
【請求項２】上記評価工程では、上記プリエンコード
工程で測定された上記ビデオ素材の符号化難易度を用い
て、上記与えられたエンコード条件により上記各記録領
域に配分されるビット量と上記各記録領域ごとの符号化
難易度の総和との比率を求め、その比率のばらつき量に
基づいて、上記各記録領域のエンコード後の画質のばら
つき量を推定することを特徴とする請求項１記載のエン
コード方法。
【請求項３】上記提示工程では、上記比率のばらつき
量が所定値を越えるときに、上記各記録領域のフレーム
数を固定した場合の、各記録領域に配分されるべきビッ
ト数の適正範囲値を表示することを特徴とする請求項２
記載のエンコード方法。
【請求項４】上記提示工程では、上記比率のばらつき
量が所定値を越えるときに、上記各記録領域のビット配
分量を固定した場合の、各記録領域に記録されるべきフ
レーム数の適正範囲値を表示することを特徴とする請求
項２記載のエンコード方法。
【請求項５】上記提示工程では、上記フレーム数の適
正範囲内でのチャプター位置、またはシーンチェンジ検
出位置を検出し、新たに記録層の境界を変更する際のビ
デオ素材上での適切な場所として表示することを特徴と
する請求項４記載のエンコード方法。
【請求項６】上記複数の記録領域は、ディジタルビデ
オディスクの複数の記録層であることを特徴とする請求
項１記載のエンコード方法。
【請求項７】複数の記録領域にシームレスアングルブ
ロックを含むエンコードを行うエンコード方法におい
て、各記録領域ごとに与えられる上限が考慮されたバイト数
の総和および総フレーム数からエンコードされた素材の
平均レートを求める工程と、重み係数を考慮したフレーム数の比率に従って、上記各
記録領域に記録されるべきシームレスアングルブロック
に割り当てられるバイト数を、上記各記録領域から確保
する工程と、上記シームレスアングルブロックに割り当てられるバイ
ト数が差し引かれた残りのバイト数を、上記シームレス
アングルブロック以外のブロックに重み係数を考慮した
符号化難易度の和の比率で配分する工程とを有すること
を特徴とするエンコード方法。
【請求項８】上記エンコードされたビデオ素材の平均
レートは、本エンコードに先立つプリエンコードにより
求められることを特徴とする請求項７記載のエンコード
方法。
【請求項９】上記複数の記録領域は、ディジタルビデ
オディスクの複数の記録層であることを特徴とする請求
項７記載のエンコード方法。
【請求項１０】ビデオ素材を圧縮符号化して複数の記
録領域に記録するエンコード装置において、本エンコードに先立ってプリエンコードを行うプリエン
コード手段と、各記録領域の間の画質の差を許容できるビット配分の可
否を評価する評価手段と、上記各記録領域の間の画質の差が許容できるビット配分
の適正範囲を提示する提示手段とを備え、上記与えられ
たエンコード条件または上記提示された適正範囲のビッ
ト配分により本エンコードを行うことを特徴とするエン
コード装置。
【請求項１１】上記評価手段は、上記プリエンコード
手段により測定された上記ビデオ素材の符号化難易度を
用いて、上記与えられたエンコード条件により上記各記
録領域に配分されるビット量と上記各記録領域ごとの符
号化難易度の総和との比率を求め、その比率のばらつき
量に基づいて、上記各記録領域のエンコード後の画質の
ばらつき量を推定することを特徴とする請求項１０記載
のエンコード装置。
【請求項１２】上記提示手段は、上記比率のばらつき
量が所定値を越えるときに、上記各記録領域のフレーム
数を固定した場合の、各記録領域に配分されるべきビッ
ト数の適正範囲値を表示することを特徴とする請求項１
１記載のエンコード装置。
【請求項１３】上記提示手段は、上記比率のばらつき
量が所定値を越えるときに、上記各記録領域のビット配
分量を固定した場合の、各記録領域に記録されるべきフ
レーム数の適正範囲値を表示することを特徴とする請求
項１１記載のエンコード装置。
【請求項１４】上記提示手段は、上記フレーム数の適
正範囲内でのチャプター位置、またはシーンチェンジ検
出位置を検出し、新たに記録層の境界を変更する際の素
材上での適切な場所として表示することを特徴とする請
求項１３記載のエンコード装置。
【請求項１５】上記複数の記録領域は、ディジタルビ
デオディスクの複数の記録層であることを特徴とする請
求項１０記載のエンコード装置。
【請求項１６】複数の記録領域にシームレスアングル
ブロックを含むエンコードを行うエンコード装置におい
て、各記録領域ごとに与えられる上限が考慮されたバイト数
の総和および総フレーム数からエンコードされた素材の
平均レートを求める手段と、重み係数を考慮したフレーム数の比率に従って、上記各
記録領域に記録されるべきシームレスアングルブロック
に割り当てられるバイト数を、上記各記録領域から確保
する手段と、上記シームレスアングルブロックに割り当てられるバイ
ト数が差し引かれた残りのバイト数を、上記シームレス
アングルブロック以外のブロックに重み係数を考慮した
符号化難易度の和の比率で配分する手段とを備えること
を特徴とするエンコード装置。
【請求項１７】上記エンコードされた素材の平均レー
トは、本エンコードに先立つプリエンコードにより求め
られることを特徴とする請求項１６記載のエンコード装
置。
【請求項１８】上記複数の記録領域は、ディジタルビ
デオディスクの複数の記録層であることを特徴とする請
求項１６記載のエンコード装置。