JPH11196375A - エンコード方法およびエンコード装置 - Google Patents

エンコード方法およびエンコード装置

Info

Publication number
JPH11196375A
JPH11196375A JP36926497A JP36926497A JPH11196375A JP H11196375 A JPH11196375 A JP H11196375A JP 36926497 A JP36926497 A JP 36926497A JP 36926497 A JP36926497 A JP 36926497A JP H11196375 A JPH11196375 A JP H11196375A
Authority
JP
Japan
Prior art keywords
encoding
layer
recording
bytes
bit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP36926497A
Other languages
English (en)
Other versions
JP3837889B2 (ja
Inventor
Masaaki Isozaki
正明 五十崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP36926497A priority Critical patent/JP3837889B2/ja
Priority to US09/221,459 priority patent/US6356178B1/en
Publication of JPH11196375A publication Critical patent/JPH11196375A/ja
Application granted granted Critical
Publication of JP3837889B2 publication Critical patent/JP3837889B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/114Adapting the group of pictures [GOP] structure, e.g. number of B-frames between two anchor frames
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/84Television signal recording using optical recording
    • H04N5/85Television signal recording using optical recording on discs or drums
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
    • H04N9/8227Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal the additional signal being at least another television signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

(57)【要約】 【課題】 複数の記録領域(層)に亘って記録される圧
縮ビデオデータへのビット配分時に、与えられたエンコ
ード条件で各記録領域間の画質に許容できない差を生じ
ないビット配分の可否を評価し、最適条件を提示できる
エンコード方法および装置を提供する。 【解決手段】 変更後のピクチャタイプに応じて補正さ
れた符号化難易度およびエンコード素材全体に与えられ
たビット数「SUPPLY_BYTES」に応じてエンコードユニッ
ト毎にビット配分され、各記録領域間の配分量のばらつ
きが検出されて許容できるかどうか評価される。許容で
きない場合はワーニングが表示され、許容できる場合は
補正後の符号化難易度と「SUPPLY_BYTES」に応じてピク
チャ毎のターゲットビット数が計算されてエンコーダ用
コントロールファイルが作成される。当初の条件でエン
コードしない場合はビット配分量等の適正値が提示され
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、画像/音声信号を
圧縮して記録媒体に記録するためのエンコード方法およ
び装置に関し、特に画像/音声信号をディジタルビデオ
ディスク(DVD)などのいわゆるパッケージメディア
に蓄積するために好適なエンコード方法および装置に関
する。
【0002】
【従来の技術】ビデオ情報を圧縮符号化してディジタル
ビデオディスク(Digital Video Disk:DVD)やビデ
オCDのようないわゆるパッケージメディアに蓄積する
エンコードシステムでは、まず、ビデオ素材の画像の符
号化難易度(Difficulty)を測定し、次に、その符号化
難易度に基づいてパッケージメディアの記録容量の範囲
内の与えられたバイト数に収まるように、各ビデオ情報
のフレームごとにビット配分(Bit assign)処理を行う
方法が一般に採用されている。以下では、このような2
段階のエンコード処理を2パスエンコードという。
【0003】図20は、ビデオ情報を圧縮符号化してデ
ィジタルビデオディスク(DVD)などのオーサリング
に用いられるオーサリングシステムの基本的な構成を例
示している。
【0004】このオーサリングシステムは、ビデオエン
コーダ22,オーディオエンコーダ21,サブタイトル
エンコーダ23,メニューエンコーダ24,エミュレー
タ26,マルチプレクサ25等の各エンコード作業工程
のための装置と、エンコード結果が書き込まれるハード
ディスクアレイ(RAID)4と、これらの動作を統括
管理するスーパーバイザ3とが、ネットワーク2で相互
に接続されている。
【0005】このようなオーサリングシステムは、ビデ
オやオーディオなどの各パートのエンコード作業が同時
並列的に行えるため、作業効率が非常に良い。
【0006】図21は、図20に例示したオーサリング
システムにおける、従来のビデオエンコードシステムの
構成例を示している。
【0007】スーパーバイザ103は、ビデオエンコー
ドシステムの全体を管理するものであり、ビデオ,オー
ディオ,メニューなどの各エンコードシステムにエンコ
ード条件を与え、エンコード結果の報告を受ける。この
例では、ファイル「v.enc 」によってビデオエンコード
条件が指定され、ビデオエンコーダ側からはエンコード
結果のビットストリームが書き込まれたRAID104
上のアドレス「v.adr」と、ビットストリームをマルチ
プレックスする際に必要なデータ「vxxx.aui」が報告さ
れる。
【0008】主コントローラ111は、ネットワーク1
02を介して接続されるスーパーバイザ103との間の
通信により、このビデオエンコードシステム全体の動作
を制御する。
【0009】具体的には、主コントローラ111は、グ
ラフィカルユーザーインターフェース(GUI:Graphi
cal User Interface)部114の管理により、スーパー
バイザ103からの制御を受け付けると共に、オペレー
タの操作を受け付け、このGUI部114により管理さ
れるビットアサイン部115,エンコーダコントロール
部116,VTRコントロール部117により、エンコ
ーダ112,ビデオテープレコーダ(VTR)110の
動作を制御する。これにより主コントローラ111は、
スーパーバイザ103から通知されたエンコード条件に
従って処理対象の素材を符号化処理し、その処理結果を
スーパーバイザ103に通知する。さらに、主コントロ
ーラ111は、GUI部114を介してオペレータの設
定を受け付けて、上記の符号化の詳細な条件を変更でき
るようにされている。
【0010】上記の主コントローラ111のGUI部1
14は、ビットアサイン部115のビット配分プログラ
ム「BIT_ASSIGN」,エンコーダコントロール部116の
エンコーダコントロールプログラム「CTRL_ENC」および
VTRコントロール部117のVTRコントロールプロ
グラムの3つのプログラムを管理している。
【0011】また、ビットアサイン部115は、スーパ
ーバイザ103から通知されるエンコード条件のファイ
ル「v.enc 」に従って符号化処理の条件をフレーム単位
で決定し、この条件による制御データをファイル形式
「CTL file」によりコントロール部116に通知する。
【0012】このとき、ビットアサイン部115は、符
号化処理におけるビット配分(ビットアサイン)を設定
し、さらに設定された条件をオペレータの操作に応じて
変更する。さらに、ビットアサイン部115は、データ
圧縮されたビデオデータD2がRAID104に記録さ
れると、そのビデオデータD2が書き込まれたRAID
104上のアドレスのデータ「v.adr 」を、後段におけ
る多重化処理に必要なデータ量等の情報「vxxx.aui」と
共にスーパーバイザ103に通知する。
【0013】エンコーダコントロール部116は、ビッ
トアサイン部115から通知される制御ファイル「CTL
file」に従ってエンコーダ112の動作を制御する。さ
らに、エンコーダコントロール部116は、符号化処理
に要する符号化難易度「Difficulty」のデータをフレー
ム単位でビットアサイン部115に通知し、RAID1
04にビデオデータD2が記録されると、その記録アド
レスのデータ「v.adr」,後の多重化処理に必要なデー
タ「vxxx.aui 」をビットアサイン部115に通知す
る。
【0014】VTRコントロール部117は、スーパー
バイザ3から通知される編集リストに従ってビデオテー
プレコーダ(VTR)110の動作を制御し、所望の編
集対象の素材を再生する。
【0015】ビデオテープレコーダ(VTR)110
は、主コントローラ111を介してスーパーバイザ10
3から通知される編集リストに従って、磁気テープに記
録されたビデオデータD1を再生してエンコーダ112
に出力する。
【0016】エンコーダ112は、スーパーバイザ10
3から主コントローラ111を介して通知される条件に
従って動作を切り換え、VTR110から出力されるビ
デオデータD1を、MPEG(Moving Picture Experts
Group)の手法により圧縮符号化する。
【0017】このとき、エンコーダ112は、符号化処
理の結果を主コントローラ111に通知し、主コントロ
ーラ111は、そのデータ圧縮における符号化の条件を
制御し、発生するビット量を制御する。これにより、主
コントローラ111は、データ圧縮により発生するビッ
ト量をフレーム単位で把握できる。
【0018】また、エンコーダ112は、2パスエンコ
ードにおける事前のエンコード条件設定の処理時(仮エ
ンコード時)には、単にビデオデータD1をデータ圧縮
して処理結果を主コントローラ111に通知するだけで
あるが、最終的なデータ圧縮処理時(本エンコード時)
には、圧縮処理されたビデオデータD2をRAID10
4に記録し、さらにそのデータが記録されたアドレス,
データ量等を主コントローラ11に通知する。
【0019】モニタ装置113は、エンコーダ112に
よりデータ圧縮されたビデオデータD2をモニタできる
ように構成される。このビデオエンコードシステムで
は、モニタ装置113により、オペレータがデータ圧縮
処理の結果を必要に応じて確認する、いわゆるプレビュ
ーを行うことができる。そして、オペレータが、このプ
レビュー結果に基づいて主コントローラ111を操作し
て、符号化の条件を詳細に変更できるようにされてい
る。
【0020】前述したように、いわゆるDVDなどのパ
ッケージメディアには、ビデオデータの圧縮方式として
MPEG(Moving Picture Experts Group)が採用され
ている。
【0021】MPEGは、動き補償予測による時間方向
の冗長度を除去することによりデータ圧縮する方式であ
り、フレーム内だけで符号化されるI(Intra )ピクチ
ャ,過去の画面から現在を予測して符号化されるP(Pr
edictive)ピクチャ,過去の画像と未来の画像とから現
在を予測して符号化されるB(Bidirectionally Predic
tive)ピクチャの3種類の符号化画像が用いられる。
【0022】また、これらの画像は、Iピクチャを必ず
1つ含むまとまりであるGOP(Group of Pictures )
とされる。
【0023】次に、従来の2パスエンコード作業につい
て、図20に例示したビデオエンコードシステムの構成
を参照しながら説明する。
【0024】図22は、図21に例示した従来のビデオ
エンコードシステムにおける、2パスエンコードの基本
的な処理手順を示している。
【0025】まず、ステップS51で、スーパーバイザ
103からネットワーク102を経由して、ビデオ情報
に割り当てられるビット総量や最大レートなどのエンコ
ード条件「v.enc 」が与えられ、エンコーダコントロー
ル部116はこのエンコード条件に従って設定される。
【0026】次に、ステップS52で、エンコーダコン
トロール部116が、エンコーダ112を使ってエンコ
ード素材の符号化難易度(Difficulty)を測定する。こ
のとき、素材の各画素のDC値や動きベクトル量MEも
併せて測定される。そして、これらの測定結果に基づい
てファイルが作成される。
【0027】符号化難易度の実際の測定は、以下のよう
に行われる。
【0028】エンコード素材となるビデオ情報は、マス
ターテープであるディジタルビデオカセットからVTR
110により再生される。
【0029】エンコーダコントロール部116は、エン
コーダ112を介して、VTR110により再生された
ビデオ情報D1の符号化難易度を測定する。ここでは、
符号化の際に量子化ステップ数を固定値に設定して発生
ビット量が測定される。動きが多く、高い周波数成分が
多い画像では発生ビット量が多くなり、静止画や平坦な
部分が多い画像では発生ビット量が少なくなる。この発
生ビット量の大きさが符号化難易度とされる。
【0030】次に、ステップS53では、ステップS5
1で設定されたエンコード条件に従ってステップS52
で測定された、各ピクチャの符号化難易度の大きさに応
じて、エンコーダコントロール部116が、ビットアサ
イン部115内のビット配分計算プログラム「BIT_ASSI
GN」を実行し、割り当てビット量(ターゲット量)の配
分計算を行う。
【0031】そして、上記のビット配分計算の結果を使
って仮エンコードを行い、ステップS54で、エンコー
ダ112に内蔵されているローカルデコーダ出力の画質
によって、本エンコードを実行するかどうかをオペレー
タに判断させるようにする。実際には、上記のビット配
分によるビットストリームをRAID4に出力しない
で、オペレータが任意の処理範囲を指定できるモードで
あるプレビユー(Preview )モードで画質が確認され
る。
【0032】そして、ステップS55で、画質評価が行
われ、画質に問題がある場合(NG)にはステップS5
6に進み、問題がある部分のビットレートを上げたりフ
ィルターレベルを調整するといった画質調整のためのカ
スタマイズ作業が行われた後に、ステップS57でビッ
ト配分再計算が実行される。
【0033】その後、ステップS54に戻り、カスタマ
イズされた部分がプレビューされ、ステップS55で画
質が確認される。ここで、全ての部分の画質が良好であ
ればステップS58に進み、エンコーダ112によっ
て、ステップS57で再計算されたビット配分による素
材全体についての最終的なエンコード処理(本エンコー
ド)が実行される。
【0034】一方、ステップS55で、画質に問題がな
いと判断された場合には、そのままステップS58に進
み、エンコーダ112により、ステップS53で計算さ
れたビット配分による本エンコードが実行される。
【0035】そして、ステップS59で、エンコード結
果であるビットストリームがSCSI(Small Computer
System Interface )等を介してRAID104に書き
込まれる等の後処理が行われ、2パスエンコード処理が
終了する。
【0036】ステップS58におけるエンコードの実行
後、ビデオエンコーダコントロール部116は、上述し
たようなエンコード結果の情報をネットワーク102経
由でスーパーバイザ103に報告する。
【0037】なお、この図22の各ステップのうち、ス
テップS52,ステップS54およびステップS58を
除く各ステップの処理は、オフラインで行われる。
【0038】この一連の作業工程において、エンコード
素材を1本のビデオテープに記録し切れない場合には、
複数のロール(テープ)に亘って記録されることにな
る。このテープの入れ換え作業のため、連続してエンコ
ードを行うことができない。
【0039】また、マルチアングルの場合には、その部
分のタイムコードはアングルブロック間で同じなので、
この場合も連続してエンコードすることができない。こ
のような、エンコード作業を一旦中断しなければならな
い処理単位をエンコードユニットENCU(Encode uni
t) と定義する。次に、上述したような2パスエンコー
ド作業におけるビット配分計算について説明する。
【0040】まず、エンコード結果が蓄積されるパッケ
ージメディアの記録容量のうちのビデオに割り当てられ
たビット総量「QTY_BYTES 」と最大ビットレート「MAXR
ATE」とが、オーサリングシステムから指定される。こ
れに対して、最大ビットレート以下になるように制限を
加えられた総ビット数「USB_BYTES 」を求め、その値か
ら「GOP header」に必要なビット数「TOTAL_HEADER」を
引いた値と全体のフレーム総数から、ターゲット数の総
和の目標値となる「SUPPLY_BYTES」を算出する。そし
て、この「SUPPLY_BYTES 」の大きさに収まるように、
各ピクチャへの割り当てビット量(以下ターゲット(tar
get)量という。)が配分される。
【0041】図23は、図22のステップS53におけ
る、上記のビット配分計算の処理手順の一具体例を示し
ている。
【0042】まず、ステップS61で、上述したように
スーパーバイザから送られるビット総量「QTY_BYTES 」
と最大ビットレート「MAXRATE 」が入力される。
【0043】次に、ステップS62で、図22のステッ
プS52で作成された符号化難易度(Difficulty)の測
定結果のファイルが読み込まれる。
【0044】次に、ステップS63で、符号化難易度と
共に測定された各画像のDC値や動きベクトル量MEの
大きさのパラメータの変化量から、シーンが変化するポ
イントが検出される。
【0045】図24は、このようなシーンチェンジ指定
されたフレームの処理を示している。
【0046】符号化難易度(Difficulty)測定の際に併
せて測定される、各画像のDC値や動きベクトル量の大
きさなどのパラメータの変化量から、シーンが変化する
ポイントを見つけることが可能である。これにより、図
24に示すように、シーンチェンジとして検出されたP
ピクチャをIピクチャに変更して、画質改善を図ること
ができる。なお、ここではフレーム数N=15の場合を
例示している。
【0047】次に、ステップS64では、チャプター
(CHAPTER )境界処理が行われる。ディスク再生装置で
のチャプターサーチ時には、再生されるピクチャが、特
定されないピクチャからジャンプしてくる。その場合で
も再生画像が乱れないようにするため、このチャプタ境
界処理によって、チャプターの位置が必ずGOPの先頭
になるようにピクチャタイプが変更されたり、GOP長
が制限される。
【0048】図25は、このようなチャプタ(CHAPTER )
指定されたフレームの処理、すなわち、セル(CELL)境
界の処理を示している。
【0049】そして、ステップS65では、上記の一連
の作業の結果として変更された、Iピクチャ,Pピクチ
ャ,Bピクチャなどのピクチャタイプに合わせて符号化
難易度(Difficulty)の値が補間/補正される。これ
は、いわゆるDVDなどの記録媒体では、1GOPのデ
コード時に、表示される最大のフィールド数が制限され
ていることから、ピクチャタイプの変更に伴ってGOP
構造が変化したことにより1GOPの長さがこの制限を
越えることがあるためである。そのような場合には、制
限を満たすように、PピクチャをIピクチャに変更して
GOP長が短くされるGOP制約処理が行われる。
【0050】次に、ステップS66では、各エンコード
ユニット(ENCU)ごとに、ビット量が配分される。
【0051】次に、ステップS67では、ステップS6
5における補間/補正処理によって得られた符号化難易
度、およびエンコードされる素材全体に与えられたビッ
ト数「SUPPLY_BYTES」に応じて、まず各ENCUごとに
ビットが配分(supply_bytes[encu_nb] )し、それがター
ゲットビット(Target bit)量の総和の目標値とされ
る。その後、各ENCUごとに、その目標値に応じて各
ピクチャ単位のビット配分が実行される。
【0052】そして、ステップS68でエンコード結果
のビットストリームを書き込む際のRAIDのアドレス
(ADDRESS )が計算された上で、ステップS69でエン
コーダ用のコントロールファイルが作成されて一連の処
理が終了する。
【0053】上記のような手順により、素材の符号化難
易度(Difficulty)および素材全体に与えられたビット
数「SUPPLY_BYTES」に応じて、各ピクチャごとのターゲ
ットビット数が計算され、エンコーダ用のコントロール
ファイルが作成される。
【0054】以下では、このようなビット配分の手順に
ついて、図26に示す、素材がいわゆるアングルブロッ
クを含む場合のビット配分例を参照しながら、さらに詳
しく説明する。なお、このマルチアングルについての詳
細は後述する。
【0055】図27は、シームレスアングル部分に対す
る重み係数が考慮されたビット配分の基本的な手順を示
している。
【0056】まず、ステップS71で、パッケージメデ
ィアの記録容量のうちのビデオに割り当てられたビット
総量「QTY_BYTES 」がスーパーバイザから取得される。
【0057】次に、ステップS72では、このビット総
量「QTY_BYTES 」に対して、エンコード条件として指定
された総ビット数「USB_BYTES 」が求められる。
【0058】 USB_BYTES = min(QTY_BYTES,MAXRATE × KT × total_frame_number) ---- [1] ここで、ビデオ素材のフォーマットがNTSC方式であ
る場合には KT = 1/8(bits)/30(Hz),PAL方式である
場合には KT = 1/8(bits)/25(Hz)である。また、「tota
l_frame_number」はエンコードされる素材のフレーム総
数,「min(s,t)」はs,tのうちの小さい方を選択する
関数である。
【0059】次に、ステップS73では、この「USB_BY
TES 」から「GOP header」に必要なビット数の総和「TO
TAL_HEADER 」を引いた値「ΣTOTAL_SUPPLY_BYTES 」が
求められる。なお、総和Σは、各記録層についての和を
意味している。
【0060】また、ステップS74では、全体のフレー
ム総数「total_framenb 」から、シームレスアングル部
分の「ALL_ANGLE_BYTES 」が計算される。ここで、最初
にシームレスアングルブロックにビット配分するのは、
シームレスアングルブロックには他の部分よりも厳しい
制約があり、より多くのビット量が必要なことと、対応
するシームレスアングルブロックに同一量のビットが割
り当てられることが必要なためである。
【0061】各エンコードユニット(ENCU)のフレ
ーム数を「ENCU_frame[encu_nb] 」とすると、 supply_bytes[encu_nb] = (USB_BYTES - TOTAL_HEADER) × ENCU_frame[encu_nb] /total_framenb ---- [2] ALL_ANGLE_BYTES = Σsupply_bytes(Seamless Angle Block) ---- [3] このとき、対応するシームレスアングルブロックのフレ
ーム数は互いに同じであるため、各々の「supply_byte
s」も必ず同じになる。
【0062】次に、ステップS75では、「USB_BYTES
」から「ALL_ANGLE_BYTES 」を引いた値に対し、アン
グルブロックではない部分の各ENCUの「supply_byt
es」、すなわち「ALL_SUPPLY_BYTES」が算出される。こ
のとき、単純にフレーム数の比率でビット分配すると、
ENCU間での画像の難しさにばらつきがある場合に最
適なビット割当ができないため、各ENCUでの符号難
易度の総和「ENCU_diff[encu_nb]」を求めておき、ステ
ップS76ではその比率でビット量が分配される。
【0063】その際、ユーザーが、ENCU間のビット
配分を、素材の段階で意識的に操作したい場合がある。
例えば、映画素材の前にコマーシャルなどをいれる場合
に、その部分だけはビットレートを意識的に上げたい場
合などが考えられる。このような要求は、各ENCUの
符号化難易度の総和に対して、重み係数「e_weight」を
設定することで実現される。
【0064】この重み係数は、例えば、以下の表1に示
されるようなファイルで設定され、ビット計算の実行時
にロードされる。 DIFF_SUM = ΣENCU_diff[encu_nb] (シームレスアングル以外のENCU) ---- [4] ALL_SUPPLY_BYTES = USB_BYTES - TOTAL_HEADER - ALL_ANGLE_BYTES ---- [5] supply_bytes [encu_nb] = ALL_SUPPLY_BYTES * ENCU_diff[encu_nb]/ DIFF_SUM ---- [6]
【0065】
【表1】 以下では、ビット配分計算の例として、まずGOP単位
にビット量を配分し、その後に各GOP内で各ピクチャ
の難しさ「GOP_DIFFICULTY」に応じたビット配分を行う
ものとして説明する。各GOPごとのDifficultyの和で
ある「GOP_diff」に応じて、エンコードする際のGOP
単位のビット割り当て量「GOP_target」が配分される。
【0066】図28は、GOPごとの符号化難易度の和
「gop_diff」とエンコード時のGOP単位のビット割当
て量「gop_target」とを変換するための、最も簡単な関
数の例を示している。
【0067】この例では、「GOP_target」をY , 「GO
P_diff」 をX とし、 DIFFICULTY_SUM = ENCU_diff[encu_nb] として、 Y = AX + B という形で表される評価関数が用いられる。また、全て
のピクチャの「Difficulty」の総和「ENCU_diff[encu_n
b]」が用られる。 B = GOP_MINBYTES ---- [7] Σy = A×Σx + B×n ここで、Σy = supply_bytes[encu_nb],Σx = ENCU_di
ff[encu_nb],nはGOPの総数である。よって、 A = (supply_bytes[encu_nb] - B×n)/ ENCU_diff[encu
_nb] となる。
【0068】 GOP_target = A × GOP_diff + B ---- [8] その後、各GOP内で各ピクチャの符号化難易度「gen_
bit[k]」に応じたビット配分を行う。この「gen_bit
[k]」は、仮エンコードによって測定されたk番目のフ
レームの符号化難易度の値であり、大きいほど画像が難
しいことを表す。GOP内での各ピクチャの配分は Dif
ficulty の大きさに比例させた場合には、各ピクチャの
ターゲット量は以下の式で求められる。
【0069】 target(k) = GOP_TARGET × gen_bit[k]/GOP_diff ---- [9] (1 ≦ k ≦ GOP 内の picture 数) この場合、素材の中に極端に難しい(すなわち、「GOP_
diff」が大きい)ピクチャがあると、非常に大きい「go
p_target」量になってしまい、システムにおいて許容さ
れている最大レートを越えてしまうため、「GOP_MAXBYT
ES」といった固定量でリミッタをかけることが必要であ
る。また、最小のターゲット量も「GOP_MINBYTES」によ
り同様に制限される。
【0070】MPEGによるビデオのエンコード時に
は、仮想デコーダのバッファ残量を考慮しながらビット
配分することが義務付けられている。この仮想バッファ
残量の計算をVBV(Video buffering verifier) とい
う。
【0071】以下に、この仮想バッファ残量の計算方法
について説明する。
【0072】図29は、VBV計算方法を示している。
【0073】記録媒体がいわゆるDVDの場合、バッフ
ァサイズ「VBV MAX 」(1.75Mbits )に対して、k番目の
ピクチャのバッファのスタート点を「Occupancy_up(k)
」,k番目のピクチャのターゲット量を「target(k)
」とすると、ピクチャにビットを供給した後のバッフ
ァ残量「Occupancy_down(k) 」は[7] 式で表される。
【0074】このバッファには、デコーダのピックアッ
プからビデオのデータ量に応じたビットレートのデータ
量「SYSTEM_SUPPLY 」が蓄積される。この供給後のバッ
ファ残量「Occupancy_up(k+1) 」は [8] 式で表され
る。
【0075】この供給量は、図中の右上にあがる量に相
当する。供給されるビットレートが大きいほど傾きは大
きくなり、バッファにデータがたまりやすくなる。バッ
ファがいっぱいになった場合には、ピックアップからバ
ッファへの供給がストップするため、バッファのオーバ
ーフローに関しては考慮する必要はない。このことは、
ある設定値ちょうどに制御する必要はなく、設定値以上
になるように制御すれば良いことを意味している。
【0076】逆に、各ピクチャのデータ量が大きいと、
バッファにたまったデータは減少する。このバッファ残
量が一定値以下にならないようにターゲットビット量を
計算する。この計算の最初の「Occupancy_up(0) 」は固
定値(この例ではVBV MAX×2/3 )からスタートする。
【0077】以下の「Occupancy_up 」はグラフ上の各
ピクチャの上側のポイント、「Occupancy_down 」はグ
ラフ上の各ピクチャの下側のポイントを意味している。
【0078】 Occupancy_up(0) = VBV MAX × 2/3 ---- [10] Occupancy_down(k) = Ouucpancy_up(k) - target(k) ---- [11] Occupancy_up(k+1) = Ouucpancy_down(k) + SYSTEM_SUPPLY ---- [12] SYSTEM_SUPPLY = MAXRATE(bps)×KT ---- [13] 次に、以上説明したような、GOP単位でのターゲット
ビット配分計算を行った例を示す。
【0079】図30は、評価関数と「GOP_MAXRATE 」制
限を考慮して求めたターゲット量に対して、VBVバッ
ファ計算を行った場合のターゲットビット配分例を示し
ている。
【0080】図30中の1番目,4番目,7番目のピク
チャは、VBVバッファの下限である「VBV MIN 」の値
を下回っている。そこで、VBVが「VBV MIN 」を下回
ったピクチャを含むGOPのターゲット量を削減させ
る。
【0081】GOP内でVBV制限を加える前のターゲ
ット量でVBV計算を実行したときの「Occupancy 」の
最小値を「Occ_min 」とすると、調整量は以下の式で表
される。ここで、制限を行うスタート点「kstart」は、
「Occupancy_up(k) 」が基準値「VBVLINE 」とされる。
この「VBVLINE 」は、例えば、 VBV MAX×(3/4) 以上の
kの値で、このときの「Occupancy_up(k) 」の値を「Oc
c_start 」とする。
【0082】Occupancy_min < VBV MIN の時 r = (Occ_start - VBV MIN)/(VBVSTART - Occ_min) ---- [14] 各ターゲットに対して target(j) = target(j) × r (kstart ≦ j ≦ k) とする。
【0083】図31は、上記のようなVBV制限処理を
行った後のターゲットビット配分例を示している。
【0084】VBV制限処理前には、VBVバッファの
下限である「VBV MIN 」の値を下回っていた1番目,4
番目,7番目のピクチャも、この下限値を下回らないよ
うに調整されている。
【0085】このようにして求められたターゲット量を
用いて作成されたコントロールファイルによりエンコー
ド処理を行うことで、素材の画像の難しさに応じて、簡
単な画像には少ないビット量が割り当てられ、難しい画
像により多くのビット量が割り当られるようになるた
め、演奏時間の中で画質のばらつきが少ない可変レート
エンコーディングが実現される。
【0086】
【発明が解決しようとする課題】ところで、DVD(デ
ジタルビデオディスク)は、片面に2層の記録層を有す
るディスク、および両面に計4層の記録層を有するディ
スクのフォーマットが規定されている。
【0087】各記録層に記録されるビデオデータに対し
て、どの程度のバイト数を割り当てるかは、ディスク全
体の構成に関わるため、スーパーバイザ側からエンコー
ド条件として指定される。スーパーバイザ側でエンコー
ド条件を決める際には、各記録層に記録される予定の素
材の画像の難しさの違いは分からないため、例えば、単
純に各記録層に記録されるフレーム数の比率を用いてバ
イト数を分配するしかない。
【0088】しかし、実際のエンコードでは、各記録層
に記録される素材の画像にはばらつきがあるため、この
ようにバイト数が一律に配分された場合には、記録層の
間に画質の差が生じることになる。
【0089】例えば、第1層の演奏時間と第2層の演奏
時間とが同じである場合には、同じ量のバイト数がエン
コード条件として指定される。ところが、第1層には簡
単な静止画像が多く含まれ、第2層には情報量の多い画
像が多く含まれる場合には、第1層の画質と第2層の画
質との間に大きな差が生じることとなり、ディスク再生
装置で記録層間を切替えて再生させた場合に違和感を生
じさせるという問題がある。
【0090】図32は、2層の記録層を有するいわゆる
DVDなどの記録媒体に対して、従来方式によりビット
配分された例を示している。
【0091】エンコードユニットENCU1とENCU
3とは、符号化難易度の和およびフレーム数が全く同じ
であり、同じエンコード条件であるにも関わらず、各記
録層「Layer 1」と「layer 2」との間でのビット配分が
変わってしまっている。この条件でエンコードを実行す
ると、ENCU1とENCU3との間には明らかな画質
の差が生じてしまう。
【0092】図33は、図32に示す例における各エン
コードユニット(ENCU)に対するビット配分結果を
まとめて示している。
【0093】このような従来方式における記録層の間の
画質の差は、エンコード後の画質評価によって始めて確
認できるため、画質が望ましくないと判断された場合に
は、その時点でエンコード条件が変更されることにな
る。しかし、エンコード条件をどの程度調整してよいか
は分からないため、カットアンドトライによる作業とな
り、効率が非常に悪いという問題がある。
【0094】次に、エンコード素材が、いわゆるアング
ルブロックを含む場合について説明する。
【0095】DVD(ディジタルビデオディスク)にお
けるアングル再生とは、図34に示すように、デコーダ
(再生装置)側で、ユーザーが、同一の被写体の同じ時
間における画像を、複数の角度から再生できるようにす
るものであり、切替時に再生画像が一旦中断する(黒な
どが挿入される)ことを許すノンシームレスアングル
と、切替時に乱れることなく(シームレスに)つながる
シームレスアングルとがある。ここでは、3つの角度か
らの画像である「Angle 1」,「Angle 2」,「Angle
3」 が切替られる場合を例示している。
【0096】図35は、アングルブロックを含むデータ
の一例を示している。
【0097】この図中で、各エンコードユニットENC
U2,ENCU4,ENCU5は、アングルの組合せを
意味している。シームレスアングルの場合には、アング
ルの組合せであるENCU2,ENCU4,ENCU5
において、ピクチャ数とGOP構造とが同じであるよう
にされる。
【0098】再生時にアングルを切替えると、再生装置
の再生ピックアップが所定のアングルのデータの位置に
移動し、データの読み出しを開始する。再生時のアング
ル切替えにかかるディレイを少なくするためには、この
移動距離が小さいことが必要であるため、アングルブロ
ックのデータは、ディスク上での配置がインターリーブ
処理されている。インターリーブされる単位はM個のG
OP単位で、Mの値はエンコード条件によって異なる。
【0099】図36は、このインターリーブ処理の一例
を示している。
【0100】このように、データをユニットごとにイン
ターリーブする作業は、個々のアングルごとのインター
リーブされるデータ量が異なる場合には、非常に複雑に
なり、アングル数が多いと処理時間も指数関数的に増加
するため問題となる。
【0101】そこで、図36(a)に示すように、イン
ターリーブされる単位内の各アングルのデータ量が、エ
ンコード後の出力データの段階で同じになるようにビッ
トを割り当てれば、図36(b)に示すようなダミーデ
ータの挿入(スタッフィング)は不要となり、アングル
部分でのビデオレートを上げることができる。よって、
図36(c)に示すように、アングル部分のビット配分
時に対応する各GOPに同じターゲット量を割り当て
る。つまり、同一のシームレスアングルブロックには同
じビット量を割り当てることが望ましい。
【0102】図37は、上記のようなシームレスアング
ルブロックの処理例を示している。
【0103】再生装置側でシームレスに再生するには、
VBVバッファ残量の境界での最後のピクチャのVBV
のバッファ残量の値と、次のスタート点のピクチャのV
BVのバッファ残量の値が、一定値以上に(例えば、VB
V MAX * 2/3) なるように制御すればよい。
【0104】図38(a)は、VBVバッファ残量の制
限を加えたエンコードを行った例を示している。また、
図38(b)は、このエンコード結果をデコーダ(再生
装置)で再生したときのバッファ残量を示している。
【0105】このように、デコーダでのバッファ残量
は、エンコード時のVBV計算値よりも必ず大きくな
る。デコーダでは、バッファがいっぱいになった場合に
は、ピックアップからバッファへの供給がストップする
ため、バッファのオーバーフローに関しては考慮する必
要はない。したがって、エンコード時にこのような条件
で制限を加えれば、切替時にバッファが破綻することが
ないため、シームレスな切替えが補償される。
【0106】また、シームレスアングルでは、GOP単
位で相互に切替えられることを想定しているため、図3
9に示すように、全てのGOPの最初と最後のVBVの
値は、一定値以上になるように制御されることになる。
【0107】このように、シームレスアングルブロック
は、通常のブロックに対して制約が多いため、同じビッ
トレートを割り当てても同等の画質を得ることが困難で
ある。そこで、シームレスアングルブロックへのビット
配分を優先して行なうことが望ましい。
【0108】ところが、いわゆるDVDなどの記録媒体
の複数の記録層に記録される、シームレスアングルブロ
ックを含むビデオデータに対して、各記録層ごとに閉じ
たビット配分が実行されると、記録層によってはシーム
レスアングルブロックに十分なレートが割り当てられな
い場合がでてくる。エンコード後に十分な画質が得られ
なかった場合には、条件を変更して、エンコード作業を
最初からやり直さなければならなくなる。
【0109】DVDのようなパッケージメディアのディ
スク作成のためのエンコード作業は、オーディオ、ビデ
オ、サブタイトル、メニューなどの各パートの作業が並
列して行われるため、ビデオのエンコード条件に修正が
必要になった場合には、例えばオーディオのエンコード
などのビデオ以外の工程にも影響が及ぶため、ビデオ以
外の工程も最初からやり直さなければならなくなる。こ
のように、ビット配分の適否の判定が遅れるほど、エン
コード作業のやり直しに伴う多くの無駄な工数がかかっ
てしまう。
【0110】本発明は、このような問題を解決するため
に行われたものであり、複数の記録領域に記録される圧
縮ビデオデータに対してビットの配分を行う際に、与え
られたエンコード条件下で、各記録領域の間の画質に大
きな差が無いようにビット配分できるかどうかを評価
し、画質が定められた条件を満たさない場合には、その
ばらつき量を最適もしくは許容できるようにするエンコ
ード条件の変更内容をオペレーターに提示できる機能を
有する2パスのエンコード方法および装置を提供するこ
とを目的とする。
【0111】
【課題を解決するための手段】上記の課題を解決するた
めに提案する本発明のエンコード方法は、ビデオ素材を
圧縮符号化して複数の記録領域に記録するエンコード方
法において、本エンコードに先立つプリエンコード工程
と、与えられたエンコード条件下で、各記録領域の間の
画質の差を許容できるビット配分の可否を評価する評価
工程と、上記各記録領域の間の画質の差が許容できるビ
ット配分の適正範囲を提示する提示工程とを有し、上記
与えられたエンコード条件または上記提示された適正範
囲のビット配分により本エンコードを行うことを特徴と
するものである。
【0112】また、上記の課題を解決するために提案す
る本発明の別のエンコード方法は、複数の記録領域にシ
ームレスアングルブロックを含むエンコードを行うエン
コード方法において、各記録領域ごとに与えられる上限
が考慮されたバイト数の総和および総フレーム数からエ
ンコードされた素材の平均レートを求める工程と、重み
係数を考慮したフレーム数の比率に従って、上記各記録
領域に記録されるべきシームレスアングルブロックに割
り当てられるバイト数を、上記各記録領域から確保する
工程と、上記シームレスアングルブロックに割り当てら
れるバイト数が差し引かれた残りのバイト数を、上記シ
ームレスアングルブロック以外のブロックに重み係数を
考慮した符号化難易度の和の比率で配分する工程とを有
することを特徴とするものである。
【0113】また、上記の課題を解決するために提案す
る本発明のエンコード装置は、ビデオ素材を圧縮符号化
して複数の記録領域に記録するエンコード装置におい
て、本エンコードに先立ってプリエンコードを行う手段
と、各記録領域の間の画質の差を許容できるビット配分
の可否を評価する評価手段と、上記各記録領域の間の画
質の差が許容できるビット配分の適正範囲を提示する提
示手段とを備え、上記与えられたエンコード条件または
上記提示された適正範囲のビット配分により本エンコー
ドを行うことを特徴とするものである。
【0114】また、上記の課題を解決するために提案す
る本発明の別のエンコード装置は、複数の記録領域にシ
ームレスアングルブロックを含むエンコードを行うエン
コード装置において、各記録領域ごとに与えられる上限
が考慮されたバイト数の総和および総フレーム数からエ
ンコードされた素材の平均レートを求める手段と、重み
係数を考慮したフレーム数の比率に従って、上記各記録
領域に記録されるべきシームレスアングルブロックに割
り当てられるバイト数を、上記各記録領域から確保する
手段と、上記シームレスアングルブロックに割り当てら
れるバイト数が差し引かれた残りのバイト数を、上記シ
ームレスアングルブロック以外のブロックに重み係数を
考慮した符号化難易度の和の比率で配分する手段とを備
えることを特徴とするものである。
【0115】上記の本発明によれば、複数の記録領域に
記録される圧縮ビデオデータに対してビットの配分を行
う場合に、各記録領域の間に画質の差が生じにくく、早
い時点でエンコード条件の見直しや変更を行うことがで
きるエンコード方法およびエンコード装置を提供でき
る。
【0116】
【発明の実施の形態】以下に、本発明の好ましい実施の
形態について図面を参照しながら説明する。
【0117】なお、本発明の具体的な説明に先だって、
以下の説明に用いる用語について説明する。
【0118】 encu_max :ENCU の個数 layer_max :記録層の個数 angle_num_max :アングルブロックに含まれるアン
グル数 angle_block_max :アングルブロック数 gen_bit[k] :仮エンコードによって測定された
k番目のフレームの符号化難易度(Difficulty)の値。
大きいほど画像が難しいことを示す。 ENCU_mode[encu_nb]:対象となるENCUがシームレス
アングルであるかどうかを示す情報。シームレスアング
ルのとき「1」,それ以外のとき「0」。 ENCU_angle[encu_nb] :対象となるENCUがどのアン
グルブロックに属するかどうかを示す情報。シームレス
アングル以外のときは「0」となる。 ENCU_weight[encu_nb]:対象となるシームレスアングル
ブロックのビット配分時の重み係数 ANGLE_weight[angle_blk] :対象となるシームレスアン
グルブロックのビット配分時の重み係数。同一のアング
ルブロックでのビット配分時の重みは同じ値にするた
め、該当するアングルブロックの「ENCU_weight 」の平
均値とする。(最大値、最小値でも良いが、この例では
平均値とする。) ANGLE_weight[ENCU_angle[encu_nb]] = (ENCU_angle の値が同じ ENCU の ENCU_weight の和)/angle_num ---- [15] ENCU_diff [encu_nb]: 対象となるENCUの符号難易
度(gen_bit[k])× ENCU_weight[encu_nb] の総和 ENCU_frame[encu_nb]: 対象となるENCUのフレーム
数の総和 ENCU_layer[encu_nb]: 対象となるENCUがどの記録
層に属するかを示す情報。 0 ≦ ENCU_layer[encu_nb]
≦ layer_max QTY_BYTES[layer_nb]: 対象となる記録層のスーパーバ
イザから指定された利用可能なバイト数 USB_BYTES[layer_nb]: 対象となる記録層での上限値を
考慮した利用可能なバイト数 QTY_change[layer_nb]:対象となる記録層で「QTY_BYTE
S 」が上限値を越えていたかどうかの情報。変更された
場合「1」,変更されていない場合「0」。
【0119】TOTAL_HEADER[layer_nb]:対象となる記録
層のGOPヘッダーの総バイト数TOTAL_FRAME [layer_n
b]:対象となる記録層の総フレーム数 SUM_DIFF[layer_nb] :対象となる記録層のシームレ
スアングル以外の 重み係数を掛けた符号化難易度の総
和 (ENCU_mode[encu_nb] == layer_nb かつ ENCU_mode[enc
u_nb] == 0 ) を満たす encu_nb に対して SUM_DIFF[layer_nb] = ΣENCU_diff[encu_nb] ---- [16] ここで、「=」は代入を意味しているのに対し、「==」
はC言語等で用いられるのと同様に等しいかどうかの条
件判定を意味するものである。
【0120】ANGLE_WFRAME[layer_nb]:対象となる記録
層の重み係数の反映されたシームレスアングルだけの総
フレーム量 (ENCU_mode[encu_nb] == layer_nb かつ ENCU_mode[enc
u_nb] > 0 ) を満たす「encu_nb」に対して ANGLE_WFRAME[layer_nb] = Σ(ENCU_frame[encu_nb] × ANGLE_weight[ENCU_angle[encu_nb]]) ---- [17] SUM_WFRAME:シームレスアングルの重み係数の反映された総フレーム量 SUM_WFRAME = ΣENCU_frame[encu_nb] (ただし、ENCU_mode[encu_nb] == 0 を 満たす encu_nb) + ΣANGLE_WFRAME[layer_nb] ---- [18] CHECK_USB_ [layer_nb]:対象となる記録層での利用可
能なバイト数の適正値 CHECK_SUPPLY[layer_nb]:対象となる記録層でのシーム
レスアングル以外の利用可能なバイト数の適正値 CHECK_DIFF [layer_nb]:対象となる記録層のシームレ
スアングル以外の Difficulty の総和の適正値 CHECK_FRAME [layer_nb]:対象となる記録層でのシーム
レスアングル以外の総フレーム数の適正値 supply_bytes[encu_nb] :対象となる ENCU に配分され
たバイト数 まず、本発明の実施の形態に係るエンコード方法におけ
る、各エンコードユニット(ENCU)へのビット配分
方法について、複数の記録領域を有する記録媒体である
DVDなどの記録媒体の複数の記録層に記録される圧縮
ビデオデータに対してビット配分を行う場合を例として
説明する。
【0121】本発明の実施の形態に係るエンコードは、
従来の方式を拡張して「QTY_BYTES」を各記録層に分け
て管理する。
【0122】各記録層の最大バイト数を MAXBYTES = MAXRATE × KT × total_framenb[layer_nb] ---- [19] とすると、 USB_BYTES[layer_nb] = min (QTY_BYTES[layer_nb], MAXBYTES) (0 ≦ layer_nb ≦ 記録層の個数「layer_max」) ---- [20] TOTAL_SUPPLY_BYTES[layer_nb] = ΣUSB_BYTES[layer_nb] - ΣTOTAL_HEADER[layer_nb] ---- [21] ALL_ANGLE_BYTES[layer_nb] = ANGLE_WFRAME_frame[layer_nb] /SUM_WFRAME×ΣTOTAL_SUPPLY_BYTES[layer_nb] ---- [22] ALL_SUPPLY_BYTES[layer_nb] = USB_BYTES[layer_nb] - ALL_ANGLE_BYTES[layer_nb] ---- [23] 前述したように、シームレスアングルブロックでは、対
応するブロック間のビット配分量が、ほぼ同じにされな
ければならないため、「layer_nb」で示される記録層の
各エンコードユニットENCUへのビット配分は、シー
ムレスアングルである場合と、それ以外である場合とで
分けて行われる。
【0123】すなわち、従来方式では各記録層ごとにシ
ームレスアングルのフレームの比率でビット配分が行わ
れていたが、本発明の実施の形態に係る方式では全ての
記録層の「TOTAL_SUPPLY_BYTES」に対して、フレーム数
に重み係数を考慮した比率でビット配分が行われる。
【0124】このようにすることで、全ての記録層にお
いてシームレスアングルブロックのレートを同じにでき
る。また、オペレータがレートを意識的にコントロール
したければ、重み係数を変えることにより実現できる。
【0125】(1)シームレスアングルブロックのEN
CUへのビット配分 (ENCU_layer[encu_nb] == layer_nb かつ ENCU_angle
[encu_nb] == 1) を満たす「encu_nb 」に対して、 supply_bytes[encu_nb] = (ENCU_frame[encu_nb] × ANGLE_weight[ENCU_angle[encu_nb]]) /ANGLE_WFRAME[layer_nb] × ALL_ANGLE_BYTES[layer_nb] ---- [24] (2)シームレスアングルブロック以外のENCUへの
ビット配分 (ENCU_layer[encu_nb] == layer_nb かつ ENCU_angle
[encu_nb] == 0) を満たす「encu_nb 」に対して、 supply_bytes[encu_nb] = ENCU_diff[encu_nb] /SUM_DIFF[layer_nb]×ALL_SUPPLY_BYTES[layer_nb] ---- [25] 次に、本発明の具体的な実施例を示す。なお以下では、 Gr_min_limit = 0.9 Gr_max_limit = 1.1 とし、説明の簡略化のために ENCU_weight[encu_nb] = 1.0 とする。
【0126】図1は、いわゆるDVDなどの記録媒体の
2つの記録層「Layer 0 」および「Layer 1 」に記録さ
れる、それぞれシームレスアングルブロックを含む圧縮
ビデオデータに対して、フレーム数の比率に応じてビッ
ト配分される例を示している。
【0127】ここで、「Layer 0 」のENCU(エンコ
ードユニット)2,ENCU4,ENCU5、および
「Layer 1 」のENCU7,ENCU9,ENCU10
は、シームレスアングルからなるアングルブロック1お
よびアングルブロック2である。
【0128】図2は、図1に例示した2つの記録層から
なる記録媒体に記録される圧縮ビデオデータに対する、
ビット配分の一具体例を示している。
【0129】すなわち、エンコード素材から、オーディ
オデータやサブタイトルデータなどのデータ量を記録媒
体の記録容量から差し引いたデータ量である「QTY_BYTE
S[0]」および「QTY_BYTES[1]」が、スーパーバイザから
与えられる。
【0130】この「QTY_BYTES[0]」および「QTY_BYTES
[1]」は、DVDのフォーマットで規定されている最大
レート制限やVBV制限などの条件を満たさない場合が
ある。そこで、「QTY_BYTES[0]」および「QTY_BYTES
[1]」は、これらの制限を満足するようにレート制限さ
れて「USB_BYTES[0]」および「USB_BYTES[1]」とされ
る。
【0131】そして、「USB_BYTES[0]」および「USB_BY
TES[1]」のヘッダ領域「TOTAL_HEADER[0] 」および「TO
TAL_HEADER[1] 」が差し引かれたデータ量が、「TOTAL_
SUPPLY_BYTES[0] 」および「TOTAL_SUPPLY_BYTES[1] 」
とされる。
【0132】ここで、上記の「TOTAL_SUPPLY_BYTES[0]
」および「TOTAL_SUPPLY_BYTES[1]」jは、各記録層の
アングル部分に対してはフレーム数の比率で配分され、
アングル以外の部分には符号化難易度(Difficulty)の
和の比率で配分される。
【0133】つまり、「Layer 0 」のENCU2,EN
CU4,ENCU5、および「Layer 1 」のENCU
7,ENCU9,ENCU10に対しては、「TOTAL_SU
PPLY_BYTES[0] 」および「TOTAL_SUPPLY_BYTES[1] 」が
フレーム数の比率で配分され、「Layer 0 」のENCU
1,ENCU3、および「Layer 1 」のENCU6,E
NCU8に対しては、「TOTAL_SUPPLY_BYTES[0] 」およ
び「TOTAL_SUPPLY_BYTES[1] 」を符号化難易度(Diffic
ulty)の和の比率で配分される。このように配分された
ビットが、「SUPPLY_BYTES」とされる。
【0134】図3および図4は、比較のために従来方式
によるビット配分例を示している。以下では、この従来
方式を参照しながら、本発明によるビット配分方式につ
いてさらに説明する。
【0135】図3は、従来方式により、DVDなどの記
録媒体の2つの記録層「Layer 0 」および「Layer 1 」
に記録される、それぞれシームレスアングルを含む対し
て、フレーム数の比率に応じてビット配分される様子を
示している。
【0136】ここで、図3(a)中の「Layer 0 」のE
NCU2,ENCU4、および「Layer 1 」のENCU
6,ENCU8は、シームレスアングルからなるアング
ルブロック1およびアングルブロック2とされる。
【0137】図3(b)に示すように、これらの各記録
層ごとに、ヘッダ領域「TOTAL_HEADER[0] 」および「TO
TAL_HEADER[1] 」が差し引かれたデータ量が、「TOTAL_
SUPPLY_BYTES[0] 」および「TOTAL_SUPPLY_BYTES[1] 」
とされる。
【0138】ここで、上記の「TOTAL_SUPPLY_BYTES[0]
」および「TOTAL_SUPPLY_BYTES[1]」は、各記録層のア
ングル部分に対してはフレーム数の比率で配分され、ア
ングル以外の部分に対しては符号化難易度(Difficult
y)の和の比率で配分される。なお、ここでは説明の簡
略化のため、TOTAL_HEADER = 0 としている。
【0139】図4は、図3の例における各エンコードユ
ニット(ENCU)に対するビット配分結果をまとめて
示している。
【0140】この例では、アングルブロック1のレート
に対して、アングルブロック2のレートが不十分である
ことが分かる。このように、従来方式によるビット配分
では、シームレスアングルブロックにおいて、エンコー
ド制約が厳しいため、レートが低いと満足できる画質が
得られないことが非常に多い。
【0141】次に、上記のような問題点を解決するため
に提案された、本発明の実施の形態に係るビット配分方
式について説明する。図5は、本発明の実施の形態に係
る方式により、DVDの2つの記録層「Layer 0 」およ
び「Layer 1 」に記録される、それぞれシームレスアン
グルを含む圧縮ビデオデータに対して、フレーム数の比
率に応じてビット配分される様子を示している。
【0142】図5(a)中の、「Layer 0 」のENCU
2,ENCU4、および「Layer 1」のENCU6,E
NCU8は、図3(a)と同様のシームレスアングルか
らなるアングルブロック1およびアングルブロック2と
される。
【0143】そして、図5(b)に示すように、これら
の各記録層から、ヘッダ領域「TOTAL_HEADER[0] 」およ
び「TOTAL_HEADER[1] 」が差し引かれたデータ量が、
「TOTAL_SUPPLY_BYTES[0] 」および「TOTAL_SUPPLY_BYT
ES[1] 」とされる。
【0144】ここで、本発明の実施の形態に係るビット
配分方式においては、上記の「TOTAL_SUPPLY_BYTES[0]
」および「TOTAL_SUPPLY_BYTES[1] 」が、最初に、各
記録層のアングル部分に対して全体のレートからフレー
ム数の比率で配分され、次に、アングル以外の部分に対
しては符号化難易度(Difficulty)の和の比率で配分さ
れる。なお、ここでも説明の簡略化のため、TOTAL_HEAD
ER = 0 としている。
【0145】図6は、図5の例における、各エンコード
ユニット(ENCU)に対するビット配分結果をまとめ
て示している。
【0146】このように、本発明の実施の形態に係るビ
ット配分によれば、例えばDVDの2つの記録層のどち
らのアングルブロックのレートも同じにすることが可能
となっている。
【0147】ところが、上記のような方法により複数の
記録層にビット配分すると、シームレスアングルでない
部分に、符号化難易度に応じて配分されるビット量にば
らつきが生じることがある。図5,図6に示したビット
配分の例でも、調整前の段階では、ENCU3のレート
とENCU7のレートとが大きく異なっている。
【0148】このような現象は、スーパーバイザから与
えられた「QTY_BYTES 」が適切でなかったために生じる
が、スーパーバイザがエンコード条件を決める際には、
素材の画像の難しさ(符号化難易度)の情報がまだ得ら
れていないため、最適なエンコード条件を発行できな
い。
【0149】そこで、このような状況においては、ビデ
オエンコードシステム側で、各記録層間のビット配分の
ばらつき量を計算し、所定の規定値を越えている場合に
は、警告を発し、エンコード条件の再発行を促すことが
必要となる。
【0150】図7は、上述した本発明の実施の形態に係
るビット配分計算の基本的な手順を示している。
【0151】まず、ステップS1でエンコード条件が入
力され、ステップS2で符号化難易度(Difficulty)パ
ラメータが入力さる。
【0152】次に、ステップS3で、符号化難易度と共
に測定された各画像のDC値や動きベクトル量MEの大
きさのパラメータの変化量から、シーンが変化するポイ
ントが検出され、画質改善のためのピクチャタイプの変
更処理などが行われる。
【0153】次に、ステップS4では、チャプター(CH
APTER )境界処理が行われる。再生装置でのチャプター
サーチ時には、再生されるピクチャが、特定されないピ
クチャからジャンプしてくることになる。その場合でも
再生画像が乱れないようにするため、ステップS5で
は、このチャプタ境界処理によってチャプターの位置が
必ずGOPの先頭になるようにピクチャタイプが変更さ
れたり、GOP長が制限される。
【0154】次に、ステップS6では、上記の一連の作
業の結果として変更された、Iピクチャ,Pピクチャ,
Bピクチャなどのピクチャタイプに合わせて、符号化難
易度(Difficulty)の値が補間/補正される。
【0155】次に、ステップS7では、ステップS6に
おける補間/補正処理によって得られた符号化難易度、
およびエンコードされる素材全体に与えられたビット数
「SUPPLY_BYTES」に応じて、各エンコードユニットEN
CUごとにビット配分が行われる。
【0156】次に、ステップS8では、各記録層の間の
ビット配分量のばらつきが検出される。
【0157】そして、ステップS9で、ステップS8で
検出された記録層間のビット配分のばらつき量が許容で
きるかどうかが評価され、許容できない(No)場合に
はステップS10でワーニング(警告)が表示され、ス
テップS11でエンコードを続けるかどうかがオペレー
タにより判断される。そして、ステップS11で、当初
のエンコード条件で処理を続けるとされた場合にはステ
ップS12に進む。一方、ステップS9で、ステップS
8で評価された記録層間のばらつき量が許容できる(Y
es)場合にはそのままステップS12に進む。
【0158】なお、ステップS11でエンコードを続け
ないとされた場合には、ステップS15で、ビット配分
量などの条件の適正値がオペレータに提示されて、処理
が終了される。この場合には、ステップS1で入力され
るエンコード条件等が見直されて、エンコード条件の適
否が評価される。
【0159】ステップS12では、ステップS6におけ
る補間/補正処理によって得られた符号化難易度、およ
びエンコードされる素材全体に与えられたビット数「SU
PPLY_BYTES」に応じて、各ピクチャごとのターゲットビ
ット(Target bit)数が計算される。
【0160】次に、ステップS13では、エンコード結
果が記録される記録媒体のアドレス(ADDRESS )が計算
される。
【0161】そして、ステップS14で、エンコーダ用
コントロールファイルが作成されて、ビット配分計算処
理が終了する。そして、このコントロールファイルによ
り最終的なエンコードである本エンコードが実行され
る。
【0162】次に、上述した各記録層の間でのビット配
分のばらつき量を計算するためのアルゴリズムについて
説明する。
【0163】いわゆるDVDなどの記録媒体の各記録層
に配分されるビット量のばらつき量は、全体のシームレ
スアングルブロック以外のビット配分量と符号化難易度
(Difficulty)の総和の比「Gr_avr 」に対して、各記
録層の値が規定値以内であるかどうかにより評価され
る。
【0164】上記の規定値に入らない場合には、各記録
層に記録されるフレーム数はそのままにした場合に配分
されるバイト数(「QTY_BYTES 」から「USB_BYTES 」に
置き換えられている)の適正範囲が計算される。
【0165】また、これとは別に、DVDなどの記録媒
体の各記録層へのビット配分量を同じにした場合に、各
記録層に記録されるフレーム数の適正範囲が計算され
る。このことは、素材が記録される境界をずらすことを
意味している。
【0166】以下では、以上説明した本発明の実施の形
態に係るエンコード方法におけるビット配分計算につい
て、さらに具体的に説明する。
【0167】以下の説明では、複数層の場合でのフレー
ム数もしくはバイト数の適正値の計算は、最初の記録層
から順次実行される。
【0168】[STEP 1] 「Gr_avr」の計算 Gr_avr = ΣALL_SUPPLY_BYTES[layer_nb]/ΣSUM_DIFF[layer_nb] (0 ≦ layer_nb ≦ layer_max) ---- [26]
【0169】[STEP 2] フレーム数固定条件での「USB_
BYTES」調整範囲の提示ループ初期化 CHECK_USB_[layer_nb] = USER_BYTES[layer_nb] ---- [27] CHECK_SUPPLY[layer_nb] = ALL_SUPPLY_BYTES[layer_nb] ---- [28] CHECK_DIFF [layer_nb] = SUM_DIFF[layer_nb] ---- [29] ただし、0 ≦ layer_nb ≦ layer_max) layer_nb = 0 とする。
【0170】[STEP 3] 「Gr_check」の計算 gr[layer_nb] = CHECK_SUPPLY[layer_nb]/SUM_DIFF[layer_nb] ---- [30] GR[layer_nb] = gr[layer_nb]/Gr_avr ---- [31] (1)Gr_min_limit ≦ GR[layer_nb] ≦ Gr_max_limit
の場合 この記録層の画質の全体に対するばらつきは許容範囲で
ある。
【0171】Gcheck [layer_nb] = 0 (2)GR[layer_nb] < Gr_min_limit の場合 CHECK_SUPPLY[layer_nb] が CHECK_DIFF[layer_nb] に
対して不足している。
【0172】Gcheck [layer_nb] = 1 (3)Gr_max_limit < GR[layer_nb] の場合 CHECK_SUPPLY[layer_nb] が CHECK_DIFF[layer_nb] に
対して余裕がある。
【0173】 Gcheck [layer_nb] = 2 ---- [32]
【0174】[STEP 4] 調整範囲の提示 「USB_BYTES 」調整後に、「USB_BYTES 」の最大バイト
数制限を越えないようにされなければならない。また、
すでに最大バイト数制限を受けている記録層については
「USB_BYTES 」の増加は許されない。
【0175】QTY_change[layer_nb] == 0かつ QTY_chan
ge[layer_nb+1] == 0かつ Gcheck[layer_nb] == 1 or 2
またはQTY_change[layer_nb] == 1かつ QTY_change[lay
er_nb+1] == 0かつ Gcheck[layer_nb] == 2または QTY_change[layer_nb] == 0 かつ QTY_change[layer_nb+1] == 1 かつ Gcheck[layer_nb] == 1 ---- [33] の条件を満たす「layer_nb」の記録層の「USB_BYTES 」
の調整量を提示する。
【0176】 MAXBYTES = MAXRATE×KT×total_framenb[layer_nb] ---- [34] Gr_min_limit×Gr_avr×CHECK_DIFF[layer_nb] ≦ CHECK_SUPPLY[layer_nb] かつ CHECK_SUPPLY[layer_nb] ≦ min(Gr_max_limit×Gr_avr×CHECK_DIFF[layer_nb], MAXBYTES - ALL_ANGLE_BYTES[layer_nb]) ---- [35] 仮に、 CHECK_SUPPLY[layer_nb] = Gr_avr×CHECK_DIFF[layer
_nb] としたとすれば、次の「layer_nb」の「CHECK_SUPPLY」
は、以下のように修正される。
【0177】 CHECK_SUPPLY[layer_nb+1] = min(CHECK_SUPPLY[layer_nb] + CHECK_SUPPLY[layer_nb+1] -CHECK_SUPPLY[layer_nb],MAXBYTES-ALL_ANGLE_BYTES[layer_nb+1]) ---- [36] CHECK_USB[layer_nb] = CHECK_SUPPLY[layer_nb] + ALL_ANGLE_BYTES[layer_nb] + TOTAL_HEADER[layer_nb] ---- [37] CHECK_USB[layer_nb+1] = CHECK_SUPPLY[layer_nb+1] + ALL_ANGLE_BYTES[layer_nb+1] + TOTAL_HEADER[layer_nb+1] ---- [38]
【0178】[STEP 5] layer_nb = layer_nb + 1 とし、「layer_nb」が「layer_max 」と同じ値でなけれ
ば[STEP 3]に戻る。
【0179】[STEP 6]「USB_BYTES」数固定条件での記
録層へのフレーム数調整範囲の提示ループ初期化 CHECK_USB_ [layer_nb] = USER_BYTES[layer_nb] CHECK_SUPPLY[layer_nb] = ALL_SUPPLY_BYTES[layer_n
b] CHECK_DIFF [layer_nb] = SUM_DIFF[layer_nb] CHECK_FRAME [layer_nb] = total_frame[layer_nb] ただし、0 ≦ layer_nb ≦ layer_max layer_nb = 0 とする。
【0180】[STEP 7] 「Gr_check」の計算 gr[layer_nb] = CHECK_SUPPLY[layer_nb]/CHECK_DIFF[l
ayer_nb] GR[layer_nb] = gr[layer_nb]/Gr_avr (1)Gr_min_limit ≦ GR[layer_nb] ≦ Gr_max_limit
の場合 Gcheck [layer_nb] = 0 (2)GR[layer_nb] < Gr_min_limit の場合 Gcheck [layer_nb] = 1 (3)Gr_max_limit < GR[layer_nb] の場合 Gcheck [layer_nb] = 2
【0181】[STEP 8] 調整範囲の提示 フレーム数調整後に、「USB_BYTES 」の最大バイト数制
限を越えないようにされなければならない。また、すで
に最大バイト数制限を受けている記録層については、フ
レーム数の削減は許されない。
【0182】QTY_change[layer_nb] == 0かつ QTY_chan
ge[layer_nb+1] == 0かつ Gcheck[layer_nb] == 1 or 2
またはQTY_change[layer_nb] == 1かつ QTY_change[lay
er_nb+1] == 0かつ Gcheck[layer_nb] == 2またはQTY_c
hange[layer_nb] == 0かつ QTY_change[layer_nb+1] ==
1かつ Gcheck[layer_nb] == 1の条件を満たす「layer_
nb」の記録層のフレーム数の調整量が提示される。
【0183】CHECK_SUPPLY[layer_nb]/Gr_max_limit/Gr
_avr ≦ CHECK_DIFF[layer_nb] かつ CHECK_DIFF[layer_nb] ≦ CHECK_SUPPLY[layer_nb]/Gr_min_limit/Gr_avr ---- [40] また、 USB_BYTES[layer_nb] ≦ MAXRATE×KT×CHECK_FRAME[la
yer_nb] より CHECK_USB[layer_nb]/MAXRATE/ KT ≦ CHECK_FRAME[layer_nb] ---- [41] を満たすフレーム数の境界が検出される。
【0184】具体的には、 MAX_CHECK_DIFF = CHECK_SUPPLY[layer_nb]/Gr_min_lim
it/Gr_avr MIN_CHECK_DIFF = CHECK_SUPPLY[layer_nb]/Gr_max_lim
it/Gr_avr MIN_CHECK_FRAME = CHECK_USB[layer_nb]/MAXRATE/ KT また、layer_nb == layer_max -1 のとき、 MAX_CHECK_FRAME = CHECK_FRAME[layer_nb] + CHECK_FR
AME[layer_nb]- CHECK_USB[layer_nb+1]/MAXRATE/ KT の制約も考慮される。
【0185】 CHECK_FRAME[layer_nb] = CHECK_DIFF[layer_nb] = 0 とし、対象となる「layer_nb」で示される記録層のエン
コードユニット(ENCU)のうち、シームレスアング
ル以外のENCUの gen_bit[k]×ENCU_weight[encu_nb] (0 ≦ k ≦ k_max : k フレーム目の Difficulty の大
きさ)を演奏時間の早い順から「CHECK_DIFF[layer_n
b]」に順次加算し、フレームのカウント数を「CHECK_FR
AME[layer_nb] 」に順次加算していくことで、上記の条
件を満たす k の範囲(フレームの範囲)を求めてい
く。
【0186】この際に、範囲内に境界として望ましいチ
ャプターポイントやシーンチェンジポイントがあれば、
その情報も提示される。仮に、 CHECK_DIFF[layer_nb] = CHECK_SUPPLY[layer_nb]/Gr_a
vr となるように境界を変更したとして、境界変更対象とな
る記録層の符号化難易度(Difficulty)の総和とフレー
ム数を変更する。
【0187】この結果、次の「layer_nb」の符号化難易
度の総和とフレーム数は、以下のように修正される。 CHECK_DIFF[layer_nb+1] = CHECK_DIFF[layer_nb] + CHECK_DIFF[layer_nb+1] - CHECK_DIFF[layer_nb] ---- [42] CHECK_FRAME[layer_nb+1] = CHECK_FRAME[layer_nb] + CHECK_FRAME[layer_nb+ 1] - CHECK_FRAME[layer_nb] ---- [43]
【0188】[STEP 9] layer_nb = layer_nb + 1 と
し、「layer_nb」が「layer_max 」と同じ値でなければ
[STEP 7] に戻る。
【0189】各記録層のフレーム数を変えるということ
は、素材の記録される場所を変えることを意味するた
め、素材の切れ目(シーンの切れ目)などの情報が非常
に重要になる。
【0190】図8は、以上説明した本発明の実施の形態
に係るエンコード方法の[STEP 1]〜[STEP 5]の処理
の流れを示している。
【0191】ステップS21では、各記録層へのビット
配分数「QTY_BYTES 」をスーパーバイザから受け取る。
【0192】次に、ステップS22では、各記録層の最
大バイト数制限を考慮して「USB_BYTES 」が求められ
る。
【0193】次に、ステップS23では、各記録層の
「USB_BYTES 」から「GOP_Header」のバイト数を除いた
ものの総和「ΣTOTAL_SUPPLY_BYTES」が求められる。
【0194】次に、ステップS24では、各記録層のシ
ームレスアングルブロックの重み係数を考慮した総フレ
ーム量「ANGLE_WFRAME」が求められ、「ΣTOTAL_SUPPLY
_BYTES」がフレーム量「frame×weight」の比率で各ア
ングルブロックに配分される。
【0195】次に、ステップS25では、各記録層の
「TOTAL_SUPPLY_BYTES」からシームレスアングルへの配
分ビット数の総和を引いて、「ALL_SUPPLY_BYTES」が求
められる。
【0196】次に、ステップS26では、各記録層毎の
符号簡易度(Difficulty)の総和「SUM_DIFF」と、各E
NCUごとの重み係数を考慮した符号簡易度の総和「EN
CU_DIFF 」との比率から、「ALL_SUPPLY_BYTES」が各E
NCUブロックに配分される。
【0197】そして、ステップS27では、各記録層ご
とのビット配分のばらつき量が計算される。このばらつ
き量が規定値を越えていたら、オペレータおよびスーパ
ーバイザに警告され、適正値が計算されて提示される。
【0198】以上の手順により、本発明の実施の形態に
係るエンコード方法の[STEP 1]〜[STEP 5]の処理が
終了する。
【0199】また、図9および図10に、前述した本発
明の実施の形態に係るエンコード方法の[STEP 6]〜[ST
EP 9]の処理の流れを示す。これらの各ステップは、フ
レーム数固定の条件での USB_BYTES の調整範囲の提示
方法を示している。
【0200】図9のステップS31では、全体のビット
配分のばらつき度の平均値「Gr_avr」が計算される。
【0201】Gr_avr = ΣALL_SUPPLY_BYTES[layer_nb]
/ΣSUM_DIFF[layer_nb] 次に、ステップS32では、フレーム数固定の条件での
「USB_BYTES 」調整範囲の提示用に値が初期化される。
【0202】 CHECK_USB_ [layer_nb] = USER_BYTES[layer_nb] CHECK_SUPPLY[layer_nb] = ALL_SUPPLY_BYTES[layer_n
b] CHECK_DIFF [layer_nb] = SUM_DIFF[layer_nb] CHECK_FRAME [layer_nb] = total_framenb[layer_nb] そして、ステップS33で、layer_nb = 0 とされる。
【0203】次に、図10のステップS34で、ばらつ
き度が判定される。
【0204】Gr [layer_nb]= CHECK_SUPPLY[layer_nb]
/CHECK_DIFF[layer_nb]/Gr_avr (1)Gr_min_limit ≦ Gr [layer_nb] ≦ Gr_max_limi
t の場合 Gcheck[layer_nb] = 0 (2)Gr [layer_nb] < Gr_min_limit の場合 Gcheck[layer_nb] = 1 (3)Gr_min_limit < Gr [layer_nb]の場合 Gcheck[layer_nb] = 2 次に、ステップS35で、以下の条件を満たす「layer_
nb」の記録層の「USB_BYTES 」の調整範囲が提示され
る。
【0205】QTY_change [layer_nb]== 0 かつ QTY_cha
nge [layer_nb+1]==0かつ Gcheck[layer_nb]==1 or 2ま
たはQTY_change [layer_nb]==1 かつ QTY_change [laye
r_nb+1]==0かつ Gcheck[layer_nb]==2またはQTY_change
[layer_nb]==0 かつ QTY_change [layer_nb+1]==1かつ
Gcheck[layer_nb]==1 適正範囲 Gr_min_limit × Gr_avr × CHECK_DIFF[layer_nb]≦ C
HECK_SUPPLY[layer_nb] かつ CHECK_SUPPLY[layer_nb]≦ min(Gr_min_limit×Gr_avr
×CHECK_DIFF[layer_nb],MAXBYTE-ALL_ANGLE_BYTES[la
yer_nb]) 次に、ステップS36で、layer_nb = layer_nb + 1 と
される。
【0206】そして、ステップS37で、layer_nb >
layer_max を満足するかどうかが判断され、この条件を
満足しないときにはステップS34以降の手順が繰り返
される。一方、ステップS37の条件を満足する場合に
は、図11および図12に示す、バイト数固定の条件で
のフレーム数の調整範囲の提示方法の処理手順に進む。
【0207】図11のステップS38で、USB_BYTES 数
固定の条件での記録層へのフレーム数の調整範囲の提示
用に値が初期化される。
【0208】 CHECK_USB_ [layer_nb] = USER_BYTES[layer_nb] CHECK_SUPPLY[layer_nb] = ALL_SUPPLY_BYTES[layer_n
b] CHECK_DIFF [layer_nb] = SUM_DIFF[layer_nb] CHECK_FRAME [layer_nb] = total_framenb[layer_nb] なお、ステップS38に先立って、全体のビット配分の
ばらつき度の平均値「Gr_avr」が計算される必要がある
が、図9のステップS31で得られた値を用いることが
できる。
【0209】そして、ステップS39で、layer_nb = 0
とされる。
【0210】次に、図12のステップS40で、ビット
配分量のばらつき度が判定される。
【0211】 Gr [layer_nb] = CHECK_SUPPLY[layer_nb]/CHECK_DIFF[layer_nb]/Gr_avr Gr_min_limit ≦ Gr [layer_nb] ≦ Gr_max_limit の場合 Gcheck[layer_nb] = 0 Gr [layer_nb] < Gr_min_limit の場合 Gcheck[layer_nb] = 1 Gr_min_limit < Gr [layer_nb]の場合 Gcheck[layer_nb] = 2 次に、ステップS41で、以下の条件を満たす「layer_
nb」の記録層のフレーム数の調整範囲が提示される。
【0212】QTY_change [layer_nb]== 0 かつ QTY_cha
nge [layer_nb+1]==0かつ Gcheck[layer_nb]==1 or 2ま
たはQTY_change [layer_nb]==1 かつ QTY_change [laye
r_nb+1]==0かつ Gcheck[layer_nb]==2またはQTY_change
[layer_nb]==0 かつ QTY_change [layer_nb+1]==1かつ
Gcheck[layer_nb]==1 適正範囲 MAX_CHECK_DIFF = CHECK_SUPPLY[layer_nb]/Gr_min_l
imit/Gr_avr MIN_CHECK_DIFF = CHECK_SUPPLY[layer_nb]/Gr_max_l
imit/Gr_avr MIN_CHECK_FRAME = CHECK_USB[layer_nb]/MAXRATE/kT とすると、 MIN_CHECK_DIFF ≦ CHECK_DIFF[layer_nb] ≦ MAX_CHEC
K_DIFF の条件を満たし、かつ MIN_FRAME = CHECK_DIFF = 0 とし、layer_nb 層のENCUのうち、シームレスアン
グル以外のENCUの Difficulty × ENCU_weight の大きさを、演奏時間の早い順から、「CHECK_DIFF」に
フレームのカウント数を、「CHECK_FRAME 」に、それぞ
れ順次加算していく。
【0213】この際に、範囲内に境界として望ましいチ
ャプターポイント、シーンチェンジポイントがあれば、
その情報も提示される。
【0214】次に、ステップS42で、layer_nb = lay
er_nb + 1 とされる。
【0215】そして、ステップS43で、layer_nb >
layer_max を満足するかどうかが判断され、この条件を
満足しないときにはステップS40以降の手順が繰り返
される。一方、ステップS43の条件を満足する場合に
は、以上の処理が終了する。
【0216】各記録層に割り当てるビット数やフレーム
数を変更すると、「MAX_BYTES 」条件によって新たに制
限を受けることになる。このことから、逆に、すでにそ
のような制限を受けている場合には、ビット数やフレー
ム数を変更できない場合があることが予想される。
【0217】図13は、2層の記録層を有する、いわゆ
るDVDなどの記録媒体において、「MAXBYTES」制限を
すでに受けている場合の処理の分類を示している。
【0218】また、図14は、4層の記録層を有する記
録媒体において、上記の条件を適応させた場合の例を示
している。
【0219】以下に、2層の記録層を有するDVDなど
のディスクに対して、ビット配分を行う場合を例とし
て、上記の処理の分類について説明する。なお、以下の
説明では、 Gr_min_limit = 0.9 Gr_max_limit = 1.1 とする。 (1)GR[0] < 0.9 の場合 ALL_SUPPLY_BYTES[0] が SUM_DIFF[0] に対して不足し
ている。 (2)1.1 < GR[0] の場合 ALL_SUPPLY_BYTES[1] が SUM_DIFF[1] に対して不足し
ている。 (3)上記(1),(2)以外の場合 処理を行なわない。
【0220】<A>フレーム数固定の場合の USB_BYTES
の適正範囲「CHECK_USB」 0.9×Gr_avr×CHECK_DIFF[0]≦ CHECK_SUPPLY[0] ≦ 1.
1×Gr_avr×CHECK_DIFF[0] CHECK_USB[0]= CHECK_SUPPLY[0] + ALL_ANGLE_BYTES[0]
+ TOTAL_HEADER[0]
【0221】<B>「USB_BYTES」数固定の場合の記録
フレーム数の適正範囲「CHECK_FRAME」 CHECK_SUPPLY[0]/1.1/Gr_avr≦ CHECK_DIFF[0] ≦ CHEC
K_SUPPLY[0]/0.9/Gr_avr を満たす範囲を探す。
【0222】「layer 0 」のシームレスアングル以外の
ENCUの gen_bit[k]×_ENCU_weight[encu_nb] を順次加算して「CHECK_DIFF[0] 」を再計算していく過
程で、上記の条件を満たすkの範囲を求めていく。この
際に、範囲内に境界として望ましいチャプターポイント
やシーンチェンジポイントがあれば、その情報も提示す
る。このようにして適正範囲に修正して再度ビット配分
した例を、図15〜図18に示した。
【0223】どの例においても、符号簡易度(Difficul
ty)の和とビット配分量との関係が理想的になっている
ことが分かる。
【0224】次に、本発明の実施の形態に係るエンコー
ド装置について説明する。
【0225】図19は、本発明の実施の形態に係るビデ
オエンコードシステムの構成例を示している。
【0226】このビデオエンコードシステムは、上述し
た本発明の実施の形態に係るエンコード方法を適用し
て、ディジタルビデオディスク(DVD)用にビデオ情
報を圧縮符号化してオーサリングなどを行うために用い
ることができるものであり、その基本的な構成は図21
に示した従来のビデオエンコードシステムの構成とほぼ
同様とすることができる。
【0227】主コントローラ11は、このビデオエンコ
ードシステムに割り当てられた計算機により構成され、
ネットワーク2を介して接続されるスーパーバイザ3と
の間でデータ通信を行って、このビデオエンコードシス
テム全体の動作を制御する。
【0228】具体的には、主コントローラ11は、グラ
フィカルユーザーインターフェース(GUI:Graphica
l User Interface)部14の管理により、スーパーバイ
ザ3からの制御を受け付けると共に、図示していないオ
ペレータの操作を受け付け、このGUI部14により管
理されるビットアサイン部15,エンコーダコントロー
ル部16,VTRコントロール部17により、エンコー
ダ12,ビデオテープレコーダ(VTR)10の動作を
制御する。これにより、主コントローラ11は、スーパ
ーバイザ3から通知されたエンコード条件に従って、処
理対象の素材を符号化処理し、その処理結果をスーパー
バイザ3に通知する。さらに、主コントローラ11は、
GUI部14を介してオペレータの設定を受け付けて、
上記の符号化の詳細な条件を変更できるようにされてい
る。
【0229】具体的には、主コントローラ11のGUI
部14は、ビットアサイン部15のビット配分プログラ
ム「BIT_ASSIGN」,エンコーダコントロール部16のエ
ンコーダコントロールプログラム「CTRL_ENC」およびV
TRコントロール部17のVTRコントロールプログラ
ムの3つのプログラムを管理している。
【0230】また、ビットアサイン部15は、スーパー
バイザ3から通知される符号化ファイル「v.enc 」に従
って符号化処理の条件をフレーム単位で決定し、この条
件による制御データをファイル形式「CTL file」により
コントロール部16に通知する。
【0231】このとき、ビットアサイン部15は、符号
化処理におけるビット配分を設定し、さらに設定された
条件をオペレータの操作に応じて変更する。さらに、ビ
ットアサイン部15は、データ圧縮されたビデオデータ
D2が、エンコーダ12かあSCSIなどを介してRA
ID4に記録されると、RAID4上のアドレスデータ
「v.adr 」を、後段における多重化処理に必要なデータ
量等の情報「vxxx.aui」と共にスーパーバイザ3に通知
する。
【0232】エンコーダコントロール部16は、ビット
アサイン部15から通知される制御ファイル「CTL fil
e」に従って、イーサネットETHER などを介してエンコ
ーダ12の動作を制御する。さらに、エンコーダコント
ロール部16は、符号化処理に要する符号化難易度(di
fficulty)のデータをフレーム単位でビットアサイン部
15に通知し、ビデオデータD2が記録されたRAID
4の記録アドレスのデータ「v.adr 」,後の多重化処理
に必要なデータ「vxxx.aui 」をビットアサイン部15
に通知する。
【0233】VTRコントロール部17は、スーパーバ
イザ103から通知される編集リストに従って、RS−
422(9ピンリモート)などを介してビデオテープレ
コーダ(VTR)10の動作を制御し、所望の編集対象
の素材を再生する。
【0234】ビデオテープレコーダ(VTR)10は、
主コントローラ11を介してスーパーバイザ3から通知
される編集リストに従って、磁気テープに記録されたビ
デオデータD1を再生して、処理対象の「SDI 」,「RE
F V 」,「TIME CODE 」をエンコーダ12に出力する。
このVTR10としては、通常はディジタルVTRが用
いられる。
【0235】エンコーダ12は、スーパーバイザ3から
主コントローラ11を介して通知される条件に従って動
作を切り換え、VTR10から出力されるビデオデータ
D1を、MPEG(Moving Picture Experts Group)の
手法により圧縮符号化する。
【0236】このとき、エンコーダ12は、符号化処理
の結果を主コントローラ11に通知し、主コントローラ
11は、そのデータ圧縮における符号化の条件を制御
し、発生するビット量を制御する。これにより、主コン
トローラ11は、データ圧縮により発生するビット量を
フレーム単位で把握できる。
【0237】また、エンコーダ12は、2パスエンコー
ドにおける事前のエンコード条件設定の処理時(仮エン
コード時)には、VTR10からはビデオデータを単に
データ圧縮して処理結果を主コントローラ11に通知す
るだけであるが、最終的なデータ圧縮処理時(本エンコ
ード時)には、圧縮処理されたビデオデータD2をRA
ID4に記録し、さらにそのデータが記録されたアドレ
ス,データ量等を主コントローラ11に通知する。
【0238】モニタ装置13は、エンコーダ12により
データ圧縮されたビデオデータD2をモニタできるよう
に構成される。このモニタ装置13ににより、このビデ
オエンコードシステムでは、オペレータがデータ圧縮処
理の結果を必要に応じて確認する、いわゆるプレビュー
を行うことができる。そして、オペレータが、このプレ
ビュー結果に基づいて主コントローラ11を操作して、
符号化の条件を詳細に変更できるようにされている。
【0239】また、モニタ装置13には、仮エンコード
時に測定された符号化難易度に基づいて、与えられたエ
ンコード条件によるビット配分が、記録層間に許容でき
ない程の画質の差を生じることの警告や、適正とされる
ビット配分などの条件が表示される。
【0240】以上のように、本発明の実施の形態に係る
エンコード方法およびエンコード装置によれは、ビデオ
の2パスエンコード方式の場合に、スーパーバイザから
与えられたエンコード条件による複数の記録層または記
録領域の画質のばらつき量を本エンコードの実行前に予
測し評価できる。
【0241】なお、ここでは、DVDの複数層のビット
配分について説明したが、必ずしも記録層間ではなく、
同一記録層内に固定された、パーティションが設けられ
た複数の記録領域間に亘って記録されるデータに対する
ビット配分にも適応可能である。
【0242】また、ここでは、複数の記録層を有する記
録媒体に記録されるビデオデータのエンコードについて
説明したが、本発明の実施の形態に係る処理の基本的な
アルゴリズムは、2パス可変ビットレートエンコードを
行うオーディオ処理システムで、オーディオデータを複
数の固定された記録領域に対して、音質のばらつきを少
なくなるようにビット配分するシステムに対しても適応
可能である。
【0243】
【発明の効果】本発明によれば、2パスエンコード方式
の場合に、本エンコードの実行前にスーパーバイザから
与えられたエンコード条件による複数の記録層または記
録領域の画質のばらつき量を予測評価できるようにした
ため、早い時点でスーパーバイザへの条件の見直しを促
すことができ、DVDなどのパッケージメディアのディ
スク作成のためのエンコード作業工数を削減することが
できる。
【図面の簡単な説明】
【図1】2つの記録領域に記録されるシームレスアング
ルブロックを含むデータに対して、フレーム数の比率に
応じてビット配分される様子を説明するための図であ
る。
【図2】上記のビット配分の詳細を示す図である。
【図3】2つの記録領域に記録されるシームレスアング
ルブロックを含むデータに対して、従来方式によりビッ
ト配分される様子を説明するための図である。
【図4】上記の例における各エンコードユニット(EN
CU)に対するビット配分結果をまとめて示す図であ
る。
【図5】2つの記録領域に記録されるシームレスアング
ルブロックを含むデータに対して、本発明の実施の形態
に係る方式によりビット配分される様子を説明するため
の図である。
【図6】上記の例における、各エンコードユニット(E
NCU)に対するビット配分結果をまとめて示す図であ
る。
【図7】本発明の実施の形態に係るビット配分計算の基
本的な手順を示すフローチャートである。
【図8】本発明の実施の形態に係るエンコード方法の[S
TEP 1]〜[STEP 5]における処理の流れを示すフローチ
ャートである。
【図9】本発明の実施の形態に係るエンコード方法の[S
TEP 6]〜[STEP 9]における、フレーム数固定の条件で
の「USB_BYTES 」の調整範囲の提示方法についての処理
の流れを示すフローチャートである。
【図10】本発明の実施の形態に係るエンコード方法の
[STEP 6]〜[STEP 9]における、フレーム数固定の条件
での「USB_BYTES 」の調整範囲の提示方法についての処
理の流れを示す、図9に続くフローチャートである。
【図11】本発明の実施の形態に係るエンコード方法に
おける、バイト数固定の条件でのフレーム数の調整範囲
の提示方法についての処理の流れを示すフローチャート
である。
【図12】本発明の実施の形態に係るエンコード方法に
おける、バイト数固定の条件でのフレーム数の調整範囲
の提示方法についての処理の流れを示す、図11に続く
フローチャートである。
【図13】2つの記録層を有する記録媒体において「MA
XBYTES」制限をすでに受けている場合の処理の分類を示
す図である。
【図14】上記の条件を4つの記録層を有する記録媒体
に適応した場合の処理例を説明するための図である。
【図15】適正範囲に修正して再度ビット配分した例を
示す図である。
【図16】適正範囲に修正して再度ビット配分した例を
示す図である。
【図17】適正範囲に修正して再度ビット配分した例を
示す図である。
【図18】適正範囲に修正して再度ビット配分した例を
示す図である。
【図19】本発明の実施の形態に係るビデオエンコード
システムの構成例を示す図である。
【図20】エンコード装置の一形態を示す図である。
【図21】従来のビデオエンコードシステムの構成例を
示す図である。
【図22】従来のエンコード作業の流れを示すフローチ
ャートである。
【図23】従来のエンコード作業における、ビット配分
計算処理の手順の一具体例を示すフローチャートであ
る。
【図24】従来のエンコード作業における、シーンチェ
ンジの検出/処理について説明するための図である。
【図25】従来のエンコード作業における、チャプタ(C
HAPTER )指定されたフレームの処理について説明するた
めの図である。
【図26】本発明の実施の形態における、各エンコード
ユニット(ENCU)へのビット配分例を示す図であ
る。
【図27】シームレスアングル部分に対する重み係数が
考慮された、本発明の実施の形態に係るビット配分の基
本的な手順を示すフローチャートである。
【図28】GOPごとの符号化難易度の和「gop_diff」
とエンコード時のGOP単位のビット割当て量「gop_ta
rget」とを変換するための、最も簡単な関数の例を示す
図である。
【図29】VBV(Video buffering verifier)計算方法
について説明するための図である。
【図30】評価関数と「GOP_MAXRATE 」制限を考慮して
求めたターゲット量に対して、VBVバッファ計算を行
った場合のターゲットビット配分例を示す図である。
【図31】VBV制限処理後のターゲットビット配分例
を示す図である。
【図32】2つの記録層を有する記録媒体に対して、従
来方式によりビット配分した例を示す図である。
【図33】2つの記録層を有する記録媒体に対して、従
来方式によりビット配分した例を示す図である。
【図34】いわゆるDVD(ディジタルビデオディス
ク)におけるアングルブロックおよびアングル再生につ
いて説明するための図である。
【図35】素材がアングルブロックを含む場合について
説明するための図である。
【図36】インターリーブ処理について説明するための
図である。
【図37】シームレスアングルブロックの処理について
説明するための図である。
【図38】VBVバッファ残量の制限を加えたエンコー
ドおよびデコードを行った場合の例を示す図である。
【図39】シームレスアングルで、全てのGOPの最初
と最後のVBVの値が一定値以上になるように制御され
る様子を説明するための図である。
【符号の説明】
2 ネットワーク、 3 スーパーバイザ、 4 RA
ID、 10 ビデオテープレコーダ(VTR)、 1
1 主コントローラ、 12 エンコーダ、14 GU
I(グラフィカルユーザインターフェース)部、 15
ビットアサイン部、 16 エンコーダコントロール
部、 17 VTRコントロール部

Claims (18)

    【特許請求の範囲】
  1. 【請求項1】 ビデオ素材を圧縮符号化して複数の記録
    領域に記録するエンコード方法において、 本エンコードに先立つプリエンコード工程と、 与えられたエンコード条件下で、各記録領域の間の画質
    の差を許容できるビット配分の可否を評価する評価工程
    と、 上記各記録領域の間の画質の差が許容できるビット配分
    の適正範囲を提示する提示工程とを有し、上記与えられ
    たエンコード条件または上記提示された適正範囲のビッ
    ト配分により本エンコードを行うことを特徴とするエン
    コード方法。
  2. 【請求項2】 上記評価工程では、上記プリエンコード
    工程で測定された上記ビデオ素材の符号化難易度を用い
    て、上記与えられたエンコード条件により上記各記録領
    域に配分されるビット量と上記各記録領域ごとの符号化
    難易度の総和との比率を求め、その比率のばらつき量に
    基づいて、上記各記録領域のエンコード後の画質のばら
    つき量を推定することを特徴とする請求項1記載のエン
    コード方法。
  3. 【請求項3】 上記提示工程では、上記比率のばらつき
    量が所定値を越えるときに、上記各記録領域のフレーム
    数を固定した場合の、各記録領域に配分されるべきビッ
    ト数の適正範囲値を表示することを特徴とする請求項2
    記載のエンコード方法。
  4. 【請求項4】 上記提示工程では、上記比率のばらつき
    量が所定値を越えるときに、上記各記録領域のビット配
    分量を固定した場合の、各記録領域に記録されるべきフ
    レーム数の適正範囲値を表示することを特徴とする請求
    項2記載のエンコード方法。
  5. 【請求項5】 上記提示工程では、上記フレーム数の適
    正範囲内でのチャプター位置、またはシーンチェンジ検
    出位置を検出し、新たに記録層の境界を変更する際のビ
    デオ素材上での適切な場所として表示することを特徴と
    する請求項4記載のエンコード方法。
  6. 【請求項6】 上記複数の記録領域は、ディジタルビデ
    オディスクの複数の記録層であることを特徴とする請求
    項1記載のエンコード方法。
  7. 【請求項7】 複数の記録領域にシームレスアングルブ
    ロックを含むエンコードを行うエンコード方法におい
    て、 各記録領域ごとに与えられる上限が考慮されたバイト数
    の総和および総フレーム数からエンコードされた素材の
    平均レートを求める工程と、 重み係数を考慮したフレーム数の比率に従って、上記各
    記録領域に記録されるべきシームレスアングルブロック
    に割り当てられるバイト数を、上記各記録領域から確保
    する工程と、 上記シームレスアングルブロックに割り当てられるバイ
    ト数が差し引かれた残りのバイト数を、上記シームレス
    アングルブロック以外のブロックに重み係数を考慮した
    符号化難易度の和の比率で配分する工程とを有すること
    を特徴とするエンコード方法。
  8. 【請求項8】 上記エンコードされたビデオ素材の平均
    レートは、本エンコードに先立つプリエンコードにより
    求められることを特徴とする請求項7記載のエンコード
    方法。
  9. 【請求項9】 上記複数の記録領域は、ディジタルビデ
    オディスクの複数の記録層であることを特徴とする請求
    項7記載のエンコード方法。
  10. 【請求項10】 ビデオ素材を圧縮符号化して複数の記
    録領域に記録するエンコード装置において、 本エンコードに先立ってプリエンコードを行うプリエン
    コード手段と、 各記録領域の間の画質の差を許容できるビット配分の可
    否を評価する評価手段と、 上記各記録領域の間の画質の差が許容できるビット配分
    の適正範囲を提示する提示手段とを備え、上記与えられ
    たエンコード条件または上記提示された適正範囲のビッ
    ト配分により本エンコードを行うことを特徴とするエン
    コード装置。
  11. 【請求項11】 上記評価手段は、上記プリエンコード
    手段により測定された上記ビデオ素材の符号化難易度を
    用いて、上記与えられたエンコード条件により上記各記
    録領域に配分されるビット量と上記各記録領域ごとの符
    号化難易度の総和との比率を求め、その比率のばらつき
    量に基づいて、上記各記録領域のエンコード後の画質の
    ばらつき量を推定することを特徴とする請求項10記載
    のエンコード装置。
  12. 【請求項12】 上記提示手段は、上記比率のばらつき
    量が所定値を越えるときに、上記各記録領域のフレーム
    数を固定した場合の、各記録領域に配分されるべきビッ
    ト数の適正範囲値を表示することを特徴とする請求項1
    1記載のエンコード装置。
  13. 【請求項13】 上記提示手段は、上記比率のばらつき
    量が所定値を越えるときに、上記各記録領域のビット配
    分量を固定した場合の、各記録領域に記録されるべきフ
    レーム数の適正範囲値を表示することを特徴とする請求
    項11記載のエンコード装置。
  14. 【請求項14】 上記提示手段は、上記フレーム数の適
    正範囲内でのチャプター位置、またはシーンチェンジ検
    出位置を検出し、新たに記録層の境界を変更する際の素
    材上での適切な場所として表示することを特徴とする請
    求項13記載のエンコード装置。
  15. 【請求項15】 上記複数の記録領域は、ディジタルビ
    デオディスクの複数の記録層であることを特徴とする請
    求項10記載のエンコード装置。
  16. 【請求項16】 複数の記録領域にシームレスアングル
    ブロックを含むエンコードを行うエンコード装置におい
    て、 各記録領域ごとに与えられる上限が考慮されたバイト数
    の総和および総フレーム数からエンコードされた素材の
    平均レートを求める手段と、 重み係数を考慮したフレーム数の比率に従って、上記各
    記録領域に記録されるべきシームレスアングルブロック
    に割り当てられるバイト数を、上記各記録領域から確保
    する手段と、 上記シームレスアングルブロックに割り当てられるバイ
    ト数が差し引かれた残りのバイト数を、上記シームレス
    アングルブロック以外のブロックに重み係数を考慮した
    符号化難易度の和の比率で配分する手段とを備えること
    を特徴とするエンコード装置。
  17. 【請求項17】 上記エンコードされた素材の平均レー
    トは、本エンコードに先立つプリエンコードにより求め
    られることを特徴とする請求項16記載のエンコード装
    置。
  18. 【請求項18】 上記複数の記録領域は、ディジタルビ
    デオディスクの複数の記録層であることを特徴とする請
    求項16記載のエンコード装置。
JP36926497A 1997-12-29 1997-12-29 エンコード方法およびエンコード装置 Expired - Fee Related JP3837889B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP36926497A JP3837889B2 (ja) 1997-12-29 1997-12-29 エンコード方法およびエンコード装置
US09/221,459 US6356178B1 (en) 1997-12-29 1998-12-28 Method and apparatus for encoding video material for recording

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP36926497A JP3837889B2 (ja) 1997-12-29 1997-12-29 エンコード方法およびエンコード装置

Publications (2)

Publication Number Publication Date
JPH11196375A true JPH11196375A (ja) 1999-07-21
JP3837889B2 JP3837889B2 (ja) 2006-10-25

Family

ID=18493988

Family Applications (1)

Application Number Title Priority Date Filing Date
JP36926497A Expired - Fee Related JP3837889B2 (ja) 1997-12-29 1997-12-29 エンコード方法およびエンコード装置

Country Status (2)

Country Link
US (1) US6356178B1 (ja)
JP (1) JP3837889B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008301532A (ja) * 2004-06-02 2008-12-11 Panasonic Corp 生成装置および再生装置
JP2009027273A (ja) * 2007-07-17 2009-02-05 Toshiba Corp 情報処理装置およびプログラム
JP2010523048A (ja) * 2007-03-29 2010-07-08 トムソン ライセンシング デジタルシネマシステムへのコンテンツ配信及びデジタルシネマシステムでの再生方法及び装置
JP2011504337A (ja) * 2007-11-15 2011-02-03 トムソン ライセンシング 映像を符号化するシステムおよび方法

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100303727B1 (ko) * 1998-04-28 2001-09-24 구자홍 동영상의적응적디스플레이속도자동조절장치와방법
JP3584033B1 (ja) * 2003-03-25 2004-11-04 株式会社リコー 情報記録方法、情報記録装置、プログラム及び記憶媒体
JP3675464B2 (ja) * 2003-10-29 2005-07-27 ソニー株式会社 動画像符号化装置および動画像符号化制御方法
US20060168632A1 (en) * 2004-02-20 2006-07-27 Yoshimasa Honda Video reception device, video transmission device, and video transmission system
US9070408B2 (en) 2005-08-26 2015-06-30 Endless Analog, Inc Closed loop analog signal processor (“CLASP”) system
US7751916B2 (en) * 2005-08-26 2010-07-06 Endless Analog, Inc. Closed loop analog signal processor (“CLASP”) system
US8630727B2 (en) * 2005-08-26 2014-01-14 Endless Analog, Inc Closed loop analog signal processor (“CLASP”) system
JP5028798B2 (ja) * 2005-12-27 2012-09-19 ソニー株式会社 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3629728B2 (ja) * 1994-08-31 2005-03-16 ソニー株式会社 動画像信号符号化方法、動画像信号符号化装置及び動画像信号記録媒体
GB9517130D0 (en) * 1995-08-22 1995-10-25 Nat Transcommunications Ltd Statistical multiplexing
US6243417B1 (en) * 1996-12-12 2001-06-05 Sony Corporation Device and method for encoding image data, and image data transmission method
US6038256A (en) * 1996-12-31 2000-03-14 C-Cube Microsystems Inc. Statistical multiplexed video encoding using pre-encoding a priori statistics and a priori and a posteriori statistics
US6229850B1 (en) * 1997-07-22 2001-05-08 C-Cube Semiconductor Ii, Inc. Multiple resolution video compression

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008301532A (ja) * 2004-06-02 2008-12-11 Panasonic Corp 生成装置および再生装置
US7526031B2 (en) 2004-06-02 2009-04-28 Panasonic Corporation Seamless switching between random access units multiplexed in a multi angle view multimedia stream
US7856062B2 (en) 2004-06-02 2010-12-21 Panasonic Corporation Multiplexing apparatus and demultiplexing apparatus
US8411759B2 (en) 2004-06-02 2013-04-02 Panasonic Corporation Multiplexing apparatus and demultiplexing apparatus
JP2010523048A (ja) * 2007-03-29 2010-07-08 トムソン ライセンシング デジタルシネマシステムへのコンテンツ配信及びデジタルシネマシステムでの再生方法及び装置
JP2009027273A (ja) * 2007-07-17 2009-02-05 Toshiba Corp 情報処理装置およびプログラム
JP2011504337A (ja) * 2007-11-15 2011-02-03 トムソン ライセンシング 映像を符号化するシステムおよび方法

Also Published As

Publication number Publication date
JP3837889B2 (ja) 2006-10-25
US6356178B1 (en) 2002-03-12

Similar Documents

Publication Publication Date Title
KR100288094B1 (ko) 부호화된 비디오 시퀀스의 품질을 수동으로 변경하기 위한 방법 및 시스템
JP3361009B2 (ja) ビデオ符号化方法および速度量子化モデルを利用して符号化を行うシステム
KR100283384B1 (ko) 부호화된 비디오 프레임의 품질을 수동으로 변경하기 위한 방법 및 시스템
KR100288130B1 (ko) 양자화 레벨을 가변시킴에 의해 비디오 부호기의 비트 할당을 제어하는 전송 속도 제어 디지탈 비디오 편집 방법 및 시스템
US8331457B2 (en) Information processing apparatus and method, and recording medium and program used therewith
KR100304212B1 (ko) 감소된개수의오디오부호기들을갖는시청각물부호화시스템
JP3740813B2 (ja) 画像符号化方法および画像符号化装置
JP3837889B2 (ja) エンコード方法およびエンコード装置
JP3911768B2 (ja) 画像符号化方法及び画像符号化装置
EP2112663A2 (en) Information processing apparatus and information processing method
US6282242B1 (en) Data compression device that switches between intra-frame coding and inter-frame coding
JP4650454B2 (ja) 符号化装置及び符号化方法
JPH10304372A (ja) 画像符号化方法および装置、画像伝送方法
JP3951152B2 (ja) 画像符号化装置および方法
JP4462643B2 (ja) 画像符号化方法及び画像符号化装置
JP4161385B2 (ja) 画像符号化方法及び装置並びに画像処理装置及び画像処理方法
JPH10308942A (ja) 画像符号化方法及び装置並びに記録媒体並びに画像伝送方法
JP4207098B2 (ja) 符号化制御装置及び符号化制御方法、符号化装置及び符号化方法
JPH10290429A (ja) データ圧縮装置
JPH10304377A (ja) 画像符号化方法、装置及び記録媒体
JPH10290427A (ja) データ圧縮装置
JPH1198499A (ja) 画像符号化装置および画質予測方法
JPH10294936A (ja) バッファ残量制限処理装置
JPH10290428A (ja) データ圧縮装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040420

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060629

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060711

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060724

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100811

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110811

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120811

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130811

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees