JPH11196375A - エンコード方法およびエンコード装置 - Google Patents
エンコード方法およびエンコード装置Info
- Publication number
- JPH11196375A JPH11196375A JP36926497A JP36926497A JPH11196375A JP H11196375 A JPH11196375 A JP H11196375A JP 36926497 A JP36926497 A JP 36926497A JP 36926497 A JP36926497 A JP 36926497A JP H11196375 A JPH11196375 A JP H11196375A
- Authority
- JP
- Japan
- Prior art keywords
- encoding
- layer
- recording
- bytes
- bit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/79—Processing of colour television signals in connection with recording
- H04N9/80—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
- H04N9/804—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
- H04N9/8042—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/114—Adapting the group of pictures [GOP] structure, e.g. number of B-frames between two anchor frames
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/115—Selection of the code volume for a coding unit prior to coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/149—Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/15—Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/152—Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/177—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/236—Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/434—Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/189—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
- H04N19/192—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/84—Television signal recording using optical recording
- H04N5/85—Television signal recording using optical recording on discs or drums
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/79—Processing of colour television signals in connection with recording
- H04N9/80—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
- H04N9/82—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
- H04N9/8205—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
- H04N9/8227—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal the additional signal being at least another television signal
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Algebra (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Television Signal Processing For Recording (AREA)
Abstract
縮ビデオデータへのビット配分時に、与えられたエンコ
ード条件で各記録領域間の画質に許容できない差を生じ
ないビット配分の可否を評価し、最適条件を提示できる
エンコード方法および装置を提供する。 【解決手段】 変更後のピクチャタイプに応じて補正さ
れた符号化難易度およびエンコード素材全体に与えられ
たビット数「SUPPLY_BYTES」に応じてエンコードユニッ
ト毎にビット配分され、各記録領域間の配分量のばらつ
きが検出されて許容できるかどうか評価される。許容で
きない場合はワーニングが表示され、許容できる場合は
補正後の符号化難易度と「SUPPLY_BYTES」に応じてピク
チャ毎のターゲットビット数が計算されてエンコーダ用
コントロールファイルが作成される。当初の条件でエン
コードしない場合はビット配分量等の適正値が提示され
る。
Description
圧縮して記録媒体に記録するためのエンコード方法およ
び装置に関し、特に画像/音声信号をディジタルビデオ
ディスク(DVD)などのいわゆるパッケージメディア
に蓄積するために好適なエンコード方法および装置に関
する。
ビデオディスク(Digital Video Disk:DVD)やビデ
オCDのようないわゆるパッケージメディアに蓄積する
エンコードシステムでは、まず、ビデオ素材の画像の符
号化難易度(Difficulty)を測定し、次に、その符号化
難易度に基づいてパッケージメディアの記録容量の範囲
内の与えられたバイト数に収まるように、各ビデオ情報
のフレームごとにビット配分(Bit assign)処理を行う
方法が一般に採用されている。以下では、このような2
段階のエンコード処理を2パスエンコードという。
ィジタルビデオディスク(DVD)などのオーサリング
に用いられるオーサリングシステムの基本的な構成を例
示している。
コーダ22,オーディオエンコーダ21,サブタイトル
エンコーダ23,メニューエンコーダ24,エミュレー
タ26,マルチプレクサ25等の各エンコード作業工程
のための装置と、エンコード結果が書き込まれるハード
ディスクアレイ(RAID)4と、これらの動作を統括
管理するスーパーバイザ3とが、ネットワーク2で相互
に接続されている。
オやオーディオなどの各パートのエンコード作業が同時
並列的に行えるため、作業効率が非常に良い。
システムにおける、従来のビデオエンコードシステムの
構成例を示している。
ドシステムの全体を管理するものであり、ビデオ,オー
ディオ,メニューなどの各エンコードシステムにエンコ
ード条件を与え、エンコード結果の報告を受ける。この
例では、ファイル「v.enc 」によってビデオエンコード
条件が指定され、ビデオエンコーダ側からはエンコード
結果のビットストリームが書き込まれたRAID104
上のアドレス「v.adr」と、ビットストリームをマルチ
プレックスする際に必要なデータ「vxxx.aui」が報告さ
れる。
02を介して接続されるスーパーバイザ103との間の
通信により、このビデオエンコードシステム全体の動作
を制御する。
ラフィカルユーザーインターフェース(GUI:Graphi
cal User Interface)部114の管理により、スーパー
バイザ103からの制御を受け付けると共に、オペレー
タの操作を受け付け、このGUI部114により管理さ
れるビットアサイン部115,エンコーダコントロール
部116,VTRコントロール部117により、エンコ
ーダ112,ビデオテープレコーダ(VTR)110の
動作を制御する。これにより主コントローラ111は、
スーパーバイザ103から通知されたエンコード条件に
従って処理対象の素材を符号化処理し、その処理結果を
スーパーバイザ103に通知する。さらに、主コントロ
ーラ111は、GUI部114を介してオペレータの設
定を受け付けて、上記の符号化の詳細な条件を変更でき
るようにされている。
14は、ビットアサイン部115のビット配分プログラ
ム「BIT_ASSIGN」,エンコーダコントロール部116の
エンコーダコントロールプログラム「CTRL_ENC」および
VTRコントロール部117のVTRコントロールプロ
グラムの3つのプログラムを管理している。
ーバイザ103から通知されるエンコード条件のファイ
ル「v.enc 」に従って符号化処理の条件をフレーム単位
で決定し、この条件による制御データをファイル形式
「CTL file」によりコントロール部116に通知する。
号化処理におけるビット配分(ビットアサイン)を設定
し、さらに設定された条件をオペレータの操作に応じて
変更する。さらに、ビットアサイン部115は、データ
圧縮されたビデオデータD2がRAID104に記録さ
れると、そのビデオデータD2が書き込まれたRAID
104上のアドレスのデータ「v.adr 」を、後段におけ
る多重化処理に必要なデータ量等の情報「vxxx.aui」と
共にスーパーバイザ103に通知する。
トアサイン部115から通知される制御ファイル「CTL
file」に従ってエンコーダ112の動作を制御する。さ
らに、エンコーダコントロール部116は、符号化処理
に要する符号化難易度「Difficulty」のデータをフレー
ム単位でビットアサイン部115に通知し、RAID1
04にビデオデータD2が記録されると、その記録アド
レスのデータ「v.adr」,後の多重化処理に必要なデー
タ「vxxx.aui 」をビットアサイン部115に通知す
る。
バイザ3から通知される編集リストに従ってビデオテー
プレコーダ(VTR)110の動作を制御し、所望の編
集対象の素材を再生する。
は、主コントローラ111を介してスーパーバイザ10
3から通知される編集リストに従って、磁気テープに記
録されたビデオデータD1を再生してエンコーダ112
に出力する。
3から主コントローラ111を介して通知される条件に
従って動作を切り換え、VTR110から出力されるビ
デオデータD1を、MPEG(Moving Picture Experts
Group)の手法により圧縮符号化する。
理の結果を主コントローラ111に通知し、主コントロ
ーラ111は、そのデータ圧縮における符号化の条件を
制御し、発生するビット量を制御する。これにより、主
コントローラ111は、データ圧縮により発生するビッ
ト量をフレーム単位で把握できる。
ードにおける事前のエンコード条件設定の処理時(仮エ
ンコード時)には、単にビデオデータD1をデータ圧縮
して処理結果を主コントローラ111に通知するだけで
あるが、最終的なデータ圧縮処理時(本エンコード時)
には、圧縮処理されたビデオデータD2をRAID10
4に記録し、さらにそのデータが記録されたアドレス,
データ量等を主コントローラ11に通知する。
よりデータ圧縮されたビデオデータD2をモニタできる
ように構成される。このビデオエンコードシステムで
は、モニタ装置113により、オペレータがデータ圧縮
処理の結果を必要に応じて確認する、いわゆるプレビュ
ーを行うことができる。そして、オペレータが、このプ
レビュー結果に基づいて主コントローラ111を操作し
て、符号化の条件を詳細に変更できるようにされてい
る。
ッケージメディアには、ビデオデータの圧縮方式として
MPEG(Moving Picture Experts Group)が採用され
ている。
の冗長度を除去することによりデータ圧縮する方式であ
り、フレーム内だけで符号化されるI(Intra )ピクチ
ャ,過去の画面から現在を予測して符号化されるP(Pr
edictive)ピクチャ,過去の画像と未来の画像とから現
在を予測して符号化されるB(Bidirectionally Predic
tive)ピクチャの3種類の符号化画像が用いられる。
1つ含むまとまりであるGOP(Group of Pictures )
とされる。
て、図20に例示したビデオエンコードシステムの構成
を参照しながら説明する。
エンコードシステムにおける、2パスエンコードの基本
的な処理手順を示している。
103からネットワーク102を経由して、ビデオ情報
に割り当てられるビット総量や最大レートなどのエンコ
ード条件「v.enc 」が与えられ、エンコーダコントロー
ル部116はこのエンコード条件に従って設定される。
トロール部116が、エンコーダ112を使ってエンコ
ード素材の符号化難易度(Difficulty)を測定する。こ
のとき、素材の各画素のDC値や動きベクトル量MEも
併せて測定される。そして、これらの測定結果に基づい
てファイルが作成される。
に行われる。
ターテープであるディジタルビデオカセットからVTR
110により再生される。
コーダ112を介して、VTR110により再生された
ビデオ情報D1の符号化難易度を測定する。ここでは、
符号化の際に量子化ステップ数を固定値に設定して発生
ビット量が測定される。動きが多く、高い周波数成分が
多い画像では発生ビット量が多くなり、静止画や平坦な
部分が多い画像では発生ビット量が少なくなる。この発
生ビット量の大きさが符号化難易度とされる。
1で設定されたエンコード条件に従ってステップS52
で測定された、各ピクチャの符号化難易度の大きさに応
じて、エンコーダコントロール部116が、ビットアサ
イン部115内のビット配分計算プログラム「BIT_ASSI
GN」を実行し、割り当てビット量(ターゲット量)の配
分計算を行う。
って仮エンコードを行い、ステップS54で、エンコー
ダ112に内蔵されているローカルデコーダ出力の画質
によって、本エンコードを実行するかどうかをオペレー
タに判断させるようにする。実際には、上記のビット配
分によるビットストリームをRAID4に出力しない
で、オペレータが任意の処理範囲を指定できるモードで
あるプレビユー(Preview )モードで画質が確認され
る。
われ、画質に問題がある場合(NG)にはステップS5
6に進み、問題がある部分のビットレートを上げたりフ
ィルターレベルを調整するといった画質調整のためのカ
スタマイズ作業が行われた後に、ステップS57でビッ
ト配分再計算が実行される。
イズされた部分がプレビューされ、ステップS55で画
質が確認される。ここで、全ての部分の画質が良好であ
ればステップS58に進み、エンコーダ112によっ
て、ステップS57で再計算されたビット配分による素
材全体についての最終的なエンコード処理(本エンコー
ド)が実行される。
いと判断された場合には、そのままステップS58に進
み、エンコーダ112により、ステップS53で計算さ
れたビット配分による本エンコードが実行される。
果であるビットストリームがSCSI(Small Computer
System Interface )等を介してRAID104に書き
込まれる等の後処理が行われ、2パスエンコード処理が
終了する。
後、ビデオエンコーダコントロール部116は、上述し
たようなエンコード結果の情報をネットワーク102経
由でスーパーバイザ103に報告する。
テップS52,ステップS54およびステップS58を
除く各ステップの処理は、オフラインで行われる。
素材を1本のビデオテープに記録し切れない場合には、
複数のロール(テープ)に亘って記録されることにな
る。このテープの入れ換え作業のため、連続してエンコ
ードを行うことができない。
分のタイムコードはアングルブロック間で同じなので、
この場合も連続してエンコードすることができない。こ
のような、エンコード作業を一旦中断しなければならな
い処理単位をエンコードユニットENCU(Encode uni
t) と定義する。次に、上述したような2パスエンコー
ド作業におけるビット配分計算について説明する。
ージメディアの記録容量のうちのビデオに割り当てられ
たビット総量「QTY_BYTES 」と最大ビットレート「MAXR
ATE」とが、オーサリングシステムから指定される。こ
れに対して、最大ビットレート以下になるように制限を
加えられた総ビット数「USB_BYTES 」を求め、その値か
ら「GOP header」に必要なビット数「TOTAL_HEADER」を
引いた値と全体のフレーム総数から、ターゲット数の総
和の目標値となる「SUPPLY_BYTES」を算出する。そし
て、この「SUPPLY_BYTES 」の大きさに収まるように、
各ピクチャへの割り当てビット量(以下ターゲット(tar
get)量という。)が配分される。
る、上記のビット配分計算の処理手順の一具体例を示し
ている。
スーパーバイザから送られるビット総量「QTY_BYTES 」
と最大ビットレート「MAXRATE 」が入力される。
プS52で作成された符号化難易度(Difficulty)の測
定結果のファイルが読み込まれる。
共に測定された各画像のDC値や動きベクトル量MEの
大きさのパラメータの変化量から、シーンが変化するポ
イントが検出される。
されたフレームの処理を示している。
せて測定される、各画像のDC値や動きベクトル量の大
きさなどのパラメータの変化量から、シーンが変化する
ポイントを見つけることが可能である。これにより、図
24に示すように、シーンチェンジとして検出されたP
ピクチャをIピクチャに変更して、画質改善を図ること
ができる。なお、ここではフレーム数N=15の場合を
例示している。
(CHAPTER )境界処理が行われる。ディスク再生装置で
のチャプターサーチ時には、再生されるピクチャが、特
定されないピクチャからジャンプしてくる。その場合で
も再生画像が乱れないようにするため、このチャプタ境
界処理によって、チャプターの位置が必ずGOPの先頭
になるようにピクチャタイプが変更されたり、GOP長
が制限される。
指定されたフレームの処理、すなわち、セル(CELL)境
界の処理を示している。
の作業の結果として変更された、Iピクチャ,Pピクチ
ャ,Bピクチャなどのピクチャタイプに合わせて符号化
難易度(Difficulty)の値が補間/補正される。これ
は、いわゆるDVDなどの記録媒体では、1GOPのデ
コード時に、表示される最大のフィールド数が制限され
ていることから、ピクチャタイプの変更に伴ってGOP
構造が変化したことにより1GOPの長さがこの制限を
越えることがあるためである。そのような場合には、制
限を満たすように、PピクチャをIピクチャに変更して
GOP長が短くされるGOP制約処理が行われる。
ユニット(ENCU)ごとに、ビット量が配分される。
5における補間/補正処理によって得られた符号化難易
度、およびエンコードされる素材全体に与えられたビッ
ト数「SUPPLY_BYTES」に応じて、まず各ENCUごとに
ビットが配分(supply_bytes[encu_nb] )し、それがター
ゲットビット(Target bit)量の総和の目標値とされ
る。その後、各ENCUごとに、その目標値に応じて各
ピクチャ単位のビット配分が実行される。
のビットストリームを書き込む際のRAIDのアドレス
(ADDRESS )が計算された上で、ステップS69でエン
コーダ用のコントロールファイルが作成されて一連の処
理が終了する。
易度(Difficulty)および素材全体に与えられたビット
数「SUPPLY_BYTES」に応じて、各ピクチャごとのターゲ
ットビット数が計算され、エンコーダ用のコントロール
ファイルが作成される。
ついて、図26に示す、素材がいわゆるアングルブロッ
クを含む場合のビット配分例を参照しながら、さらに詳
しく説明する。なお、このマルチアングルについての詳
細は後述する。
る重み係数が考慮されたビット配分の基本的な手順を示
している。
ィアの記録容量のうちのビデオに割り当てられたビット
総量「QTY_BYTES 」がスーパーバイザから取得される。
量「QTY_BYTES 」に対して、エンコード条件として指定
された総ビット数「USB_BYTES 」が求められる。
る場合には KT = 1/8(bits)/30(Hz),PAL方式である
場合には KT = 1/8(bits)/25(Hz)である。また、「tota
l_frame_number」はエンコードされる素材のフレーム総
数,「min(s,t)」はs,tのうちの小さい方を選択する
関数である。
TES 」から「GOP header」に必要なビット数の総和「TO
TAL_HEADER 」を引いた値「ΣTOTAL_SUPPLY_BYTES 」が
求められる。なお、総和Σは、各記録層についての和を
意味している。
ム総数「total_framenb 」から、シームレスアングル部
分の「ALL_ANGLE_BYTES 」が計算される。ここで、最初
にシームレスアングルブロックにビット配分するのは、
シームレスアングルブロックには他の部分よりも厳しい
制約があり、より多くのビット量が必要なことと、対応
するシームレスアングルブロックに同一量のビットが割
り当てられることが必要なためである。
ーム数を「ENCU_frame[encu_nb] 」とすると、 supply_bytes[encu_nb] = (USB_BYTES - TOTAL_HEADER) × ENCU_frame[encu_nb] /total_framenb ---- [2] ALL_ANGLE_BYTES = Σsupply_bytes(Seamless Angle Block) ---- [3] このとき、対応するシームレスアングルブロックのフレ
ーム数は互いに同じであるため、各々の「supply_byte
s」も必ず同じになる。
」から「ALL_ANGLE_BYTES 」を引いた値に対し、アン
グルブロックではない部分の各ENCUの「supply_byt
es」、すなわち「ALL_SUPPLY_BYTES」が算出される。こ
のとき、単純にフレーム数の比率でビット分配すると、
ENCU間での画像の難しさにばらつきがある場合に最
適なビット割当ができないため、各ENCUでの符号難
易度の総和「ENCU_diff[encu_nb]」を求めておき、ステ
ップS76ではその比率でビット量が分配される。
配分を、素材の段階で意識的に操作したい場合がある。
例えば、映画素材の前にコマーシャルなどをいれる場合
に、その部分だけはビットレートを意識的に上げたい場
合などが考えられる。このような要求は、各ENCUの
符号化難易度の総和に対して、重み係数「e_weight」を
設定することで実現される。
されるようなファイルで設定され、ビット計算の実行時
にロードされる。 DIFF_SUM = ΣENCU_diff[encu_nb] (シームレスアングル以外のENCU) ---- [4] ALL_SUPPLY_BYTES = USB_BYTES - TOTAL_HEADER - ALL_ANGLE_BYTES ---- [5] supply_bytes [encu_nb] = ALL_SUPPLY_BYTES * ENCU_diff[encu_nb]/ DIFF_SUM ---- [6]
にビット量を配分し、その後に各GOP内で各ピクチャ
の難しさ「GOP_DIFFICULTY」に応じたビット配分を行う
ものとして説明する。各GOPごとのDifficultyの和で
ある「GOP_diff」に応じて、エンコードする際のGOP
単位のビット割り当て量「GOP_target」が配分される。
「gop_diff」とエンコード時のGOP単位のビット割当
て量「gop_target」とを変換するための、最も簡単な関
数の例を示している。
P_diff」 をX とし、 DIFFICULTY_SUM = ENCU_diff[encu_nb] として、 Y = AX + B という形で表される評価関数が用いられる。また、全て
のピクチャの「Difficulty」の総和「ENCU_diff[encu_n
b]」が用られる。 B = GOP_MINBYTES ---- [7] Σy = A×Σx + B×n ここで、Σy = supply_bytes[encu_nb],Σx = ENCU_di
ff[encu_nb],nはGOPの総数である。よって、 A = (supply_bytes[encu_nb] - B×n)/ ENCU_diff[encu
_nb] となる。
bit[k]」に応じたビット配分を行う。この「gen_bit
[k]」は、仮エンコードによって測定されたk番目のフ
レームの符号化難易度の値であり、大きいほど画像が難
しいことを表す。GOP内での各ピクチャの配分は Dif
ficulty の大きさに比例させた場合には、各ピクチャの
ターゲット量は以下の式で求められる。
diff」が大きい)ピクチャがあると、非常に大きい「go
p_target」量になってしまい、システムにおいて許容さ
れている最大レートを越えてしまうため、「GOP_MAXBYT
ES」といった固定量でリミッタをかけることが必要であ
る。また、最小のターゲット量も「GOP_MINBYTES」によ
り同様に制限される。
は、仮想デコーダのバッファ残量を考慮しながらビット
配分することが義務付けられている。この仮想バッファ
残量の計算をVBV(Video buffering verifier) とい
う。
について説明する。
ァサイズ「VBV MAX 」(1.75Mbits )に対して、k番目の
ピクチャのバッファのスタート点を「Occupancy_up(k)
」,k番目のピクチャのターゲット量を「target(k)
」とすると、ピクチャにビットを供給した後のバッフ
ァ残量「Occupancy_down(k) 」は[7] 式で表される。
プからビデオのデータ量に応じたビットレートのデータ
量「SYSTEM_SUPPLY 」が蓄積される。この供給後のバッ
ファ残量「Occupancy_up(k+1) 」は [8] 式で表され
る。
当する。供給されるビットレートが大きいほど傾きは大
きくなり、バッファにデータがたまりやすくなる。バッ
ファがいっぱいになった場合には、ピックアップからバ
ッファへの供給がストップするため、バッファのオーバ
ーフローに関しては考慮する必要はない。このことは、
ある設定値ちょうどに制御する必要はなく、設定値以上
になるように制御すれば良いことを意味している。
バッファにたまったデータは減少する。このバッファ残
量が一定値以下にならないようにターゲットビット量を
計算する。この計算の最初の「Occupancy_up(0) 」は固
定値(この例ではVBV MAX×2/3 )からスタートする。
ピクチャの上側のポイント、「Occupancy_down 」はグ
ラフ上の各ピクチャの下側のポイントを意味している。
ビット配分計算を行った例を示す。
限を考慮して求めたターゲット量に対して、VBVバッ
ファ計算を行った場合のターゲットビット配分例を示し
ている。
チャは、VBVバッファの下限である「VBV MIN 」の値
を下回っている。そこで、VBVが「VBV MIN 」を下回
ったピクチャを含むGOPのターゲット量を削減させ
る。
ット量でVBV計算を実行したときの「Occupancy 」の
最小値を「Occ_min 」とすると、調整量は以下の式で表
される。ここで、制限を行うスタート点「kstart」は、
「Occupancy_up(k) 」が基準値「VBVLINE 」とされる。
この「VBVLINE 」は、例えば、 VBV MAX×(3/4) 以上の
kの値で、このときの「Occupancy_up(k) 」の値を「Oc
c_start 」とする。
行った後のターゲットビット配分例を示している。
下限である「VBV MIN 」の値を下回っていた1番目,4
番目,7番目のピクチャも、この下限値を下回らないよ
うに調整されている。
用いて作成されたコントロールファイルによりエンコー
ド処理を行うことで、素材の画像の難しさに応じて、簡
単な画像には少ないビット量が割り当てられ、難しい画
像により多くのビット量が割り当られるようになるた
め、演奏時間の中で画質のばらつきが少ない可変レート
エンコーディングが実現される。
ジタルビデオディスク)は、片面に2層の記録層を有す
るディスク、および両面に計4層の記録層を有するディ
スクのフォーマットが規定されている。
て、どの程度のバイト数を割り当てるかは、ディスク全
体の構成に関わるため、スーパーバイザ側からエンコー
ド条件として指定される。スーパーバイザ側でエンコー
ド条件を決める際には、各記録層に記録される予定の素
材の画像の難しさの違いは分からないため、例えば、単
純に各記録層に記録されるフレーム数の比率を用いてバ
イト数を分配するしかない。
に記録される素材の画像にはばらつきがあるため、この
ようにバイト数が一律に配分された場合には、記録層の
間に画質の差が生じることになる。
時間とが同じである場合には、同じ量のバイト数がエン
コード条件として指定される。ところが、第1層には簡
単な静止画像が多く含まれ、第2層には情報量の多い画
像が多く含まれる場合には、第1層の画質と第2層の画
質との間に大きな差が生じることとなり、ディスク再生
装置で記録層間を切替えて再生させた場合に違和感を生
じさせるという問題がある。
DVDなどの記録媒体に対して、従来方式によりビット
配分された例を示している。
3とは、符号化難易度の和およびフレーム数が全く同じ
であり、同じエンコード条件であるにも関わらず、各記
録層「Layer 1」と「layer 2」との間でのビット配分が
変わってしまっている。この条件でエンコードを実行す
ると、ENCU1とENCU3との間には明らかな画質
の差が生じてしまう。
コードユニット(ENCU)に対するビット配分結果を
まとめて示している。
画質の差は、エンコード後の画質評価によって始めて確
認できるため、画質が望ましくないと判断された場合に
は、その時点でエンコード条件が変更されることにな
る。しかし、エンコード条件をどの程度調整してよいか
は分からないため、カットアンドトライによる作業とな
り、効率が非常に悪いという問題がある。
ルブロックを含む場合について説明する。
けるアングル再生とは、図34に示すように、デコーダ
(再生装置)側で、ユーザーが、同一の被写体の同じ時
間における画像を、複数の角度から再生できるようにす
るものであり、切替時に再生画像が一旦中断する(黒な
どが挿入される)ことを許すノンシームレスアングル
と、切替時に乱れることなく(シームレスに)つながる
シームレスアングルとがある。ここでは、3つの角度か
らの画像である「Angle 1」,「Angle 2」,「Angle
3」 が切替られる場合を例示している。
の一例を示している。
U2,ENCU4,ENCU5は、アングルの組合せを
意味している。シームレスアングルの場合には、アング
ルの組合せであるENCU2,ENCU4,ENCU5
において、ピクチャ数とGOP構造とが同じであるよう
にされる。
の再生ピックアップが所定のアングルのデータの位置に
移動し、データの読み出しを開始する。再生時のアング
ル切替えにかかるディレイを少なくするためには、この
移動距離が小さいことが必要であるため、アングルブロ
ックのデータは、ディスク上での配置がインターリーブ
処理されている。インターリーブされる単位はM個のG
OP単位で、Mの値はエンコード条件によって異なる。
を示している。
ターリーブする作業は、個々のアングルごとのインター
リーブされるデータ量が異なる場合には、非常に複雑に
なり、アングル数が多いと処理時間も指数関数的に増加
するため問題となる。
ターリーブされる単位内の各アングルのデータ量が、エ
ンコード後の出力データの段階で同じになるようにビッ
トを割り当てれば、図36(b)に示すようなダミーデ
ータの挿入(スタッフィング)は不要となり、アングル
部分でのビデオレートを上げることができる。よって、
図36(c)に示すように、アングル部分のビット配分
時に対応する各GOPに同じターゲット量を割り当て
る。つまり、同一のシームレスアングルブロックには同
じビット量を割り当てることが望ましい。
ルブロックの処理例を示している。
VBVバッファ残量の境界での最後のピクチャのVBV
のバッファ残量の値と、次のスタート点のピクチャのV
BVのバッファ残量の値が、一定値以上に(例えば、VB
V MAX * 2/3) なるように制御すればよい。
限を加えたエンコードを行った例を示している。また、
図38(b)は、このエンコード結果をデコーダ(再生
装置)で再生したときのバッファ残量を示している。
は、エンコード時のVBV計算値よりも必ず大きくな
る。デコーダでは、バッファがいっぱいになった場合に
は、ピックアップからバッファへの供給がストップする
ため、バッファのオーバーフローに関しては考慮する必
要はない。したがって、エンコード時にこのような条件
で制限を加えれば、切替時にバッファが破綻することが
ないため、シームレスな切替えが補償される。
位で相互に切替えられることを想定しているため、図3
9に示すように、全てのGOPの最初と最後のVBVの
値は、一定値以上になるように制御されることになる。
は、通常のブロックに対して制約が多いため、同じビッ
トレートを割り当てても同等の画質を得ることが困難で
ある。そこで、シームレスアングルブロックへのビット
配分を優先して行なうことが望ましい。
の複数の記録層に記録される、シームレスアングルブロ
ックを含むビデオデータに対して、各記録層ごとに閉じ
たビット配分が実行されると、記録層によってはシーム
レスアングルブロックに十分なレートが割り当てられな
い場合がでてくる。エンコード後に十分な画質が得られ
なかった場合には、条件を変更して、エンコード作業を
最初からやり直さなければならなくなる。
スク作成のためのエンコード作業は、オーディオ、ビデ
オ、サブタイトル、メニューなどの各パートの作業が並
列して行われるため、ビデオのエンコード条件に修正が
必要になった場合には、例えばオーディオのエンコード
などのビデオ以外の工程にも影響が及ぶため、ビデオ以
外の工程も最初からやり直さなければならなくなる。こ
のように、ビット配分の適否の判定が遅れるほど、エン
コード作業のやり直しに伴う多くの無駄な工数がかかっ
てしまう。
に行われたものであり、複数の記録領域に記録される圧
縮ビデオデータに対してビットの配分を行う際に、与え
られたエンコード条件下で、各記録領域の間の画質に大
きな差が無いようにビット配分できるかどうかを評価
し、画質が定められた条件を満たさない場合には、その
ばらつき量を最適もしくは許容できるようにするエンコ
ード条件の変更内容をオペレーターに提示できる機能を
有する2パスのエンコード方法および装置を提供するこ
とを目的とする。
めに提案する本発明のエンコード方法は、ビデオ素材を
圧縮符号化して複数の記録領域に記録するエンコード方
法において、本エンコードに先立つプリエンコード工程
と、与えられたエンコード条件下で、各記録領域の間の
画質の差を許容できるビット配分の可否を評価する評価
工程と、上記各記録領域の間の画質の差が許容できるビ
ット配分の適正範囲を提示する提示工程とを有し、上記
与えられたエンコード条件または上記提示された適正範
囲のビット配分により本エンコードを行うことを特徴と
するものである。
る本発明の別のエンコード方法は、複数の記録領域にシ
ームレスアングルブロックを含むエンコードを行うエン
コード方法において、各記録領域ごとに与えられる上限
が考慮されたバイト数の総和および総フレーム数からエ
ンコードされた素材の平均レートを求める工程と、重み
係数を考慮したフレーム数の比率に従って、上記各記録
領域に記録されるべきシームレスアングルブロックに割
り当てられるバイト数を、上記各記録領域から確保する
工程と、上記シームレスアングルブロックに割り当てら
れるバイト数が差し引かれた残りのバイト数を、上記シ
ームレスアングルブロック以外のブロックに重み係数を
考慮した符号化難易度の和の比率で配分する工程とを有
することを特徴とするものである。
る本発明のエンコード装置は、ビデオ素材を圧縮符号化
して複数の記録領域に記録するエンコード装置におい
て、本エンコードに先立ってプリエンコードを行う手段
と、各記録領域の間の画質の差を許容できるビット配分
の可否を評価する評価手段と、上記各記録領域の間の画
質の差が許容できるビット配分の適正範囲を提示する提
示手段とを備え、上記与えられたエンコード条件または
上記提示された適正範囲のビット配分により本エンコー
ドを行うことを特徴とするものである。
る本発明の別のエンコード装置は、複数の記録領域にシ
ームレスアングルブロックを含むエンコードを行うエン
コード装置において、各記録領域ごとに与えられる上限
が考慮されたバイト数の総和および総フレーム数からエ
ンコードされた素材の平均レートを求める手段と、重み
係数を考慮したフレーム数の比率に従って、上記各記録
領域に記録されるべきシームレスアングルブロックに割
り当てられるバイト数を、上記各記録領域から確保する
手段と、上記シームレスアングルブロックに割り当てら
れるバイト数が差し引かれた残りのバイト数を、上記シ
ームレスアングルブロック以外のブロックに重み係数を
考慮した符号化難易度の和の比率で配分する手段とを備
えることを特徴とするものである。
記録される圧縮ビデオデータに対してビットの配分を行
う場合に、各記録領域の間に画質の差が生じにくく、早
い時点でエンコード条件の見直しや変更を行うことがで
きるエンコード方法およびエンコード装置を提供でき
る。
形態について図面を参照しながら説明する。
以下の説明に用いる用語について説明する。
グル数 angle_block_max :アングルブロック数 gen_bit[k] :仮エンコードによって測定された
k番目のフレームの符号化難易度(Difficulty)の値。
大きいほど画像が難しいことを示す。 ENCU_mode[encu_nb]:対象となるENCUがシームレス
アングルであるかどうかを示す情報。シームレスアング
ルのとき「1」,それ以外のとき「0」。 ENCU_angle[encu_nb] :対象となるENCUがどのアン
グルブロックに属するかどうかを示す情報。シームレス
アングル以外のときは「0」となる。 ENCU_weight[encu_nb]:対象となるシームレスアングル
ブロックのビット配分時の重み係数 ANGLE_weight[angle_blk] :対象となるシームレスアン
グルブロックのビット配分時の重み係数。同一のアング
ルブロックでのビット配分時の重みは同じ値にするた
め、該当するアングルブロックの「ENCU_weight 」の平
均値とする。(最大値、最小値でも良いが、この例では
平均値とする。) ANGLE_weight[ENCU_angle[encu_nb]] = (ENCU_angle の値が同じ ENCU の ENCU_weight の和)/angle_num ---- [15] ENCU_diff [encu_nb]: 対象となるENCUの符号難易
度(gen_bit[k])× ENCU_weight[encu_nb] の総和 ENCU_frame[encu_nb]: 対象となるENCUのフレーム
数の総和 ENCU_layer[encu_nb]: 対象となるENCUがどの記録
層に属するかを示す情報。 0 ≦ ENCU_layer[encu_nb]
≦ layer_max QTY_BYTES[layer_nb]: 対象となる記録層のスーパーバ
イザから指定された利用可能なバイト数 USB_BYTES[layer_nb]: 対象となる記録層での上限値を
考慮した利用可能なバイト数 QTY_change[layer_nb]:対象となる記録層で「QTY_BYTE
S 」が上限値を越えていたかどうかの情報。変更された
場合「1」,変更されていない場合「0」。
層のGOPヘッダーの総バイト数TOTAL_FRAME [layer_n
b]:対象となる記録層の総フレーム数 SUM_DIFF[layer_nb] :対象となる記録層のシームレ
スアングル以外の 重み係数を掛けた符号化難易度の総
和 (ENCU_mode[encu_nb] == layer_nb かつ ENCU_mode[enc
u_nb] == 0 ) を満たす encu_nb に対して SUM_DIFF[layer_nb] = ΣENCU_diff[encu_nb] ---- [16] ここで、「=」は代入を意味しているのに対し、「==」
はC言語等で用いられるのと同様に等しいかどうかの条
件判定を意味するものである。
層の重み係数の反映されたシームレスアングルだけの総
フレーム量 (ENCU_mode[encu_nb] == layer_nb かつ ENCU_mode[enc
u_nb] > 0 ) を満たす「encu_nb」に対して ANGLE_WFRAME[layer_nb] = Σ(ENCU_frame[encu_nb] × ANGLE_weight[ENCU_angle[encu_nb]]) ---- [17] SUM_WFRAME:シームレスアングルの重み係数の反映された総フレーム量 SUM_WFRAME = ΣENCU_frame[encu_nb] (ただし、ENCU_mode[encu_nb] == 0 を 満たす encu_nb) + ΣANGLE_WFRAME[layer_nb] ---- [18] CHECK_USB_ [layer_nb]:対象となる記録層での利用可
能なバイト数の適正値 CHECK_SUPPLY[layer_nb]:対象となる記録層でのシーム
レスアングル以外の利用可能なバイト数の適正値 CHECK_DIFF [layer_nb]:対象となる記録層のシームレ
スアングル以外の Difficulty の総和の適正値 CHECK_FRAME [layer_nb]:対象となる記録層でのシーム
レスアングル以外の総フレーム数の適正値 supply_bytes[encu_nb] :対象となる ENCU に配分され
たバイト数 まず、本発明の実施の形態に係るエンコード方法におけ
る、各エンコードユニット(ENCU)へのビット配分
方法について、複数の記録領域を有する記録媒体である
DVDなどの記録媒体の複数の記録層に記録される圧縮
ビデオデータに対してビット配分を行う場合を例として
説明する。
従来の方式を拡張して「QTY_BYTES」を各記録層に分け
て管理する。
応するブロック間のビット配分量が、ほぼ同じにされな
ければならないため、「layer_nb」で示される記録層の
各エンコードユニットENCUへのビット配分は、シー
ムレスアングルである場合と、それ以外である場合とで
分けて行われる。
ームレスアングルのフレームの比率でビット配分が行わ
れていたが、本発明の実施の形態に係る方式では全ての
記録層の「TOTAL_SUPPLY_BYTES」に対して、フレーム数
に重み係数を考慮した比率でビット配分が行われる。
いてシームレスアングルブロックのレートを同じにでき
る。また、オペレータがレートを意識的にコントロール
したければ、重み係数を変えることにより実現できる。
CUへのビット配分 (ENCU_layer[encu_nb] == layer_nb かつ ENCU_angle
[encu_nb] == 1) を満たす「encu_nb 」に対して、 supply_bytes[encu_nb] = (ENCU_frame[encu_nb] × ANGLE_weight[ENCU_angle[encu_nb]]) /ANGLE_WFRAME[layer_nb] × ALL_ANGLE_BYTES[layer_nb] ---- [24] (2)シームレスアングルブロック以外のENCUへの
ビット配分 (ENCU_layer[encu_nb] == layer_nb かつ ENCU_angle
[encu_nb] == 0) を満たす「encu_nb 」に対して、 supply_bytes[encu_nb] = ENCU_diff[encu_nb] /SUM_DIFF[layer_nb]×ALL_SUPPLY_BYTES[layer_nb] ---- [25] 次に、本発明の具体的な実施例を示す。なお以下では、 Gr_min_limit = 0.9 Gr_max_limit = 1.1 とし、説明の簡略化のために ENCU_weight[encu_nb] = 1.0 とする。
2つの記録層「Layer 0 」および「Layer 1 」に記録さ
れる、それぞれシームレスアングルブロックを含む圧縮
ビデオデータに対して、フレーム数の比率に応じてビッ
ト配分される例を示している。
ードユニット)2,ENCU4,ENCU5、および
「Layer 1 」のENCU7,ENCU9,ENCU10
は、シームレスアングルからなるアングルブロック1お
よびアングルブロック2である。
なる記録媒体に記録される圧縮ビデオデータに対する、
ビット配分の一具体例を示している。
オデータやサブタイトルデータなどのデータ量を記録媒
体の記録容量から差し引いたデータ量である「QTY_BYTE
S[0]」および「QTY_BYTES[1]」が、スーパーバイザから
与えられる。
[1]」は、DVDのフォーマットで規定されている最大
レート制限やVBV制限などの条件を満たさない場合が
ある。そこで、「QTY_BYTES[0]」および「QTY_BYTES
[1]」は、これらの制限を満足するようにレート制限さ
れて「USB_BYTES[0]」および「USB_BYTES[1]」とされ
る。
TES[1]」のヘッダ領域「TOTAL_HEADER[0] 」および「TO
TAL_HEADER[1] 」が差し引かれたデータ量が、「TOTAL_
SUPPLY_BYTES[0] 」および「TOTAL_SUPPLY_BYTES[1] 」
とされる。
」および「TOTAL_SUPPLY_BYTES[1]」jは、各記録層の
アングル部分に対してはフレーム数の比率で配分され、
アングル以外の部分には符号化難易度(Difficulty)の
和の比率で配分される。
CU4,ENCU5、および「Layer 1 」のENCU
7,ENCU9,ENCU10に対しては、「TOTAL_SU
PPLY_BYTES[0] 」および「TOTAL_SUPPLY_BYTES[1] 」が
フレーム数の比率で配分され、「Layer 0 」のENCU
1,ENCU3、および「Layer 1 」のENCU6,E
NCU8に対しては、「TOTAL_SUPPLY_BYTES[0] 」およ
び「TOTAL_SUPPLY_BYTES[1] 」を符号化難易度(Diffic
ulty)の和の比率で配分される。このように配分された
ビットが、「SUPPLY_BYTES」とされる。
によるビット配分例を示している。以下では、この従来
方式を参照しながら、本発明によるビット配分方式につ
いてさらに説明する。
録媒体の2つの記録層「Layer 0 」および「Layer 1 」
に記録される、それぞれシームレスアングルを含む対し
て、フレーム数の比率に応じてビット配分される様子を
示している。
NCU2,ENCU4、および「Layer 1 」のENCU
6,ENCU8は、シームレスアングルからなるアング
ルブロック1およびアングルブロック2とされる。
層ごとに、ヘッダ領域「TOTAL_HEADER[0] 」および「TO
TAL_HEADER[1] 」が差し引かれたデータ量が、「TOTAL_
SUPPLY_BYTES[0] 」および「TOTAL_SUPPLY_BYTES[1] 」
とされる。
」および「TOTAL_SUPPLY_BYTES[1]」は、各記録層のア
ングル部分に対してはフレーム数の比率で配分され、ア
ングル以外の部分に対しては符号化難易度(Difficult
y)の和の比率で配分される。なお、ここでは説明の簡
略化のため、TOTAL_HEADER = 0 としている。
ニット(ENCU)に対するビット配分結果をまとめて
示している。
に対して、アングルブロック2のレートが不十分である
ことが分かる。このように、従来方式によるビット配分
では、シームレスアングルブロックにおいて、エンコー
ド制約が厳しいため、レートが低いと満足できる画質が
得られないことが非常に多い。
に提案された、本発明の実施の形態に係るビット配分方
式について説明する。図5は、本発明の実施の形態に係
る方式により、DVDの2つの記録層「Layer 0 」およ
び「Layer 1 」に記録される、それぞれシームレスアン
グルを含む圧縮ビデオデータに対して、フレーム数の比
率に応じてビット配分される様子を示している。
2,ENCU4、および「Layer 1」のENCU6,E
NCU8は、図3(a)と同様のシームレスアングルか
らなるアングルブロック1およびアングルブロック2と
される。
の各記録層から、ヘッダ領域「TOTAL_HEADER[0] 」およ
び「TOTAL_HEADER[1] 」が差し引かれたデータ量が、
「TOTAL_SUPPLY_BYTES[0] 」および「TOTAL_SUPPLY_BYT
ES[1] 」とされる。
配分方式においては、上記の「TOTAL_SUPPLY_BYTES[0]
」および「TOTAL_SUPPLY_BYTES[1] 」が、最初に、各
記録層のアングル部分に対して全体のレートからフレー
ム数の比率で配分され、次に、アングル以外の部分に対
しては符号化難易度(Difficulty)の和の比率で配分さ
れる。なお、ここでも説明の簡略化のため、TOTAL_HEAD
ER = 0 としている。
ユニット(ENCU)に対するビット配分結果をまとめ
て示している。
ット配分によれば、例えばDVDの2つの記録層のどち
らのアングルブロックのレートも同じにすることが可能
となっている。
記録層にビット配分すると、シームレスアングルでない
部分に、符号化難易度に応じて配分されるビット量にば
らつきが生じることがある。図5,図6に示したビット
配分の例でも、調整前の段階では、ENCU3のレート
とENCU7のレートとが大きく異なっている。
えられた「QTY_BYTES 」が適切でなかったために生じる
が、スーパーバイザがエンコード条件を決める際には、
素材の画像の難しさ(符号化難易度)の情報がまだ得ら
れていないため、最適なエンコード条件を発行できな
い。
オエンコードシステム側で、各記録層間のビット配分の
ばらつき量を計算し、所定の規定値を越えている場合に
は、警告を発し、エンコード条件の再発行を促すことが
必要となる。
るビット配分計算の基本的な手順を示している。
力され、ステップS2で符号化難易度(Difficulty)パ
ラメータが入力さる。
に測定された各画像のDC値や動きベクトル量MEの大
きさのパラメータの変化量から、シーンが変化するポイ
ントが検出され、画質改善のためのピクチャタイプの変
更処理などが行われる。
APTER )境界処理が行われる。再生装置でのチャプター
サーチ時には、再生されるピクチャが、特定されないピ
クチャからジャンプしてくることになる。その場合でも
再生画像が乱れないようにするため、ステップS5で
は、このチャプタ境界処理によってチャプターの位置が
必ずGOPの先頭になるようにピクチャタイプが変更さ
れたり、GOP長が制限される。
業の結果として変更された、Iピクチャ,Pピクチャ,
Bピクチャなどのピクチャタイプに合わせて、符号化難
易度(Difficulty)の値が補間/補正される。
おける補間/補正処理によって得られた符号化難易度、
およびエンコードされる素材全体に与えられたビット数
「SUPPLY_BYTES」に応じて、各エンコードユニットEN
CUごとにビット配分が行われる。
ビット配分量のばらつきが検出される。
検出された記録層間のビット配分のばらつき量が許容で
きるかどうかが評価され、許容できない(No)場合に
はステップS10でワーニング(警告)が表示され、ス
テップS11でエンコードを続けるかどうかがオペレー
タにより判断される。そして、ステップS11で、当初
のエンコード条件で処理を続けるとされた場合にはステ
ップS12に進む。一方、ステップS9で、ステップS
8で評価された記録層間のばらつき量が許容できる(Y
es)場合にはそのままステップS12に進む。
ないとされた場合には、ステップS15で、ビット配分
量などの条件の適正値がオペレータに提示されて、処理
が終了される。この場合には、ステップS1で入力され
るエンコード条件等が見直されて、エンコード条件の適
否が評価される。
る補間/補正処理によって得られた符号化難易度、およ
びエンコードされる素材全体に与えられたビット数「SU
PPLY_BYTES」に応じて、各ピクチャごとのターゲットビ
ット(Target bit)数が計算される。
果が記録される記録媒体のアドレス(ADDRESS )が計算
される。
コントロールファイルが作成されて、ビット配分計算処
理が終了する。そして、このコントロールファイルによ
り最終的なエンコードである本エンコードが実行され
る。
分のばらつき量を計算するためのアルゴリズムについて
説明する。
に配分されるビット量のばらつき量は、全体のシームレ
スアングルブロック以外のビット配分量と符号化難易度
(Difficulty)の総和の比「Gr_avr 」に対して、各記
録層の値が規定値以内であるかどうかにより評価され
る。
層に記録されるフレーム数はそのままにした場合に配分
されるバイト数(「QTY_BYTES 」から「USB_BYTES 」に
置き換えられている)の適正範囲が計算される。
体の各記録層へのビット配分量を同じにした場合に、各
記録層に記録されるフレーム数の適正範囲が計算され
る。このことは、素材が記録される境界をずらすことを
意味している。
態に係るエンコード方法におけるビット配分計算につい
て、さらに具体的に説明する。
ム数もしくはバイト数の適正値の計算は、最初の記録層
から順次実行される。
BYTES」調整範囲の提示ループ初期化 CHECK_USB_[layer_nb] = USER_BYTES[layer_nb] ---- [27] CHECK_SUPPLY[layer_nb] = ALL_SUPPLY_BYTES[layer_nb] ---- [28] CHECK_DIFF [layer_nb] = SUM_DIFF[layer_nb] ---- [29] ただし、0 ≦ layer_nb ≦ layer_max) layer_nb = 0 とする。
の場合 この記録層の画質の全体に対するばらつきは許容範囲で
ある。
対して不足している。
対して余裕がある。
数制限を越えないようにされなければならない。また、
すでに最大バイト数制限を受けている記録層については
「USB_BYTES 」の増加は許されない。
ge[layer_nb+1] == 0かつ Gcheck[layer_nb] == 1 or 2
またはQTY_change[layer_nb] == 1かつ QTY_change[lay
er_nb+1] == 0かつ Gcheck[layer_nb] == 2または QTY_change[layer_nb] == 0 かつ QTY_change[layer_nb+1] == 1 かつ Gcheck[layer_nb] == 1 ---- [33] の条件を満たす「layer_nb」の記録層の「USB_BYTES 」
の調整量を提示する。
_nb] としたとすれば、次の「layer_nb」の「CHECK_SUPPLY」
は、以下のように修正される。
ば[STEP 3]に戻る。
録層へのフレーム数調整範囲の提示ループ初期化 CHECK_USB_ [layer_nb] = USER_BYTES[layer_nb] CHECK_SUPPLY[layer_nb] = ALL_SUPPLY_BYTES[layer_n
b] CHECK_DIFF [layer_nb] = SUM_DIFF[layer_nb] CHECK_FRAME [layer_nb] = total_frame[layer_nb] ただし、0 ≦ layer_nb ≦ layer_max layer_nb = 0 とする。
ayer_nb] GR[layer_nb] = gr[layer_nb]/Gr_avr (1)Gr_min_limit ≦ GR[layer_nb] ≦ Gr_max_limit
の場合 Gcheck [layer_nb] = 0 (2)GR[layer_nb] < Gr_min_limit の場合 Gcheck [layer_nb] = 1 (3)Gr_max_limit < GR[layer_nb] の場合 Gcheck [layer_nb] = 2
限を越えないようにされなければならない。また、すで
に最大バイト数制限を受けている記録層については、フ
レーム数の削減は許されない。
ge[layer_nb+1] == 0かつ Gcheck[layer_nb] == 1 or 2
またはQTY_change[layer_nb] == 1かつ QTY_change[lay
er_nb+1] == 0かつ Gcheck[layer_nb] == 2またはQTY_c
hange[layer_nb] == 0かつ QTY_change[layer_nb+1] ==
1かつ Gcheck[layer_nb] == 1の条件を満たす「layer_
nb」の記録層のフレーム数の調整量が提示される。
_avr ≦ CHECK_DIFF[layer_nb] かつ CHECK_DIFF[layer_nb] ≦ CHECK_SUPPLY[layer_nb]/Gr_min_limit/Gr_avr ---- [40] また、 USB_BYTES[layer_nb] ≦ MAXRATE×KT×CHECK_FRAME[la
yer_nb] より CHECK_USB[layer_nb]/MAXRATE/ KT ≦ CHECK_FRAME[layer_nb] ---- [41] を満たすフレーム数の境界が検出される。
it/Gr_avr MIN_CHECK_DIFF = CHECK_SUPPLY[layer_nb]/Gr_max_lim
it/Gr_avr MIN_CHECK_FRAME = CHECK_USB[layer_nb]/MAXRATE/ KT また、layer_nb == layer_max -1 のとき、 MAX_CHECK_FRAME = CHECK_FRAME[layer_nb] + CHECK_FR
AME[layer_nb]- CHECK_USB[layer_nb+1]/MAXRATE/ KT の制約も考慮される。
コードユニット(ENCU)のうち、シームレスアング
ル以外のENCUの gen_bit[k]×ENCU_weight[encu_nb] (0 ≦ k ≦ k_max : k フレーム目の Difficulty の大
きさ)を演奏時間の早い順から「CHECK_DIFF[layer_n
b]」に順次加算し、フレームのカウント数を「CHECK_FR
AME[layer_nb] 」に順次加算していくことで、上記の条
件を満たす k の範囲(フレームの範囲)を求めてい
く。
ャプターポイントやシーンチェンジポイントがあれば、
その情報も提示される。仮に、 CHECK_DIFF[layer_nb] = CHECK_SUPPLY[layer_nb]/Gr_a
vr となるように境界を変更したとして、境界変更対象とな
る記録層の符号化難易度(Difficulty)の総和とフレー
ム数を変更する。
度の総和とフレーム数は、以下のように修正される。 CHECK_DIFF[layer_nb+1] = CHECK_DIFF[layer_nb] + CHECK_DIFF[layer_nb+1] - CHECK_DIFF[layer_nb] ---- [42] CHECK_FRAME[layer_nb+1] = CHECK_FRAME[layer_nb] + CHECK_FRAME[layer_nb+ 1] - CHECK_FRAME[layer_nb] ---- [43]
し、「layer_nb」が「layer_max 」と同じ値でなければ
[STEP 7] に戻る。
は、素材の記録される場所を変えることを意味するた
め、素材の切れ目(シーンの切れ目)などの情報が非常
に重要になる。
に係るエンコード方法の[STEP 1]〜[STEP 5]の処理
の流れを示している。
配分数「QTY_BYTES 」をスーパーバイザから受け取る。
大バイト数制限を考慮して「USB_BYTES 」が求められ
る。
「USB_BYTES 」から「GOP_Header」のバイト数を除いた
ものの総和「ΣTOTAL_SUPPLY_BYTES」が求められる。
ームレスアングルブロックの重み係数を考慮した総フレ
ーム量「ANGLE_WFRAME」が求められ、「ΣTOTAL_SUPPLY
_BYTES」がフレーム量「frame×weight」の比率で各ア
ングルブロックに配分される。
「TOTAL_SUPPLY_BYTES」からシームレスアングルへの配
分ビット数の総和を引いて、「ALL_SUPPLY_BYTES」が求
められる。
符号簡易度(Difficulty)の総和「SUM_DIFF」と、各E
NCUごとの重み係数を考慮した符号簡易度の総和「EN
CU_DIFF 」との比率から、「ALL_SUPPLY_BYTES」が各E
NCUブロックに配分される。
とのビット配分のばらつき量が計算される。このばらつ
き量が規定値を越えていたら、オペレータおよびスーパ
ーバイザに警告され、適正値が計算されて提示される。
係るエンコード方法の[STEP 1]〜[STEP 5]の処理が
終了する。
明の実施の形態に係るエンコード方法の[STEP 6]〜[ST
EP 9]の処理の流れを示す。これらの各ステップは、フ
レーム数固定の条件での USB_BYTES の調整範囲の提示
方法を示している。
配分のばらつき度の平均値「Gr_avr」が計算される。
/ΣSUM_DIFF[layer_nb] 次に、ステップS32では、フレーム数固定の条件での
「USB_BYTES 」調整範囲の提示用に値が初期化される。
b] CHECK_DIFF [layer_nb] = SUM_DIFF[layer_nb] CHECK_FRAME [layer_nb] = total_framenb[layer_nb] そして、ステップS33で、layer_nb = 0 とされる。
き度が判定される。
/CHECK_DIFF[layer_nb]/Gr_avr (1)Gr_min_limit ≦ Gr [layer_nb] ≦ Gr_max_limi
t の場合 Gcheck[layer_nb] = 0 (2)Gr [layer_nb] < Gr_min_limit の場合 Gcheck[layer_nb] = 1 (3)Gr_min_limit < Gr [layer_nb]の場合 Gcheck[layer_nb] = 2 次に、ステップS35で、以下の条件を満たす「layer_
nb」の記録層の「USB_BYTES 」の調整範囲が提示され
る。
nge [layer_nb+1]==0かつ Gcheck[layer_nb]==1 or 2ま
たはQTY_change [layer_nb]==1 かつ QTY_change [laye
r_nb+1]==0かつ Gcheck[layer_nb]==2またはQTY_change
[layer_nb]==0 かつ QTY_change [layer_nb+1]==1かつ
Gcheck[layer_nb]==1 適正範囲 Gr_min_limit × Gr_avr × CHECK_DIFF[layer_nb]≦ C
HECK_SUPPLY[layer_nb] かつ CHECK_SUPPLY[layer_nb]≦ min(Gr_min_limit×Gr_avr
×CHECK_DIFF[layer_nb],MAXBYTE-ALL_ANGLE_BYTES[la
yer_nb]) 次に、ステップS36で、layer_nb = layer_nb + 1 と
される。
layer_max を満足するかどうかが判断され、この条件を
満足しないときにはステップS34以降の手順が繰り返
される。一方、ステップS37の条件を満足する場合に
は、図11および図12に示す、バイト数固定の条件で
のフレーム数の調整範囲の提示方法の処理手順に進む。
固定の条件での記録層へのフレーム数の調整範囲の提示
用に値が初期化される。
b] CHECK_DIFF [layer_nb] = SUM_DIFF[layer_nb] CHECK_FRAME [layer_nb] = total_framenb[layer_nb] なお、ステップS38に先立って、全体のビット配分の
ばらつき度の平均値「Gr_avr」が計算される必要がある
が、図9のステップS31で得られた値を用いることが
できる。
とされる。
配分量のばらつき度が判定される。
nb」の記録層のフレーム数の調整範囲が提示される。
nge [layer_nb+1]==0かつ Gcheck[layer_nb]==1 or 2ま
たはQTY_change [layer_nb]==1 かつ QTY_change [laye
r_nb+1]==0かつ Gcheck[layer_nb]==2またはQTY_change
[layer_nb]==0 かつ QTY_change [layer_nb+1]==1かつ
Gcheck[layer_nb]==1 適正範囲 MAX_CHECK_DIFF = CHECK_SUPPLY[layer_nb]/Gr_min_l
imit/Gr_avr MIN_CHECK_DIFF = CHECK_SUPPLY[layer_nb]/Gr_max_l
imit/Gr_avr MIN_CHECK_FRAME = CHECK_USB[layer_nb]/MAXRATE/kT とすると、 MIN_CHECK_DIFF ≦ CHECK_DIFF[layer_nb] ≦ MAX_CHEC
K_DIFF の条件を満たし、かつ MIN_FRAME = CHECK_DIFF = 0 とし、layer_nb 層のENCUのうち、シームレスアン
グル以外のENCUの Difficulty × ENCU_weight の大きさを、演奏時間の早い順から、「CHECK_DIFF」に
フレームのカウント数を、「CHECK_FRAME 」に、それぞ
れ順次加算していく。
ャプターポイント、シーンチェンジポイントがあれば、
その情報も提示される。
er_nb + 1 とされる。
layer_max を満足するかどうかが判断され、この条件を
満足しないときにはステップS40以降の手順が繰り返
される。一方、ステップS43の条件を満足する場合に
は、以上の処理が終了する。
数を変更すると、「MAX_BYTES 」条件によって新たに制
限を受けることになる。このことから、逆に、すでにそ
のような制限を受けている場合には、ビット数やフレー
ム数を変更できない場合があることが予想される。
るDVDなどの記録媒体において、「MAXBYTES」制限を
すでに受けている場合の処理の分類を示している。
録媒体において、上記の条件を適応させた場合の例を示
している。
のディスクに対して、ビット配分を行う場合を例とし
て、上記の処理の分類について説明する。なお、以下の
説明では、 Gr_min_limit = 0.9 Gr_max_limit = 1.1 とする。 (1)GR[0] < 0.9 の場合 ALL_SUPPLY_BYTES[0] が SUM_DIFF[0] に対して不足し
ている。 (2)1.1 < GR[0] の場合 ALL_SUPPLY_BYTES[1] が SUM_DIFF[1] に対して不足し
ている。 (3)上記(1),(2)以外の場合 処理を行なわない。
の適正範囲「CHECK_USB」 0.9×Gr_avr×CHECK_DIFF[0]≦ CHECK_SUPPLY[0] ≦ 1.
1×Gr_avr×CHECK_DIFF[0] CHECK_USB[0]= CHECK_SUPPLY[0] + ALL_ANGLE_BYTES[0]
+ TOTAL_HEADER[0]
フレーム数の適正範囲「CHECK_FRAME」 CHECK_SUPPLY[0]/1.1/Gr_avr≦ CHECK_DIFF[0] ≦ CHEC
K_SUPPLY[0]/0.9/Gr_avr を満たす範囲を探す。
ENCUの gen_bit[k]×_ENCU_weight[encu_nb] を順次加算して「CHECK_DIFF[0] 」を再計算していく過
程で、上記の条件を満たすkの範囲を求めていく。この
際に、範囲内に境界として望ましいチャプターポイント
やシーンチェンジポイントがあれば、その情報も提示す
る。このようにして適正範囲に修正して再度ビット配分
した例を、図15〜図18に示した。
ty)の和とビット配分量との関係が理想的になっている
ことが分かる。
ド装置について説明する。
オエンコードシステムの構成例を示している。
た本発明の実施の形態に係るエンコード方法を適用し
て、ディジタルビデオディスク(DVD)用にビデオ情
報を圧縮符号化してオーサリングなどを行うために用い
ることができるものであり、その基本的な構成は図21
に示した従来のビデオエンコードシステムの構成とほぼ
同様とすることができる。
ードシステムに割り当てられた計算機により構成され、
ネットワーク2を介して接続されるスーパーバイザ3と
の間でデータ通信を行って、このビデオエンコードシス
テム全体の動作を制御する。
フィカルユーザーインターフェース(GUI:Graphica
l User Interface)部14の管理により、スーパーバイ
ザ3からの制御を受け付けると共に、図示していないオ
ペレータの操作を受け付け、このGUI部14により管
理されるビットアサイン部15,エンコーダコントロー
ル部16,VTRコントロール部17により、エンコー
ダ12,ビデオテープレコーダ(VTR)10の動作を
制御する。これにより、主コントローラ11は、スーパ
ーバイザ3から通知されたエンコード条件に従って、処
理対象の素材を符号化処理し、その処理結果をスーパー
バイザ3に通知する。さらに、主コントローラ11は、
GUI部14を介してオペレータの設定を受け付けて、
上記の符号化の詳細な条件を変更できるようにされてい
る。
部14は、ビットアサイン部15のビット配分プログラ
ム「BIT_ASSIGN」,エンコーダコントロール部16のエ
ンコーダコントロールプログラム「CTRL_ENC」およびV
TRコントロール部17のVTRコントロールプログラ
ムの3つのプログラムを管理している。
バイザ3から通知される符号化ファイル「v.enc 」に従
って符号化処理の条件をフレーム単位で決定し、この条
件による制御データをファイル形式「CTL file」により
コントロール部16に通知する。
化処理におけるビット配分を設定し、さらに設定された
条件をオペレータの操作に応じて変更する。さらに、ビ
ットアサイン部15は、データ圧縮されたビデオデータ
D2が、エンコーダ12かあSCSIなどを介してRA
ID4に記録されると、RAID4上のアドレスデータ
「v.adr 」を、後段における多重化処理に必要なデータ
量等の情報「vxxx.aui」と共にスーパーバイザ3に通知
する。
アサイン部15から通知される制御ファイル「CTL fil
e」に従って、イーサネットETHER などを介してエンコ
ーダ12の動作を制御する。さらに、エンコーダコント
ロール部16は、符号化処理に要する符号化難易度(di
fficulty)のデータをフレーム単位でビットアサイン部
15に通知し、ビデオデータD2が記録されたRAID
4の記録アドレスのデータ「v.adr 」,後の多重化処理
に必要なデータ「vxxx.aui 」をビットアサイン部15
に通知する。
イザ103から通知される編集リストに従って、RS−
422(9ピンリモート)などを介してビデオテープレ
コーダ(VTR)10の動作を制御し、所望の編集対象
の素材を再生する。
主コントローラ11を介してスーパーバイザ3から通知
される編集リストに従って、磁気テープに記録されたビ
デオデータD1を再生して、処理対象の「SDI 」,「RE
F V 」,「TIME CODE 」をエンコーダ12に出力する。
このVTR10としては、通常はディジタルVTRが用
いられる。
主コントローラ11を介して通知される条件に従って動
作を切り換え、VTR10から出力されるビデオデータ
D1を、MPEG(Moving Picture Experts Group)の
手法により圧縮符号化する。
の結果を主コントローラ11に通知し、主コントローラ
11は、そのデータ圧縮における符号化の条件を制御
し、発生するビット量を制御する。これにより、主コン
トローラ11は、データ圧縮により発生するビット量を
フレーム単位で把握できる。
ドにおける事前のエンコード条件設定の処理時(仮エン
コード時)には、VTR10からはビデオデータを単に
データ圧縮して処理結果を主コントローラ11に通知す
るだけであるが、最終的なデータ圧縮処理時(本エンコ
ード時)には、圧縮処理されたビデオデータD2をRA
ID4に記録し、さらにそのデータが記録されたアドレ
ス,データ量等を主コントローラ11に通知する。
データ圧縮されたビデオデータD2をモニタできるよう
に構成される。このモニタ装置13ににより、このビデ
オエンコードシステムでは、オペレータがデータ圧縮処
理の結果を必要に応じて確認する、いわゆるプレビュー
を行うことができる。そして、オペレータが、このプレ
ビュー結果に基づいて主コントローラ11を操作して、
符号化の条件を詳細に変更できるようにされている。
時に測定された符号化難易度に基づいて、与えられたエ
ンコード条件によるビット配分が、記録層間に許容でき
ない程の画質の差を生じることの警告や、適正とされる
ビット配分などの条件が表示される。
エンコード方法およびエンコード装置によれは、ビデオ
の2パスエンコード方式の場合に、スーパーバイザから
与えられたエンコード条件による複数の記録層または記
録領域の画質のばらつき量を本エンコードの実行前に予
測し評価できる。
配分について説明したが、必ずしも記録層間ではなく、
同一記録層内に固定された、パーティションが設けられ
た複数の記録領域間に亘って記録されるデータに対する
ビット配分にも適応可能である。
録媒体に記録されるビデオデータのエンコードについて
説明したが、本発明の実施の形態に係る処理の基本的な
アルゴリズムは、2パス可変ビットレートエンコードを
行うオーディオ処理システムで、オーディオデータを複
数の固定された記録領域に対して、音質のばらつきを少
なくなるようにビット配分するシステムに対しても適応
可能である。
の場合に、本エンコードの実行前にスーパーバイザから
与えられたエンコード条件による複数の記録層または記
録領域の画質のばらつき量を予測評価できるようにした
ため、早い時点でスーパーバイザへの条件の見直しを促
すことができ、DVDなどのパッケージメディアのディ
スク作成のためのエンコード作業工数を削減することが
できる。
ルブロックを含むデータに対して、フレーム数の比率に
応じてビット配分される様子を説明するための図であ
る。
ルブロックを含むデータに対して、従来方式によりビッ
ト配分される様子を説明するための図である。
CU)に対するビット配分結果をまとめて示す図であ
る。
ルブロックを含むデータに対して、本発明の実施の形態
に係る方式によりビット配分される様子を説明するため
の図である。
NCU)に対するビット配分結果をまとめて示す図であ
る。
本的な手順を示すフローチャートである。
TEP 1]〜[STEP 5]における処理の流れを示すフローチ
ャートである。
TEP 6]〜[STEP 9]における、フレーム数固定の条件で
の「USB_BYTES 」の調整範囲の提示方法についての処理
の流れを示すフローチャートである。
[STEP 6]〜[STEP 9]における、フレーム数固定の条件
での「USB_BYTES 」の調整範囲の提示方法についての処
理の流れを示す、図9に続くフローチャートである。
おける、バイト数固定の条件でのフレーム数の調整範囲
の提示方法についての処理の流れを示すフローチャート
である。
おける、バイト数固定の条件でのフレーム数の調整範囲
の提示方法についての処理の流れを示す、図11に続く
フローチャートである。
XBYTES」制限をすでに受けている場合の処理の分類を示
す図である。
に適応した場合の処理例を説明するための図である。
示す図である。
示す図である。
示す図である。
示す図である。
システムの構成例を示す図である。
示す図である。
ャートである。
計算処理の手順の一具体例を示すフローチャートであ
る。
ンジの検出/処理について説明するための図である。
HAPTER )指定されたフレームの処理について説明するた
めの図である。
ユニット(ENCU)へのビット配分例を示す図であ
る。
考慮された、本発明の実施の形態に係るビット配分の基
本的な手順を示すフローチャートである。
とエンコード時のGOP単位のビット割当て量「gop_ta
rget」とを変換するための、最も簡単な関数の例を示す
図である。
について説明するための図である。
求めたターゲット量に対して、VBVバッファ計算を行
った場合のターゲットビット配分例を示す図である。
を示す図である。
来方式によりビット配分した例を示す図である。
来方式によりビット配分した例を示す図である。
ク)におけるアングルブロックおよびアングル再生につ
いて説明するための図である。
説明するための図である。
図である。
説明するための図である。
ドおよびデコードを行った場合の例を示す図である。
と最後のVBVの値が一定値以上になるように制御され
る様子を説明するための図である。
ID、 10 ビデオテープレコーダ(VTR)、 1
1 主コントローラ、 12 エンコーダ、14 GU
I(グラフィカルユーザインターフェース)部、 15
ビットアサイン部、 16 エンコーダコントロール
部、 17 VTRコントロール部
Claims (18)
- 【請求項1】 ビデオ素材を圧縮符号化して複数の記録
領域に記録するエンコード方法において、 本エンコードに先立つプリエンコード工程と、 与えられたエンコード条件下で、各記録領域の間の画質
の差を許容できるビット配分の可否を評価する評価工程
と、 上記各記録領域の間の画質の差が許容できるビット配分
の適正範囲を提示する提示工程とを有し、上記与えられ
たエンコード条件または上記提示された適正範囲のビッ
ト配分により本エンコードを行うことを特徴とするエン
コード方法。 - 【請求項2】 上記評価工程では、上記プリエンコード
工程で測定された上記ビデオ素材の符号化難易度を用い
て、上記与えられたエンコード条件により上記各記録領
域に配分されるビット量と上記各記録領域ごとの符号化
難易度の総和との比率を求め、その比率のばらつき量に
基づいて、上記各記録領域のエンコード後の画質のばら
つき量を推定することを特徴とする請求項1記載のエン
コード方法。 - 【請求項3】 上記提示工程では、上記比率のばらつき
量が所定値を越えるときに、上記各記録領域のフレーム
数を固定した場合の、各記録領域に配分されるべきビッ
ト数の適正範囲値を表示することを特徴とする請求項2
記載のエンコード方法。 - 【請求項4】 上記提示工程では、上記比率のばらつき
量が所定値を越えるときに、上記各記録領域のビット配
分量を固定した場合の、各記録領域に記録されるべきフ
レーム数の適正範囲値を表示することを特徴とする請求
項2記載のエンコード方法。 - 【請求項5】 上記提示工程では、上記フレーム数の適
正範囲内でのチャプター位置、またはシーンチェンジ検
出位置を検出し、新たに記録層の境界を変更する際のビ
デオ素材上での適切な場所として表示することを特徴と
する請求項4記載のエンコード方法。 - 【請求項6】 上記複数の記録領域は、ディジタルビデ
オディスクの複数の記録層であることを特徴とする請求
項1記載のエンコード方法。 - 【請求項7】 複数の記録領域にシームレスアングルブ
ロックを含むエンコードを行うエンコード方法におい
て、 各記録領域ごとに与えられる上限が考慮されたバイト数
の総和および総フレーム数からエンコードされた素材の
平均レートを求める工程と、 重み係数を考慮したフレーム数の比率に従って、上記各
記録領域に記録されるべきシームレスアングルブロック
に割り当てられるバイト数を、上記各記録領域から確保
する工程と、 上記シームレスアングルブロックに割り当てられるバイ
ト数が差し引かれた残りのバイト数を、上記シームレス
アングルブロック以外のブロックに重み係数を考慮した
符号化難易度の和の比率で配分する工程とを有すること
を特徴とするエンコード方法。 - 【請求項8】 上記エンコードされたビデオ素材の平均
レートは、本エンコードに先立つプリエンコードにより
求められることを特徴とする請求項7記載のエンコード
方法。 - 【請求項9】 上記複数の記録領域は、ディジタルビデ
オディスクの複数の記録層であることを特徴とする請求
項7記載のエンコード方法。 - 【請求項10】 ビデオ素材を圧縮符号化して複数の記
録領域に記録するエンコード装置において、 本エンコードに先立ってプリエンコードを行うプリエン
コード手段と、 各記録領域の間の画質の差を許容できるビット配分の可
否を評価する評価手段と、 上記各記録領域の間の画質の差が許容できるビット配分
の適正範囲を提示する提示手段とを備え、上記与えられ
たエンコード条件または上記提示された適正範囲のビッ
ト配分により本エンコードを行うことを特徴とするエン
コード装置。 - 【請求項11】 上記評価手段は、上記プリエンコード
手段により測定された上記ビデオ素材の符号化難易度を
用いて、上記与えられたエンコード条件により上記各記
録領域に配分されるビット量と上記各記録領域ごとの符
号化難易度の総和との比率を求め、その比率のばらつき
量に基づいて、上記各記録領域のエンコード後の画質の
ばらつき量を推定することを特徴とする請求項10記載
のエンコード装置。 - 【請求項12】 上記提示手段は、上記比率のばらつき
量が所定値を越えるときに、上記各記録領域のフレーム
数を固定した場合の、各記録領域に配分されるべきビッ
ト数の適正範囲値を表示することを特徴とする請求項1
1記載のエンコード装置。 - 【請求項13】 上記提示手段は、上記比率のばらつき
量が所定値を越えるときに、上記各記録領域のビット配
分量を固定した場合の、各記録領域に記録されるべきフ
レーム数の適正範囲値を表示することを特徴とする請求
項11記載のエンコード装置。 - 【請求項14】 上記提示手段は、上記フレーム数の適
正範囲内でのチャプター位置、またはシーンチェンジ検
出位置を検出し、新たに記録層の境界を変更する際の素
材上での適切な場所として表示することを特徴とする請
求項13記載のエンコード装置。 - 【請求項15】 上記複数の記録領域は、ディジタルビ
デオディスクの複数の記録層であることを特徴とする請
求項10記載のエンコード装置。 - 【請求項16】 複数の記録領域にシームレスアングル
ブロックを含むエンコードを行うエンコード装置におい
て、 各記録領域ごとに与えられる上限が考慮されたバイト数
の総和および総フレーム数からエンコードされた素材の
平均レートを求める手段と、 重み係数を考慮したフレーム数の比率に従って、上記各
記録領域に記録されるべきシームレスアングルブロック
に割り当てられるバイト数を、上記各記録領域から確保
する手段と、 上記シームレスアングルブロックに割り当てられるバイ
ト数が差し引かれた残りのバイト数を、上記シームレス
アングルブロック以外のブロックに重み係数を考慮した
符号化難易度の和の比率で配分する手段とを備えること
を特徴とするエンコード装置。 - 【請求項17】 上記エンコードされた素材の平均レー
トは、本エンコードに先立つプリエンコードにより求め
られることを特徴とする請求項16記載のエンコード装
置。 - 【請求項18】 上記複数の記録領域は、ディジタルビ
デオディスクの複数の記録層であることを特徴とする請
求項16記載のエンコード装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP36926497A JP3837889B2 (ja) | 1997-12-29 | 1997-12-29 | エンコード方法およびエンコード装置 |
US09/221,459 US6356178B1 (en) | 1997-12-29 | 1998-12-28 | Method and apparatus for encoding video material for recording |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP36926497A JP3837889B2 (ja) | 1997-12-29 | 1997-12-29 | エンコード方法およびエンコード装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH11196375A true JPH11196375A (ja) | 1999-07-21 |
JP3837889B2 JP3837889B2 (ja) | 2006-10-25 |
Family
ID=18493988
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP36926497A Expired - Fee Related JP3837889B2 (ja) | 1997-12-29 | 1997-12-29 | エンコード方法およびエンコード装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US6356178B1 (ja) |
JP (1) | JP3837889B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008301532A (ja) * | 2004-06-02 | 2008-12-11 | Panasonic Corp | 生成装置および再生装置 |
JP2009027273A (ja) * | 2007-07-17 | 2009-02-05 | Toshiba Corp | 情報処理装置およびプログラム |
JP2010523048A (ja) * | 2007-03-29 | 2010-07-08 | トムソン ライセンシング | デジタルシネマシステムへのコンテンツ配信及びデジタルシネマシステムでの再生方法及び装置 |
JP2011504337A (ja) * | 2007-11-15 | 2011-02-03 | トムソン ライセンシング | 映像を符号化するシステムおよび方法 |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100303727B1 (ko) * | 1998-04-28 | 2001-09-24 | 구자홍 | 동영상의적응적디스플레이속도자동조절장치와방법 |
JP3584033B1 (ja) * | 2003-03-25 | 2004-11-04 | 株式会社リコー | 情報記録方法、情報記録装置、プログラム及び記憶媒体 |
JP3675464B2 (ja) * | 2003-10-29 | 2005-07-27 | ソニー株式会社 | 動画像符号化装置および動画像符号化制御方法 |
US20060168632A1 (en) * | 2004-02-20 | 2006-07-27 | Yoshimasa Honda | Video reception device, video transmission device, and video transmission system |
US9070408B2 (en) | 2005-08-26 | 2015-06-30 | Endless Analog, Inc | Closed loop analog signal processor (“CLASP”) system |
US7751916B2 (en) * | 2005-08-26 | 2010-07-06 | Endless Analog, Inc. | Closed loop analog signal processor (“CLASP”) system |
US8630727B2 (en) * | 2005-08-26 | 2014-01-14 | Endless Analog, Inc | Closed loop analog signal processor (“CLASP”) system |
JP5028798B2 (ja) * | 2005-12-27 | 2012-09-19 | ソニー株式会社 | 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3629728B2 (ja) * | 1994-08-31 | 2005-03-16 | ソニー株式会社 | 動画像信号符号化方法、動画像信号符号化装置及び動画像信号記録媒体 |
GB9517130D0 (en) * | 1995-08-22 | 1995-10-25 | Nat Transcommunications Ltd | Statistical multiplexing |
US6243417B1 (en) * | 1996-12-12 | 2001-06-05 | Sony Corporation | Device and method for encoding image data, and image data transmission method |
US6038256A (en) * | 1996-12-31 | 2000-03-14 | C-Cube Microsystems Inc. | Statistical multiplexed video encoding using pre-encoding a priori statistics and a priori and a posteriori statistics |
US6229850B1 (en) * | 1997-07-22 | 2001-05-08 | C-Cube Semiconductor Ii, Inc. | Multiple resolution video compression |
-
1997
- 1997-12-29 JP JP36926497A patent/JP3837889B2/ja not_active Expired - Fee Related
-
1998
- 1998-12-28 US US09/221,459 patent/US6356178B1/en not_active Expired - Fee Related
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008301532A (ja) * | 2004-06-02 | 2008-12-11 | Panasonic Corp | 生成装置および再生装置 |
US7526031B2 (en) | 2004-06-02 | 2009-04-28 | Panasonic Corporation | Seamless switching between random access units multiplexed in a multi angle view multimedia stream |
US7856062B2 (en) | 2004-06-02 | 2010-12-21 | Panasonic Corporation | Multiplexing apparatus and demultiplexing apparatus |
US8411759B2 (en) | 2004-06-02 | 2013-04-02 | Panasonic Corporation | Multiplexing apparatus and demultiplexing apparatus |
JP2010523048A (ja) * | 2007-03-29 | 2010-07-08 | トムソン ライセンシング | デジタルシネマシステムへのコンテンツ配信及びデジタルシネマシステムでの再生方法及び装置 |
JP2009027273A (ja) * | 2007-07-17 | 2009-02-05 | Toshiba Corp | 情報処理装置およびプログラム |
JP2011504337A (ja) * | 2007-11-15 | 2011-02-03 | トムソン ライセンシング | 映像を符号化するシステムおよび方法 |
Also Published As
Publication number | Publication date |
---|---|
JP3837889B2 (ja) | 2006-10-25 |
US6356178B1 (en) | 2002-03-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100288094B1 (ko) | 부호화된 비디오 시퀀스의 품질을 수동으로 변경하기 위한 방법 및 시스템 | |
JP3361009B2 (ja) | ビデオ符号化方法および速度量子化モデルを利用して符号化を行うシステム | |
KR100283384B1 (ko) | 부호화된 비디오 프레임의 품질을 수동으로 변경하기 위한 방법 및 시스템 | |
KR100288130B1 (ko) | 양자화 레벨을 가변시킴에 의해 비디오 부호기의 비트 할당을 제어하는 전송 속도 제어 디지탈 비디오 편집 방법 및 시스템 | |
US8331457B2 (en) | Information processing apparatus and method, and recording medium and program used therewith | |
KR100304212B1 (ko) | 감소된개수의오디오부호기들을갖는시청각물부호화시스템 | |
JP3740813B2 (ja) | 画像符号化方法および画像符号化装置 | |
JP3837889B2 (ja) | エンコード方法およびエンコード装置 | |
JP3911768B2 (ja) | 画像符号化方法及び画像符号化装置 | |
EP2112663A2 (en) | Information processing apparatus and information processing method | |
US6282242B1 (en) | Data compression device that switches between intra-frame coding and inter-frame coding | |
JP4650454B2 (ja) | 符号化装置及び符号化方法 | |
JPH10304372A (ja) | 画像符号化方法および装置、画像伝送方法 | |
JP3951152B2 (ja) | 画像符号化装置および方法 | |
JP4462643B2 (ja) | 画像符号化方法及び画像符号化装置 | |
JP4161385B2 (ja) | 画像符号化方法及び装置並びに画像処理装置及び画像処理方法 | |
JPH10308942A (ja) | 画像符号化方法及び装置並びに記録媒体並びに画像伝送方法 | |
JP4207098B2 (ja) | 符号化制御装置及び符号化制御方法、符号化装置及び符号化方法 | |
JPH10290429A (ja) | データ圧縮装置 | |
JPH10304377A (ja) | 画像符号化方法、装置及び記録媒体 | |
JPH10290427A (ja) | データ圧縮装置 | |
JPH1198499A (ja) | 画像符号化装置および画質予測方法 | |
JPH10294936A (ja) | バッファ残量制限処理装置 | |
JPH10290428A (ja) | データ圧縮装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040420 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060629 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060711 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060724 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100811 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110811 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120811 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130811 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |