JPH10304372A - 画像符号化方法および装置、画像伝送方法 - Google Patents

画像符号化方法および装置、画像伝送方法

Info

Publication number
JPH10304372A
JPH10304372A JP11314497A JP11314497A JPH10304372A JP H10304372 A JPH10304372 A JP H10304372A JP 11314497 A JP11314497 A JP 11314497A JP 11314497 A JP11314497 A JP 11314497A JP H10304372 A JPH10304372 A JP H10304372A
Authority
JP
Japan
Prior art keywords
encoding
image
rate
bit
gop
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP11314497A
Other languages
English (en)
Inventor
Masaaki Isozaki
正明 五十崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP11314497A priority Critical patent/JPH10304372A/ja
Publication of JPH10304372A publication Critical patent/JPH10304372A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

(57)【要約】 【課題】 圧縮符号化処理時間を短縮すると共に、符号
化ビットレートを任意に配できる画像符号化方法および
装置、画像伝送方法を提供する。 【解決手段】 ステップS41で設定されたエンコード
条件に従って、ステップS42でエンコード素材(ビデ
オ素材)に対するビット配分の重み係数を含むカスタマ
イズパラメータを設定する。ステップS43で、このパ
ラメータに基づいてGOPに対する符号化レートの配分
を計算し、コントロールファイルを作成する。このと
き、仮想的な符号化難易度を導入することにより、GO
P単位でカスタマイズを行うことができる。その後、必
要に応じてステップS44でプレビューを行い、ステッ
プS45で画質評価した後に、ステップS43で作成さ
れたコントロールファイルを用いて1パス画像符号化を
実行し、ステップS47で後処理を行って画像符号化処
理を終了する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、少なくとも1つの
フレーム内符号化画像と、フレーム間順方向予測符号化
画像および双方向予測符号化画像を含んで構成される画
像符号化グループを単位として画像を圧縮符号化する画
像符号化方法および装置、ならびに上記の圧縮符号化さ
れた画像を伝送する画像伝送方法に関する。
【0002】
【従来の技術】ディジタルビデオディスク(Digital Vi
deo Disk:DVD)やビデオCDなどの、いわゆるパッ
ケージメディアに蓄積されるビデオデータには、圧縮符
号化処理が施されている。このような圧縮符号化処理
(エンコード)を行う際には、ビデオ素材を画像符号化
装置(エンコーダ)に2回読み込んで処理する2パス符
号化(2パスエンコード)と呼ばれる方法が用いられ
る。
【0003】この2パスエンコードでは、1パス目の読
み込み時に、エンコードされる画像毎の符号化難易度
(Difficulty)がビデオ素材の全体に亘って測定され、
その符号化難易度に基づいて、データ圧縮されたビデオ
素材がパッケージメディアの記録容量に収まるように符
号化の際のビット配分(Bit assign)が計算される。そ
して、2パス目の読み込み時には、上記のビット配分に
従って、ビデオ素材が可変レートで圧縮符号化される。
【0004】以上のような可変レートの2パスエンコー
ドは、限られた符号化ビット量を有効に利用できるた
め、圧縮されたビデオ素材をディジタルビデオディスク
(Digital Video Disk:DVD)やビデオCDのような
所定の記録容量のパッケージメディアに蓄積する際に有
効である。
【0005】しかし、2パスエンコードを行うために
は、ビデオ素材の長さの少なくとも2倍の作業時間が必
要であるため、制作コストが上昇する一因になる。この
ため、画質よりも作業時間の短縮を優先させる場合に
は、1パスの固定レートのエンコードが選択されること
がある。
【0006】
【発明が解決しようとする課題】上記の1パスエンコー
ドによれば、ビデオ素材を1回だけエンコーダに読み込
ませればよいため、2パスエンコードに比べて作業時間
を短縮できる。しかし、固定レートでエンコードするた
め、複数のエンコード単位からなるビデオ素材のうちの
特定のエンコード単位の符号化ビットレートだけを他の
エンコード単位よりも上げる等の処理ができなかった。
このような要求があるビデオ素材としては、例えば、広
告用のビデオクリップなどがあるために問題であった。
【0007】また、エンコードを行う前に、ビデオ素材
の静止画の部分や、被写体の動きが特に激しく複雑な画
像の部分について、タイムコードなどの時間情報が分か
っている場合には、符号化が特に難しいと予測される部
分についてのみ符号化ビットレートを上げたいという要
求がある。さらに、1パスエンコードを行った結果の画
質に問題があるときには、特定の範囲のレートだけを調
整したいという要求も生じる。しかし、固定レートのエ
ンコードは、このような要求には応じられないという問
題があった。
【0008】本発明は、このような問題を解決するため
に行われたものであり、エンコード作業時間を短縮する
ことができる1パスのエンコードにおいて、ビデオ素材
に配分される符号化ビットレートを可変して圧縮符号化
できる画像符号化方法および装置、ならびに上記の圧縮
符号化を施して画像を伝送する画像伝送方法を提供する
ことを目的としている。
【0009】
【課題を解決するための手段】上記の課題を解決するた
めに提案する本発明の画像符号化方法は、ビデオ素材に
対してビット配分の重み係数を含むカスタマイズパラメ
ータを設定するカスタマイズパラメータ設定工程と、上
記設定されたカスタマイズパラメータに基づいて、少な
くとも1つのフレーム内符号化画像と、フレーム間順方
向予測符号化画像および双方向予測符号化画像を含んで
構成される画像符号化グループを単位とする符号化ビッ
トレートを、それらの総データ量が予め設定された所定
のデータ量を越えないように配分するレート配分工程と
を有することを特徴とするものである。
【0010】また、上記の課題を解決するために提案す
る本発明の画像符号化装置は、ビデオ素材に対してビッ
ト配分の重み係数を含むカスタマイズパラメータを設定
するためのカスタマイズパラメータ設定手段と、上記設
定されたカスタマイズパラメータに基づいて、少なくと
も1つのフレーム内符号化画像と、フレーム間順方向予
測符号化画像および双方向予測符号化画像を含んで構成
される画像符号化グループを単位とする符号化ビットレ
ートを、それらの総データ量が予め設定された所定のデ
ータ量を越えないように配分するための制御手段とを備
えることを特徴とするものである。
【0011】また、上記の課題を解決するために提案す
る本発明の画像伝送方法は、ビデオ素材に対してビット
配分の重み係数を含むカスタマイズパラメータを設定す
るカスタマイズパラメータ設定工程と、上記設定された
カスタマイズパラメータに基づいて、少なくとも1つの
フレーム内符号化画像と、フレーム間順方向予測符号化
画像および双方向予測符号化画像を含んで構成される画
像符号化グループを単位とする符号化ビットレートを、
それらの総データ量が予め設定された所定の伝送データ
量を越えないように配分するレート配分工程と、上記ビ
ットレートが配分された符号化画像を伝送する伝送工程
とを有することを特徴とするものである。
【0012】上記の本発明によれば、ビデオ素材のエン
コード作業時間を短縮することができる1パスのエンコ
ードにおいて、ビデオ素材の任意の部分に仮想的な符号
化難易度に基づいて重み付けされた符号化ビットレート
を配分できるようにしたため、高画質を保ちながらデー
タ量を効果的に圧縮できる画像符号化方法および装置、
ならびに上記の圧縮符号化を施して画像を伝送する画像
伝送方法を提供できる。
【0013】
【発明の実施の形態】次に、本発明の好ましい実施の形
態について図面を参照しながら説明する。
【0014】以下では、まず本発明の画像符号化装置の
構成について説明する。次に、上記の画像符号化装置の
構成に基づいて、本発明の画像符号化方法の基本となる
2パスエンコードおよび固定レートの1パスエンコード
について説明し、その後、本発明の画像符号化方法につ
いて説明する。なお、本発明の画像伝送方法については
最後に説明する。
【0015】図1は、本発明の画像符号化装置の実施の
一形態であるビデオエンコードシステムの構成例を示す
ブロック図である。このビデオエンコードシステムは、
ビデオ素材を圧縮符号化して、DVDなどの記録媒体
(パッケージメディア)に蓄積するためのものである。
【0016】スーパーバイザコントローラ1は、オペレ
ーティングシステムを構成するプログラムのうち、この
ビデオエンコードシステム全体の動作を監視して効率的
に制御するプログラムであるスーパーバイザを実行する
コントローラである。
【0017】このビデオエンコードシステムでは、スー
パーバイザコントローラ1が、DVDのオーサリングシ
ステム全体の管理を行い、ビデオ,オーディオ,字幕や
メニューなどのデータをエンコードするための各エンコ
ードシステムにエンコード条件を与えたり、エンコード
結果の報告を受ける。
【0018】なお、オーサリングとは、映像,音声,字
幕などのデータを、それぞれのデータ圧縮方式でエンコ
ードして、最終的にDVDなどの記録媒体に記録できる
ディジタルデータにまとめることをいう。
【0019】ビデオエンコードコントローラ20は、ビ
デオエンコードを制御するシステム全体を管理するため
のものであり、ネットワーク2を介してスーパーバイザ
コントローラ1に接続されている。
【0020】このビデオエンコードシステムでは、スー
パーバイザコントローラ1から送られる「v.enc 」とい
うファイルによって、ビデオエンコード条件が指定され
る。そして、ビデオエンコードコントローラ20側から
は、RAID(Redundant Arrays of Inexpensive Disk
es)16上のアドレス「v.adr 」と、データ「vxxx.au
i」がスーパーバイザコントローラ1に報告される。上
記の「v.adr 」は、エンコード結果のビット列(ビット
ストリーム)が書き込まれるRAID16のアドレスで
ある。「vxxx.aui」は、エンコード結果のビットストリ
ームがオーディオや字幕,メニュー等のサブピクチャと
多重化(マルチプレックス)される際に必要とされるデ
ータである。なお、RAID16は、複数台のハードデ
ィスクドライブ(HDD)を並列接続して冗長度を付与
することにより、記録容量や転送速度を向上させた記録
再生装置である。
【0021】ビデオエンコードコントローラ20は、ビ
デオ素材に対して符号化ビットレートを配分(以下では
単にビット配分ともいう。)する際の重み係数を含むカ
スタマイズパラメータを設定するためのカスタマイズパ
ラメータ設定手段であるグラフィカルユーザインターフ
ェース(GUI)21と、ビット配分計算部22と、M
PEGエンコーダコントローラ23と、ディジタルVT
R(DVTR)コントローラ24を備えており、パーソ
ナルコンピュータなどを用いて構成される。
【0022】ユーザは、GUI21を介して、ビット配
分計算部22に格納されているプログラム「BIT_ASSIG
N」と、MPEGエンコーダコントローラ23の3つの
プログラムを管理することができる。また、ユーザは、
GUI21を介してDVTRコントローラ24を管理す
ることもできる。
【0023】MPEGエンコーダコントローラ23は、
フレーム間順方向予測符号化画像および双方向予測符号
化画像を含んで構成される画像符号化グループを単位と
する符号化ビットレートを、それらの総データ量が予め
設定された所定のデータ量を越えないように配分するた
めの制御手段であり、後述するMPEGエンコーダ25
を制御する。
【0024】また、DVTRコントローラ24は、DV
TR(ディジタルVTR)17を制御するためのもので
ある。このDVTR17は、MPEGエンコーダ25と
接続されている。
【0025】MPEGエンコーダ25は、ビデオデータ
などをMPEG(Moving Picture Experts Group)方式
により圧縮符号化するためのものである。ここでは、ビ
デオデータの時間方向の冗長度が、動き補償予測により
除去される。なお、動き補償予測は、前画像から現在の
画像を予測して符号化する予測符号化に際して、画像中
の動きがある部分の変化分(動きのずれの量)を表す
「動きベクトル」を符号化することによりビデオデータ
を効果的に圧縮する方法である。
【0026】また、MPEGエンコーダ25は、エンコ
ードした結果を表示するためのモニタ18に接続され、
また、エンコード結果のビットストリームが記録される
RAID16にも接続されている。
【0027】MPEGエンコーダ25では、前画像を用
いる予測符号化を行わずにフレーム内だけで符号化され
る画像であるIピクチャ(Intra-Picture )、過去の画
像から現在の画像を予測して符号化される画像であるP
ピクチャ(Predictive-Picture)、過去と未来の両方向
の画像から現在の画像を予測して符号化される画像であ
るBピクチャ(Bidirectionally Predictive-Picture)
が生成される。
【0028】そして、生成されたピクチャは、少なくと
も1枚のIピクチャを必ず含む画像符号化グループであ
るGOP(Group of Pictures )として構成される。
【0029】図2は、GOP内の各ピクチャの配置例を
示している。ここでは、1つのGOPを構成するピクチ
ャ(フレーム)枚数Nが15であり、Iピクチャまたは
Pピクチャが現れる周期Mが3である場合を例示してい
る。
【0030】Iピクチャは、GOPの独立性を保ち、ラ
ンダムアクセスを可能にするために必要なピクチャであ
り、通常は1フィールドに1枚(1フレームに2枚)の
割合で含まれている。そして、15枚(0.5秒)程度
の画面が1つのGOPとされて取り扱われるのが通常で
ある。
【0031】表示順におけるGOPの先頭は、Iピクチ
ャの前にある最初のPピクチャ、またはIピクチャの次
にあるBピクチャである。また、GOPの最後は、次の
Iピクチャの前にある最初のPピクチャである。
【0032】次に、ビデオ素材を圧縮符号化処理するた
めの2パスエンコードについて説明する。
【0033】図3は、図1のビデオエンコードシステム
において、2パスエンコードを行う際の処理手順を示す
フローチャートである。
【0034】まず、ステップS71で、エンコード条件
を示すファイル「v.enc 」が、スーパーバイザコントロ
ーラ1からネットワーク2を経由してビデオエンコード
コントローラ20に与えられる。そして、MPEGエン
コーダコントローラ23は、このファイル「v.enc 」に
より示される、ビデオ素材に割り当てられる符号化のた
めのビット総量や最大レートなどのエンコード条件を設
定する。
【0035】ステップS72では、MPEGエンコーダ
コントローラ23が、エンコード素材(ビデオ素材)の
符号化難易(Difficulty)を測定する。この符号化難易
度については後述する。また、ここでは、上記のビデオ
素材の各画素のDC(直流成分)値や動きベクトル量M
Eなども測定される。そして、これらの測定結果に基づ
いてファイルが作成される。
【0036】上記の符号化難易度(Difficulty)は、次
のように測定される。エンコード素材となるビデオデー
タは、例えばDVTR(ディジタルVTR)17により
磁気テープにマスタとして収録されている。このマスタ
は、DVTRコントローラ24により制御されながらD
VTR17で再生されて、MPEGコントローラ23で
ピクチャ毎の符号化難易度(Difficulty)が測定され
る。
【0037】このとき、符号化時の量子化ステップ数を
固定値に設定しておき、エンコード素材を符号化する際
の発生ビット量が符号化難易度として測定される。この
測定により、被写体の動きが多く、高い周波数成分を多
く含む画像は、符号化時の発生ビット量が大きくなるた
め符号化難易度が高いとされる。一方、静止画や平坦な
部分が多い画像は、発生ビット量が少なくなるため符号
化難易度が低いとされる。
【0038】次に、ステップS73では、ビデオエンコ
ードコントローラ20が、ステップS71で設定された
エンコード条件に基づいて、割り当てビット量(ターゲ
ット量)の配分計算を行う。このビットの配分計算は、
ステップS72で測定された各ピクチャの符号化難易度
に応じて、ビット配分計算部22に格納された計算プロ
グラム「BIT_ASSIGN」を実行することにより行われるも
のである。なお、このビットの配分計算については後述
する。
【0039】そして、ステップS74では、ステップS
73で得たビット配分計算の結果を用いてエンコードさ
れた画像の画質を確認するためのプレビュー(Preview
)が行われる。このプレビューは、MPEGエンコー
ダ25に内蔵されているローカルデコーダを用いるモー
ドであり、エンコード結果のビットストリームの任意の
範囲を指定することができる。なお、上記のエンコード
結果は、RAID16には転送されない。
【0040】ステップS75では、ユーザーが、プレビ
ュー画像の画質を確認して、上記のビット配分計算の結
果を用いて最終的にエンコードを実行するかどうかを判
断する。この評価で画質に問題がないとされる場合には
ステップS78に進む。一方、ステップS75の画質評
価で問題があるとされる場合には、ステップS76に進
む。
【0041】ステップS76では、プレビューされたビ
ットストリームのうちの画質に問題があるとされた部分
に対して、ビット配分を多く(ビットレートを高く)し
たり、ビデオデータのR,G,Bの各成分に適切なノイ
ズリダクション処理を行う際のフィルターレベルを調整
するなどの、画質調整のためのカスタマイズが行われ
る。
【0042】そして、ステップS77でビット配分の再
計算を行った後にステップS74に戻り、カスタマイズ
を行った部分のプレビューを行う。そして、画質に問題
がないとされればステップS78に進む。
【0043】ステップS78では、MPEGエンコーダ
25が、ステップS77で計算されたビット配分に従っ
て、エンコード素材全体のエンコードを実行する。
【0044】そして、ステップS79で、エンコード結
果のビットストリームが、SCSI(Small Computer S
ystem Interface )を介してRAID16に直接転送さ
れて書き込まれる。また、ビデオエンコードコントロー
ラ20は、ステップS78におけるエンコードの終了後
に、エンコード結果情報をネットワーク2を経由してス
ーパーバイザコントローラ1に報告する。このような後
処理が終了すると、2パスエンコード処理が終了したこ
とになる。
【0045】なお、この図3に示す処理手順において、
ステップS72,ステップS74およびステップS78
はオンライン処理であり、その他の各ステップの処理は
オフラインで行われる。
【0046】次に、図3に示した処理手順のステップS
73で行われるビットの配分計算について詳細に説明す
る。
【0047】まず、エンコード結果が最終的に蓄積され
るDVDなどの記録媒体の容量のうちの、ビデオデータ
に割り当てられるビット総量「QTY_BYTES 」と最大ビッ
トレート「MAXRATE 」が、スーパーバイザコントローラ
1から指定される。
【0048】これに対して、ビット配分計算部22は、
最大ビットレート「MAXRATE 」以下になるように制限を
加えた総ビット量「USB_BYTES 」を求め、この値からG
OPのヘッダ(GOP header)として必要なビット量「TO
TAL_HEADER」を差し引いた値と、全体のフレーム総数か
らターゲット数の総和の目標値となる「SUPPLY_BYTES」
を算出する。そして、エンコード結果が「SUPPLY_BYTE
S」の大きさに収まるように、各ピクチャに対する符号
化ビット量(以下では、ターゲット(target)量とい
う。)を配分する。
【0049】なお、計算プログラム「BIT_ASSIGN」は、
例えばビデオエンコードコントローラ20のメモリに格
納されており、上記のビットの配分計算は、実際にはM
PEGエンコーダコントローラ23で実行される。
【0050】図4は、上記のビットの配分計算の処理手
順を示すフローチャートである。
【0051】ここでは、エンコード素材に対して、まず
ビット量がGOP単位で配分され、その後、各GOP内
で各ピクチャの符号化難易度(Difficulty)に応じてビ
ット配分が行われるものとして説明する。このとき、各
GOP毎の符号化難易度の和である「GOP_DIFF」に応じ
て、エンコードする際のGOP単位のビット割り当て量
「GOP_TARGET」が配分される。
【0052】まず、ステップS81で、エンコード条件
が入力される。このエンコード条件は、前述したよう
に、ビット総量「QTY_BYTES 」と最大ビットレート「MA
XRATE」などであり、スーパーバイザコントローラ1か
ら送られる。
【0053】次に、ステップS82で、図3のステップ
S72における符号化難易度(Difficulty)の測定に基
づいて作成されたファイルがそのまま読み込まれる。
【0054】ステップS83では、上記の符号化難易度
と併せて測定された各画像のDC(直流成分)値や動き
ベクトル量MEの大きさのパラメータの変化量から、シ
ーンが変化するシーンチェンジ点が検出され、後述する
シーンチェンジ処理が行われる。
【0055】なお、ステップS83におけるシーンチェ
ンジ検出/処理は、本発明の出願人が特願平8−274
094号明細書および図面にて既に開示した「映像信号
処理装置」に応じて行われる処理である。この「映像信
号処理装置」は、各フレームの映像信号の直流成分のレ
ベルを検出し、この直流レベルを曲線近似して得られる
誤差値を用いて上記映像信号のシーンチェンジのフレー
ムを検出するものである。
【0056】図5は、シーンチェンジ指定ポイントで、
PピクチャがIピクチャに変更される様子を示してい
る。
【0057】このように、シーンチェンジが検出された
ポイントでは、Pピクチャを、前画像を用いる予測符号
化を行わずにフレーム内だけで符号化される画像である
Iピクチャに変更することにより、画質改善が図られ
る。
【0058】次に、ステップS84で、チャプタ(CHAP
TER )境界処理が行われる。DVD再生装置におけるチ
ャプタサーチ時には、表示される画像が、特定されない
画像(ピクチャ)からチャプタ指定ポイントにジャンプ
してくることになる。その場合にも表示される再生画像
が乱れないようにするため、チャプタ指定ポイントが必
ずGOPの先頭になるようにピクチャタイプが変更され
る。
【0059】図6は、このようなチャプタ指定ポイント
で、PピクチャがIピクチャに変更される様子を示して
いる。
【0060】そして、ステップS85では、符号化難易
度(Difficulty)の値が変更後のピクチャタイプに合わ
せた値に補間/補正される。これは、ステップS82お
よびステップS83における一連の処理の結果、ピクチ
ャタイプ(I,P,Bピクチャ)が変更されたことによ
り符号化難易度測定時のピクチャタイプも変更されるた
めである。
【0061】ステップS86では、ステップS85で補
間/補正されて得られた符号化難易度と、エンコード素
材全体に対して与えられたビット(ターゲット)数の総
和の目標値である「SUPPLY_BYTES」に応じて、各ピクチ
ャ毎のターゲットビット量が計算される。
【0062】そして、ステップS87で、エンコード結
果のビットストリームをRAID16に書き込む際のア
ドレスが計算される。
【0063】そして、ステップS88では、エンコーダ
用のコントロールファイルが作成される。
【0064】以上の手順により、図3のステップS73
におけるビット配分計算が行われる。
【0065】ところで、上記のビット配分計算におい
て、各GOP毎の符号化難易度の和である「GOP_DIFF」
と、エンコードする際のGOP単位のビット割り当て量
「GOP_TARGET」とを変換するために、適当な評価関数が
用いられている。
【0066】図7は、上記の「GOP_DIFF」と「GOP_TARG
ET」とを変換するための最も簡単な関数の例を示してい
る。この例では、縦軸Yを「GOP_TARGET」,横軸Xを
「GOP_DIFF」として、Y=AX+Bという形の評価関数
を用いている。なお、全てのピクチャの符号化難易度の
総和「DIFFICULTY_SUM」は、予め算出されているものと
している。
【0067】次に、上記の評価関数を用いて行われるビ
ット配分計算について具体的に説明する。
【0068】まず、最大ビットレート「MAXRATE 」以下
になるように制限を加えた総ビット量「USB_BYTES 」
を、スーパーバイザコントローラ1から与えられたビッ
ト総量「QTY_BYTES 」と最大ビットレート「MAXRATE 」
を用いて(1)式のように求める。
【0069】 USB_BYTES = min(QTY_BYTES,MAXRATE × KT × total_frame_number) (1) ここで、ビデオ信号規格がNTSC方式である場合には
KT=1/8(bits)/30(Hz)であり、PAL方式
の場合には1/8(bits)/25(Hz)である。
【0070】「total_frame_number」はエンコードする
ビデオ素材のフレーム総数であり、「min(s,t)」は
s,tのうちの小さい方を選択する関数である。
【0071】ターゲット数の総和の目標値「SUPPLY_BYT
ES」は、(1)式で求めた制限を加えた総ビット量「US
B_BYTES 」からGOPのヘッダに必要なビット量「TOTA
L_HEADER」を差し引いて(2)式のように求める。
【0072】 SUPPLY_BYTES = (USB_BYTES )−(TOTAL_HEADER) (2) また、全てのピクチャの符号化難易度(Difficulty)の
総和「DIFFICULTY_SUM」は、(3)式で表される。
【0073】 DIFFICULTY_SUM = Σ(Difficulty) (3) さらに、GOP単位のビット割り当て量「GOP_TARGET」
の最小値を(4)式のようにおくと(5)式を得る。
【0074】 B = GOP_MINBYTES (4) Σy = A×Σx + B×n (5) ここで、Σy = SUPPLY_BYTES ,Σx = DIFFICULTY_SU
M であり、nはGOPの総数である。これより(6)式
を得る。
【0075】 A = (SUPPLY_BYTES − B×n)/(DIFFICULTY_SUM) (6) 従って、各GOP毎のターゲット量は(7)式で表され
る。
【0076】 GOP_TARGET = A × (GOP_DIFF) + B (7) その後、各GOP内で、ピクチャ毎の符号化難易度(Di
fficulty)に応じたビット配分が行われる。GOP内の
各ピクチャに配分される符号化ビット量を符号化難易度
の大きさに比例させる場合には、各ピクチャのターゲッ
ト量は(8)式で求められる。
【0077】 target(k) =(GOP_TARGET × diffuculty(k) )/(GOP_DIFF) (1 ≦ k ≦ GOP内のピクチャ数) (8) この場合には、ビデオ素材の中に符号化が極端に難しい
(すなわち「GOP_DIFF」が大きい)ピクチャがあると、
「GOP_TARGET」が非常に大きい量になってしまい、許容
されている最大ビットレートを越えてしまうことがあ
る。このため、最大のターゲット量が、「GOP_MAXBYTE
S」などの固定量を用いて制限されるようにする必要が
ある。同様に、最小のターゲット量も固定値「GOP_MINB
YTES」で制限される。このようなターゲット量の制限
は、具体的には、以下に説明するアルゴリズムにより行
われる。
【0078】MPEG(Moving Picture Experts Grou
p)によるビデオエンコード時には、仮想デコーダのバ
ッファ残量を考慮しながらビット配分することが義務付
けられている。この仮想バッファ残量の計算はVBV
(Video buffering verifier)と呼ばれる。
【0079】図8は、このVBVの計算手順を例示して
いる。計算の最初の「OCCUPANCY_UP(0) 」は、次の
(9)式に示すように固定値(この例では「VBVMAX * 2
/3」)からスタートする。
【0080】 OCCUPANCY_UP(0) = VBVMAX * 2/3 (9) なお、以下の説明では、「OCCUPANCY_UP」がグラフ上の
各ピクチャの上側のポイントを意味し、「OCCUPANCY_DO
WN」がグラフ上の各ピクチャの下側のポイントを意味す
るものとする。
【0081】例えば、DVDのバッファサイズ「VBVMAX
(1.75Mbits) 」に対して、k番目のピクチャのバッフ
ァのスタート点を「Occupancy_up(k) 」とし、そのピ
クチャのターゲット量を「target(k) 」とすると、ピ
クチャにビットを配分した後のバッファ内のデータ残量
「OCCUPANCY_DOWN(k) 」は(10)式で表される。
【0082】このバッファには、ビデオ素材のデータ量
に応じたビットレートとされるデータ量「SYSTEM_SUPPL
Y 」が、デコーダから供給され蓄積される。また、ピク
チャにビットを配分した後のバッファ内のデータ残量
「OCCUPANCY_UP(k+1) 」は(11)式で表される。
【0083】 OCCUPANCY_DOWN(k) = OCCUPANCY_UP(k) − target(k) (10) OCCUPANCY_UP(k+1) = OCCUPANCY_DOWN(k) + SYSTEM_SUPPLY (11) (11)式で表されるビット配分後のバッファ内のデー
タ残量は、図8中の右上に向かって上昇する矢印で表さ
れる量に相当する。すなわち、各ピクチャに配分される
ビットレートが大きいほど、この傾きは大きくなり、デ
ータがバッファに蓄積されやすいことを示す。なお、バ
ッファが一杯になった場合には、デコーダからバッファ
へのデータ供給が中止されるため、バッファのオーバー
フローを考慮する必要はない。このことは、バッファ残
量を、ある設定値ちょうどになるように制御する必要は
なく、設定値以上になるように制御すれば良いことを意
味している。逆に、各ピクチャに配分されるデータ量が
大きすぎると、バッファに蓄積されるデータが減少して
しまうことになる。
【0084】つまり、このバッファ内のデータ残量が一
定値以下にならないように、ターゲットビット量が計算
される。そして、ビデオ素材のデータ量に応じたビット
レートとされるデータ量「SYSTEM_SUPPLY 」が(12)
式で求められる。
【0085】 SYSTEM_SUPPLY = MAXRATE(bps) * KT (12) 図9は、GOP単位のターゲットビット配分計算の結果
の一例を示している。ここで、図9(A)は、前述した
評価関数と、最大ビットレート「GOP_MAXRATE」による
制限を考慮して求めたターゲット量に対して、上記のV
BVバッファ計算を行った結果の一例である。この図中
の1番目,4番目,7番目のピクチャでは、VBVの下
限である「VBVMIN」の値を下回っている。そこで、VB
Vが「VBVMIN」を下回ったピクチャを含むGOPのター
ゲット量が削減される。
【0086】GOP内で、VBV制限を加える前のター
ゲット量を用いてVBV計算を実行したときの「OCCUPA
NCY 」の最小値を「Occ_min 」とすると、VBVが制限
された値を越えないようにするための調整量は以下の式
で表される。ここで、VBV制限を開始するスタート点
「kstart」は、「OCCUPANCY_UP(k) 」が基準値「VBVL
INE(例えば VBVMAX * 3/4)」以上のkの値であり、こ
のときの「OCCUPANCY_UP(k)」の値を「Occ_start」と
する。OCCUPANCY_MIN < VBVMIN のときには r = (Occ_start - VBVMIN)/(VBVSTART - Occ_min) (13) ただし、各ターゲットに対して(14)式が成り立つと
する。
【0087】 target(j) = target(j) × r (kstart ≦ j ≦ k) (14) また、図9(B)は、上記のVBV制限を行った後の計
算結果の例を示している。このように求められたターゲ
ット量に基づいて作成されたコントロールファイルを用
いてエンコード処理を行うことにより、ビデオ素材の画
像毎の符号化難易度に応じてビットレートを配分する可
変ビットレートエンコードが実行される。
【0088】しかし、2パスエンコードを行うために
は、前述したように、ビデオ素材の長さの少なくとも2
倍の作業時間が必要である。このため、制作コストが上
昇するという問題があり、画質よりも作業時間の短縮を
優先させる場合には、以下に説明する1パスの固定レー
トのエンコードが選択される。
【0089】次に、従来行われている固定レートの1パ
スエンコードについて、再び図1のビデオエンコードシ
ステムの構成を参照しながら説明する。
【0090】図10は、固定レートの1パスエンコード
における処理手順を示すフローチャートである。
【0091】まず、ステップS21では、スーパーバイ
ザコントローラ1から、ネットワーク2を経由してエン
コード条件「v.enc 」が与えられる。この「v.enc 」
は、ビデオ素材に割り当てる符号化ビットの総量や最大
レートなどに関する情報である。そして、MPEGエン
コーダコントローラ13は、このエンコード条件に基づ
いてMPEGエンコーダ25を設定する。
【0092】ステップS22では、1パスエンコード用
のコントロールファイルが作成される。このコントロー
ルファイルの具体的な作成手順については後述する。
【0093】ステップS23では、ステップS22で作
成されたコントロールファイルを用いてエンコード処理
が行われる。
【0094】最後に、ステップS24で、エンコード結
果のビットストリームをRAID16に書き込むための
アドレスの設定や、エンコーダ用コントロールファイル
を出力する等の後処理が行われ、1パスエンコード処理
が終了する。
【0095】なお、ステップS23のエンコード工程を
除く各ステップにおける処理は、オフラインで行われる
処理である。
【0096】ところで、上記のようなエンコードにおい
て、エンコード素材(ビデオ素材)を1本の磁気テープ
に記録することができない場合には、複数の磁気テープ
に分割して記録されることになる。この場合には、デジ
タルVTR17で磁気テープの入れ換え作業を行う必要
があるため、エンコード処理を連続して行うことができ
ない。このような場合に、処理を中断することなく一度
にエンコードできる素材のエンコード単位(ENCU:
ENCode Unit )と定義する。図11は、前述した1パス
エンコード用コントロールファイルの作成手順を示すフ
ローチャートである。
【0097】まず、ステップS31で、エンコード条件
が入力される。ここでは、前述した2パスエンコードの
場合と同様に、ディスク容量のうちのビデオに割り当て
られたビット総量「QTY_BYTES 」と、最大ビットレート
「MAXRATE 」が、オーサリングシステムから指定され
る。そして、これに対して、最大ビットレート以下にな
るように制限を加えられた総ビット量「USB_BYTES 」が
求められる。
【0098】ステップS32では、ピクチャタイプが指
定される。ここでは、ピクチャタイプが、先頭のフレー
ムから順にI,B,B,P,B,B,・・・と規則正し
く設定されていく。
【0099】各エンコードユニット(ENCU)の先頭
からk番目のフレーム番号kのピクチャタイプを「p_ty
pe[k] 」とし、GOPの長さを「gop_n 」とすると、
「p_type[k] 」は(15)式で与えられる。
【0100】 gop_cycle[15] = {"B","B","I","B","B","P","B","B","P","B","B","P","B","B","P"} p_type[k] = gop_cycle[(k+2) mod(gop_n)] (15) 次に、ステップS33では、CELL境界(チャプタ境
界)処理が行われる。この処理は、図6に示した2パス
エンコードにおけるチャプタ境界処理と同様であるの
で、ここでは説明を省略する。
【0101】次に、ステップS34で、平均のビットレ
ートが計算される。
【0102】固定レートの1パスエンコードにおける平
均ビットレート「CONSTANT_RATE 」は、以下の(17)
式で表される。
【0103】 USB_BYTES = min(QTY_BYTES - MAXRATE × KT × total_frame_number) (16) CONSTANT_RATE = USB_BYTES / total_frame_number / KT (17) なお、上記の(16)式は、前述した2パスエンコード
における(1)式と同様の式であり、NTSC方式の場
合にはKT=1/8(bits)/30(Hz)であり、PA
L方式の場合には1/8(bits)/25(Hz)である。
【0104】また、「total_frame_number」はエンコー
ド素材(ビデオ素材)のフレーム総数であり、「min
(s,t)」はs,tのうちの小さい方を選択する関数で
ある。
【0105】ステップS35では、GOP毎に配分され
るビットレートが設定される。このビットレートの平均
がエンコード時のターゲットレートとされ、各GOPは
このターゲットレートに合わせてエンコードされる。
【0106】そして、ステップS36で、エンコード結
果のビットストリームをRAID16に書き込む際のア
ドレスが設定され、ステップS37で、エンコーダ用コ
ントロールファイルが出力される。このようにして作成
されたコントロールファイルを用いることにより、ピク
チャタイプが指定された固定レートの1パスエンコード
が実行される。
【0107】ところが、上述した固定レートの1パスの
エンコードでは、2パスエンコードに比べて作業時間を
短縮できるものの、例えば複数のエンコード単位からな
るビデオ素材のうちの任意のエンコード単位のビットレ
ートだけを他のエンコード単位よりも高くすることなど
はできなかった。このため、ビデオ素材のうちの、符号
化が特に難しいと予測される部分についてのみビットレ
ートを上げたいという要求や、エンコード結果の画質に
問題があときに、特定の範囲のビットレートだけを調整
したいという要求には応じられないという問題がある。
【0108】以下では、上記の問題を解決するために提
案する本発明の画像符号化方法について説明する。な
お、ここでは、上述した2パスおよび固定レートの1パ
スによる画像符号化方法と共通する部分についての説明
は省略し、これらとは異なる部分について主に説明する
ものとする。
【0109】図12は、本発明の画像符号化方法に係る
1パスエンコードの処理手順を示すフローチャートであ
る。この図12に示す処理手順において、ステップS4
2,ステップS44およびステップS46はオンライン
で行われる処理であり、その他の各ステップの処理はオ
フラインで行われる。
【0110】まず、ステップS41で、エンコード条件
が設定される。このエンコード条件は、従来と同様にス
ーパーバイザコントローラ1から送られる「v.enc 」と
いうファイルによって指定される。
【0111】次に、ステップS42で、カスタマイズ処
理を行うためのカスタマイズパラメータが設定される。
このカスタマイズパラメータは、前述したように、ビデ
オ素材に対する符号化ビットレートを配分する際の重み
係数を含むものである。このカスタマイズパラメータに
より、画質に問題があるとされた部分に対するビット配
分を多く(ビットレートを高く)する、画質調整のため
のカスタマイズが行われる。
【0112】このとき、ユーザーが、ビデオ素材に対し
て符号化レート配分などを変えて画質調整したい範囲
を、エンコードの開始前に知っている場合には、最初に
画質調整用のカスタマイズファイルが作成される。
【0113】ステップS43では、GOP毎のレート配
分が計算され、1パスエンコード用のコントロールファ
イルが作成される。そして、ピクチャタイプと各GOP
毎のターゲットレートが指定される。ここで、従来の1
パスエンコードと異なる点は、GOP毎に割り当てられ
るビットレートが固定ではなく、異なるレートが指定さ
れることである。このGOP毎のターゲットレートは、
ビデオ素材の全再生時間が、記録媒体の記録容量や伝送
路の伝送容量など、予め設定される総ビット量以内に収
まるように決定される。
【0114】ステップS44では、ステップS43で作
成されたコントロールファイルに従ってエンコードを実
行するどうかが判断される。実際には、ユーザーが、M
PEGエンコーダ25に内蔵されているローカルデコー
ダから出力される画質をチェックするプレビュー(Prev
iew )を行って判断する。
【0115】このプレビューは、上記のローカルデコー
ダから出力されるエンコード結果のビットストリームを
RAID16に出力しないモードであり、ユーザがロー
カルデコードする範囲を任意に指定することができる。
【0116】そして、ステップS45で画質に問題がな
いと判断された場合には、ステップS46に進み、ステ
ップS43で作成されたコントロールファイルに従って
エンコードを実行する。一方、ステップS45で画質に
問題があると判断された場合には、ステップS42に戻
って画質調整のためのカスタマイズ作業を行い、各GO
Pに対するレート配分計算を再度実行する。このカスタ
マイズ作業では、画質に問題がある部分のビットレート
を高くしたり、フィルターレベルを調整することなどが
行われる。
【0117】その後、ステップS46に進み、ユーザ
が、カスタマイズした部分の画質を確認し、全ての部分
が良好であるとされれば全体のエンコードを実行させ
る。
【0118】そして、ステップS47では、エンコード
結果であるビットストリームが、SCSIを経由して、
オーサリングシステムのサーバーであるRAID16に
直接書き込まれるなどの後処理が行われる。また、エン
コード後には、エンコード結果情報が、ネットワーク経
由でスーパーバイザーに報告される。
【0119】以上の手順は、本発明に係る画像符号化方
法によるビデオ素材のエンコード処理を示しているが、
プレビューによる画質評価を行う必要がない場合には、
処理を簡略化することができる。
【0120】図13は、図12に示した処理手順を簡略
化した手順を示している。すなわち、GOP毎のターゲ
ットレートを部分的に変更する必要がないことが予め分
かっている場合には、ステップS43でGOP毎のレー
ト配分を計算した後に、プレビューによる画質確認を省
略してステップS46に進み、エンコード素材全体のエ
ンコード処理を実行するようにする。
【0121】このようにすれば、エンコード作業時間を
さらに短縮することができる。
【0122】図14は、上述した本発明に係るエンコー
ド処理手順のステップS43におけるGOPレート配分
計算の手順を具体的に示している。
【0123】まず、ステップS51では、エンコード条
件が入力される。ここで、ディスク容量の中からビデオ
に割り当てられたビット総量「QTY_BYTES 」と、最大ビ
ットレート「MAXRATE 」に対して、最大ビットレート以
下になるように制限を加えた総ビット量「USB_BYTES 」
を求め、この値からGOPヘッダに必要なビット量「TO
TAL_HEADER」を差し引いた値と全体のフレーム総数から
ターゲット数の総和の目標値となる「TOTAL_SUPPLY」
を算出する。
【0124】ステップS52では、カスタマイズファイ
ルが読み込まれ、カスタマイズパラメータが設定され
る。
【0125】表1は、カスタマイズファイル「weight.t
xt」の例である。「ENCU_nb 」はエンコードするロール
の番号、「Filter」はフィルターの強さ、「D_weight」
はビット配分の際の重み係数を意味している。また、
「mquant_level」は、各ピクチャでの平坦な画像の場合
のフレーム内の処理モードの選択「MQUANT ON/OFF」で
ある。「scene_add 」は、シーンチェンジ点などでPピ
クチャをIピクチャにマニュアルで変更したい場合に用
いられる。ここでは、パラメータの変化点の時間情報が
タイムコードとして表されている。なお、表1中では、
「Filter」を「Fil 」、「D_weight」を「D_w 」、「sc
ene_add 」を「S_add」、「mquant_level」を「Mq」と
それぞれ略記している。
【0126】
【表1】
【0127】カスタマイズパラメータの指定方法、およ
びカスタマイズファイルの作成手順については後述す
る。
【0128】ステップS53では、ピクチャタイプが指
定される。これは、従来の場合と同じである。ここで、
シーンチェンジが指定された(すなわち「weight.txt」
の「scene_add 」が1とされた)フレームでは、Pピク
チャがIピクチャに変換される。このとき、指定された
フレームがBピクチャである場合には、そのフレームか
ら最も近いPピクチャがIピクチャに変換される。な
お、このピクチャタイプの指定については、前述した場
合と同様であるので、ここでは詳しい説明を省略する。
【0129】ステップS54ではシーンチェンジ処理が
行われ、ステップS55ではチャプタ境界処理が行われ
る。このシーンチェンジ処理およびチャプタ境界処理に
ついても、前述した場合と同様であるので、ここでは詳
しい説明を省略する。
【0130】そして、ステップS56で、上記のように
指定されたピクチャタイプに対して、仮想的な符号化難
易度(Difficulty)の値が作成される。
【0131】次に、この仮想符号化難易度の値を作成す
る方法について説明する。
【0132】仮想符号化難易度は(18)式で表され
る。
【0133】 difficulty[k] = d_weight[k] * KX * genbit (18) ここで、「d_weight[k] 」はエンコードユニットENC
Uの先頭からk番目のフレームの重み係数の値、「cons
t 」は定数、「KX」はピクチャタイプに対する重み係数
であり、「genbit」は各ピクチャタイプ(I,P,Bピ
クチャ)に対する仮想的な符号化難易度である。この
「KX」と「genbit」は、(19)〜(21)式で与えら
れる。
【0134】p_type[k] = "I" (Iピクチャ)のとき KX = Ki, genbit = Gi (19) p_type[k] = "P" (Pピクチャ)のとき KX = Kp, genbit = Gp (20) p_type[k] = "B" (Bピクチャ)のとき KX = Kb,genbit = Gb (21) これらの値は、例えば、Ki = 1.0, Gi = 40000, Kp
= 1.0, Gp = 20000,Kb = 1.4, Gb = 10000などであ
る。そして、「difficulty[k] 」には、「weight.txt
」に設定された重み付けが反映される。
【0135】次に、各ENCUのターゲット数の総和の
目標値「SUPPLY_BYTES」を求める。
【0136】図15は、総ビット量と「SUPPLY_BYTES」
との関係を示している。例えば、ENCUが2つの場合
には次の式で求められる。
【0137】 Qt[1] = frame_number[1] × e_weight[1] (22) Qt[2] = frame_number[2] × e_weight[2] (23) SUPPLY_BYTES[1] = TOTAL_SUPPLY × Qt[1]/(Qt[1] + Qt[2]) (24) SUPPLY_BYTES[2] = TOTAL_SUPPLY × Qt[2]/(Qt[1] + Qt[2]) (25) ここで、「frame_number[1] 」,「frame_number[2] 」
は「ENCU 1」,「ENCU2」のフレーム数であり、「e_wei
ght[1] 」,「e_weight[2] 」は各ENCUのレート配
分時に対する重み係数である。
【0138】そして、ステップS57では、GOPレー
トが計算される。ここでは、各GOPに対して、仮想的
な符号化難易度(difficuty )を用い、図7のような評
価関数を用いて符号化ビットレートの配分が計算され
る。「ENCU 1」の各GOPへのレート配分は、次の(2
6)式〜(31)式により求められる。「ENCU 2」に対
するレート配分についても同様である。 DIFFICULTY_SUM = Σ(difficulty[k]) (26) B = GOP_MINBYTES (27) Σy = A × Σx + B × n (28) ここで、Σy = SUPPLY_BYTES[1],Σx = DIFFICULTY_
SUM であり、nはGOPの総数である。よって、(2
8)式が得られ、「gop_target[j] 」および「target_r
ate[j]」は、(30)式および(31)式で与えられ
る。
【0139】 A = (SUPPLY_BYTES[1] − B×n)/DIFFICULTY_SUM (29) gop_target[j] = A × (gop_diff[j])+ B (30) target_rate[j] = gop_target[j]/gop_nb[j]/KT (31) jはENCUの最初から数えたGOPの番号、「gop_di
ff」および「gop_nb」はj番目のGOPに含まれるピク
チャの符号化難易度の総和およびピクチャの数である。
また、「GOP_MINBYTES」はGOP単位での最小ターゲッ
トバイト数(定数)である。各GOPは、このターゲッ
トレートに合わせてエンコード処理されることになる。
【0140】ステップS58では、エンコード結果のビ
ットストリームが書き込まれるRAID16のアドレス
が計算される。
【0141】そして、ステップS59で、エンコーダ用
コントロールファイルが出力され、処理が終了する。図
16は、カスタマイズパラメータの指定方法の具体例を
示している。
【0142】「WINDOW (1) 」は、ビット計算の結果の
各ピクチャに対するターゲットビット量を棒グラフで示
しており、縦方向はビットの大きさ、横方向は時間軸で
ある。
【0143】ユーザーは、エンコードした結果を見て、
画質を改善するためにターゲットビット量を調整したい
部分の仮想的な符号化難易度の重み係数「d_weight」を
指定する。また、「WINDOW (2) 」は、各ピクチャに対
する仮想的な符号化難易度の重み係数「d_weight」を示
している。なお、「WINDOW (3) 」は、「cs enable
[k]」により再配分される0の範囲を示している。
【0144】この例では、各ピクチャに対する符号化ビ
ットレートは、重み付け後の符号化難易度に応じて配分
されているため、「WINDOW (2)」で重み係数を大きく
すると、レート配分計算の結果、その分だけレートが増
加することになる。
【0145】ユーザーは、図中のTSからTEまでのカ
スタマイズ範囲と、重み係数の大きさを指定する。ここ
で、TSは「START POINT 」を示しており、TEは「EN
D POINT 」を示している。フィルターなどの他のパラメ
ータも同様に指定される。
【0146】このようなカスタマイズパラメータ指定作
業の結果として、カスタマイズ用のコントロールファイ
ル「weight.txt」が作成される。
【0147】図17は、上述したカスタマイズファイル
の作成手順を示すフローチャートである。ステップS6
1では、VBV制限を行うスタート点「kstart」および
エンド点「kend」が設定され、カスタマイズ範囲が入力
される。
【0148】ステップS62では、カスタマイズレベル
が指定される。このカスタマイズレベルは、画質を改善
するためにターゲットビット量を調整したい部分の仮想
的な符号化難易度の重み係数「d_weight」により指定さ
れる。
【0149】そして、ステップS63で、カスタマイズ
用のコントロールファイル「weight.txt」が作成され
る。なお、ここで作成されるカスタマイズ用のコントロ
ールファイル「weight.txt」は、前述の表1に示したも
のと同様である。
【0150】表2は、タイムコード指定するためのカス
タマイズメニューの例を示している。これにより仮想的
な符号化難易度の重みを変えて、特定の範囲のターゲッ
トビット量を調整する。
【0151】
【表2】
【0152】ところで、ユーザーが、エンコード素材の
段階でENCU間のビット配分を操作したい場合があ
る。例えば、映画素材の前に挿入される宣伝用の画像だ
けはビットレートを上げたいという場合である。このよ
うな場合には、各ENCUのレート配分時に、重み係数
「e_weight」を設定する。この重み係数は、例
えば、表3のようなファイルにより設定され、レート配
分計算時に読み込まれる。
【0153】
【表3】
【0154】なお、ここでは、ENCUが2個の場合に
ついて説明したが、ENCUが2個より多い場合にも同
様に計算できる。このようにして作成されたコントロー
ルファイルによるエンコード処理を行うことにより、カ
スタマイズパラメータが反映された1パスエンコードが
実現される。
【0155】次に、本発明に係る画像符号化方法におい
て、エンコード素材が映画フィルムに記録された映像で
ある場合の処理手順について説明する。
【0156】映画フィルムに記録された映像を、ビデオ
映像規格のメディアに記録するためには、オーサリング
に先だって、デジタルVTRに記録してマスタを作成す
るテレシネ変換と呼ばれる作業が行われる。このテレシ
ネ変換の際には、24コマ/秒で構成されているフィル
ム映像を、例えばNTSC方式の30フレーム/秒に変
換するプルダウン(pull down )と呼ばれる処理も行わ
れる。この処理は、同じフィールドを周期的に繰り返す
ものであり、2−3プルダウンなどと呼ばれる。
【0157】本発明に係るエンコードシステムでは、圧
縮符号化されたビデオ素材をDVDに蓄積する際には2
4コマ/秒のままでディスクに記録し、再生時にDVD
プレーヤ内部の信号処理により、これを30フレーム/
秒に変換することにより記録されるデータ量を低減して
いる。
【0158】図18は、このような2−3プルダウンを
含むエンコードの処理手順を示すフローチャートであ
る。
【0159】ステップS91では、まずエンコード条件
が入力される。
【0160】そして、ステップS92で、上記の入力さ
れたエンコード条件に基づいて、プルダウンパターンが
測定される。なお、この測定は、プルダウン指定時にの
み各ENCUごとに30秒間ずつ行われる。
【0161】ステップS93では、上記のプルダウンパ
ターンに従ってレート配分計算が行われる。
【0162】そして、ステップS94で、エンコードを
実行するかどうかが判断される。ここで、上記の計算さ
れたレート配分に基づいてエンコードを実行すると画質
に問題があると判断された場合にはステップS95に進
み、そのままエンコードを実行してもよいと判断された
場合にはステップS98に進む。
【0163】ステップS95では、前述した手順と同様
にカスタマイズ条件が設定される。
【0164】ステップS96では、上記の設定されたカ
スタマイズ条件に基づいてレートの再配分計算が行われ
る。そして、必要に応じてステップS97でプレビュー
を行って、ユーザが画質を確認した後に、再びステップ
S94に戻り、エンコードを実行するかどうかが判断さ
れる。
【0165】一方、ステップS94でエンコードを実行
してもよいと判断された場合には、ステップS98でそ
のままエンコードが実行される。
【0166】そして、ステップS99で、エンコードを
終了するかどうかが判断される。ここで、エンコードを
終了してもよいと判断された場合にはステップS100
に進み、エンコードをやり直す必要があると判断された
場合にはステップS95以降のステップを繰り返す。
【0167】そして、ステップS100で、エンコード
結果のビットストリームをRAID16に書き込むため
のアドレスの設定や、エンコーダ用コントロールファイ
ルを出力する等の後処理が行われてエンコード作業を終
了する。
【0168】ところで、以上の本発明に係る画像符号化
方法についての説明は、ビデオ素材を圧縮符号化してパ
ッケージメディアに蓄積することを前提としている。し
かし、本発明の画像符号化方法により、GOP毎に符号
化ビットレートが配分されて圧縮符号化されたビデオ素
材は、パッケージメディアに蓄積されるのみでなく、エ
ンコードシステムから他の機器に伝送されることもあ
る。
【0169】すなわち、本発明の画像伝送方法は、ビデ
オ素材に対してビット配分の重み係数を含むカスタマイ
ズパラメータを設定した後に、そのカスタマイズパラメ
ータに基づいて、GOPを単位とする符号化ビットレー
トを、それらの総データ量が予め設定された所定の伝送
データ量を越えないように配分するものである。
【0170】この画像伝送方法によれば、前述した本発
明に係る画像符号化装置を用いて、短時間にエンコード
作業時間を行うことができ、ビデオ素材の任意の部分に
符号化ビットを配分できる画像伝送方法を提供できる。
【0171】
【発明の効果】本発明によれば、固定レートの1パスエ
ンコードにおいて、仮想的な符号化難易度を導入してビ
ット配分を行うようにしたため、エンコード作業時間を
短縮すると共に、ユーザーの多様な要求に応じて任意に
符号化ビットレートを配分できる画像符号化方法および
装置、画像伝送方法を提供できる。
【図面の簡単な説明】
【図1】本発明に係る画像符号化装置の構成例を示すブ
ロック図である。
【図2】GOPについて説明するための図である。
【図3】2パスエンコードの手順を示すフローチャート
である。
【図4】2パスエンコードにおけるコントロールファイ
ルの作成手順を示すフローチャートである。
【図5】シーンチェンジについて説明するための図であ
る。
【図6】チャプタ処理について説明するための図であ
る。
【図7】「GOP_DIFF」と「GOP_TARGET」量とを変換する
ための関数の一例を示す図である。
【図8】VBVの計算について模式的に示す図である。
【図9】GOP単位のターゲットビット配分計算の一例
を示す図である。
【図10】1パス固定レートエンコードの手順を示すフ
ローチャートである。
【図11】1パス固定レートエンコードにおけるコント
ロールファイルの作成手順を示すフローチャートであ
る。
【図12】本発明に係る画像符号化方法の処理手順を示
すフローチャートである。
【図13】本発明に係る画像符号化方法の別の処理手順
を示すフローチャートである。
【図14】本発明に係る画像符号化方法におけるコント
ロールファイルの作成手順を示すフローチャートであ
る。
【図15】総ビット量と「SUPPLY_BYTES」との関係を示
す図である。
【図16】カスタマイズパラメータの指定方法の様子を
説明するための図である。
【図17】本発明に係る画像符号化方法におけるカスタ
マイズファイルの作成手順を示すフローチャートであ
る。
【図18】本発明に係る画像符号化方法を映画素材のプ
ルダウン処理に適用した場合の処理手順を示すフローチ
ャートである。
【符号の説明】
1 スーパーバイザコントローラ、 2 ネットワー
ク、 16 RAID、17 DVTR(ディジタルV
TR)、 18 モニタ、 20 ビデオエンコードコ
ントローラ、 21 グラフィカルユーザインターフェ
ース(GUI)、 22 ビット配分計算部、 23
MPEGエンコーダコントローラ、 24 ディジタル
VTR(DVTR)コントローラ、 25 MPEGエ
ンコーダ

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 ビデオ素材に対してビット配分の重み係
    数を含むカスタマイズパラメータを設定するカスタマイ
    ズパラメータ設定工程と、 上記設定されたカスタマイズパラメータに基づいて、少
    なくとも1つのフレーム内符号化画像と、フレーム間順
    方向予測符号化画像および双方向予測符号化画像を含ん
    で構成される画像符号化グループを単位とする符号化ビ
    ットレートを、それらの総データ量が予め設定された所
    定のデータ量を越えないように配分するレート配分工程
    とを有することを特徴とする画像符号化方法。
  2. 【請求項2】 上記カスタマイズパラメータ設定工程に
    おいて、ビデオ素材に対して画質調整を行うカスタマイ
    ズ範囲を指定することを特徴とする請求項1記載の画像
    符号化方法。
  3. 【請求項3】 上記レート配分工程において、上記画像
    符号化グループを構成する画像毎に設定される仮想符号
    化難易度と上記重み係数を用いて、符号化ビットレート
    を配分することを特徴とする請求項1記載の画像符号化
    方法。
  4. 【請求項4】 ビデオ素材に対してビット配分の重み係
    数を含むカスタマイズパラメータを設定するためのカス
    タマイズパラメータ設定手段と、 上記設定されたカスタマイズパラメータに基づいて、少
    なくとも1つのフレーム内符号化画像と、フレーム間順
    方向予測符号化画像および双方向予測符号化画像を含ん
    で構成される画像符号化グループを単位とする符号化ビ
    ットレートを、それらの総データ量が予め設定された所
    定のデータ量を越えないように配分するための制御手段
    とを備えることを特徴とする画像符号化装置。
  5. 【請求項5】 上記カスタマイズパラメータ設定手段
    は、ビデオ素材に対して画質調整を行うカスタマイズ範
    囲を指定することを特徴とする請求項4記載の画像符号
    化装置。
  6. 【請求項6】 上記制御手段は、上記画像符号化グルー
    プを構成する画像毎に設定される仮想符号化難易度と上
    記重み係数を用いて、符号化ビットレートを配分するこ
    とを特徴とする請求項4記載の画像符号化装置。
  7. 【請求項7】 ビデオ素材に対してビット配分の重み係
    数を含むカスタマイズパラメータを設定するカスタマイ
    ズパラメータ設定工程と、 上記設定されたカスタマイズパラメータに基づいて、少
    なくとも1つのフレーム内符号化画像と、フレーム間順
    方向予測符号化画像および双方向予測符号化画像を含ん
    で構成される画像符号化グループを単位とする符号化ビ
    ットレートを、それらの総データ量が予め設定された所
    定の伝送データ量を越えないように配分するレート配分
    工程と、 上記ビットレートが配分された符号化画像を伝送する伝
    送工程とを有することを特徴とする画像伝送方法。
JP11314497A 1997-04-30 1997-04-30 画像符号化方法および装置、画像伝送方法 Withdrawn JPH10304372A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11314497A JPH10304372A (ja) 1997-04-30 1997-04-30 画像符号化方法および装置、画像伝送方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11314497A JPH10304372A (ja) 1997-04-30 1997-04-30 画像符号化方法および装置、画像伝送方法

Publications (1)

Publication Number Publication Date
JPH10304372A true JPH10304372A (ja) 1998-11-13

Family

ID=14604694

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11314497A Withdrawn JPH10304372A (ja) 1997-04-30 1997-04-30 画像符号化方法および装置、画像伝送方法

Country Status (1)

Country Link
JP (1) JPH10304372A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002344941A (ja) * 2001-05-14 2002-11-29 Sony Corp コンテンツ品質制御システム
US6834080B1 (en) 2000-09-05 2004-12-21 Kabushiki Kaisha Toshiba Video encoding method and video encoding apparatus
WO2005125217A1 (ja) * 2004-06-21 2005-12-29 Mitsubishi Denki Kabushiki Kaisha 動画像符号化装置、動画像記録装置、及び動画像再生装置
US7023914B2 (en) 2000-02-29 2006-04-04 Kabushiki Kaisha Toshiba Video encoding apparatus and method
JP2011109351A (ja) * 2009-11-17 2011-06-02 Canon It Solutions Inc 動画編集システム、制御方法およびプログラム
JP2012509013A (ja) * 2008-11-13 2012-04-12 トムソン ライセンシング Gopマージおよびビット割付けを用いたマルチスレッド・ビデオ符号化
CN113766230A (zh) * 2021-11-04 2021-12-07 广州易方信息科技股份有限公司 媒体文件编码方法、装置、计算机设备和存储介质

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7023914B2 (en) 2000-02-29 2006-04-04 Kabushiki Kaisha Toshiba Video encoding apparatus and method
US6834080B1 (en) 2000-09-05 2004-12-21 Kabushiki Kaisha Toshiba Video encoding method and video encoding apparatus
US7180945B2 (en) 2000-09-05 2007-02-20 Kabushiki Kaisha Toshiba Video encoding system calculating statistical video feature amounts
JP2002344941A (ja) * 2001-05-14 2002-11-29 Sony Corp コンテンツ品質制御システム
WO2005125217A1 (ja) * 2004-06-21 2005-12-29 Mitsubishi Denki Kabushiki Kaisha 動画像符号化装置、動画像記録装置、及び動画像再生装置
JP2012509013A (ja) * 2008-11-13 2012-04-12 トムソン ライセンシング Gopマージおよびビット割付けを用いたマルチスレッド・ビデオ符号化
US9210431B2 (en) 2008-11-13 2015-12-08 Thomson Licensing Multiple thread video encoding using GOP merging and bit allocation
JP2011109351A (ja) * 2009-11-17 2011-06-02 Canon It Solutions Inc 動画編集システム、制御方法およびプログラム
CN113766230A (zh) * 2021-11-04 2021-12-07 广州易方信息科技股份有限公司 媒体文件编码方法、装置、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
JP3675464B2 (ja) 動画像符号化装置および動画像符号化制御方法
JP3740813B2 (ja) 画像符号化方法および画像符号化装置
JP3911768B2 (ja) 画像符号化方法及び画像符号化装置
JP3837889B2 (ja) エンコード方法およびエンコード装置
JP4958713B2 (ja) 動画像符号化装置及びその制御方法
JPH10304372A (ja) 画像符号化方法および装置、画像伝送方法
EP2112663A2 (en) Information processing apparatus and information processing method
JP4650454B2 (ja) 符号化装置及び符号化方法
US6282242B1 (en) Data compression device that switches between intra-frame coding and inter-frame coding
JP4462643B2 (ja) 画像符号化方法及び画像符号化装置
US20110228857A1 (en) Video data processing apparatus, video data processing method, and program
JP3951152B2 (ja) 画像符号化装置および方法
JP2000261799A (ja) 可変レート動画像符号化装置
JP4710108B2 (ja) 画像信号符号化方法及び装置
JP4288897B2 (ja) 符号化装置及び方法、プログラム、記録媒体
JPH11196410A (ja) 動画像符号化方法、動画像符号化装置及び動画像信号記録媒体
JP3307367B2 (ja) 可変転送レート符号化装置
JP3660514B2 (ja) 可変レート動画像符号化方法および動画像編集システム
JPH10308942A (ja) 画像符号化方法及び装置並びに記録媒体並びに画像伝送方法
JP4207098B2 (ja) 符号化制御装置及び符号化制御方法、符号化装置及び符号化方法
JP4161385B2 (ja) 画像符号化方法及び装置並びに画像処理装置及び画像処理方法
JPH10304376A (ja) 画像符号化方法及び装置並びに記録媒体並びに画像伝送方法
JPH10108200A (ja) 画像符号化方法およびその装置
JPH08331556A (ja) 画像符号化装置および画像符号化方法
JP4423215B2 (ja) 画像処理装置

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20040706