JPH10108200A - 画像符号化方法およびその装置 - Google Patents

画像符号化方法およびその装置

Info

Publication number
JPH10108200A
JPH10108200A JP27899096A JP27899096A JPH10108200A JP H10108200 A JPH10108200 A JP H10108200A JP 27899096 A JP27899096 A JP 27899096A JP 27899096 A JP27899096 A JP 27899096A JP H10108200 A JPH10108200 A JP H10108200A
Authority
JP
Japan
Prior art keywords
image
picture
encoding
cut
amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP27899096A
Other languages
English (en)
Other versions
JP4416845B2 (ja
Inventor
Toshiaki Setogawa
俊明 瀬戸川
Kazuyasu Imahashi
一泰 今橋
Kenji Mori
健治 森
Kentaro Tanaka
謙太郎 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP27899096A priority Critical patent/JP4416845B2/ja
Publication of JPH10108200A publication Critical patent/JPH10108200A/ja
Application granted granted Critical
Publication of JP4416845B2 publication Critical patent/JP4416845B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 (修正有) 【課題】 符号化した画像データの画質低下を検出して
も、GOPに起因するピクチャの非独立性により、任意
の部位から修正することができない。 【解決手段】 編集リストを用いて編集点の対象となる
カットの場所を指定しておき(S01)、仮符号化処理
によりピクチャの複雑の度合いを示す「DIFFICALTY」を
求め(S02)、「DIFFICALTY」から最終的に発生すべ
き総情報量をシーンごとの「DIFFICALTY」に比例するよ
うにGOP単位でビット量を割り当て(S03)、正式
の符号化処理を行う(S04)。正式の符号化処理は仮
符号化処理と同じ符号化処理方法で行う。正式の符号化
処理中は、割り振られたビット量により予め定められた
量子化レベルの重み付け制御を行い、画像の各周波数帯
域の情報量の制御を行う。正式の符号化処理結果を復号
して、その結果を観察して画質を評価する(S05)。
画質に問題があるとき、カット場所を基準にして再符号
化処理する(S06)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は画像符号化方法とそ
の装置に関する。より特定的には、本発明は、画質を低
下させずかつ圧縮画像データ全体として規定された範囲
以内で収まるように「可変ビットレート方式」で画像圧
縮を行う際、「カット」編集方式を用いてカットごとに
オペレーターが任意にビットレートを指定できるように
して自動管理されたビットレートを部分的に修正し、か
つその部分だけを再符号処理を行う画像符号化方法とそ
の装置に関する。
【0002】
【従来の技術】画像信号帯域圧縮技術のうち動画像信号
帯域圧縮方式として、H.261、MPEG(Motion P
icture Eepert Group)などの国際標準化実用技術が知ら
れている。高能率画像圧縮技術(または高能率画像符号
化技術)の1つであるMPEGはマルチメディアにおけ
る動画像信号帯域圧縮方式としてとして、DVD(デジ
タル・ビデオ・ディスク)、VOD(ビデオ・オン・デ
マンド)、コンピュータ、通信、放送、情報家電、エン
ターテイメントなど多くの分野での適用が試みられてい
る。MPEGについては、下記の分類による提案がされ
ている。 MPEG1:1.5 Mb/s前後で許容限度を上回る品質
の動画像符号化 MPEG2:16Mb/s前後で高品質動画像符号化 MPEG3:50〜80Mb/sでハイビジョンテレビ
(HDTV)信号符号化 本発明において主としてMPEG2について言及する。
本明細書においてMPEGによる符号化・復号化方式を
MPEG処理と略称する。
【0003】MPEG処理においては、ピクチャ(画
像)を複数まとめた「GOP(GROUPOF PICTURE)」と
呼ぶ複数のピクチャごとに符号化処理または復号化処理
を行う。GOPは画像伝送の単位であり、符号化処理・
復号化処理の単位でもある。フレームごと(またはフィ
ールドごと)の画像データ(ビデオデータまたはピクチ
ャ)が連続するTV画像を例示すると、GOPにおける
ピクチャは単純なフレームごとのピクチャ、つまり、I
(Intra) ピクチャ(画面内符号化ピクチャ)の連続では
なく、符号化効率を高めてデータの伝送量を減少させる
ために動き補償などの技法を用いて予測したピクチャを
用いる。予測ピクチャとしては、P(Prediction)ピクチ
ャ(前方予測符号化ピクチャ)、B(Bidirection)-ピク
チャ(双方向予測(外挿・内挿)符号化ピクチャ)が知
られている。したがって、GOPには、複数のIピクチ
ャ、Pピクチャ、Bピクチャが混在したピクチャの集合
が収容されている。GOP、Iピクチャ、Pピクチャ、
Bピクチャの詳細およびこれらの関連については後述す
る。
【0004】高能率画像圧縮方式としては、図1に図解
したように、「固定ビットレート符号化方式」と「可変
ビットレート符号化方式」とが知られている。「固定ビ
ットレート符号化方式」は画像(ピクチャ)ごとのビッ
ト発生量は変化するがGOP単位で見ればほぼ一定のビ
ット量にする方式である。「可変ビットレート符号化方
式」は、画像(ピクチャ)ごとのビット発生量も変化す
るが、GOP単位でもビット発生量が変化する方式であ
る。図1における変数iはシーン数を示す。本発明は
「可変ビットレート符号化方式」に関係する。
【0005】可変ビットレート符号化処理 映画やドラマなどの画像のMPEG2による帯域圧縮・
符号化処理を行う場合、複雑な絵柄のシーンのため量子
化レベルを上げて圧縮して情報量を増やさなければ画質
が保てない部分と、単純な絵柄のシーンのために量子化
レベルを下げて情報量を減らしても圧縮しても画質を保
つことが可能な部分がある。可変ビットレート符号化方
式は、トータルとしてはビット発生量をある値に収める
ことを前提としつつ、全体として高い画像符号化を実現
させるため、画像の内容に応じて符号化情報量を変化さ
せる符号化方法である。すなわち、可変ビットレート符
号化方法においては、複雑な絵柄にはその画質を保つの
に十分な情報量を割り当て、単純な絵柄にはその情報量
を抑制して、全体のビット発生量(またはビットレー
ト)を制約された範囲に収める。
【0006】より具体的に述べると、DVDにおける画
像データはMPEG2のMP@ML標準に従って圧縮さ
れる。しかしながら、DVDのメモリ容量に限度がある
から、その容量内に圧縮画像データが収容できるよう
に、画像ごとに圧縮比を変化させて高画質を保ちながら
限られたメモリ容量を効率的に使用する可変ビットレー
ト・フォーマットで圧縮画像データを符号化処理する。
【0007】2パス符号化処理について 可変ビットレート符号化方式において、図2に図解した
ように、第1回目の工程として仮符号化処理(仮エンコ
ーディングまたは前処理符号化処理)を行って画像デー
タ全体の複雑の度合い(「DIFFICALTY」)を調査し、そ
の後、第2回目の工程として「DIFFICALTY」を参照して
正式な画像圧縮符号化処理を行う2パス符号化処理を行
う。仮符号化処理は、一枚の画像を複数のブロックに切
り分け、その一つのブロックを、直交変換処理、たとえ
ば、離散コサイン変換(Discrete Cosin
e Transform、DCT)処理またはウエーブ
レット変換処理などのサブバンドコーディング方式(与
えられた信号源をいくつかの周波数帯域に分解し、それ
ぞれの周波数帯域の電力値を求める変換方式)による信
号処理を行う。サブバンドコーディングのような、画像
信号を二次元の時間領域の画素情報から周波数領域の情
報に直交変換する方式において、画像を分割した各ブロ
ックごとの、周波数領域の電力値または、情報量、ある
いはビットのマグニチュード、もしくはビット発生量の
分布に着目してみると、符号化処理後の各周波数帯域の
電力値が直流成分や低域成分のみならず高域成分に至る
まで広く分布していれば、複雑な絵柄を示しており、逆
に、直流成分や低域成分に発生ビット量が集中しており
全体の電力値が少ない時には単純な絵柄を示しているこ
とが判る。従って、仮符号化処理の結果の各画像ごとの
周波数成分の電力値を合計したビット発生量の時間変化
は、そのまま絵柄の複雑なシーンや単純なシーンの時間
的な経過の様子を示している。この仮符号化処理後の発
生ビット量は絵柄(または画像(ピクチャ) )の「複雑
の度合い」を意味しており、この絵柄の複雑の度合いを
「DIFFICALTY」と呼ぶ。「DIFFICALTY」は符号化の際の
おおよそのビット発生量を示すパラメータである。
【0008】
【発明が解決しようとする課題】しかしながら、上述し
た方法には下記に述べる不具合がある。 第1の不具合:2パス符号化処理における第2工程であ
る正式の符号化処理において、仮符号化処理において求
めた「DIFFICALTY」に基づき定められた総情報量に合わ
せ込む形で画像の帯域別の情報量の重み付けを行うが、
この重み付けは、あくまでも「最も確からしい予測」で
あり、符号化後の最終的な総ビット発生量はある程度約
束されてはいても、符号化処理した画像全てにわたって
画質が約束されているわけではない。したがって、全て
の画質を良好なものとするにはさらに精密な符号化処理
を行う必要がある。しかしながら、従来の方法では、部
分的なピクチャの画質改善が効率よく行えない。
【0009】第2の不具合:可変ビットレート符号化方
式によって画像ごとにビット発生量を変化できるが、単
純にピクチャーごとのデータビットを送りだせばよいわ
けではない。MPEG2においては標準再生機が厳密に
定義されており、再生バッファの容量は1.75Mbit と定
められている。画像圧縮符号処理を行う符号化装置側で
は再生バッファがオーバーフローしたりアンダーフロー
したりしないように制御(管理)しなければならない。
画像の絵柄によりある部分はビット量を多くし、ある部
分は少なくするという「可変ビットレート符号化処理」
の条件下では、毎フレームごとに発生したビットを単純
に等間隔で送り出すと、MPEG2で定められたバッフ
ァサイズではオーバーフローすることがある。そこで、
符号化装置において、再生機のバッファに実際どのくら
いのデータ量が入っているのか計算しつつ、例えば、ビ
ット量が多いピクチャについては少し手前から送り出す
などして、絶えずバッファ容量を監視制御する必要があ
る。この制御は、映画やドラマなどのプログラムの始ま
りから終了まで継続的に行われなければならない。例え
ば、仮にある部分の符号化処理後の画質に問題あるから
と言って、その部分の量子化レベルを変更することは、
そこから後ろの部分のバッファ容量に影響を与えてしま
い、問題となる箇所のみを変更するわけには行かない。
このため、通常では途中だけビットレートを変更するこ
とは極めて困難となる。
【0010】第3の不具合:GOPは完全に独立はして
いない。そのため、ある部分だけを再符号化するわけに
はいかない。この詳細については具体的に詳述するが、
ここでは簡単に述べる。MPEGにおいては基本的に、
GOP単位で符号化処理・復号化処理を行うから、それ
ぞれのGOPが完全に独立していることが望ましい。し
かしながら、あるGOP内のBピクチャの処理には前の
GOPに含まれるIピクチャまたはピクチャを参照しな
いと処理できないから、それぞれのGOPは完全には独
立していない。その結果、自活の低下が検出された任意
のピクチャから自由に画質を改善することはできない。
【0011】以上の記述から明らかなように、もし符号
化処理される画像(たとえば、映画などのプログラム)
の途中に画質的に問題点があったとしてもそこだけを再
符号化処理して差し替え編集をすることは困難であり、
かりに画質が問題となる箇所が1秒間であったとして
も、映画なら約2時間分を問題となる箇所のビット発生
量を訂正しつつもう一度最初から繰り返して符号化する
必要があるが、これまでの方法では、画質的に問題が生
じた場合そこだけを修正しようと考えることは事実上で
きないという問題に遭遇している。
【0012】
【課題を解決するための手段】本願発明者は、GOP単
位での編集は可能であるMPEGの持っているオリジナ
ルの特質は保ちながら、編集などにおける「カット」単
位では原理的に画質に影響を与えない編集方法を提案し
た(たとえば、平成8年2月29日に出願した「画像デ
ータ処理方法と装置」、特願平8−42980号)。こ
の方法は、「カットのあるピクチャシーケンス」を応用
し、画質的に問題となる部分だけを再符号化して差し替
え編集する方法である。カットとしては、編集段階にお
いて作成された編集決定リスト(EDL)に基づいて行
う、定期的に行う、映像シーンの状況に応じて行うなど
任意に設定できる。このカット編集方式の詳細は後述す
る。
【0013】本発明の目的は、上記「カット」編集方式
を応用し、カットごとに編集のディレクタなど、画像処
理を行うオペレーターが任意にビットレートを指定でき
るようにして自動管理されたビットレートを部分的に修
正し、かつその部分だけを再符号化処理し、改善された
画質に編集する方法および装置を提供することにある。
【0014】したがって、本発明によれば、2パス符号
化処理を行う画像符号化方法であって、(a)後に編集
点の候補となりうる「カット」の場所を指定し、(b)
指定した「カット」位置に基づいて仮符号化処理(第1
の符号化処理工程)をして画像の複雑の度合いを示す
「DIFFICALTY」データを求め、(c)該「DIFFICALTY」
データにより、最終的に発生すべき総情報量をシーンご
との「DIFFICALTY」に比例するように、ビット量を割り
振り、(d)割り振られたビット容量によりあらかじめ
定められた量子化レベルの重み付け制御を行ない画像の
各帯域の情報用の制御を行いながら、仮符号化処理の時
と同じ符号化方法で画像データを正式に符号化処理し、
(e)符号化処理結果を観察して低い画質の部分が存在
するときその部分の量子化レベルの重み付けの制御を変
更し、(f)その部分を含む「カット」位置を再符号化
処理する、画像符号化方法が提供される。すなわち、本
発明においては、編集可能な単位「カット」を設定し、
「カット」単位で発生ビット量を指定し、「カット」ご
とに再生機のバッファをシミュレートし、バッファがオ
ーバーフローしないように制御し、(実際には多重化レ
ートを制御し)、一度符号化処理をした後であっても、
部分的にビット量を上下に再調整し再符号化処理した画
像をもって、差し替え編集することにより、符号化処理
後に画質を部分的に改善するか、または、さらに全体の
圧縮比を上げる。
【0015】再符号化処理としては下記がある。 1.低い画質の部分で一旦、符号化処理を停止し、再符
号化処理によるビット増加量に相当する情報量をそれ以
前のシーンの部分で情報量を減少させても画質に問題が
生じない場所を選択し、画質が問題となるシーンのビッ
トの増加量に見合うようにその部分の量子化レベルを下
げて、前記両者を再符号化処理する。 2.低い画質のシーンの量子化レベルを上げて再符号化
処理し、増加したビット量を一時的に保留し、後に符号
化処理されるシーン全体から均等にビット量を差し引
き、その結果、その後のビット量を減少させて、総ビッ
ト量を定められた範囲に収める。 3.低い画質のシーンの量子化レベルを上げて再符号化
処理し、増加したビット量を一時的に保留し、画質が問
題になりにくそうなシーンを特定し、その部分の量子化
レベルを下げて符号化処理を行い、その結果、その後の
ビット量を減少させて総ビット量を定められた範囲に収
める。 4.画質が問題となるシーンまたは「カット」は、その
場では再符号化処理せずに、その場所を特定するマーキ
ング(例えば、タイムコードや「カット」の番号を控え
ておくなど)だけして符号化処理を続け、最後まで符号
化処理が終わった時点で、問題となるシーンのすべての
量子化レベルの重み付けを変更して再符号化処理し、そ
の時に増加したビット量に見合う分を減少させるべく量
子化レベルを下げても問題のないようなシーンを選び出
し、その部分のビット量を減少させて再符号化処理し、
その結果、総ビット量を定められた範囲に収める。
【0016】また本発明によれば、上記画像符号化方法
を実施する画像符号化装置が提供される。すなわち、本
発明の画像符号化装置は、後に編集点の候補となりうる
「カット」の場所を指定する手段と、「カット」位置に
応じて仮符号化処理をして符号化する画像の複雑の度合
いを示す「DIFFICALTY」データを求める手段と、該「DI
FFICALTY」データにより、最終的に発生すべき総情報量
をシーンごとの「DIFFICALTY」に比例するように、ビッ
ト量を割り振る手段と、割り振られたビット容量により
あらかじめ定められた量子化レベルの重み付け制御を行
ない画像の各帯域の情報用の制御を行いながら、仮符号
化処理の時と同じ符号化方法で画像データを正式に符号
化処理する手段と、低い画質の部分が存在するときその
部分の量子化レベルの重み付けの制御を変更し、その部
分を含む「カット」を再符号化処理する手段とを有する
画像符号化装置が提供される。
【0017】
【発明の実施の形態】本発明の好適実施例を述べる前
に、MPEGが適用されるシステムの例、および、MP
EGの処理の対象とするピクチャ(画像)の構造につい
て述べる。
【0018】画像伝送系統における符号化・復号化シス
テム 図3はMPEGが適用されるシステム構成の1例として
画像伝送系統における画像符号化装置と画像復号化装置
とのシステム構成を示した図である。このシステムは、
たとえば、VOD(Video On Demand: ビデオ・オン・デ
マンド)に代表されるような通信サービス、または、D
VDに記録された映像信号を、DVDを蓄積メディア3
00として復号するシステムにも適用できる。この画像
符号化・復号化システムにおいては、ビデオテープ記録
再生装置(VTR)100において再生されたフレーム
ごとのオリジナルのディジタルビデオ信号(フレーム画
像データまたはフレーム・ピクチャ)を画像符号化装置
200においてフレームのピクチャごとに帯域圧縮・符
号化して蓄積メディア300(または伝送経路)に送出
する。蓄積メディア300としては、たとえば、DV
D、HDD(ハードディスク装置)などが例示され、こ
れらの記録媒体を用いた場合は、帯域圧縮・符号化処理
された画像データが記録され、読み出される。伝送経路
300の場合は伝送経路の上をビットストリームとして
帯域圧縮・符号化された画像データが伝送されていく。
画像復号化装置400は蓄積メディア300(または伝
送経路)を経由して入力された帯域圧縮・符号化処理さ
れた画像データを、画像符号化装置200における符号
化処理と逆の復号処理を行ってVTR100から出力さ
れたと同等の画像データを再生し、TVモニタ500に
その再生画像を表示する。画像符号化装置200におい
てMPEGに基づく画像データの圧縮・符号化処理が行
われ、画像復号化装置400において帯域伸長・復号処
理が行われる。
【0019】本発明の好適な実施例を述べる前に、上記
本願発明者で提案した、特願平8−42980号のカッ
ト編集方式の概要を述べる。まず、ピクチャとの関連に
おいてその処理を述べる。ピクチャの構成 図4はMPEGにおける符号化順序を示したグラフであ
る。図5は図4に示したピクチャの意味とのその関連を
示したグラフである。符号「I」はI(Intra) ピクチャ
(画面内符号化ピクチャ)を示し、符号「P」はP(Pre
diction)ピクチャ(前方予測符号化ピクチャ)を示し、
符号「B」はB(Bidirection)-ピクチャ(双方向予測
(外挿・内挿)符号化ピクチャ)を示す。Iピクチャと
はある画面、たとえば、フレームでそれ自身独立して再
生が可能な画像のことである。Pピクチャとはそれより
も前方(過去)にあるIピクチャまたはPピクチャから
の予測を使った符号化画像である。Bピクチャとは、そ
れ自身よりも前方(過去)にあるIピクチャまたはPピ
クチャからの予測と後方(未来)にあるIピクチャまた
はPピクチャからの予測の両方を使用した画像のことで
ある。
【0020】図6(A)はGOPの構成を示したMPE
Gのビットストリームの構成を示すグラフであり、図6
(B)はGOPヘッダの内容を示す図であり、図6
(C)はピクチャヘッダの内容を示す図である。MPE
Gのビットストリームは、最上層にシーケンス層があ
り、複数のGOPが連続している。それぞれのGOP
は、図6(A)に示した内容を格納するGOPヘッダ、
複数のピクチャ層が連続して構成されている。それぞれ
のピクチャ層は、図6(C)に示した内容を格納するピ
クチャヘッダと、複数のスライス層が連続している。そ
れぞれのスライス層は、スライス情報を記憶する部分
と、複数のマクロブロックが連続している。それぞれの
マクロブロック層は、マクロブロック情報を格納する部
分と、複数のブロックが連続している。それぞれのブロ
ック層は、上述した。DCT符号化された画像データが
格納されている。
【0021】図7を参照してビデオ信号の編集に関連し
てGOPおよびピクチャの詳細について述べる。図7は
一般的なMPEGの画像列の様子を示すグラフである。
この図面に図解したものは、連続した長い画像(ピクチ
ャ列)のうちの途中を切り出して示したもので、原画像
(符号化前のオリジナル・ピクチャ)がどのような種類
の画像に圧縮符号化(エンコード)されて、どのような
順番に並べられるのかを代表的な例を用いて表したもの
である。Iピクチャ、Bピクチャ、Pピクチャに添えら
れた数字、たとえば、B3は原画像(符号化前のオリジナ
ル・ピクチャ)の3番目のピクチャに関連するBピクチ
ャを示している。なお、値の小さい数字が過去を示し、
大きい数字が未来を表している。実線の矢印はどのピク
チャからどのピクチャが予測されているかの関係を示
す。
【0022】GOPが完全に独立していないことの説明 図7に示した原画像Aは、下記の順番で順次圧縮符号化
されている。 『B3−B2−P1−B0−B1−I2−B3−B4−P5−B6−B7−P8−
B9−B10−I11 −B12 −B13 −P14 』
【0023】このピクチャ列について述べる。実線の矢
印で示されるように、例えば、位置5(かっこ内に示し
た数字は、ピクチャ(画像)などの位置を示す)のI2−
ピクチャは、位置6のB3−ピクチャ、位置7のB4−ピク
チャ、位置8のP5- ピクチャの3画像の前方予測に使用
される。位置6のB3- ピクチャおよび位置7のB4- ピク
チャは、位置8のP5- ピクチャからの後方予測に使用さ
れる。
【0024】図3に示す画像符号化装置(エンコーダ)
200で圧縮・符号化処理(エンコード)されたピクチ
ャは、図3に示す画像復号化装置(デコーダ)400に
おける復号処理(デコード)時に便利なように、エンコ
ーダ出力Bとして示したように、並べ変えが行なわれ
る。例えば、原画像Aの位置5のI2- ピクチャは、エン
コード出力時には位置9に置かれるが、位置6のB3- ピ
クチャおよび位置7のB4- ピクチャは、後ろにずれた位
置10のP5- ピクチャの後ろの位置11と位置12に置
かれる。こうすることによりデコーダ入力Cとして示し
たように、たとえば、位置16のB3- ピクチャと位置1
7のB4- ピクチャを再生するのに必要な位置14のI2-
ピクチャと位置15のP5- ピクチャを先にデコードする
ことができる。エンコーダ出力Bにおいて、Iピクチャ
(たとえば、I2- ピクチャ)から次のIピクチャ(たと
えば、I11 ピクチャ)の手前まで、つまり、B7- ピクチ
ャまで、1つのGOPと呼ぶ。GOPは図6(A)に図
解した構成になっているが、以下の記述においては、ピ
クチャのみを簡略化して示す。
【0025】GOPが完全に独立していないため、編集
作業などでピクチャの差し替えを行うと正確な画像の再
生が行えない。図7においてデコーダによって再生され
た再生画像Dとして示した位置18のB0- ピクチャと位
置19のB1- ピクチャの再生に留意されたい。GOPの
構成の観点から見れば、B0- ピクチャとB1- ピクチャ
は、I2- ピクチャと同一のGOP、すなわち、「GOP
N(位置13)」に含まれるが、その再生のために
は、一つ手前のGOP、すなわち、「GOP N-1 」に
含まれるPピクチャ(P1- ピクチャ)とIピクチャ(I2
- ピクチャ)からの予測(位置20)が必要となる。つ
まり、「GOP N(位置13)」は、1 つ前の「GO
P N-1 」内のP1- ピクチャを用いるから、「GOP
N-1 」と関連を持っており、『GOPは完全には独立し
ていない』。
【0026】GOPが完全に独立していないことに起因
する編集処理または符号化処理時の問題 画像データ列のあるシーンでカットして編集するとか、
GOPの伝送が中断したあとのピクチャの復号などの場
合にはこのGOPの非独立性が問題になる。図8は、た
とえば、GOP単位での画像編集を行なったときに起こ
る問題を説明するための図である。原画像Aは図7に図
解したものと同じ構成である。エンコーダで連続的に圧
縮エンコードされたGOPの列を「編集前のGOP列
B」とする。この編集前のGOP例Bは図7に示したエ
ンコーダ出力BのGOP例と同じ構成である。この例で
は、 「GOP N(位置23)」のピクチャ列:I2,B0,B1,P
5,B3,B4,P8,B6,B7を 「GOP N'(位置24)」に示した、ピクチャ列:I
2',B0',B1',P5',B3',B4',P8',B6',B7' に差し替える( 並べ換える) 編集を行なって、「編集後
のGOP列E」にしたとする。この編集後のGOP列E
は、Iピクチャ、Bピクチャ、Pピクチャの順序は同じ
であるが、「’」をつけない編集前のピクチャが「’」
をつけたピクチャに差し替えられたことを示している。
【0027】「GOP N'」のピクチャは、Iピクチ
ャ、Bピクチャ、Pピクチャの順序は同じであるから、
フォーマット的には問題がない。しかし、これをデコー
ダ入力Fとして見てみると、差し替えたB0'-ピクチャ
(位置27)とB1'-ピクチャ(位置28)を再生するた
めには、差し替えていないP1- ピクチャ(位置26)か
らの前方予測が必要になる。ところが、すでに編集をし
てピクチャを差し替えてしまったので、「GOP N-1
」の差し替えていないP1- ピクチャ(位置26)と、
「GOP N」の差し替えたB0'-ピクチャ(位置27)
とB1'-ピクチャ( 位置28)とのあいだの相関関係はな
い。その結果、B0'-ピクチャ(位置27)とB1'-ピクチ
ャ( 位置28)の復号には、P1- ピクチャ( 位置26)
からの予測(位置29)は使えなくなる。同様の問題
が、「GOP N'」の最後のピクチャと、「GOP N+
1」のピクチャとの関係においても発生し、「GOP N+
1」の最初の2枚のBピクチャ(B9,B10) への予測(位
置30)も意味のないものとなる。以上のごとく、画像
編集すると、一つ前のGOPの最後のPピクチャから次
のGOPの始めのBピクチャの予測ができなくなるた
め、編集処理後の再生画像Gは、GOP内の最初にある
いくつかのBピクチャ(位置32、33)は正しくない
ピクチャを含むことになる。
【0028】MPEG2においては、このように圧縮エ
ンコード後にGOP単位で編集した場合発生する問題点
については、編集点前後のGOPには使用不可能なBピ
クチャが含まれていることを表すために、図6(B)に
示したように、GOPヘッダの中に「Broken link 」フ
ラグを設けて、Bピクチャの正当性を示してはいるが、
ピクチャそのもののその修復は講じていない。しかし、
MPEGにおいては、図6(B)に示すように、GOP
の独立性を示す「CLOSED GOP」が設けられている。
【0029】図9を参照して編集を可能にする「CLOSED
GOP」について述べる。原画像A、編集前のGOP列
B、編集後のGOP列E、デコーダ入力Fは、図8に示
したものと同じである。「CLOSED GOP」は、GOP内の
最初にあるいくつかのBピクチャ(位置45,46,4
7,48)などをエンコードする際に、「その一つ前の
GOPの最後のIピクチャ、Pピクチャからの予測(位
置34)」を使用せずに、原画面の順で直後のIピクチ
ャのみから予測するようにコーディングする(Only Bac
kward Prediction)ことによりGOPの独立性を確保す
るためのものである。「CLOSED GOP」においては、エン
コーダ出力Bの「GOP N(位置36)」をピクチャ
のフォーマットは換えずにピクチャの内容を差し替えた
別の「GOP N'(位置38)」と置き換えて、編集後
のGOP列Eとしても、デコーダにおいては、元々前の
GOPからの前方予測(位置39,位置40)を必要と
していないので、再生画像HにおいてもIピクチャの直
後にある何枚かのBピクチャ(位置43のB0',B1' 、位
置44のB9,B10)は、Iピクチャからの後方予測のみを
使用して再生が可能となる。しかしながら、この方法に
は不都合がある。それを以下に述べる。Bピクチャは、
前方と後方の両側からの予測を使うため、前方予測のみ
のPピクチャに比べて予測精度が良く、Pピクチャより
量子化ビット数を落としても画質が低下しないという利
点がある。すなわち、両方向からの予測というのはビッ
ト効率を上げつつ画質も向上させるという特質を持つ。
しかしながら、上述したように、Bピクチャのエンコー
ドを片側のみしか使用しないということは、通常の場
合、BピクチャはPピクチャよりも量子化レベルが粗い
ため、Pピクチャのみでエンコードしたときよりも品質
が低下した画像しか得られない。したがって、編集性を
持たせようとして「CLOSED GOP」を多用することは、B
ピクチャの利点を殺すことにつながり、Bピクチャを用
いる目的に反し、Bピクチャを用いる効果が得られな
い。
【0030】MPEG2においては、上述した編集によ
るピクチャの差し替えを行うと、画質が低下するという
問題が遭遇する。この種の問題は、特に、正確な符号化
処理・復号化処理を行う画像処理において問題となる。
【0031】上述した問題を解決する、特願平8−42
980号で提案した「カット編集方式」について述べ
る。まず、基本となるとなる圧縮符号化の方法について
述べる。MPEGの圧縮符号化のシーケンスには、上述
した方法のほかにプログラムの先頭において使用される
特別なシーケンスを作ることも可能である。このシーケ
ンスを画像列の途中に使った場合の効果を図10を参照
して述べる。図10は「カット編集方式」による圧縮・
符号化処理を示すグラフである。通常のシーケンスAA
においては、例えば、P1- ピクチャ(位置50)の後ろ
にはB0- ピクチャ(位置51)、B1- ピクチャ(位置5
2)、I2- ピクチャ(位置53)と続けるが、それとは
別に特別なシーケンスを考える。これをカットシーケン
スBBという。カットシーケンスBBでは、編集によっ
て差し替えが行われるピクチャの直前のP1- ピクチャ
(位置55)の後ろを一旦、カットし(位置59)、そ
の後をI0- ピクチャ(位置56)とし、そこからB1- ピ
クチャ(位置57)、B2- ピクチャ(位置58)という
ふうに、通常のシーケンスと同じように続けていく。
【0032】通常シーケンスAAのピクチャ列は下記に
なる。 具体的には、「B3,B2,P1,B0,B1,I2,B3,B4,P5」 一般的には、「B,B,P,B,B,I,B,B,P」 カットシーケンスBBでは、下記になる。 具体的には、「B3,B2,P1,IO,B1,B2,P3,B4,B5,P6 」 一般的には、「B,B,P,I,B,B,P,B,B,
P」 つまり、カット位置59の所のBピクチャ(B0- ピクチ
ャ) が抜け、Iピクチャ(I0-ピクチャ) が挿入されたよ
うになる。これにより、次のGOPはIピクチャから始
まり、次にPピクチャが続き、その後にBピクチャが続
く。このカットを置くことにより、カットの前後の「G
OP N-1(位置60)」と「GOP N(位置61)」の
間は、ピクチャの予測が不要であり、「GOP N-1(位
置60)」と「GOP N(位置61)」は完全に独立し
ている。したがって、デコーダ入力DDを見ると、位置
63のカット以降を同様のルールのシーケンスでエンコ
ードされた別のGOP列(位置64)と入れ替えたとし
ても、何の問題もなく再生できる(位置65)。しか
も、上述した「CLOSED GOP」の手法も使っていないので
後方予測のみのBピクチャは存在しておらず、画質の劣
化に対しても影響がない。
【0033】この「カットのあるシーケンス」をエンコ
ーダ出力で見た場合の下記シーケンスは、 IPBBPBBPBB,IPBBPBBPBB,IPBBPBBPBB,IPBBPBBPBB,IPBBPBBPBB (カンマはGOPの区切りを示す) 下記に示す通常のシーケンス IBBPBBPBB,IBBPBBPBB,IBBPBBPBB,IBBPBBPBB,IBBPBBPBB, と比べて、構成するピクチャの種別を見ると、平均的に
見てIピクチャの枚数は0.9 倍に減るが、Pピクチャの
枚数は、1.35倍に増え、逆にBピクチャの枚数は0.9 倍
に減り、相対的にPピクチャの割合が増えるので、符号
化によって発生するビット量も増える。また、画質的に
見て有利であるといわれるBピクチャの使用率が減るこ
ともあり、「カットシーケンス」のみを用いてGOP列
を構成することは、MPEGの標準的方法である「CLOS
ED GOP」を用いる方法より好ましいが、最良の方法とは
言い難い。よって、さらなる改善策を述べる。
【0034】EDL:EDIT DICISION LISTの活用 MPEGにより圧縮される画像の応用用途を考えてみる
と、DVDに代表される様なパッケージメディアに記録
するか、VOD(Video On Demand: ビデオ・オン・デマ
ンド)に代表されるような通信サービスに用いられる場
合のように、完成された映画やドラマなどのプログラム
を一般利用者に提供する目的がほとんどである。このよ
うな場合は、必ずと言ってよいほど、完成されたプログ
ラムが記録された通称「マスター」と呼ばれるビデオー
テープかそれに準ずるものを再生しこれを圧縮エンコー
ドする。この「マスター」は、スタジオなどにおいて、
最終の利用目的にあわせて編集ディレクタ(オペレー
タ)の指示の元に入念に編集処理がされている。
【0035】編集過程おいて、編集点は無目的にランダ
ムに選択されているわけではなく、プログラムの内容と
最終利用目的にあわせて、編集ディレクタの意志決定の
元に例えばシーンごとに決められる。決定された編集点
は、編集決定リスト(通称、EDL:Edit Dicision Lis
t )と呼ばれるリストとしてまとめられ、実際に編集動
作を行なう編集機などに供給され、編集機はEDLを元
に素材を編集していき「マスター」が作り上げられる。
EDLは、もし「マスター」を再編集する事があったな
らば、最も編集の可能性の高い場所を記したリストとい
える。GOP単位で任意に編集できるのが望ましいが、
現実的に見て最も編集の可能性の高いところのみを編集
の対象と考えたほうが効率的である。このことに着目し
て、「GOP単位でしか編集できないのであれば、GO
Pという中途半端な単位ではなく、もっと人間的な映像
シーンの単位まで編集単位を粗くする」という発想で、
EDLに基づき、あるいはEDLを修正した、あらかじ
め登録された映像のシーンの区切りのみを編集点の対象
とする。つまり、あらかじめビデオ信号を圧縮符号化す
る前に、「マスター」に付随するEDLに示された編集
点および編集の可能性が考慮される場所を「カットのあ
るシーケンス」の区切り点(カット)として登録してお
き、カット(EDLの編集点)においては画質に影響を
与えないようにして圧縮された画像の編集を可能にしつ
つ、GOP毎の編集を否定する代わりにBピクチャの利
用率を通常のエンコードシーケンスと同等に確保するこ
とにより、圧縮率を低下させないという効果がある。
【0036】図11は「カット編集方式」におけるビデ
オ信号処理装置の構成図である。ビデオ信号処理装置7
00において、圧縮エンコードされる対象のビデオ信号
が記録されているビデオマスター751はディジタルV
TR772で再生される。ビデオマスター651に付随
しているEDLが書き込まれたフロッピーディスク65
4は、EDL読み取り部767に入力される。読み取ら
れた編集点の情報はさらに手動編集点修正装置768に
よって、編集点の追加または削除を行なう。以上の手段
で決定されたビデオマスター651に対する編集点の情
報は、カット判定回路769に送られる。ディジタルV
TR772で再生されるビデオマスター651にはあら
かじめタイムコード(TC)を記録しておき、そのディ
ジタルVTR772からのタイムコード出力770は、
カット判定回路769とビデオエンコーダ776に送ら
れている。カット判定回路769では、入力された編集
点情報を考慮しつつ、どのような圧縮シーケンス(Iピ
クチャ、Pピクチャ、Bピクチャの並び方)を組めばよ
いか判定を行ない、入力されるタイムコード770の一
つ一つのフレームナンバーとピクチャのシーケンスの対
応を準備しておく。例えば、編集点のない付近でのシー
ケンスでは、図10を参照して述べた、通常のシーケン
ス:「B,B,P,B,B,I,B,B,P」とし、編
集点の付近では図10を参照して述べた「カットのある
シーケンス」:「B,B,P,I,B,B,P,B,
B,P」のごとく、ピクチャの種類のエンコードされる
順番を決定する。
【0037】以下、動作を述べる。ディジタルVTR7
72においてビデオマスター651の再生を開始する。
カット判定回路769は、入力されてくるタイムコード
770と、あらかじめ求めておいたシーケンスとの対応
をとりながら、そのタイムコードに相当する画像をどの
ピクチャのタイプで圧縮すればよいかを符号化処理シー
ケンス指示情報771としてビデオエンコーダ776に
送る。ディジタルVTR772で再生されたビデオ信号
773は、画像遅延装置774に送られる。遅延量77
8は外部より設定され、それと同じ遅延量778がビデ
オエンコーダ776にも送られている(遅延量778に
ついては後述する)。遅延したビデオ信号775はビデ
オエンコーダ776に入力される。ビデオエンコーダ7
76には、遅延していないタイムコード770と、それ
に伴った符号化処理シーケンス指示情報771が入力さ
れているので、ビデオエンコーダ776は、ビデオ信号
の遅延分だけ、前もってどのタイミングでどのような圧
縮エンコードをすればよいかが分かる。
【0038】図12を参照して符号化シーケンスについ
て述べる。図12は、「カット編集方式」における符号
化処理シーケンスを図解したグラフである。MPEGに
おいては、GOP内のピクチャの枚数をNで表し、Iピ
クチャまたはPピクチャの周期(Iピクチャから次のP
ピクチャまでのピクチャの枚数)をMで表す。MPEG
においては、このNとMに制約はないが、説明のため、
通常シーケンスAAをピクチャ枚数N=9,ピクチャ周
期M=3とする。図12の四角囲みされたIピクチャ
は、そこがカットのあるシーケンスの先頭であることを
示し、丸囲みされたIピクチャでその他の一般のGOP
の先頭を示している。図12は、原画像におけるピクチ
ャのエンコード・シーケンスの順番を示しており、図
中、I,P,Bの添え数字が原画上で「何番」目のピク
チャであるか表している。これらの数字はGOPの概念
をもつエンコーダ出力でのピクチャの順番ではないこと
に注意されたい(ピクチャの順序については、例えば、
図6を参照)。エンコーダ出力においては、Bピクチャ
の順番が入れ替わり、GOP単位で見た場合はあくまで
もIピクチャが先頭である。ピクチャ枚数N=9の場
合、カットシーケンスは、そのカットの位置により、カ
ットシーケンス0(C0)からカットシーケンス8(C
8)までの9種類の場合が発生する。しかし、いずれ場
合であっても、ここでは、図14を参照して上述したよ
うに、カットのあるシーケンスの先頭の(四角囲みで示
した)Iピクチャの直前のピクチャタイプは必ずPピク
チャであることが特徴である。
【0039】各シーケンスについて述べる。カットシーケンス0(C0) Iピクチャの位置が通常シーケンスに比べて前に2枚ず
れてそのGOPの「0番」のピクチャがIピクチャとな
る(I0)。しかし、直前のGOPのピクチャはPピクチャ
(P1)であるので、GOPはI0- ピクチャから始まり、シ
ーケンスの都合上そのGOPのP9- ピクチャまでのピク
チャ枚数N=10となる。その後のGOPは通常のシー
ケンスが続く。
【0040】カットシーケンス1(C1) Iピクチャの位置が通常シーケンスに比べて前に1枚ず
れてカットのあるそのGOPの「1番」のピクチャがI
ピクチャ(I1)となり、かつ、直前の「0番」のピクチャ
は、通常ではBピクチャであるがPピクチャ(P0)とす
る。このGOPはI1- ピクチャから始まり、シーケンス
の都合上、P10-ピクチャまでのピクチャ枚数N=10と
なる。その後のGOPは通常のシーケンスが続く。直前
のGOPは、P0- ピクチャまでを含むので、それに限り
ピクチャ枚数N=10となる。
【0041】カットシーケンス2(C2) Iピクチャの位置は通常シーケンスと同じ位置で「2
番」のピクチャがIピクチャ(I2)となるが、直前の「0
番」と「1番」の2枚ピクチャは、通常ではBピクチャ
であるが、2枚ともPピクチャ(PO,P1)とする。カット
のあるこのGOPはI2- ピクチャから始まり、シーケン
スの都合上、P11-ピクチャまでのピクチャ枚数N=10
となる。その後のGOPは通常のシーケンスが続く。直
前のGOPは、P0- ピクチャとP1- ピクチャまでを含む
ので、それに限りピクチャ枚数N=11となる。
【0042】カットシーケンス3(C3) Iピクチャの位置が通常シーケンスに比べて後ろに1枚
ずれて「3番」のピクチャがIピクチャ(I3)となる。た
だし、「2番」のピクチャまでは通常のシーケンスを延
ばす。カットのあるこのGOPはI3- ピクチャから始ま
り、シーケンスの都合上、P12-ピクチャまでのピクチャ
枚数N=10となる。その後のGOPは通常のシーケン
スが続く。直前のGOPは、B0- ピクチャとB1- ピクチ
ャとP2-ピクチャまでを含むので、それに限りピクチャ
枚数N=12となる。
【0043】カットシーケンス4(C4) Iピクチャの位置が通常シーケンスに比べて後ろに2枚
ずれて「4番」のピクチャがIピクチャ(I4)となる。た
だし、「2番」のピクチャまでは通常のシーケンスを延
ばし、かつ、I4- ピクチャの直前の「3番」のピクチャ
はPピクチャ,3)。カットのあるこのGOPはI4- ピ
クチャから始まり、シーケンスの都合上、P13-ピクチャ
までのピクチャ枚数N=10となる。その後のGOPは
通常のシーケンスが続く。直前のGOPは、B0- ピクチ
ャ,B1-ピクチャ,P2-ピクチャ,P3-ピクチャまでを含むの
で、それに限りピクチャ枚数N=13となる。
【0044】カットシーケンス5(C5) Iピクチャの位置が通常シーケンスに比べて後ろに3枚
ずれて「5番」のピクチャがIピクチャ(I5)となる。た
だし、「2番」のピクチャまでは通常のシーケンスを延
ばし、かつ、I5- ピクチャの直前の2枚のうち「3番」
はBピクチャ(B3)、「4番」のピクチャはPピクチャ(P
4)とする。カットのあるこのGOPはI5- ピクチャから
始まり、シーケンスの都合上、P14-ピクチャまでのピク
チャ枚数N=10となる。その後のGOPは通常のシー
ケンスが続く。直前のGOPは、B0- ピクチャ,B1-ピク
チャ,P2-ピクチャ,B3-ピクチャ,P4-ピクチャまでを含む
ので、それに限りピクチャ枚数N=14となる。
【0045】カットシーケンス6(C6) カットシーケンス0〜5のようにIピクチャの位置を後
ろにずらすと直前のGOPの長さ(ピクチャ枚数N)が
長くなり過ぎるので、このカットシーケンスでは、上記
とは別のルールとし、短めの通常シーケンスを置きその
後に改めてカットのあるシーケンスを置く。B0- ピクチ
ャから始まる通常のシーケンスはP5- ピクチャまでのピ
クチャ枚数N=6で打ち切り、その後の「6番」のピク
チャをカットのあるシーケンスのIピクチャ(I6) とす
る。カットのあるこのGOPはI6- ピクチャから始ま
り、シーケンスの都合上、P15-ピクチャまでのピクチャ
枚数N=10となる。その後のGOPは通常のシーケン
スが続く。
【0046】カットシーケンス7(C7) カットシーケンス6(C6)と同様に、単純にIピクチ
ャの位置を後ろにずらすと直前のGOPの長さ(ピクチ
ャ枚数N)が長くなり過ぎるので、別のルールとし、短
めの通常シーケンスを置きその後に改めてカットのある
シーケンスを置く。B0- ピクチャから始まる通常のシー
ケンスをP5- ピクチャまで続け、かつ、その後の「6
番」にPピクチャ(P6)を続け、ここでピクチャ枚数N=
7でGOPのシーケンスを打ち切る。その直後のGOP
の「7番」のピクチャをカットのあるシーケンスのIピ
クチャ(I7)とする。カットのあるこのGOPはI7- ピク
チャから始まり、シーケンスの都合上P16-ピクチャまで
のピクチャ枚数N=10となる。その後のGOPは通常
のシーケンスが続く。
【0047】カットシーケンス8(C8) カットシーケンス7(C7)と同様に、単純にIピクチ
ャの位置を後ろにずらすと直前のGOPの長さ(ピクチ
ャ枚数N)が長くなり過ぎるので、別のルールとし、短
めの通常シーケンスを置きその後に改めてカットのある
シーケンスを置く。B0- ピクチャから始まる通常のシー
ケンスをP5- ピクチャまで続け、かつ、その後の「6
番」をBピクチャ(B6)とし「7番」にPピクチャ(P7)を
続け、ピクチャ枚数N=8でこのGOPのシーケンスを
打ち切る。その直後のGOPの「8番」のピクチャをカ
ットのあるシーケンスのIピクチャ(I8)とする。このG
OPはI8- ピクチャから始まり、シーケンスの都合上、
P17-ピクチャまでのピクチャ枚数N=10となる。その
後のGOPは通常のシーケンスが続く。
【0048】再び図11を参照して述べる。カット判定
回路769においては、EDL読み取り部767に入力
される情報と手動編集点修正装置768によって追加変
更された情報をもとに、どのタイムコードフレームでカ
ットを置けばよいかは判明しているので、カットの近傍
では、上で説明したカットシーケンスのどれを選べばよ
いかは簡単に求めることが出来る。カット判定回路76
9は、通常のカットのない部分では、通常シーケンスA
Aの順番にビデオエンコーダ776に符号化処理シーケ
ンス指示情報771を単純に繰り返し与えておき、カッ
トの近傍では、カットシーケンス0(C0)からカット
シーケンス8(C8)のどれかのうち適合するパターン
をビデオエンコーダ776に与える。
【0049】遅延量 ビデオエンコーダ776を単純に構成するため、ビデオ
エンコーダ776では、特別な指示をしない限り、Iピ
クチャまたはPピクチャが指示されたら必ずBピクチャ
が2枚続き、また、Bピクチャが2枚続いたらその次は
必ずIピクチャまたはPピクチャを置くと言うルール
(すなわち、IピクチャまたはPピクチャの周期Mが3
ということ)でしか符号化処理しないものとする。すな
わち、ビデオエンコーダ776はこの単純なルールを適
用している。ただし、ビデオエンコーダ776はあらか
じめシーケンスを指定すればそのとおりにエンコードで
きるものとする。この基本的な通常シーケンス以外の符
号化処理を行いたいときには、あらかじめ、通常とは違
うことは分かっていればよいわけであるので、ビデオエ
ンコーダ776は遅延のないタイムコード770と符号
化処理指示情報771を必要としている。遅延量778
は、ここで、図12の波線部分に注目してみる。波線は
通常シーケンスの単純ルール、すなわち、「Iピクチャ
またはPピクチャが指示されたら必ずBピクチャが2枚
続き、また、Bピクチャが2枚続いたらその次は必ずI
ピクチャまたはPピクチャを置く」というルールが適用
されない部分を示している。図12から明らかなよう
に、カットを置くことによるこの不規則ルールの影響
は、IピクチャまたはPピクチャの周期Mが3の場合
は、最大でもピクチャは3フレーム分であるので、画像
遅延装置774の遅延量778の設定値は3フレームと
すればよい。遅延量778は同時にビデオエンコーダ7
76にも入力されているので、結果的に、ビデオエンコ
ーダ776は、遅延量778が既知の遅延ビデオ信号7
75と、遅延のないタイムコード770と符号化処理指
示情報771から、通常とは異なるシーケンス(周期M
=3ではないケース)でエンコードしなくてはならない
ときには、具体的にどの画面から特別なエンコードをす
ればよいのかをそのひとつ前のフレームで知ることが出
来る。
【0050】図12を参照して述べた例は説明を容易す
るするため、通常シーケンスのピクチャ枚数N=9,ピ
クチャ周期M=3の場合について述べたが、ピクチャ枚
数Nと周期Mが変化されば、たとえば、ピクチャ枚数N
と周期Mが大きくなれば、図11を参照して述べたカッ
トシーケンスの数も増大する。これに伴い図12に波線
で示した遅延量の数も大きくなる。
【0051】以上述べたように、「カット編集方式」に
よれば、ピクチャの編集に伴うピクチャの差し替えがあ
っても、GOPヘッダに設けられる、「CLOSED GOP」、
(brocken link 」を用いず、EDLに基づくカットの考
えを適用して、カットがある部分のGOPの最初にIピ
クチャをおいて、その前のGOPとカットのあるGOP
とを独立させることにより、ピクチャの編集によっても
MPEGの特質を維持して画質を低下させない符号化結
果が得られる。「カット編集方式」においては、通常シ
ーケンスにおけるピクチャ枚数Nと周期Mに基づいた種
類のカットシーケンスを準備しておき、ピクチャ枚数N
が非常に長くなる場合はカットのあるGOPのピクチャ
枚数を制限し、信号処理の遅延量をカットシーケンスに
応じて設定しておき、カットのあるGOPの最初にはI
ピクチャが位置するようにピクチャを並べることによ
り、カットがあってもGOPの独立性を維持して、MP
EGの特質を生かした符号化処理を可能にする。
【0052】以下、特願平8−42980号において提
案した「カット編集方式」の特徴を要約する。「カット
編集方式」によれば、MPEGで符号化処理してしまっ
たビデオを符号化処理の後で編集しても画質に影響がで
ない。換言すれば、「カット編集方式」によれば、MP
EGで符号化した帯域圧縮・符号化したピクチャについ
ても、画質を低下させずに自由に編集作業ができる。こ
の場合、通常のMPEGによる符号化と比べて、同様の
画質を得るためのビット発生量に違いがでない。「カッ
ト編集方式」においては、MPEGビデオの編集に必要
な「Broken Linkフラグ」や「Closed GOPフラグ」を用
いないので、MPEGでオプション扱いとなっているG
OPを用いる必要がない。「カット編集方式」において
は、EDLによって決まっているあらかじめ決められた
場所で編集するという制限はあるものの、上で述べた利
点が存在することにより、例えば、プログラムの全部の
符号化処理が終了した時点で、ある「カットシーケン
ス」の画質に問題があったことに気がついた場合でも、
その「カットシーケンス」のみをビットレートなどを再
調整し再符号化処理し、ピクチャを差し替え編集をする
ことが許される。もし上記カット編集方式を用いなかっ
た場合は、たったその部分を差し替えたいだけなのに、
もう一度プログラムの頭から全部やり直すか、あるい
は、画質の劣化を承知で「Broken Link フラグ」や「Cl
osed GOP」を用いなければならない。しかし、そうして
しまうと、画質を良くしたいと思って行なった編集によ
り、その前後の画質が劣化するという矛盾した結果にな
る。
【0053】「カット編集方式」におけるカットとして
は、上述した編集段階において作成された編集決定リス
ト(EDL)に基づいて行う他、定期的に行う、映像シ
ーンの状況に応じて任意に設定できる。すなわち、「カ
ット編集方式」によれば、GOP内のピクチャの差し替
えなどがあっても、先行するGOPのピクチャを参照せ
ずに、そして、画質を低下させずに符号化が行える。特
に、符号化された画像データの編集、差し替えが画質を
低下させずに行える。また、「カット編集方式」によれ
ば、これまでのGOPにおけるGOPの不完全独立性が
克服され、Closed GOP、brocken linkなどを使用せずに
信号処理を行うことができる。したがって、「カット編
集方式」によれば、GOPヘッダを使用しないでよく、
GOPヘッダ部分にピクチャを置くことが可能になる。
【0054】本発明の実施例 上述したカット編集方式を適用した本発明の画像符号化
方法とその方法について述べる。図13に本発明の画像
符号化方法の処理を示すフローチャートを示す。本発明
の画像符号化方法は、基本的に上述した2パス符号化処
理をとる。しかしながら、その詳細は図13に図解した
ように、画像処理する。 ステップS01:後に編集点の候補となりうる「カッ
ト」の場所を指定する。 ステップS02:「カット」位置に基づいた符号化処理
シーケンスにより、仮符号化処理をし「DIFFICALTY」デ
ータを求める。 ステップS03:得られた「DIFFICALTY」データによ
り、最終的に発生すべき総情報量をシーンごとの「DIFF
ICALTY」に比例するように、例えば、GOP単位でビッ
ト量を割り振る。 ステップS04:正式に符号化処理をするときの符号化
処理シーケンスは、仮符号化処理の時と同じものを使用
して正式な符号化処理を行う。このとき、正式の符号化
処理中は、割り振られたビット容量により、あらかじめ
定められた量子化レベルの重み付け制御を行ない、画像
の各帯域の情報用の制御を行う。 ステップS05:正式に符号化処理された結果を、編集
ディレクタ(またはオペレータ)が、モニター用デコー
ド装置で監視して画質のチェックを行う。 ステップS06:編集ディレクタの監視によってもし画
質に問題がある部分があるは判断されたら、編集ディレ
クタの指示により、その部分の量子化レベルの重み付け
の制御を変更し問題となる部分を含む「カット」位置を
再符号化処理する。
【0055】再符号化処理について 再符号化処理を行う場合には、ほとんどの場合が発生ビ
ット量が増加する方向に行われることが予想される。従
って、もし定められた総容量以内に収めるならば、増加
した分に見合ったビット量を他の部分で減少させる必要
がある。そのために再符号化処理を行う際には次に示す
ようにいくつかの方法をとることができる。 第1の方法:画質が問題となる部分で、一旦、符号化処
理を止めて、再符号化処理によるビット増加量に相当す
る情報量をそれ以前のシーンのどこかで情報量を減少さ
せても問題になりにくい場所を選び、問題となるシーン
のビットの増加量に見合うようにその部分の量子化レベ
ルも下げて、両者とも再符号化処理する。
【0056】第2の方法(その1):問題となるシーン
の量子化レベルを上げて再符号化処理し、増加したビッ
ト量は前借りの形で保留しておき、後に符号化処理され
るシーン全体から均等にビット量を差し引き、結果、そ
の後のビット量を減少させることにより、総ビット量を
定められた範囲に収める。
【0057】第2の方法(その2):問題となるシーン
の量子化レベルを上げて再符号化処理し、増加したビッ
ト量は前借りの形で保留しておくが、後に符号化処理さ
れるシーン全体からではなく、問題になりにくそうなシ
ーンを特定し、その部分の量子化レベルを下げておき符
号化処理を続け、結果、その後のビット量を減少させる
ことにより、総ビット量を定められた範囲に収める。
【0058】第3の方法:問題となるシーンまたは「カ
ット」は、その場では再符号化処理せずに、その場所を
特定するマーキング(例えば、タイムコードや「カッ
ト」の番号を控えておくなど)だけして符号化処理を続
ける。最後まで符号化処理が終わった時点で、問題とな
るシーンのすべての量子化レベルの重み付けを変更して
再符号化処理し、その時に増加したビット量に見合う分
を減少させるべく量子化レベルを下げても問題のないよ
うなシーンを選び出し、その部分のビット量を減少させ
て再符号化処理し、結果、総ビット量を定められた範囲
に収める。
【0059】「カット編集方式」を適用する本発明にお
いては、上記のいずれの場合にも対応できるので、本発
明においてはどの方法で再符号化処理を行うかは問わな
い。ここでは、第3の方法を適用した場合を例示する。
【0060】以下、上述した画像符号化方法の詳細につ
いて述べる。ステップS01:カット位置の事前設定 ステップS02における仮符号化処理、および、ステッ
プS06における再符号化処理を行う、カット位置につ
いては、上述した「カット編集方式」として記述したよ
うに、事前にEDLなどに規定しておく。
【0061】ステップS02:仮符号化処理(「DIFFIC
ALTY」データの算出) 図14は、仮符号化処理を行い、「DIFFICALTY」データ
を求める本発明の実施例としての画像処理装置の構成図
である。図14における装置の一部は図11に図解した
装置の一部と同様の処理を行う。マスターテープ1に記
録されている圧縮符号化処理される対象の画像データは
デジタルVTR2で再生される。マスターテープ1に対
して、図11を参照して上述した「カット編集方式」に
基づき、編集データリスト(EDL)情報、あるいはそ
れに修正を加えたもの、または自動的に等間隔にカット
設定装置6により、編集の候補となるカット点を定め
る。マスターテープ1に対する編集点の情報は、カット
判定/指定回路7に送られる。デジタルVTR2で再生
されるマスターテープ1にはあらかじめタイムコードT
Cを記録しておき、そのデジタルVTR2からのタイム
コード出力3は、カット判定/指定回路7と画像タイプ
制御部8に送られている。カット判定/指定回路7で
は、図11と同様の方法でカット設定装置6から入力さ
れた編集点情報を考慮しつつ、どのような圧縮シーケン
ス、すなわち、Iピクチャ、Pピクチャ、Bピクチャの
並び方を組めばよいか判定を行い、入力されるタイムコ
ード出力3の一つ一つのフレームナンバーとピクチャの
シーケンスの対応を準備しておく。例えば、編集点のな
い付近でのシーケンスでは、通常の・・・BBPBBI
BBP・・・とし、編集点の付近では「カットのあるシ
ーケンス」・・・BBPIBBPBB・・・と言う具合
にあらかじめピクチャのタイプの符号化処理される順番
を決定する。
【0062】デジタルVTR2においてマスターテープ
1の再生を開始する。カット判定/指定回路7は、入力
されてくるタイムコード出力3と、あらかじめ求めてお
いたシーケンスとの対応をとりながら、そのタイムコー
ドに相当する画像をどのピクチャのタイプで圧縮すれば
よいかを符号化処理シーケンス指示9として画像タイプ
制御部8に送る。一方、デジタルVTR2で再生された
ビデオ信号4は、画像遅延装置5に送られる。上述した
「カット編集方式」で述べたルールに従って遅延量11
は外部より設定され、それと同じ情報が画像タイプ制御
部8にも送られている。遅延したビデオ信号10は画像
タイプ制御部8に入力される。画像タイプ制御部8に
は、遅延していないタイムコード出力3と、それに伴っ
た符号化処理シーケンス指示9が入力されているので、
画像タイプ制御部8は、ビデオ信号の遅延分だけ、前も
ってどのタイミングでどのような画像タイプ(I,B,
Pピクチャ)を生成すればよいかが判る。
【0063】画像タイプ制御部8は、それぞれのピクチ
ャータイプに応じて生成された画像の二次元画素情報1
3とその処理時間に対応して遅延させたタイムコード
(TC)12を直交変換装置の1例としてのDCT演算
装置14に送り出す。DCT演算装置14では、画像情
報を二次元の画素データから、たとえば、8×8画素ご
とのブロックごとに、周波数成分の情報に変換し、各帯
域に分かれた周波数成分画像情報16を出力する。ま
た、どの時間の画像がどの程度の情報量を持っていたの
かを保存する目的のため、DCT演算装置14からは同
時に、その処理遅延時間に対応して遅延させたタイムコ
ード(TC)15も出力され、次の量子化器17に送ら
れる。量子化器17の出力は、逆量子化器20と逆DC
T演算装置21を通じて量子化の誤差を含んだ二次元画
素情報に逆変換され、画像タイプ制御部8にフィードバ
ックされる。これにより、画像タイプ制御部8は、Bピ
クチャまたはPピクチャのための差分信号を生成するこ
とができる。画像タイプ制御部8では、動き予測やその
補償も行っているが、量子化誤差を含めたフィードバッ
ク情報は、これらの処理を適応化するのに重要な情報と
なる。
【0064】量子化器17では、特に重み付けなどは行
われず各帯域ごとに均等に量子化するような仮量子化レ
ベル22で画像の周波数帯域情報を量子化する。量子化
されたビット19は、量子化に要した時間に対応するだ
け遅延されたタイムコード(TC)18と共に出力され
る。この結果、時間ごとの画像情報量の変化が得られこ
れが「DIFFICALTY」データ23となる。
【0065】ステップS03〜S04:「DIFFICALTY」
によるビット量の割りあて、および、正式の符号化処理 図15は正式に符号化処理を行う装置の構成図である。
量子化器17までの接続と構成は、「DIFFICALTY」デー
タを求めたときの図14の装置構成と同じであり、図1
5の装置は、図14の装置構成に、「DIFFICALTY」デー
タ24、量子化レベル制御回路26、手動量子化レベル
修正装置27、エントロピー符号化器29、出力レート
決定装置32、ストリーム出力装置34、モニター用デ
コーダ35、ストレージ装置37、符号化制御部38が
加わった構成である。したがって、図14と図15に示
した装置構成で共通するものは、第1回の符号化処理工
程と、第2回の符号化処理工程の処理において、共用す
ることができる。
【0066】圧縮エンコーダされる対象の画像データが
記録されているマスターテープ1はデジタルVTR2で
再生される。ここで重要なことは、画像シーケンスを
「DIFFICALTY」データを求めたときと全く同一のものと
するために、同一のカットの設定を保つことである。従
って、カット設定装置6は接続はされているが、動作は
しない。つまり、マスターテープ1に対する編集点の情
報は、「DIFFICALTY」データを求めたときと同じものが
カット判定/指定回路7に保存されている。また、デジ
タルVTR2で再生されるマスターテープ1の内容には
あらかじめタイムコードを記録しておき、デジタルVT
R2からのタイムコード出力3は、カット判定/指定回
路7と画像タイプ制御部8に送られている。カット判定
/指定回路7では、入力された編集点情報を考慮しつ
つ、どのような圧縮シーケンス(Iピクチャ、Pピクチ
ャ、Bピクチャの並び方)を組めばよいか判定を行い、
入力されるタイムコード出力3の一つ一つのフレームナ
ンバーとピクチャのシーケンスの対応を準備しておく。
例えば、編集点のない付近でのシーケンスでは、通常の
・・・BBPBBIBBP・・・とし、編集点の付近で
は「カットのあるシーケンス」・・・BBPIBBPB
B・・・と言う具合にあらかじめピクチャのタイプのエ
ンコードされる順番を決定する。
【0067】ピクチャ列、たとえば、映画番組のピクチ
ャ列の最初から再生を開始するために、符号化制御部3
8からテープ走行指示40がデジタルVTR2に出力さ
れ、マスターテープ1に記録された画像データの再生が
開始される。出力レート決定装置32とストレージ装置
37には通常の符号化方式39を指示しておく。カット
判定/指定回路7は、入力されてくるタイムコード出力
3と、あらかじめ求めておいたシーケンスとの対応をと
りながら、そのタイムコードに相当する画像をどのピク
チャのタイプで圧縮すればよいかを符号化シーケンス指
示9として画像タイプ制御部8に送る。一方、デジタル
VTR2で再生されたビデオ信号4は、画像遅延装置5
に送られる。
【0068】上述したカット編集方式で述べたルールに
従って、外部から設定された遅延量11と同じ情報が画
像タイプ制御部8にも送られている。遅延したビデオ信
号10は画像タイプ制御部8に入力される。画像タイプ
制御部8には、遅延されていないタイムコード出力3
と、それに伴った符号化シーケンス指示9が入力されて
いるので、画像タイプ制御部8は、ビデオ信号の遅延分
だけ、前もってどのタイミングでどのような画像タイプ
(I,B,Pピクチャ)を生成すればよいかが判る。
【0069】画像タイプ制御部8は、それぞれのピクチ
ャータイプに応じて生成された画像の二次元画素情報1
3とその処理時間に対応して遅延させたタイムコード
(TC)12をDCT演算装置14に送り出す。DCT
演算装置14では、画像情報を二次元の画素から、たと
えば、8×8画素単位のブロックで、周波数成分の情報
に変換し、各帯域に分かれた周波数成分画像情報16を
出力する。また同時に、その処理遅延時間に対応して遅
延させたタイムコード(TC)15も出力され、量子化
器17に送られるとともに、量子化レベル制御回路26
にも送られる。
【0070】量子化器17の出力は、逆量子化器20と
逆DCT演算装置21を通じて量子化の誤差を含んだ二
次元画素情報に逆変換され、画像タイプ制御部8にフィ
ードバックされる。これにより、画像タイプ制御部8
は、BピクチャまたはPピクチャの差分信号を生成する
ことができる。画像タイプ制御部8では、動き予測やそ
の補償も行っているが、量子化誤差を含めたフィードバ
ック情報は、これらの処理を適応化するのに重要な情報
となる。量子化レベル制御回路26には、「DIFFICALT
Y」データ24が入力されており画像情報量の時間変化
データ25が与えられている。量子化レベル制御回路2
6は、入力されている遅延させたタイムコード(TC)
15と画像情報量の時間変化データ25から、どのよう
な重み付け制御が必要かを決定し、量子化レベル重み付
け制御信号28を量子化器17に出力する。通常、とく
に画質に問題ない場合は、手動量子化レベル修正装置2
7は動作しない。量子化器17では、量子化レベル重み
付け制御信号28に従って、各帯域ごとに量子化し情報
量の削減を行う。量子化されたビット19は、量子化に
要した時間に対応するだけ遅延されたタイムコード(T
C)18と共にエントロピー符号化器29に出力され
る。エントロピー符号化器29では、さらにビット量の
圧縮を行うために可逆圧縮手法であるエントロピー符号
化を行い、この前段まで固定長ビット列であったものを
可変長ビット列に変換する。この変換方式をVaria
ble Length Coding:VLCと呼ぶ。
エントロピー符号化器29からは、可変長符号に変換さ
れた最終的な画像符号31とその画像を表示すべき時刻
を示した時間情報30が出力レート決定装置32に送ら
れている。
【0071】符号化された後はその結果が出力される。
ここで、可変レートのビット出力について一般的な事柄
を考察する。MPEGにおいては、通常、符号化された
画像情報は音声情報やその他の符号とともに、一本のビ
ッット列に多重化されて出力されるが、画像符号が可変
レートである場合は、多重化された出力ビット列も可変
レートとなる。画像、音声、その他の情報が多重化され
た状態で出力レートとなる。音声は固定レートである。
その他の情報は画像符号に比べて極めて微量であるの
で、説明を簡単にするために本質的にビットレートを決
定している画像符号のみが出力される場合で説明する。
【0072】可変レート符号の受信/読み出しについて 可変レートの画像符号を何らかのストレージデバイス、
たとえば、DVDに記録し、それを読み出しデコードす
る場合などを考える。この場合デコーダ側としてはどの
ようにして可変レートで符号を読みだせばよいかを考察
する。例えば、仮にストレージデバイスからは最大10M
bps で符号を読みだせるのもとし、実際にはそこに記録
されている符号は5Mbps で符号化されていたものとす
る。この場合、最大速度の10Mbps でやみくもに読み込
んでしまうと、実際に復号され画像信号として消費され
る情報量は5Mbps であるから、結局、入力が10Mbps
出力が5Mbps となり、即座に読み出しバッファはオー
バーフローする。このことを防ぐためには、記録された
情報を「いつ」「どのくらいのスピード」で読みだせば
よいかが既知であればよい。
【0073】MPEG2においては、エンコードされた
画像情報をそのまま出力することはなく、適切な長さに
パケット化し(このパケットはPES:PACKETI
ZED ELEMENTARY STREAMと呼ばれ
る)、あるいは、PESをいくつかまとめたPACKと
呼ばれる単位に再パケット化している。PESまたはP
ACKには、そのパケットが読み出されるときのビット
レートと読み出すべき時間がヘッダ情報として付け加え
られている。復号装置においては、この情報を元に読み
出していればそのバッファはオーバーフローすることも
アンダーフローすることもない。例えば上述した例の場
合、実際の読み出し速度が10Mbps に固定されていたと
しても、それぞれのパケットを読みだす時間がそのパケ
ットのヘッダとして指定されているわけだから、ヘッダ
まで10Mbps で読み出し指定の時間までは読み出しを休
むことができ、結果、バースト的に読みだすことにな
り、平均して5Mbps の読み出し速度を得ることができ
る。
【0074】符号化装置においては、符号化された画像
が最終的に復号され表示されるべき時間は、オリジナル
の、例えば、マスターテープ1のタイムコードからあら
かじめ分かっている。また各画像1枚1枚が何ビットあ
るかも当然知っている。従って、ある符号化された画像
情報を表示時間までに揃えるためには、「いつ」「どの
くらいの速度」で送ればよいかを決定することは困難で
はない。MPEG2における符号化装置では、その「い
つ(クロックリファレンス)」と「どのくらいの速度
(パケットレート)」を求め、その情報をPESないし
PACKのヘッダとして付加しなければならないことに
なっている。
【0075】出力レート決定装置32には、可変長符号
に変換された最終的な画像符号31とその画像を表示す
べき時刻を示した時間情報30が入力されている。出力
レート決定装置32は、この時間情報を元にPESない
しPACKのヘッダ情報を求め、入力された画像符号を
パケット化し最終符号出力33としてストリーム出力装
置34に送る。
【0076】出力レート決定装置32は、符号化処理を
始める際に符号化制御部38より、通常の符号化方式の
指令39の指示を受けている。出力レート決定装置32
は、後に画質改善のために編集が可能となるようにうす
ために、最終符号出力33の元になった情報である、
「画像符号+時間情報」36をストレージ装置37に通
常、符号化処理の結果によるというマーキングとともに
保存しておく。
【0077】ステップS05:符号化処理結果の監視 最終符号出力33はモニター用デコーダ35にも送られ
ている。編集ディレクタ(オペレータ)は、デコーダ3
5に接続されたモニター(図示せず)に表示された符号
化処理結果を観察して、その画質を監視することができ
る。もし、画質に問題があったならば、編集ディレクタ
は画質が問題となる位置を指示する。具体的には、上述
した再符号化処理に従い、その部分に相当する画像を表
示すべき時刻を示した時間情報41を手動量子化レベル
修正装置27に記録しておく。正式の符号化処理が一通
り終了した時点で、画質に問題のある場所がどの「カッ
ト」に相当するかは、手動量子化レベル修正装置27に
記録されていた時間情報とカット判定/指定回路7に保
存されているタイムコードとカットの関係とからで容易
に求めることができる。
【0078】ステップS06:重み付け制御の変更 画質が問題となる部分に相当する「カット」を符号化制
御部38から再度再生しモニター用デコーダ35を監視
しながら、手動量子化レベル修正装置27において量子
化レベルの重み付けを調整し、画質に問題がない量子化
レベルを求める。求めた量子化レベルの重み付け制御値
はその「カット」に相当するタイムコードとともに量子
化レベル制御回路26に与えておく。画質に問題が有る
部分が複数あるときには、この作業を繰り返す。
【0079】量子化レベル制御回路26においては、も
ともと「DIFFICALTY」データ24によって総発生ビット
量が既知であるので、手動量子化レベル修正装置27に
よって量子化レベルが修正された結果、新しい総発生ビ
ット量を知ることも可能である。もし、総発生ビット量
があらかじめ定められて総容量を越えてしまうようなこ
とがあれば、今度は逆に、ビット量を減らしても問題に
なりにくそうな「カット」を指定して、その部分を上記
と同様に再生しながら手動量子化レベル修正装置27に
よって情報量が抑制されるように量子化レベルを調整す
る。
【0080】ステップS07:再符号化処理 このようにして、必要な部分の量子化レベルを調整し直
したら、符号化制御部38から、対象となる「カット」
のみをエンコードさせるようにデジタルVTR2で順次
再生させる。この符号化処理は、上述した正式の符号化
処理と同様に進行する。このとき、出力レート決定装置
32とストレージ装置37には、エンコードの結果が再
エンコードによるものであることを示すため、符号化方
式の指令39を符号化制御部38から与えておく。これ
により、ストレージ装置37には、改善された画質を持
つ「画像符号+時間情報」36が再エンコードのマーキ
ングとともに記録されることになる。
【0081】最終出力 全ての再エンコードが終了したならば、ストレージ装置
37には通常/再エンコードの画像符号及び時間情報の
全てが記録されている。出力レート決定装置32はこの
記録されているデータを元に、プログラムの先頭から順
次パケット化していき、最終符号出力33としてストリ
ーム出力装置34に出力する。
【0082】クロックリファレンスとパケットレート エンコーダでは符号化された画像情報を表示時間までに
揃えるためには、「いつ」「どのくらいの速度」で送れ
ばよいかを決定し、クロックリファレンスとパケットレ
ートを求めるが、再符号化処理により情報量が増加しビ
ットレートを上げた場合にどのようになるかを説明す
る。図16は、平均した画像符号のビットレートが5M
bps の時の例を示すグラフである。ここでは、説明を簡
単にするため1フレームの画像符号が1パケットを形成
するものとする。図中において、横軸は時間、縦軸はビ
ット量の累積、斜めの線は平均ビットレートを表す。一
つ一つの小さな四角形は、1ビデオフレームの画像を符
号化の後にパケット化したのを表しており幅が1フレー
ムの時間に相当し、その高さでビット容量を示してい
る。また、2本の斜め線で挟まれた領域は、復号装置の
バッファサイズ41を示しており上辺を越えればオーバ
ーフロー、下辺を越えればアンダーフローである。全て
の画像がその領域内に収まっているときには、デコーダ
ーのバッファはオーバーフローもアンダーフローも越し
ていないことを表している。
【0083】例えば、画像符号A(42)を5Mbps で
送る場合を考える。画像符号Aの高さを見れば、5Mbp
s の速度ではこの容量を1ビデオフレーム時間で送るこ
とはできない。従って、それより以前から送り始めなけ
ればならない。また、画像符号Aを全て送り終わったと
きに、バッファがオーバーフローのギリギリで終わるこ
となく、余裕をもってバッファ容量の中ほどで終了する
ようにすると仮定する。この場合の、パケット化された
画像符号Aの出力開始点43と終了点44は、画像符号
Aのそれぞれ上端と下端から水平に過去(左側)の向き
に直線を延ばし、それが斜め線との交点でもとまる。画
像符号Aのパケット容量をSとおき、出力開始点43を
T1、同じく終了した点44をT2とおくと、S=(T
2−T1)×5Mbps の関係になる。画像符号パケット
の下端から水平に過去の向きに延ばした直線と斜め線と
の交点が、ここでの例ではT1がその画像符号クロック
リファレンスである。
【0084】図17に示すように、画質の一部に問題が
有り、量子化レベルを上げて対処する場合が生じたとす
る。白い四角形で元々の画像符号の累積、濃い灰色の四
角形で画質改善後の画像符号の累積を表す。図より明ら
かなように、画質改善後はもはや平均して5Mbps では
送ることができない。ところが変更部分の総容量と時間
から計算して(ビットレート=総容量/変更部分の時
間)みると、この新しい画像符号は7Mbps のレート
(これが、変更部分のパケットレートになる)であれ
ば、バッファの流域内に収められることができることが
判明したとする。
【0085】図18に、この場合、エンコーダ出力のビ
ットレートはどの部分は変更されるかを示す。画像デー
タそのものの変更部分はT4より始まり、T6で終わる
ものとし、変更前の元の画像符号のビット発生量をS1
(51)、画質を改善した結果の画像符号のビット発生
量をS2(52)とする。画質改善のための変更により
バッファ残量へ与える影響を、変更部分だけにとどめる
ために、変更箇所の最後のフレームの次に来る元々存在
したフレームがバッファに書き込まれたときのバッファ
残量を同一とする(50)ことを目標におくとする。変
更部分の先頭の画像符号パケットの下端から左に直線を
引き元のビットレートを表す5Mbps の斜め線との交点
T3が、変更部分の出力開始点(クロックリファレン
ス)となる。変更部分はS2/(T6−T4)=7Mbp
s であれば、うまく送ることができるのであるから、変
更部分の最初のフレームのクロックリファレンスT3か
ら7Mbps の斜め線を引けば、これが新しいビットレー
トを表すことになる。変更部分のそれぞれの画像符号パ
ケットの下端から左側に直線を引き、7Mbps の直線と
の交点を求めれば、そこがそれぞれの画像符号パケット
の新しい出力の開始点(クロックリファレンス)とな
る。この結果、変更部分の全てのクロックリファレンス
は変更され、例えば、同一フレームの画像符号パケット
で比較すれば、位置(45)のように元より前にずれる
こともあれば、位置(46)のように後ろにずれること
もある。7Mbps の斜め線は、変更部分の最後のフレー
ムを出力し終わったところT5で終了する。つまり、変
更後の画像符号にビット累積の軌跡はうすい灰色で表し
たように、T3からT5までは7Mbps に上がり(4
8)、T5からビットレートは元の5bps に戻る(4
9)。7Mbps という値は、変更部分の総容量と時間か
ら単純計算して求めた(S2/(T6−T4)=7Mbp
s )である。また、T5はS2/7Mbps =(T5−T
3)の関係になることも明らかである。従って、T6−
T4=T5−T3である。一方、変更部分の時間は変更
の前後では同一(T6−T4)である。変更する前も後
もT3からビットを出力し始めているから、変更部分の
次に来るフレームの出力開始点(クロックリファレン
ス)T5は元々の開始点と一致する(47)。その時点
での画像符号のビット量の累積値は、ちょうど、画質を
向上させた結果のビット量S2(52)から元の発生ビ
ット量S1(51)を引いた分(S2−S1)だけ上に
並行移動しているだけであるので、5Mbps に戻ったと
ころでのバッファの残量は変更の前のときと同一の値と
なる。
【0086】図13に図解した本発明の画像符号化方法
の動作は、図14および図15に図解した両者の装置に
よって行われる。したがって、本発明の実施に際して
は、図14に図解した装置と図15に図解した装置を一
体構成にしてもよい。その場合、共用する装置を重複さ
せずに用いて簡略した構成にすることができる。
【0087】以上の実施例では、再符号化処理として、
第3の例を述べたが、その他の再符号化処理についても
上記同様に行うことができる。
【0088】なお、以上の説明では可変レートの場合を
用いたが、可変レート画像符号に一定のパッディングビ
ットを加えて固定レートとしているようなシステムでも
同様に実施できる。得られたビット列は、完全にMPE
G2フォーマットである。
【0089】
【発明の効果】本発明によれば、画質を正式に符号化処
理した後に、事前に編集事情を考慮して規定した「カッ
ト」をもとに部分的に修正できる。また本発明は、「DI
FFICALTY」データを求める際に厳密さが不要になる。換
言すれば、本発明においては、「DIFFICALTY」データを
求める作業を簡略化できるため、2パス符号化処理の1
パス目の時間を短縮できる。なお、本発明における「カ
ット」の概念、及び、本発明の一部をなす出力レート決
定装置は、MPEG符号化処理されたお互いに無関係な
複数のビット列同士を編集しつなぐことを可能とし、符
号化処理後のビット列の再利用をも可能になる。
【図面の簡単な説明】
【図1】図1は固定ビットレート符号化処理と可変ビッ
トレート符号化処理の概要を示す図である。
【図2】図2は可変ビットレート符号化処理の処理の概
要を示す図である。
【図3】図3はMPEGが適用されるシステム構成の1
例として画像伝送系統における画像符号化装置と画像復
号化装置とのシステム構成を示した図である。
【図4】図4はMPEGにおける符号化順序を示したグ
ラフである。
【図5】図5は図4に示したピクチャの意味とのその関
連を示したグラフである。
【図6】図6(A)はGOPの構成を示したMPEGの
ビットストリームの構成を示すグラフであり、図6
(B)はGOPヘッダの内容を示す図であり、図6
(C)はピクチャヘッダの内容を示す図である。
【図7】図7は一般的なMPEGの画像列の様子を示す
グラフである。
【図8】図8は、GOP単位での画像編集を行なったと
きに起こる問題を説明するための図である。
【図9】図9はMPEGにおける「CLOSED GOP」を説明
するグラフである。
【図10】図10は「カット編集方式」における圧縮・
符号化処理を示すグラフである。
【図11】図11は「カット編集方式」におけるビデオ
信号処理装置の構成図である。
【図12】図12は符号化処理シーケンスを図解したグ
ラフである。
【図13】図13は本発明の画像符号化方法の処理を図
解したフローチャートである。
【図14】図14は本発明の実施例として、「DIFFICAL
TY」を算出する仮符号化処理を行う画像符号装置の構成
図である。
【図15】図15は本発明の実施例として、正式に符号
化処理を行う装置の構成図である。
【図16】図16は本発明における平均した画像符号の
ビットレートが5Mbps の時の例を示すグラフである。
【図17】図17は本発明において、画質の一部に問題
が有り、量子化レベルを上げて対処する場合の処理を示
すグラフである。
【図18】図18は本発明において、エンコーダ出力の
ビットレートはどの部分が変更されるかを示すグラフで
ある。
【符号の説明】
1・・マスターテープ 2・・デジタルVTR 3・・タイムコード出力 4・・ビデオ信号 5・・画像遅延装置 6・・カット設定装置 7・・カット判定/指定回路 8・・画像タイプ制御部 9・・符号化シーケンス指示 10・・遅延したビデオ信号 11・・遅延量 12・・遅延させたタイムコード(TC) 13・・画像の二次元画素情報 14・・DCT演算装置 15・・遅延させたタイムコード(TC) 16・・周波数成分画像情報 17・・量子化器 19・・量子化されたビット 20・・逆量子化器 21・・逆DCT演算装置 22・・仮量子化レベル 23・・「DIFFICALTY」データ 24・・「DIFFICALTY」データ 25・・画像情報量の時間変化データ 26・・量子化レベル制御回路 27・・手動量子化レベル修正装置 28・・量子化レベル重み付け制御信号 29・・エントロピー符号化器 30・・時間情報 31・・最終的な画像符号 32・・出力レート決定装置 33・・最終符号出力 34・・ストリーム出力装置 35・・モニター用デコーダ 36・・「画像符号+時間情報」 37・・ストレージ装置 38・・符号化制御部 39・・符号化方式の指令 40・・テープ走行指示 41・・復号装置のバッファサイズ 100・・ビデオテープ記録再生装置(VTR) 200・・画像符号化装置(エンコーダ) 300・・蓄積メディア3(または伝送経路) 400・・画像復号化装置(デコーダ) 500・・TVモニタ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 田中 謙太郎 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】2パス符号化処理を行う画像符号化方法で
    あって、 後に編集点の候補となりうる「カット」の場所を指定
    し、 「カット」位置に基づいて画像データを仮符号化処理し
    て、符号化画像の複雑の度合いを示す「DIFFICALTY」デ
    ータを求め、 該「DIFFICALTY」データにより、最終的に発生すべき総
    情報量を画像のシーンごとの「DIFFICALTY」に比例する
    ように、ビット量を割り振り、 該割り振られたビット容量によりあらかじめ定められた
    量子化レベルの重み付け制御を行ない画像の各帯域の情
    報用の制御を行いながら、仮符号化処理の時と同じ符号
    化方法で前記画像データを正式に符号化処理し、 正式に符号化処理結果を観察し、低い画質の部分が存在
    するときその部分の量子化レベルの重み付けの制御を変
    更し、その部分を含む「カット」位置の画像データを再
    符号化処理する画像符号化方法。
  2. 【請求項2】前記再符号化処理として、 低い画質の部分で一旦、符号化処理を停止し、 再符号化処理によるビット増加量に相当する情報量をそ
    れ以前のシーンの部分で情報量を減少させても画質に問
    題が生じない場所を選択し、 画質が問題となるシーンのビットの増加量に見合うよう
    にその部分の量子化レベルを下げて、 前記両者を再符号化処理する請求項1記載の画像符号化
    方法。
  3. 【請求項3】前記再符号化処理として低い画質のシーン
    の量子化レベルを上げて再符号化処理し、 増加したビット量を一時的に保留し、 後に符号化処理されるシーン全体から均等にビット量を
    差し引き、その結果、その後のビット量を減少させて、
    総ビット量を定められた範囲に収める請求項1記載の画
    像符号化方法。
  4. 【請求項4】前記再符号化処理として低い画質のシーン
    の量子化レベルを上げて再符号化処理し、 増加したビット量を一時的に保留し、 画質が問題になりにくそうなシーンを特定し、その部分
    の量子化レベルを下げて符号化処理を行い、その結果、
    その後のビット量を減少させて総ビット量を定められた
    範囲に収める請求項1記載の画像符号化方法。
  5. 【請求項5】前記再符号化処理として、 画質が問題となるシーンまたは「カット」は、その場で
    は再符号化処理せずに、その場所を特定するマーキング
    (例えば、タイムコードや「カット」の番号を控えてお
    くなど)だけして符号化処理を続け、 最後まで符号化処理が終わった時点で、問題となるシー
    ンのすべての量子化レベルの重み付けを変更して再符号
    化処理し、 その時に増加したビット量に見合う分を減少させるべく
    量子化レベルを下げても問題のないようなシーンを選び
    出し、 その部分のビット量を減少させて再符号化処理し、その
    結果、総ビット量を定められた範囲に収める請求項1記
    載の画像符号化方法。
  6. 【請求項6】2パス符号化処理を行う画像符号化装置で
    あって、 後に編集点の候補となりうる「カット」の場所を指定す
    る手段と、 「カット」位置に基づいて画像データを仮符号化処理し
    て、符号化画像の複雑の度合いを示す「DIFFICALTY」デ
    ータを求める手段と、 該「DIFFICALTY」データにより、最終的に発生すべき総
    情報量を画像のシーンごとの「DIFFICALTY」に比例する
    ように、ビット量を割り振る手段と、 該割り振られたビット容量によりあらかじめ定められた
    量子化レベルの重み付け制御を行ない画像の各帯域の情
    報用の制御を行いながら、仮符号化処理の時と同じ符号
    化方法で前記画像データを正式に符号化処理する手段
    と、 正式に符号化処理結果を観察し、低い画質の部分が存在
    するときその部分の量子化レベルの重み付けの制御を変
    更し、その部分を含む「カット」位置の画像データを再
    符号化処理する手段とを具備する画像符号化装置。
JP27899096A 1996-09-30 1996-09-30 符号化装置及びその方法、および、記録装置及びその方法 Expired - Fee Related JP4416845B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP27899096A JP4416845B2 (ja) 1996-09-30 1996-09-30 符号化装置及びその方法、および、記録装置及びその方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP27899096A JP4416845B2 (ja) 1996-09-30 1996-09-30 符号化装置及びその方法、および、記録装置及びその方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2005342955A Division JP4301237B2 (ja) 2005-11-28 2005-11-28 符号化装置及びその方法、記録装置及びその方法、および、記録媒体

Publications (2)

Publication Number Publication Date
JPH10108200A true JPH10108200A (ja) 1998-04-24
JP4416845B2 JP4416845B2 (ja) 2010-02-17

Family

ID=17604884

Family Applications (1)

Application Number Title Priority Date Filing Date
JP27899096A Expired - Fee Related JP4416845B2 (ja) 1996-09-30 1996-09-30 符号化装置及びその方法、および、記録装置及びその方法

Country Status (1)

Country Link
JP (1) JP4416845B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010252404A (ja) * 2010-08-13 2010-11-04 Casio Computer Co Ltd 符号量制御装置、符号量制御方法、符号量制御プログラム、動画記録装置
CN102223527A (zh) * 2010-04-13 2011-10-19 华为技术有限公司 频带加权量化编解码方法和装置
JP2014511137A (ja) * 2011-01-28 2014-05-08 アイ アイオー,リミテッド・ライアビリティ・カンパニー シーンに基づく適用性のあるビットレート制御
US8817887B2 (en) 2006-09-05 2014-08-26 Sony Corporation Apparatus and method for splicing encoded streams

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8817887B2 (en) 2006-09-05 2014-08-26 Sony Corporation Apparatus and method for splicing encoded streams
CN102223527A (zh) * 2010-04-13 2011-10-19 华为技术有限公司 频带加权量化编解码方法和装置
JP2010252404A (ja) * 2010-08-13 2010-11-04 Casio Computer Co Ltd 符号量制御装置、符号量制御方法、符号量制御プログラム、動画記録装置
JP2014511137A (ja) * 2011-01-28 2014-05-08 アイ アイオー,リミテッド・ライアビリティ・カンパニー シーンに基づく適用性のあるビットレート制御

Also Published As

Publication number Publication date
JP4416845B2 (ja) 2010-02-17

Similar Documents

Publication Publication Date Title
JP3361009B2 (ja) ビデオ符号化方法および速度量子化モデルを利用して符号化を行うシステム
JP3493872B2 (ja) 画像データ処理方法およびその装置
JP4045553B2 (ja) 編集装置、編集方法、再符号化装置、再符号化方法、スプライシング装置及びスプライシング方法
KR100834322B1 (ko) 이미지 인코딩 장치, 화상 인코딩 방법 및 이미지 편집장치
US20110064321A1 (en) Image processing device and image processing method, information processing device and information processing method, information recording device and information recording method, information reproducing device and information reproducing method, storage medium, and program
EP1553779A1 (en) Data reduction of video streams by selection of frames and partial deletion of transform coefficients
JP2000278692A (ja) 圧縮データ処理方法及び処理装置並びに記録再生システム
US20060239563A1 (en) Method and device for compressed domain video editing
US8155458B2 (en) Image processing apparatus and image processing method, information processing apparatus and information processing method, information recording apparatus and information recording method, information reproducing apparatus and information reproducing method, recording medium and program
US7729425B2 (en) Image processing apparatus and method, program, and recording medium
JP2011514051A (ja) コンテンツデータを提供するための装置および方法
JP4301237B2 (ja) 符号化装置及びその方法、記録装置及びその方法、および、記録媒体
JP4416845B2 (ja) 符号化装置及びその方法、および、記録装置及びその方法
JP2007142809A (ja) 映像記録装置
JPH1198514A (ja) 画像符号化装置および方法
JP3660514B2 (ja) 可変レート動画像符号化方法および動画像編集システム
JP2008258858A (ja) 動画像符号化装置
JP3750846B2 (ja) 映像信号記録方法、及び映像信号記録装置
US20050084008A1 (en) Image processing apparatus and method, information processing apparatus and method, program, recording medium, and information processing system
JP4064604B2 (ja) 画像処理方法及び装置
US9219930B1 (en) Method and system for timing media stream modifications
JP3445278B2 (ja) エンコードされたビデオビットストリームのセクションを交換するための方法及びシステム
JP3692840B2 (ja) ディスク記録データの編集装置及び方法
JP2005237020A (ja) ディジタル映像処理装置及びディジタル映像処理方法
JP2004328796A (ja) ディジタル画像情報処理装置及びディジタル画像情報処理方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050916

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050927

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051128

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060725

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060922

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070116

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091125

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121204

Year of fee payment: 3

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121204

Year of fee payment: 3

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131204

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees