JP3874153B2 - 再符号化装置および再符号化方法、符号化装置および符号化方法、復号装置および復号方法、並びに、記録媒体 - Google Patents

再符号化装置および再符号化方法、符号化装置および符号化方法、復号装置および復号方法、並びに、記録媒体 Download PDF

Info

Publication number
JP3874153B2
JP3874153B2 JP34633099A JP34633099A JP3874153B2 JP 3874153 B2 JP3874153 B2 JP 3874153B2 JP 34633099 A JP34633099 A JP 34633099A JP 34633099 A JP34633099 A JP 34633099A JP 3874153 B2 JP3874153 B2 JP 3874153B2
Authority
JP
Japan
Prior art keywords
encoding
data
input
past
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP34633099A
Other languages
English (en)
Other versions
JP2001169278A (ja
Inventor
卓也 北村
勝己 田原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP34633099A priority Critical patent/JP3874153B2/ja
Publication of JP2001169278A publication Critical patent/JP2001169278A/ja
Application granted granted Critical
Publication of JP3874153B2 publication Critical patent/JP3874153B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、再符号化装置および再符号化方法、符号化装置および符号化方法、復号装置および復号方法、並びに、記録媒体に関し、特に、MPEG規格に基づいて符号化された符号化ビットストリームのGOP(Group of Pictures)の構造を変更したり、符号化ビットストリームのビットレートを変更するためのトランスコーディング装置に用いて好適な再符号化装置および再符号化方法、符号化装置および符号化方法、復号装置および復号方法、並びに、記録媒体に関する。
【0002】
【従来の技術】
近年、テレビジョンプログラムを制作及び放送する放送局においては、ビデオデータを圧縮/符号化処理するために、MPEG(Moving Picture Experts Group)技術が一般的に使われるようになってきた。特に、ビデオデータをテープなどのランダムアクセス可能な記録媒体素材に記録する場合、及びビデオデータをケーブルや衛星を介して伝送する場合には、このMPEG技術がデファクトスタンダードになりつつある。
【0003】
放送局において制作されたビデオプログラムが各家庭に伝送されるまでの放送局における処理の一例を簡単に説明する。まず、ビデオカメラとVTR(Video Tape Recorder)が一体となったカムコーダに設けられたエンコーダによって、ソースビデオデータをエンコード処理して磁気テープ上に記録する。この際、カムコーダのエンコーダは、VTRのテープの記録フォーマットに適するように、ソースビデオデータを符号化する。たとえば、この磁気テープ上に記録されるMPEGビットストリームのGOP構造は、2フレームから1GOPが構成される構造(たとえば、I,B,I,B,I,B,・・・・・・)とされる。また磁気テープ上に記録されているMPEGビットストリームのビットレートは、18Mbpsである。
【0004】
次に、メイン放送局において、この磁気テープ上に記録されたビデオビットストリームを編集する編集処理を行う。そのために、磁気テープ上に記録されたビデオビットストリームのGOP構造を、編集処理に適したGOP構造に変換する。編集処理に適したGOP構造とは、1GOPが1フレームから構成され、すべてのピクチャがIピクチャであるGOP構造である。なぜなら、フレーム単位で編集を行うためには、他のピクチャと相関のないIピクチャがもっとも適しているからである。実際のオペレーションとしては、磁気テープ上に記録されたビデオストリームを一旦デコードしてベースバンドのビデオデータに戻す。そして、そのベースバンドのビデオ信号を、すべてのピクチャがIピクチャとなるように再エンコードする。このようにデコード処理及び再エンコード処理を行うことによって、編集処理に適したGOP構造を有したビットストリームを生成することができる。
【0005】
次に、上述した編集処理によって生成された編集ビデオプログラムを、メイン局から地方局に伝送するために、編集ビデオプログラムのビットストリームを、伝送処理に適したGOP構造及びビットレートに変換する。放送局間の伝送に適したGOP構造とは、たとえば、1GOPが15フレームから構成されているGOP構造(たとえば、I,B,B,P,B,B,P・…)である。また、放送局間の伝送に適したビットレートは、一般的に放送局間においては、光ファイバなどの高伝送容量を有した専用線が設けらているので、50Mbps以上のハイビットレートであることが望ましい。具体的には、編集処理されたビデオプログラムのビットストリームを一旦デコードしてベースバンドのビデオデータに戻す。そして、そのベースバンドのビデオデータを上述した放送局間の伝送に適したGOP構造及びビットレートを有するように再エンコードする。
【0006】
地方局においては、メイン局から伝送されてきたビデオプログラムの中に、地方特有のコマーシャルを挿入するために編集処理が行われる。つまり、上述した編集処理と同じように、メイン局から伝送されてきたビデオストリームを一旦デコードしてベースバンドのビデオデータに戻す。そして、そのベースバンドのビデオ信号を、すべてのピクチャがIピクチャとなるように再エンコードすることによって、編集処理に適したGOP構造を有したビットストリームを生成することができる。
【0007】
続いて、この地方局において編集処理が行われたビデオプログラムを各家庭に、ケーブルや衛星を介して伝送するために、この伝送処理に適したGOP構造及びビットレートに変換する。たとえば、各家庭に伝送するための伝送処理に適したGOP構造とは、1GOPが15フレームから構成されるGOP構造(たとえば、I,B,B,P,B,B,P・…)であって、各家庭に伝送するための伝送処理に適したビットレートは、5Mbps程度の低ビットレートである。具体的には、編集処理されたビデオプログラムのビットストリームを一旦デコードしてベースバンドのビデオデータに戻す。そして、そのベースバンドのビデオデータを上述した伝送処理に適したGOP構造及びビットレートを有するように再エンコードする。
【0008】
このように、放送局から各家庭にビデオプログラムが伝送される間に、複数回の復号処理、符号化処理、および編集処理が繰り返されている。実際には、放送局における処理は上述した信号処理以外にもさまざまな信号処理が必要であり、そのたびに復号処理及び符号化処理を繰り返される。
【0009】
MPEG規格に基づく符号化処理及び復号処理は、100%可逆の処理ではないことは良く知られている。つまり、エンコードされる前のベースバンドのビデオデータと、デコードされた後のビデオデータは100%同じでは無く、この符号化処理及び復号処理によって画質が劣化している。つまり、上述したように、デコード処理及びエンコード処理を繰り返すと、その処理の度に、画質が劣化してしまうと言う問題があった。別の言葉で表現すると、デコード/エンコード処理を繰り返す毎に、画質の劣化が蓄積されてしまう。
【0010】
そこで、デコード/エンコード処理に伴う画質の劣化を防止するために、以前の符号化の処理で用いられた符号化パラメータを画像と関連付けて伝送して、以前の符号化の処理で用いられた符号化パラメータを利用して符号化するシステムが利用されている。
【0011】
【発明が解決しようとする課題】
しかしながら、画像の削除または画像の挿入などの編集処理が行われた画像を、以前の符号化の処理で用いられた符号化パラメータを利用して符号化しようとする場合、大きな画質劣化を招くときがある。
【0012】
図1は、時間の経過とともに図1中の左側から右側に向かって表示されるピクチャの例を示す。図1中のBは、以前の符号化の処理においてBピクチャとして符号化されたピクチャを示し、図1中のIは、以前の符号化の処理においてIピクチャとして符号化されたピクチャを示し、図1中のPは、以前の符号化の処理においてPピクチャとして符号化されたピクチャを示す。
【0013】
例えば、図1(A)に示す図1(A)中の左側の4つのピクチャに、図1(B)に示す図1(B)中の右側の5つのピクチャがつなぎ合わされて、図1(C)に示す新たな画像として生成されるように編集されたとき、編集のつなぎ目の最後の画像(編集前に図1(A)に含まれていた、図1(A)中左側から4枚目の画像に対応する画像)が、以前の符号化においてBピクチャである場合、その以前の符号化で用いられた符号化パラメータを利用して符号化しようとするとき、編集される前とは異なるPピクチャを参照して符号化してしまい、大きく画質が劣化してしまう。
【0014】
同様に、編集のつなぎ目の先頭の画像(編集前に図1(B)に含まれていた、図1(B)中左側から5枚目の画像に対応する画像)が、以前の符号化においてBピクチャである場合、その以前の符号化で用いられた符号化パラメータを利用して符号化しようとするとき、編集される前とは異なるIピクチャを参照して符号化してしまい、大きく画質が劣化してしまう。
【0015】
また、このような編集が行われた場合、VBV(Video Buffering Verifier) Bufferを基にした、ビットストリームのレイトコントロールに矛盾が生じるので、オーバーフローまたはアンダーフローが生じるときがある。
【0016】
例えば、図2(A)が、以前の符号化の処理において、図1(A)に示す画像を符号化する場合の、VBV Bufferに格納されるデータの量を示し、図2(B)が、以前の符号化の処理において、図1(B)に示す画像を符号化する場合の、VBV Bufferに格納されるデータの量を示すとき、図1(C)に示す画像を、以前の符号化パラメータをそのまま利用して符号化すると、図2(C)に示すように、VBV Bufferに格納されるデータは、オーバーフローしてしまう。
【0017】
更に、フレームシンクロナイザにより、フレーム周期のずれを吸収するため、画像のフレームを間引いたり、または同一のフレームを二回表示させた場合にも、画像の時間的な連続性を壊すことになり、上述の編集処理の場合と同様の問題が生じる。
【0018】
MPEG2のビットストリームにおいて、入力画像毎にカウントアップする、10bitのカウンタであるtemporal_referenceがpicture_header()層に挿入されているので、このtemporal_referenceを利用して、このような画像の不連続を検出することができる。
【0019】
しかし、このtemporal_referenceは、group_of_pictures_header()の後に、リセットしなければならない。group_of_pictures_header()は、周期について特に規定はないが、通常、GOPの周期で挿入されている。
【0020】
従って、1GOPが15フレームから構成されるGOP構造を有する場合、temporal_referenceの周期は15となり、この画像に上述のような編集処理がなされても、temporal_referenceは連続してしまう可能性が高いので、画像の不連続を検出できない可能性が高い。1GOPが1フレームから構成されるGOP構造を有する場合、temporal_referenceは、常に、0となるので、画像の不連続は検出できない。
【0021】
本発明は、このような状況に鑑みてなされたものであり、MPEG規格に基づいて符号化された符号化ビットストリームのGOP(Group of Pictures)の構造を変更するために復号処理、符号化処理、および編集処理を繰り返したとしても画質劣化の発生しないようにするものである。
【0022】
【課題を解決するための手段】
本発明の再符号化装置は、符号化ストリームに対する過去の符号化処理において生成された過去の符号化パラメータを、符号化ストリームとともに入力する入力手段と、入力手段により入力された符号化ストリームを復号処理するとともに、復号処理された画像データに対して施される編集に伴うつなぎ目を識別する情報として、アクセスユニット毎にカウントアップまたはカウントダウンされるカウンタ値である識別情報を生成し、復号処理された画像データを、入力手段により入力された過去の符号化パラメータおよび生成された識別情報とともに出力する復号手段と、復号手段により復号された画像データを再符号化処理して再符号化ストリームを生成する再符号化手段と、復号手段により生成された識別情報に基づいて、復号手段により出力された過去の符号化パラメータおよび再符号化処理する際に生成する現在の符号化パラメータのうち、編集に伴うつなぎ目を含む所定区間では、現在の符号化パラメータを選択し、編集に伴うつなぎ目を含む所定区間以外の区間では、過去の符号化パラメータを選択し、選択した符号化パラメータを利用して再符号化処理するように、再符号化手段を制御する制御手段とを備えることを特徴とする。
【0023】
アクセスユニットはフレームまたはフィールドであるものとすることができる。
【0024】
復号手段には、アクセスユニットに同期する同期信号を生成するとともに、同期信号カウントアップまたはカウントダウンを実行することにより得られるカウンタ値を基に、識別情報を生成させるようにすることができる。
【0025】
過去の符号化パラメータは、符号化ストリームに多重化されているものとすることができ、復号手段には、符号化ストリームから過去の符号化パラメータを取得させるようにすることができる。
復号手段には、識別情報を画像データに多重化して出力させるようにすることができる。
復号手段には、識別情報をアンシラリデータパケットに格納して、アンシラリデータパケットを画像データに多重化して出力させるようにすることができる。
【0026】
復号手段には、識別情報を画像データのブランキング部分に多重化して出力させるようにすることができる。
【0027】
復号手段には、過去の符号化パラメータを画像データに多重化して出力させるようにすることができる。
復号手段には、過去の符号化パラメータを画像データのブランキング部分に多重化して出力させるようにすることができる。
【0028】
復号手段には、識別情報を、画像データのブランキング部分に多重化されている過去の符号化パラメータに多重化して出力させるようにすることができる。
【0030】
再符号化手段により生成された再符号化ストリームを出力する出力手段を更に備えさせるようにすることができる。
再符号化手段により利用された過去の符号化パラメータおよび現在の符号化パラメータのうちのいずれかを、再符号化ストリームとともに出力する出力手段を更に備えさせるようにすることができる。
再符号化手段により利用された過去の符号化パラメータおよび現在の符号化パラメータのうちのいずれかを、再符号化ストリームに多重化する多重化手段を更に備えさせるようにすることができ、出力手段には、多重化手段により過去の符号化パラメータおよび現在の符号化パラメータのうちのいずれかが多重化された再符号化ストリームを出力させるようにすることができる。
【0031】
再符号化手段には、ビットレート、または、 GOP 構造を変更して再符号化処理を行わせるようにすることができる。
再符号化手段には、シーケンスレイヤ、 GOP レイヤ、ピクチャレイヤ、スライスレイヤ、および、マクロブロックレイヤを有する MPEG 方式で再符号化を行わせるようにすることができる。
【0032】
本発明の再符号化方法は、符号化ストリームに対する過去の符号化処理により生成された過去の符号化パラメータを、符号化ストリームとともに入力する入力工程と、入力工程により入力された符号化ストリームを復号処理するとともに、復号処理された画像データに対して施される編集に伴うつなぎ目を識別する情報として、アクセスユニット毎にカウントアップまたはカウントダウンされるカウンタ値である識別情報を生成し、復号処理された画像データを、入力工程により入力された過去の符号化パラメータおよび生成された識別情報とともに出力する復号工程と、復号工程により復号された画像データを再符号化処理して再符号化ストリームを生成する再符号化工程と、復号工程により生成された識別情報に基づいて、復号工程により出力された過去の符号化パラメータおよび再符号化処理する際に生成する現在の符号化パラメータのうち、編集に伴うつなぎ目を含む所定区間では、現在の符号化パラメータを選択し、編集に伴うつなぎ目を含む所定区間以外の区間では、過去の符号化パラメータを選択し、選択した符号化パラメータを利用して再符号化処理するように、再符号化工程の再符号化処理を制御する制御工程とを含む。
本発明の第1の記録媒体に記録されているプログラムは、符号化ストリームに対する過去の符号化処理により生成された過去の符号化パラメータを、符号化ストリームとともに入力する入力工程と、入力工程により入力された符号化ストリームを復号処理するとともに、復号処理された画像データに対して施される編集に伴うつなぎ目を識別する情報として、アクセスユニット毎にカウントアップまたはカウントダウンされるカウンタ値である識別情報を生成し、復号処理された画像データを、入力工程により入力された過去の符号化パラメータおよび生成された識別情報とともに出力する復号工程と、復号工程により復号された画像データを再符号化処理して再符号化ストリームを生成する再符号化工程と、復号工程により生成された識別情報に基づいて、復号工程により出力された過去の符号化パラメータおよび再符号化処理する際に生成する現在の符号化パラメータのうち、編集に伴うつなぎ目を含む所定区間では、現在の符号化パラメータを選択し、編集に伴うつなぎ目を含む所定区間以外の区間では、過去の符号化パラメータを選択し、選択した符号化パラメータを利用して再符号化処理するように、再符号化工程の再符号化処理を制御する制御工程とを含む処理をコンピュータに実行させる。
【0033】
本発明の再符号化装置及び再符号化方法、並びに、第1の記録媒体に記録されているプログラムにおいては、符号化ストリームに対する過去の符号化処理により生成された過去の符号化パラメータが、符号化ストリームとともに入力され、入力された符号化ストリームが復号されるとともに、復号処理された画像データに対して施される編集に伴うつなぎ目を識別する情報として、アクセスユニット毎にカウントアップまたはカウントダウンされるカウンタ値である識別情報が生成され、復号処理された画像データが、過去の符号化パラメータおよび識別情報とともに出力され、復号された画像データが、識別情報に基づいて、過去の符号化パラメータおよび再符号化処理する際に生成する現在の符号化パラメータのうち、編集に伴うつなぎ目を含む所定区間では、現在の符号化パラメータが選択されて、編集に伴うつなぎ目を含む所定区間以外の区間では、過去の符号化パラメータを選択し、選択した符号化パラメータが利用されて、復号された画像データが、再符号化されて再符号化ストリームが生成される。
【0034】
本発明の符号化装置は、符号化ストリームに対する過去の符号化処理において生成された過去の符号化パラメータおよび画像データに対して施された編集に伴うつなぎ目を識別する識別情報を、画像データとともに入力する入力手段と、入力手段により入力された画像データを符号化処理して符号化ストリームを生成する符号化手段と、入力手段により入力された識別情報に基づいて、入力手段により入力された過去の符号化パラメータおよび符号化処理する際に生成する現在の符号化パラメータのうち、編集に伴うつなぎ目を含む所定区間では、現在の符号化パラメータを選択し、編集に伴うつなぎ目を含む所定区間以外の区間では、過去の符号化パラメータを選択し、選択した符号化パラメータを利用して符号化処理するように、符号化手段を制御する制御手段とを備える。
本発明の符号化方法は、符号化ストリームに対する過去の符号化処理において生成された過去の符号化パラメータおよび画像データに対して施された編集に伴うつなぎ目を識別する識別情報を、画像データとともに入力する入力工程と、入力工程により入力された画像データを符号化処理して符号化ストリームを生成する符号化工程と、入力工程により入力された識別情報に基づいて、入力工程により入力された過去の符号化パラメータおよび符号化処理する際に生成する現在の符号化パラメータのうち、編集に伴うつなぎ目を含む所定区間では、現在の符号化パラメータを選択し、編集に伴うつなぎ目を含む所定区間以外の区間では、過去の符号化パラメータを選択し、選択した符号化パラメータを利用して符号化処理するように、符号化工程の符号化処理を制御する制御工程とを含む。
本発明の第2の記録媒体に記録されているプログラムは、符号化ストリームに対する過去の符号化処理において生成された過去の符号化パラメータおよび画像データに対して施された編集に伴うつなぎ目を識別する識別情報を、画像データとともに入力する入力工程と、入力工程により入力された画像データを符号化処理して符号化ストリームを生成する符号化工程と、入力工程により入力された識別情報に基づいて、入力工程により入力された過去の符号化パラメータおよび符号化処理する際に生成する現在の符号化パラメータのうち、編集に伴うつなぎ目を含む所定区間では、現在の符号化パラメータを選択し、編集に伴うつなぎ目を含む所定区間以外の区間では、過去の符号化パラメータを選択し、選択した符号化パラメータを利用して符号化処理するように、符号化工程の符号化処理を制御する制御工程とを含む処理をコンピュータに実行させる。
本発明の符号化装置及び符号化方法、並びに、第2の記録媒体に記録されているプログラムにおいては、符号化ストリームに対する過去の符号化処理において生成された過去の符号化パラメータおよび画像データに対して施された編集に伴うつなぎ目を識別する識別情報が、画像データとともに入力され、識別情報に基づいて、過去の符号化パラメータおよび符号化処理する際に生成する現在の符号化パラメータのうち、編集に伴うつなぎ目を含む所定区間では、現在の符号化パラメータが選択されて、編集に伴うつなぎ目を含む所定区間以外の区間では、過去の符号化パラメータを選択し、選択した符号化パラメータが利用されて、画像データが符号化処理される。
【0035】
本発明の復号装置は、符号化ストリームに対する過去の符号化処理において生成された過去の符号化パラメータを、符号化ストリームとともに入力する入力手段と、入力手段により入力された符号化ストリームを復号処理するとともに、入力手段により入力された過去の符号化パラメータを、復号処理された画像データを再符号化する際に再利用するかを判断するために利用可能な情報として、復号処理された画像データに対して施される編集に伴うつなぎ目を識別する情報であって、アクセスユニット毎にカウントアップまたはカウントダウンされるカウンタ値である識別情報を生成し、復号処理された画像データを、入力手段により入力された過去の符号化パラメータおよび生成された識別情報とともに出力する復号手段とを備える。
本発明の復号方法は、符号化ストリームに対する過去の符号化処理において生成された過去の符号化パラメータを、符号化ストリームとともに入力する入力工程と、入力工程により入力された符号化ストリームを復号処理するとともに、入力工程により入力された過去の符号化パラメータを、復号処理された画像データを再符号化する際に未来の符号化処理時に再利用するかを判断するために利用可能な情報として、復号処理された画像データに対して施される編集に伴うつなぎ目を識別する情報であって、アクセスユニット毎にカウントアップまたはカウントダウンされるカウンタ値である識別情報を生成し、復号処理された画像データを、入力工程により入力された過去の符号化パラメータおよび生成された識別情報とともに出力する復号工程とを含む。
本発明の第3の記録媒体に記録されているプログラムは、符号化ストリームに対する過去の符号化処理において生成された過去の符号化パラメータを、符号化ストリームとともに入力する入力工程と、入力工程により入力された符号化ストリームを復号処理するとともに、入力工程により入力された過去の符号化パラメータを、復号処理された画像データを再符号化する際に再利用するかを判断するために利用可能な情報として、復号処理された画像データに対して施される編集に伴うつなぎ目を識別する情報であって、アクセスユニット毎にカウントアップまたはカウントダウンされるカウンタ値である識別情報を生成し、復号処理された画像データを、入力工程により入力された過去の符号化パラメータおよび生成された識別情報とともに出力する復号工程とを含む処理をコンピュータに実行させる。
本発明の復号装置及び復号方法、並びに、第3の記録媒体に記録されているプログラムにおいては、符号化ストリームに対する過去の符号化処理において生成された過去の符号化パラメータが、符号化ストリームとともに入力され、入力された符号化ストリームが復号されるとともに、入力された過去の符号化パラメータを、復号処理された画像データを再符号化する際に再利用するかを判断するために利用可能な情報として、復号処理された画像データに対して施される編集に伴うつなぎ目を識別する情報であって、アクセスユニット毎にカウントアップまたはカウントダウンされるカウンタ値である識別情報が生成され、復号処理された画像データが、過去の符号化パラメータおよび識別情報とともに出力される。
【0037】
【発明の実施の形態】
以下に、本発明を適用したトランスコーディングシステムについて説明する。なお、本明細書においてシステムの用語は、複数の装置、手段などにより構成される全体的な装置を意味するものである。
【0038】
図3及び図4は、本発明を適用したトランスコーディングシステム1の構成を示しており、図4は、図3のさらに詳細な構成を示している。このトランスコーディングシステム1は、ビデオ復号システム11に入力された符号化ビデオビットストリーム(encoded video bit stream)のGOP構造及びビットレートを、オペレータの所望するGOP構造及びビットレートに変換する。
【0039】
トランスコーディングシステム1は、ビデオ復号システム11、ビデオ符号化システム12、VTR(Video Tape Recorder)13、スイッチ14、およびスイッチ15から構成されている。
【0040】
ビデオ復号システム11は、入力された符号化ビデオビットストリームを基にベースバンドデジタルビデオ信号を生成する。ビデオ符号化システム12は、ベースバンドビデオ信号を基にオペレータの所望するGOP構造及びビットレートを有する符号化ビデオビットストリームを出力する。
【0041】
VTR13は、スイッチ14を介して供給されたベースバンドデジタルビデオ信号を記録すると共に、記録されているベースバンドデジタルビデオ信号をスイッチ15を介してビデオ符号化システム12に供給する。
【0042】
スイッチ14は、ビデオ復号システム11から出力されたベースバンドデジタルビデオ信号の供給先をVTR13またはスイッチ15に切り換える。スイッチ15は、ビデオ復号システム11から出力されるベースバンドデジタルビデオ信号またはVTR13から出力されるベースバンドデジタルビデオ信号のいずれかを選択して、選択されたベースバンドデジタルビデオ信号をビデオ符号化システム12に出力する。
【0043】
このトランスコーディングシステム1の機能を説明するために、図4には図示されていないが、このトランスコーディングシステム1の前段に、このトランスコーディングシステム1とほぼ同様の機能を有した3つのトランスコーディングシステムが接続されているものとする。つまり、ビットストリームのGOP構造及びビットレートをさまざまに変更するために、第1のトランスコーディングシステム、第2のトランスコーディングシステム、および第3のトランスコーディングシステムが順に直列に接続され、その第3のトランスコーディングシステムの後ろに、この図4に示された第4のトランスコーディングシステムが接続されているものとする。
【0044】
本発明の以下の説明において、この第1のトランスコーディングシステムにおいて行われた符号化処理を第1世代の符号化処理と定義し、第1のトランスコーディングシステムの後ろに接続された第2のトランスコーディングシステムにおいて行われた符号化処理を第2世代の符号化処理と定義し、第2のトランスコーディングシステムの後ろに接続された第3のトランスコーディングシステムにおいて行われた符号化処理を第3世代の符号化処理と定義し、第3のトランスコーディングシステムの後ろに接続された第4のトランスコーディングシステム(図4に示されたトランスコーディングシステム1)において行われる符号化処理を第4世代の符号化処理または現在の符号化処理と定義することにする。
【0045】
また、第1世代の符号化処理において生成された符号化パラメータを第1世代の符号化パラメータと呼び、第2世代の符号化処理において生成された符号化パラメータを第2世代の符号化パラメータと呼び、第3世代の符号化処理において生成された符号化パラメータを第3世代の符号化パラメータと呼び、第4世代の符号化処理において生成された符号化パラメータを第4世代の符号化パラメータまたは現在の符号化パラメータと呼ぶことにする。
【0046】
まず、この図4に示されたトランスコーディングシステム1に供給される符号化ビデオストリームST(3rd)について説明する。ST(3rd)は、このトランスコーディングシステム1の前段に設けられている第3のトランスコーディングシステムにおける第3世代の符号化処理において生成された第3世代の符号化ストリームであることを表わしている。この第3世代の符号化処理において生成された符号化ビデオストリームST(3rd)には、第3の符号化処理において生成された第3世代の符号化パラメータが、この符号化符号化ビデオストリームST(3rd)のシーケンス層、GOP層、ピクチャ層、スライス層、及びマクロブロック層に、sequence_header() 関数、sequence_extension() 関数、group_of_pictures_header()関数、picture_header()関数,picture_coding_extension()関数、picture_data()関数、slice() 関数、及びmacroblock()関数として記述されている。このように第3の符号化処理によって生成された第3の符号化ストリームに、第3の符号化処理において使用した第3の符号化パラメータを記述することはMPEG2規格において定義されていることであって、何ら新規性は無い。
【0047】
本発明のトランスコーディングシステム1におけるユニークな点は、この第3の符号化ストリームST(3rd)中に、第3の符号化パラメータを記述するだけでなく、第1世代及び第2世代の符号化処理において生成された第1世代及び第2世代の符号化パラメータも記述されているという点、およびアクセスユニットであるフレームまたはフィールド毎にカウントアップされる、十分に周期の長いカウンタ値が画像に関連づけられている点である。
【0048】
具体的には、この第1世代及び第2世代の符号化パラメータは、第3世代の符号化ビデオストリームST(3rd)のピクチャ層のユーザデータエリアに、ヒストリストリームhistory_stream()として記述されている。本発明においては、第3世代の符号化ビデオストリームST(3rd)のピクチャ層のユーザデータエリアに記述されているヒストリストリームを、「ヒストリ情報」、または「履歴情報」と呼び、このヒストリストリームとして記述されている符号化パラメータを「ヒストリパラメータ」、または「履歴パラメータ」と呼んでいる。
【0049】
また別の呼び方として、第3世代の符号化ストリームST(3rd)に記述されている第3世代の符号化パラメータを「現在の符号化パラメータ」と呼んだ場合には、第3世代の符号化処理からみて第1世代及び第2世代の符号化処理は、過去に行なわれた符号化処理であるので、第3世代の符号化ストリームST(3rd)のピクチャ層のユーザデータエリアに記述されているヒストリストリームとして記述されている符号化パラメータを「過去の符号化パラメータ」とも呼んでいる。
【0050】
このように、この第3の符号化ストリームST(3rd)中に、第3の符号化パラメータを記述するだけでなく、第1世代及び第2世代の符号化処理において生成された第1世代及び第2世代の符号化パラメータを記述する理由は、トランスコーディング処理によって符号化ストリームのGOP構造やビットレートの変更を繰り返したとしても、画質劣化を防止することができるからである。
【0051】
例えば、あるピクチャを第1世代の符号化処理においてPピクチャとして符号化し、第1世代の符号化ストリームのGOP構造を変更するために、第2世代の符号化処理においてそのピクチャをBピクチャとして符号化し、第2世代の符号化ストリームのGOP構造をさらに変更するために、第3世代の符号化処理において、再度そのピクチャをPピクチャとして符号化することが考えられる。MPEG規格に基づく符号化処理及び復号処理は100%可逆の処理ではないので、符号化及び復号処理を繰り返す毎に画質が劣化していくことは知られている。
【0052】
このような場合に、第3の世代の符号化処理において、量子化スケール、動きベクトル、予測モードなどの符号化パラメータをもう一度計算するのではなくて、第1世代の符号化処理において生成された量子化スケール、動きベクトル、予測モードなどの符号化パラメータを再利用する。第3世代の符号化処理によって新しく生成された量子化スケール、動きベクトル、予測モードなどの符号化パラメータよりも、第1世代の符号化処理によって新しく生成された量子化スケール、動きベクトル、予測モードなどの符号化パラメータの方が、明らかに精度が良いので、この第1世代のパラメータを再利用することによって、符号化及び復号処理を繰り返したとしても画質劣化を少なくすることができる。
【0053】
また、ビデオ復号システム11が出力するベースバンドデジタルビデオ信号に含まれる画像には、アクセスユニットであるそのフレームまたはフィールド毎にカウントアップされるカウンタ値が関連付けられている。カウンタ値は、例えば、周期が65,536であり、最大値が設定された後、0になり、また、0からカウントアップされる。
【0054】
ビデオ符号化システム12は、ベースバンドデジタルビデオ信号に含まれる画像に対応するカウンタ値を基に、入力されたベースバンドデジタルビデオ信号に含まれる画像の不連続点(例えば、画像をつなぎ合わせた点、画像を挿入した点、画像を間引いた点など)を検出することができる。
【0055】
例えば、あるピクチャを第1世代の符号化処理においてPピクチャとして符号化し、第1世代の符号化ストリームのGOP構造を変更するために、第2世代の符号化処理においてそのピクチャをBピクチャとして符号化し、第2世代の符号化ストリームのGOP構造をさらに変更するために、第3世代の符号化処理において、第1世代の符号化処理における符号化パラメータを基に再度そのピクチャをPピクチャとして符号化する場合、そのピクチャの前のピクチャが削除されるように(そのピクチャが参照するIピクチャまたはPピクチャが削除されるように)画像が編集されていないとき、ビデオ符号化システム12は、第1世代の符号化処理において生成した符号化パラメータを利用してそのピクチャをPピクチャとして符号化し、そのピクチャの前のピクチャが削除されるように(そのピクチャが参照するIピクチャまたはPピクチャが削除されるように)画像が編集されているとき、符号化パラメータを生成してそのピクチャをPピクチャとして符号化する。
【0056】
このように、ビデオ符号化システム12は、アクセスユニットであるフレームまたはフィールド毎にカウントアップされるカウンタ値を基に画像の不連続点を検出して、第1世代の符号化処理において生成された量子化スケール、動きベクトル、予測モードなどの符号化パラメータを利用して、符号化するので、画質劣化を防止することができる。
【0057】
上述した本発明にかかる処理を説明するために、図4に示された第4世代のトランスコーディングシステム1の処理を例に挙げてより詳しく説明する。
【0058】
カウンタ101は、復号装置102から供給されるフレームまたはフィールドに同期したFrame/Field同期信号を基に、カウントアップ(1を加算)される16ビットのカウンタである。カウンタ101は、0乃至65,535のいずれかのカウンタ値をカウンタ値多重化装置105に出力する。
【0059】
カウンタ101は、65,535のカウンタ値を有する場合、復号装置102からフレームまたはフィールドに同期したFrame/Field同期信号が供給されたとき、カウンタ値を0とし、その後も、復号装置102から供給されるFrame/Field同期信号を基に、カウントアップを継続する。
【0060】
なお、カウンタ101は、復号装置102から供給されるフレームまたはフィールドに同期したFrame/Field同期信号を基に、カウントダウン(1を減算)するようにしてもよい。
【0061】
復号装置102は、第3世代の符号化ビットストリームST(3rd)に含まれている符号化ビデオを第3世代の符号化パラメータを使用して復号し、復号されたベースバンドのデジタルビデオデータを生成するための装置である。さらに、復号装置102は、第3世代の符号化ビットストリームST(3rd)のピクチャ層のユーザデータエリアにヒストリストリームとして記述されている第1世代及び第2世代の符号化パラメータをデコードするための装置でもある。
【0062】
具体的には、図5に示されているように、復号装置102のデコーダ251は、供給されたビットストリームをバッファリングするための受信バッファ261、符号化ビットストリームを可変長復号するための可変長復号回路262、可変長復号されたデータを可変長復号回路262から供給された量子化スケールに従って逆量子化する逆量子化回路263、逆量子化されたDCT(離散コサイン変換)係数を逆離散コサイン変換するIDCT回路264、及び動き補償処理を行うための演算器265、動き補償回路266及びフレームメモリ267を備えている。
【0063】
伝送路(または所定の記録媒体)を介して伝送された符号化された画像データは、図示せぬ受信回路で受信されたり、再生装置で再生され、受信バッファ261に一時記憶された後、可変長復号回路262に供給される。可変長復号回路262は、受信バッファ261より供給されたデータを可変長復号し、動きベクトル、予測モード、予測フラグ、およびDCTフラグを動き補償回路266に出力し、量子化スケールを逆量子化回路263に出力するとともに、復号された画像データを逆量子化回路263に出力する。
【0064】
逆量子化回路263は、可変長復号回路262より供給された画像データを、同じく可変長復号回路262より供給された量子化スケールに従って逆量子化し、IDCT回路264に出力する。逆量子化回路263より出力されたデータ(DCT係数)は、IDCT回路264により、逆離散コサイン変換処理が施され、演算器265に供給される。
【0065】
IDCT回路264より演算器265に供給された画像データが、Iピクチャのデータである場合、そのデータは演算器265より出力され、演算器265に後に入力される画像データ(PまたはBピクチャのデータ)の予測画像データ生成のために、フレームメモリ267の前方予測画像部267aに供給されて記憶される。また、このデータは、ヒストリ情報多重化装置103(図3)に出力される。
【0066】
IDCT回路264より供給された画像データが、その1フレーム前の画像データを予測画像データとするPピクチャのデータであり、前方予測モードのデータである場合、フレームメモリ267の前方予測画像部267aに記憶されている、1フレーム前の画像データ(Iピクチャのデータ)が読み出され、動き補償回路266で可変長復号回路262より出力された動きベクトルに対応する動き補償が施される。そして、演算器265において、IDCT回路264より供給された画像データ(差分のデータ)と加算され、出力される。この加算されたデータ、すなわち、復号されたPピクチャのデータは、演算器265に後に入力される画像データ(BピクチャまたはPピクチャのデータ)の予測画像データ生成のために、フレームメモリ267の後方予測画像部267bに供給されて記憶される。
【0067】
Pピクチャのデータであっても、画像内予測モードのデータは、Iピクチャのデータと同様に、演算器265において処理は行われず、そのまま後方予測画像部267bに記憶される。
【0068】
このPピクチャは、次のBピクチャの次に表示されるべき画像であるため、この時点では、まだヒストリ情報多重化装置103へ出力されない(Bピクチャの後に入力されたPピクチャが、Bピクチャより先に処理され、伝送される)。
【0069】
IDCT回路264より供給された画像データが、Bピクチャのデータである場合、可変長復号回路262より供給された予測モードに対応して、フレームメモリ267の前方予測画像部267aに記憶されているIピクチャの画像データ(前方予測モードの場合)、後方予測画像部267bに記憶されているPピクチャの画像データ(後方予測モードの場合)、または、その両方の画像データ(両方向予測モードの場合)が読み出され、動き補償回路266において、可変長復号回路262より出力された動きベクトルに対応する動き補償が施されて、予測画像が生成される。但し、動き補償を必要としない場合(画像内予測モードの場合)、予測画像は生成されない。
【0070】
このようにして、動き補償回路266で動き補償が施されたデータは、演算器265において、IDCT回路264の出力と加算される。この加算出力は、ヒストリ情報多重化装置103に出力される。
【0071】
ただし、この加算出力はBピクチャのデータであり、他の画像の予測画像生成のために利用されることがないため、フレームメモリ267には記憶されない。
【0072】
Bピクチャの画像が出力された後、後方予測画像部267bに記憶されているPピクチャの画像データが読み出され、動き補償回路266を介して演算器265に供給される。但し、このとき、動き補償は行われない。
【0073】
なお、このデコーダ251において、奇数フィールドと偶数フィールドのラインの信号が分離された構成を元の構成に必要に応じて戻す処理は、動き補償回路266により実行される。
【0074】
また、上述した説明においては、輝度信号の処理について説明したが、色差信号の処理も同様に行われる。ただし、この場合の動きベクトルは、輝度信号用の動きベクトルを、垂直方向および水平方向に1/2にしたものが用いられる。
【0075】
可変長復号回路262は、第3世代の符号化ビットストリームST(3rd)を復号処理するために、この第3世代の符号化ビットストリームST(3rd)のピクチャ層、スライス層及びマクロブロック層に記述されている第3世代の符号化パラメータを抽出する。たとえば、この可変長復号回路262において抽出される第3世代の符号化パラメータは、ピクチャタイプを示すpicture_coding_type、量子化スケールステップサイズを示すquantiser_scale_code、予測モードを示すmacroblock_type、動きベクトルを示すmotion_vector、Frame予測モードかField予測モードかを示すframe/field_motion_type、及びFrameDCTモードかField DCTモードかを示すdct_type等である。この可変長復号回路262において抽出されたquatntiser_scale_codeは、逆量子化回路263に供給され、picture_coding_type、quatntiser_scale_code、macroblock_type、motion_vector、frame/field_motion_type、dct_type等のパラメータは、動き補償回路266に供給される。
【0076】
可変長復号回路262は、第3世代の符号化ビットストリームST(3rd)を復号処理するために必要なこれらの符号化パラメータだけではなく、後段の第5世代のトランスコーディングシステムに第3世代のヒストリ情報として伝送されるべき符号化パラメータを、第3世代の符号化ビットストリームST(3rd)のシーケンス層、GOP層、ピクチャ層、スライス層、及びマクロブロック層から抽出する。もちろん、第3世代の復号処理に使用されたpicture_coding_type、quatntiser_scale_code、macroblock_type、motion_vector、frame/field_motion_type、dct_type等の第3世代の符号化パラメータは、この第3世代のヒストリ情報に含まれている。ヒストリ情報としてどのような符号化パラメータを抽出するかについては、伝送容量などに応じてオペレータやホストコンピュータ側からあらかじめ設定されている。
【0077】
また、可変長復号回路262は、アクセスユニットであるフレームまたはフィールドの切り換えに対応するFrame/Field同期信号をカウンタ101に供給する。
【0078】
さらに、可変長復号回路262は、第3世代の符号化ビットストリームST(3rd)のピクチャ層のユーザデータエリアに記述されているユーザデータを抽出し、そのユーザデータをヒストリデコーディング装置104に供給する。
【0079】
このヒストリデコーディング装置104は、第3世代の符号化ビットストリームST(3rd)のピクチャ層に記述されていたユーザデータから、ヒストリ情報として記述されている第1世代の符号化パラメータ及び第2世代の符号化パラメータ(直前の世代よりさらに前の世代の符号化パラメータ)を抽出するための回路である。具体的には、ヒストリデコーディング装置104は、受け取ったユーザデータのシンタックスを解析することによって、ユーザデータの中に記述されている固有のHistory_Data_Idを検出し、これによって、converted_history_stream()を抽出することができる。さらに、ヒストリデコーディング装置104は、converted_history_stream()中にある所定間隔に挿入されている1ビットのマーカービット(marker_bit)を取りさることによって、history_stream()を得、そして、そのhistory_stream()のシンタックスを解析することによって、history_stream()中に記述されている第1世代及び第2世代の符号化パラメータを得ることができる。このヒストリデコーディング装置104の詳しい動作については、後述する。
【0080】
ヒストリ情報多重化装置103は、第1世代、第2世代及び第3世代の符号化パラメータを、第4世代の符号化処理を行う符号化装置116に供給するために、復号装置102においてデコードされたベースバンドのビデオデータに、これらの第1世代、第2世代及び第3世代の符号化パラメータを多重化するための回路である。具体的には、ヒストリ情報多重化装置103は、復号装置102の演算器265から出力されたベースバンドのビデオデータ、復号装置102の可変長復号装置112から出力された第3世代の符号化パラメータ、並びに、ヒストリデコーディング装置104から出力された第1世代の符号化パラメータと第2世代の符号化パラメータとを受け取り、このベースバンドのビデオデータに、これらの第1世代、第2世代及び第3世代の符号化パラメータを多重化する。第1世代、第2世代及び第3世代の符号化パラメータが多重化されたベースバンドのビデオデータは、カウンタ値多重化装置105に供給される。
【0081】
カウンタ値多重化装置105は、ヒストリ情報多重化装置103から供給された、第1世代、第2世代及び第3世代の符号化パラメータが多重化されたベースバンドのビデオデータに、更に、カウンタ101から供給されたカウンタ値を多重化する。
【0082】
次に、これらの第1世代、第2世代及び第3世代の符号化パラメータのベースバンドビデオデータへの多重化の方法について、図6及び図7を参照して説明する。図6は、MPEG規格において定義されている、16ピクセル×16ピクセルからなる1つのマクロブロックを示している。この16ピクセル×16ピクセルのマクロブロックは、輝度信号に関しては4つの8ピクセル×8ピクセルからなるサブブロック(Y[0],[1],[2]及びY[3])と、色差信号に関しては4つの8ピクセル×8ピクセルからなるサブブロック(Cr[0],r[1],b[0],及びCb[1])から構成されている。
【0083】
図7は、ビデオデータのあるフォーマットを表している。このフォーマットは、ITU勧告-RDT601において定義されているフォーマットであって、放送業界において使用されている所謂「D1フォーマット」を表している。このD1フォーマットは、10ビットのビデオデータを伝送するためのフォーマットとして規格化されたので、ビデオデータの1ピクセルを10ビットで表現できるようになっている。
【0084】
MPEG規格によってデコードされたベースバンドのビデオデータは8ビットであるので、本発明のトランスコーディングシステムにおいては、図7に示したように、D1フォーマットの10ビットのうち上位8ビット(D9乃至D2)を使用して、MPEG規格にもとづいてデコードされたベースバンドのビデオデータを伝送するようにしている。このように、復号された8ビットのビデオデータをD1フォーマットに書き込むと、下位2ビット(D1とD0)は、空きビット(unallocated bits)となる。本発明のトランスコーディングシステム1ではこの空きエリア(unallocated area)を利用して、カウンタ値とともにヒストリ情報を伝送するようにしている。
【0085】
この図7に記載されたデータブロックは、各サブブロック(Y[0],Y[1],Y[2],Y[3],Cr[0],Cr[1],Cb[0],Cb[1])における1ピクセルを伝送するためのデータブロックであるので、1マクロブロックのデータを伝送するためには、この図7に示されているデータブロックが64個伝送される。下位2ビット(D1とD0)を使用すれば、1マクロブロックのビデオデータに対して、合計で1024(=16×64)ビットのカウンタ値およびヒストリ情報を伝送できる。従って、1世代分のヒストリ情報は、256ビットとなるように生成されているので、過去の4(=1024/256)世代分のヒストリ情報を1マクロブロックのビデオデータに対して重畳することができる。図7に示した例では、第1世代のヒストリ情報、第2世代のヒストリ情報、および、第3世代のヒストリ情報、並びにカウンタ値が重畳されている。
【0086】
また、輝度信号に対応するサブブロックに第1世代のヒストリ情報、第2世代のヒストリ情報、および、第3世代のヒストリ情報を重畳して、色差信号に対応するサブブロックにカウンタ値を重畳するようにしてもよい。
【0087】
更に、16ビットのカウンタ値は、SMPTE(The Society of Motion Picture and Television Engineers) 291Mで規定されているAncillary Data Packetに格納して、伝送するようにしてもよい。図8は、Ancillary Data Packetの例を示す図である。
【0088】
ADF(Ancillary Data Flag)には、Ancillary Data Packetの先頭を示す所定のデータ("000","3FF","3FF")が格納される。DID(Data Identification Word)には、Ancillary Data Packetに格納されるデータのフォーマットを特定する値、例えば、SMPTE 291Mで規定されているUser Applicationに対応する値(C0h乃至CFhのいずれか)が格納される。
【0089】
16ビットのカウンタ値を格納したワードは、3ワードに分割されてAncillary Data Packetに格納されるので、SDID(Secondary Data ID)に続くDC(Data Count Number Word)には、”3”が設定される。User Data Wordsには、図9に示すカウンタ値の下位6ビットを格納するワード(CC0)、図10に示すカウンタ値の7ビット乃至12ビットを格納するワード(CC1)、および図11に示すカウンタ値の上位4ビットを格納するワード(CC2)が順に格納される。
【0090】
図9は、カウンタ値の下位6ビットを格納するワード(CC0)の例を説明する図である。下位2ビット(B0とB1)は、それぞれ”0”が設定される。3ビット(B2)乃至8ビット(B8)には、それぞれカウンタ値の下位6ビット(カウンタ値[0]乃至カウンタ値[5])が設定される。9ビットには、下位8ビット(B0乃至B7)の偶数パリティが設定され、10ビットには、9ビットに設定された偶数パリティの否定値が設定される。
【0091】
図10は、カウンタ値の7ビット乃至12ビットを格納するワード(CC1)の例を説明する図である。下位2ビット(B0とB1)は、それぞれ”0”が設定される。3ビット(B2)乃至8ビット(B8)には、それぞれカウンタ値の7ビット乃至12ビット(カウンタ値[6]乃至カウンタ値[11])が設定される。9ビットには、下位8ビット(B0乃至B7)の偶数パリティが設定され、10ビットには、9ビットに設定された偶数パリティの否定値が設定される。
【0092】
図11は、カウンタ値の上位4ビットを格納するワード(CC2)の例を説明する図である。下位2ビット(B0とB1)は、それぞれ”0”が設定される。3ビット(B2)乃至6ビット(B5)には、それぞれカウンタ値の上位4ビット(カウンタ値[12]乃至カウンタ値[15])が設定される。7ビット(B6)および8ビット(B7)は、それぞれ”0”が設定される。9ビットには、下位8ビット(B0乃至B7)の偶数パリティが設定され、10ビットには、9ビットに設定された偶数パリティの否定値が設定される。
【0093】
Ancillary Data Packetの最後には、CS(Checksum Word)が格納される。
【0094】
このように、トランスコーディングシステム1は、16ビットのカウンタ値をAncillary Data Packetに格納して伝送することができる。
【0095】
カウンタ値は、ベースバンドデジタルビデオ信号のLSBに多重化されている符号化パラメータに多重化することもできる。図12は、ベースバンドデジタルビデオ信号のLSBに多重化されている符号化パラメータにカウンタ値を多重化するときの、ヒストリ情報多重化装置103およびカウンタ値多重化装置105に対応する機能の構成を説明する図である。タイミング信号発生装置271は、入力されたベースバンドデジタルビデオ信号を基に、ベースバンドデジタルビデオ信号のLSBに同期した、クロマタイミングパルスを生成し、スイッチ275に供給する。
【0096】
カウンタ値フォーマット変換装置272は、カウンタ101から供給されたカウンタ値をユーザデータの方式に変換して、符号化パラメータフォーマット変換装置273に出力する。符号化パラメータフォーマット変換装置273は、復号装置102から供給された符号化パラメータ(3RD)、およびヒストリデコーディング装置104から供給された符号化パラメータ(1ST,2ND)に、カウンタ値フォーマット変換装置272から供給されたユーザデータの方式のカウンタ値を多重化して、シリアル−パラレル変換装置274に出力する。
【0097】
シリアル−パラレル変換装置274は、カウンタ値が多重化された符号化パラメータを、シリアルからパラレルに変換して、スイッチ275に供給する。スイッチ275は、タイミング信号発生回路271から供給されるクロマタイミングパルスを基に、ベースバンドデジタルビデオ信号のLSBにカウンタ値が多重化された符号化パラメータを多重化する。
【0098】
このように、カウンタ値は、ベースバンドデジタルビデオ信号のブランキング部分に多重化されている符号化パラメータに多重化される。
【0099】
また、カウンタ値は、ベースバンドデジタルビデオ信号の輝度または色差のブランキング部分に多重化されている符号化パラメータに多重化することもできる。図13は、ベースバンドデジタルビデオ信号の輝度または色差のブランキング部分に多重化されている符号化パラメータにカウンタ値を多重化するときの、ヒストリ情報多重化装置103およびカウンタ値多重化装置105に対応する機能の構成を説明する図である。タイミング信号発生回路281は、入力されたベースバンドデジタルビデオ信号を基に、ベースバンドデジタルビデオ信号の輝度または色差のブランキング部分に同期した、ブランキングタイミングパルスを生成し、スイッチ282に供給する。
【0100】
カウンタ値フォーマット変換装置272は、カウンタ101から供給されたカウンタ値をユーザデータの方式に変換して、符号化パラメータフォーマット変換装置273に出力する。符号化パラメータフォーマット変換装置273は、復号装置102から供給された符号化パラメータ(3RD)、およびヒストリデコーディング装置104から供給された符号化パラメータ(1ST,2ND)に、カウンタ値フォーマット変換装置272から供給されたユーザデータの方式のカウンタ値を多重化して、スイッチ282に出力する。
【0101】
スイッチ282は、タイミング信号発生回路281から供給されるブランキングタイミングパルスを基に、ベースバンドデジタルビデオ信号の輝度または色差のブランキング部分にカウンタ値が多重化された符号化パラメータを多重化する。
【0102】
このように、カウンタ値は、ベースバンドデジタルビデオ信号の輝度または色差のブランキング部分に多重化されている符号化パラメータに多重化される。
【0103】
カウンタ値分離装置111は、D1フォーマットとして伝送されたデータの下位2ビットからカウンタ値を抽出するための回路である。カウンタ値分離装置111は、カウンタ値が抽出され、分離されたD1フォーマットとして伝送されたデータをヒストリ情報分離装置115に供給する。
【0104】
カウンタ値分離装置111は、D1フォーマットとして伝送されたデータから分離されたカウンタ値をフォーマット変換装置112に供給するとともに、フレームまたはフィールドに同期した信号をカウンタ113に供給する。
【0105】
カウンタ113は、カウンタ値分離装置111から供給されるフレームまたはフィールドに同期した信号を基に、カウントアップ(1を加算)される16ビットのカウンタである。カウンタ113は、0乃至65,535のいずれかのカウンタ値を比較装置114に出力する。
【0106】
カウンタ113は、65,535のカウンタ値を有する場合、カウンタ値分離装置111からフレームまたはフィールドに同期した信号が供給されたとき、カウンタ値を0とし、その後も、カウンタ値分離装置111から供給されるフレームまたはフィールドに同期した信号を基に、カウントアップを継続する。
【0107】
なお、カウンタ101をカウントダウン(1を減算)するようにしたとき、カウンタ113も、カウンタ値分離装置111から供給されるフレームまたはフィールドに同期した信号を基に、カウントダウンするように構成する。
【0108】
フォーマット変換装置112は、カウンタ値分離装置111から供給された、D1フォーマットとして伝送されたデータから分離されたカウンタ値の方式(例えば、図9乃至図11で説明したワードの方式)を16ビットのカウンタ値(例えば、カウンタ113が出力するカウンタ値と同じ方式)に変換して、比較装置114に出力する。
【0109】
比較装置114は、フォーマット変換装置112から供給されたカウンタ値とカウンタ113から供給されたカウンタ値とを比較し、その値が同一であるとき、所定の値の不連続パラメータを符号化装置116に出力し、その値が異なるとき、他の値の不連続パラメータを符号化装置116に出力する。
【0110】
比較装置114にフォーマット変換装置112から供給されたカウンタ値とカウンタ113から供給されたカウンタ値とが異なる値をとるとき、カウンタ113は、フォーマット変換装置112が出力するカウンタ値をロードして、自己のカウンタ値として設定する。このようにすることで、比較装置114は、一旦、画像の不連続点を検出した後でも、再度、画像に不連続点が含まれていた場合、その画像の不連続点を検出することかできる。
【0111】
ベースバンドデジタルビデオ信号に含まれる画像が編集等によりつなぎ合わされた、所定のフレームが挿入された、またはフレームが削除されとき、画像に対応してベースバンドデジタルビデオ信号に格納されたカウンタ値は不連続の値をとるので、フォーマット変換装置112から供給されたカウンタ値とカウンタ113から供給されたカウンタ値とは異なる値となり、比較装置114は、他の値の不連続パラメータを符号化装置116に供給する。ベースバンドデジタルビデオ信号に含まれる画像が編集等されていない場合、画像に対応してベースバンドデジタルビデオ信号に格納されたカウンタ値は連続した値をとるので、フォーマット変換装置112から供給されたカウンタ値とカウンタ113から供給されたカウンタ値とは同じ値となり、比較装置114は、所定の値の不連続パラメータを符号化装置116に供給する。
【0112】
このように、符号化装置116は、比較装置114から供給される信号を基に、画像が編集等されたか否かを判定することができる。
【0113】
ヒストリ情報分離装置115は、D1フォーマットとして伝送されたデータの上位8ビットから、ベースバンドビデオデータを抽出し、下位2ビットからヒストリ情報を抽出するための回路である。図4に示した例では、ヒストリ情報分離装置115は、伝送データからベースバンドのビデオデータを抽出して、そのビデオデータを符号化装置116に供給するとともに、伝送データから第1世代、第2世代及び第3世代のヒストリ情報を抽出して、符号化装置116とヒストリエンコーディング装置117にそれぞれ供給する。
【0114】
符号化装置116は、ヒストリ情報分離装置115から供給されたベースバンドのビデオデータを、オペレータまたはホストコンピュータから指定されたGOP構造及びビットレートを有するビットストリームになるように符号化するための装置である。なお、GOP構造を変更するとは、たとえば、GOPに含まれるピクチャの数、IピクチャとIピクチャの間に存在するPピクチャの数、及びIピクチャとPピクチャ(またはIピクチャ)の間に存在するBピクチャの数を変更することを意味する。
【0115】
図4に示された例では、供給されたベースバンドのビデオデータには、第1世代、第2世代及び第3世代のヒストリ情報が重畳されているので、この符号化装置116は、再符号化処理による画質劣化が少なくなるように、これらのヒストリ情報を選択的に再利用して第4世代の符号化処理を行う。
【0116】
図14は、この符号化装置116に設けられているエンコーダ301の具体的な構成を示している図である。このエンコーダ301は、動きベクトル検出回路310、フレームメモリ311、フレーム/フィールド予測モード切り替え回路312、演算器313、DCTモード切り替え回路315、DCT回路316、量子化回路317、可変長符号化回路318、伝送バッファ319、逆量子化回路320、逆DCT回路321、演算器322、フレームメモリ323、並びに動き補償回路324を備えている。
【0117】
始めに、ヒストリ情報が無い場合のエンコーダ301の参照ピクチャの符号化処理を説明する。
【0118】
符号化される画像データは、マクロブロック単位で動きベクトル検出回路310に入力される。動きベクトル検出回路310は、予め設定されている所定のシーケンスに従って、各フレームの画像データを、Iピクチャ、Pピクチャ、またはBピクチャとして処理する。シーケンシャルに入力される各フレームの画像を、I,P、またはBのいずれのピクチャとして処理するかは、予め定められている(例えば、フレームF1乃至F17により構成されるグループオブピクチャが、I,B,P,B,P,・・・B,Pとして処理される)。
【0119】
Iピクチャとして処理されるフレーム(例えば、フレームF1)の画像データは、動きベクトル検出回路310からフレームメモリ311の前方原画像部311aに転送、記憶され、Bピクチャとして処理されるフレーム(例えば、フレームF2)の画像データは、参照原画像部311bに転送、記憶され、Pピクチャとして処理されるフレーム(例えば、フレームF3)の画像データは、後方原画像部311cに転送、記憶される。
【0120】
また、次のタイミングにおいて、さらにBピクチャ(フレームF4)またはPピクチャ(フレームF5)として処理すべきフレームの画像が入力されたとき、それまで後方原画像部311cに記憶されていた最初のPピクチャ(フレームF3)の画像データが、前方原画像部311aに転送され、次のBピクチャ(フレームF4)の画像データが、参照原画像部311bに記憶(上書き)され、次のPピクチャ(フレームF5)の画像データが、後方原画像部311cに記憶(上書き)される。このような動作が順次繰り返される。
【0121】
フレームメモリ311に記憶された各ピクチャの信号は、そこから読み出され、Frame/Field予測モード切り替え回路312において、フレーム予測モード処理、またはフィールド予測モード処理が行なわれる。
【0122】
さらにまた、コントローラ330の制御の下に、演算器313において、画像内予測、前方予測、後方予測、または両方向予測の演算が行なわれる。これらの処理のうち、いずれの処理を行なうかは、予測誤差信号(処理の対象とされている参照画像と、これに対する予測画像との差分)に対応して決定される。このため、動きベクトル検出回路310は、この判定に用いられる予測誤差信号の絶対値和(自乗和でもよい)を生成する。
【0123】
ここで、Frame/Field予測モード切り替え回路312におけるフレーム予測モードとフィールド予測モードについて説明する。
【0124】
フレーム予測モードが設定された場合においては、Frame/Field予測モード切り替え回路312は、動きベクトル検出回路310より供給される4個の輝度ブロックY[1]乃至Y[4]を、そのまま後段の演算器313に出力する。すなわち、この場合においては、各輝度ブロックに奇数フィールドのラインのデータと、偶数フィールドのラインのデータとが混在した状態となっている。このフレーム予測モードにおいては、4個の輝度ブロック(マクロブロック)を単位として予測が行われ、4個の輝度ブロックに対して1個の動きベクトルが対応される。
【0125】
これに対して、Frame/Field予測モード切り替え回路312は、フィールド予測モードにおいては、動きベクトル検出回路310より入力される信号を、4個の輝度ブロックのうち、輝度ブロックY[1]とY[2]を、例えば奇数フィールドのラインのドットだけで構成させ、他の2個の輝度ブロックY[3]とY[4]を、偶数フィールドのラインのドットだけで構成させて、演算器313に出力する。この場合においては、2個の輝度ブロックY[1]とY[2]に対して、1個の動きベクトルが対応され、他の2個の輝度ブロックY[3]とY[4]に対して、他の1個の動きベクトルが対応される。
【0126】
動きベクトル検出回路310は、フレーム予測モードにおける予測誤差の絶対値和、およびフィールド予測モードにおける予測誤差の絶対値和をFrame/Field予測モード切り替え回路312に出力する。Frame/Field予測モード切り替え回路312は、フレーム予測モードとフィールド予測モードにおける予測誤差の絶対値和を比較し、その値が小さい予測モードに対応する処理を施して、データを演算器313に出力する。
【0127】
ただし、このような処理は、実際には動きベクトル検出回路310で行われる。すなわち、動きベクトル検出回路310は、決定されたモードに対応する構成の信号をFrame/Field予測モード切り替え回路312に出力し、Frame/Field予測モード切り替え回路312は、その信号を、そのまま後段の演算器313に出力する。
【0128】
なお、色差信号は、フレーム予測モードの場合、奇数フィールドのラインのデータと偶数フィールドのラインのデータとが混在する状態で、演算器313に供給される。また、フィールド予測モードの場合、各色差ブロックCb,Crの上半分(4ライン)が、輝度ブロックY[1],Y[2]に対応する奇数フィールドの色差信号とされ、下半分(4ライン)が、輝度ブロックY[3],Y[4]に対応する偶数フィールドの色差信号とされる。
【0129】
また、動きベクトル検出回路310は、以下に示すようにして、コントローラ330において、画像内予測、前方予測、後方予測、または両方向予測のいずれの予測を行なうかを決定するための予測誤差の絶対値和を生成する。
【0130】
すなわち、画像内予測の予測誤差の絶対値和として、参照画像のマクロブロックの信号Aijの総和ΣAijの絶対値|ΣAij|と、マクロブロックの信号Aijの絶対値|Aij|の総和Σ|Aij|の差を求める。また、前方予測の予測誤差の絶対値和として、参照画像のマクロブロックの信号Aijと、予測画像のマクロブロックの信号Bijの差Aij−Bijの絶対値|Aij−Bij|の総和Σ|Aij−Bij|を求める。また、後方予測と両方向予測の予測誤差の絶対値和も、前方予測における場合と同様に(その予測画像を前方予測における場合と異なる予測画像に変更して)求める。
【0131】
これらの絶対値和は、コントローラ330に供給される。コントローラ330は、前方予測、後方予測および両方向予測の予測誤差の絶対値和のうちの最も小さいものを、インタ予測の予測誤差の絶対値和として選択する。さらに、このインタ予測の予測誤差の絶対値和と、画像内予測の予測誤差の絶対値和とを比較し、その小さい方を選択し、この選択した絶対値和に対応するモードを予測モードとして選択する。すなわち、画像内予測の予測誤差の絶対値和の方が小さければ、画像内予測モードが設定される。インタ予測の予測誤差の絶対値和の方が小さければ、前方予測、後方予測または両方向予測モードのうちの対応する絶対値和が最も小さかったモードが設定される。
【0132】
このように、動きベクトル検出回路310は、参照画像のマクロブロックの信号を、フレームまたはフィールド予測モードのうち、Frame/Field予測モード切り替え回路312により選択されたモードに対応する構成で、Frame/Field予測モード切り替え回路312を介して演算器313に供給するとともに、4つの予測モードのうちのコントローラ330により選択された予測モードに対応する予測画像と参照画像の間の動きベクトルを検出し、可変長符号化回路318と動き補償回路324に出力する。上述したように、この動きベクトルとしては、対応する予測誤差の絶対値和が最小となるものが選択される。
【0133】
コントローラ330は、動きベクトル検出回路310が前方原画像部311aよりIピクチャの画像データを読み出しているとき、予測モードとして、フレームまたはフィールド(画像)内予測モード(動き補償を行わないモード)を設定し、演算器313のスイッチ313dを接点a側に切り替える。これにより、Iピクチャの画像データがFrame/FieldDCTモード切り替え回路315に入力される。
【0134】
Frame/FieldDCTモード切り替え回路315は、4個の輝度ブロックのデータを、奇数フィールドのラインと偶数フィールドのラインが混在する状態(フレームDCTモード)、または、分離された状態(フィールドDCTモード)、のいずれかの状態にして、DCT回路316に出力する。
【0135】
すなわち、Frame/FieldDCTモード切り替え回路315は、奇数フィールドと偶数フィールドのデータを混在してDCT処理した場合における符号化効率と、分離した状態においてDCT処理した場合の符号化効率とを比較し、符号化効率の良好なモードを選択する。
【0136】
例えば、入力された信号を、奇数フィールドと偶数フィールドのラインが混在する構成とし、上下に隣接する奇数フィールドのラインの信号と偶数フィールドのラインの信号の差を演算し、さらにその絶対値の和(または自乗和)を求める。
【0137】
また、入力された信号を、奇数フィールドと偶数フィールドのラインが分離した構成とし、上下に隣接する奇数フィールドのライン同士の信号の差と、偶数フィールドのライン同士の信号の差を演算し、それぞれの絶対値の和(または自乗和)を求める。
【0138】
さらに、両者(絶対値和)を比較し、小さい値に対応するDCTモードを設定する。すなわち、前者の方が小さければ、フレームDCTモードを設定し、後者の方が小さければ、フィールドDCTモードを設定する。
【0139】
そして、選択したDCTモードに対応する構成のデータをDCT回路316に出力するとともに、選択したDCTモードを示すDCTフラグを、可変長符号化回路318、および動き補償回路324に出力する。
【0140】
Frame/Field予測モード切り替え回路312における予測モードと、このFrame/FieldDCTモード切り替え回路315におけるDCTモードを比較して明らかなように、輝度ブロックに関しては、両者の各モードにおけるデータ構造は実質的に同一である。
【0141】
Frame/Field予測モード切り替え回路312において、フレーム予測モード(奇数ラインと偶数ラインが混在するモード)が選択された場合、Frame/FieldDCTモード切り替え回路315においても、フレームDCTモード(奇数ラインと偶数ラインが混在するモード)が選択される可能性が高く、またFrame/Field予測モード切り替え回路312において、フィールド予測モード(奇数フィールドと偶数フィールドのデータが分離されたモード)が選択された場合、Frame/FieldDCTモード切り替え回路315において、フィールドDCTモード(奇数フィールドと偶数フィールドのデータが分離されたモード)が選択される可能性が高い。
【0142】
しかしながら、必ずしも常にこのようにモードが選択されるわけではなく、Frame/Field予測モード切り替え回路312においては、予測誤差の絶対値和が小さくなるようにモードが決定され、Frame/FieldDCTモード切り替え回路315においては、符号化効率が良好となるようにモードが決定される。
【0143】
Frame/FieldDCTモード切り替え回路315より出力されたIピクチャの画像データは、DCT回路316に入力されてDCT処理され、DCT係数に変換される。このDCT係数は、量子化回路317に入力され、送信バッファ319のデータ蓄積量(バッファ蓄積量)に対応した量子化スケールで量子化された後、可変長符号化回路318に入力される。
【0144】
可変長符号化回路318は、量子化回路317より供給される量子化スケール(スケール)に対応して、量子化回路317より供給される画像データ(いまの場合、Iピクチャのデータ)を、例えばハフマン符号などの可変長符号に変換し、送信バッファ319に出力する。
【0145】
可変長符号化回路318にはまた、量子化回路317より量子化スケール(スケール)、コントローラ330より予測モード(画像内予測、前方予測、後方予測、または両方向予測のいずれが設定されたかを示すモード)、動きベクトル検出回路310より動きベクトル、Frame/Field予測モード切り替え回路312より予測フラグ(フレーム予測モードまたはフィールド予測モードのいずれが設定されたかを示すフラグ)、およびFrame/FieldDCTモード切り替え回路315が出力するDCTフラグ(フレームDCTモードまたはフィールドDCTモードのいずれが設定されたかを示すフラグ)が入力されており、これらも可変長符号化される。
【0146】
送信バッファ319は、入力されたデータを一時蓄積し、蓄積量に対応するデータを量子化回路317に出力する。送信バッファ319は、そのデータ残量が許容上限値まで増量すると、量子化制御信号によって量子化回路317の量子化スケールを大きくすることにより、量子化データのデータ量を低下させる。また、これとは逆に、データ残量が許容下限値まで減少すると、送信バッファ319は、量子化制御信号によって量子化回路317の量子化スケールを小さくすることにより、量子化データのデータ量を増大させる。このようにして、送信バッファ319のオーバフローまたはアンダフローが防止される。
【0147】
そして、送信バッファ319に蓄積されたデータは、所定のタイミングで読み出され、伝送路に出力される。
【0148】
一方、量子化回路317より出力されたIピクチャのデータは、逆量子化回路320に入力され、量子化回路317より供給される量子化スケールに対応して逆量子化される。逆量子化回路320の出力は、IDCT(逆離散コサイン変換)回路321に入力され、逆離散コサイン変換処理された後、演算器322を介してフレームメモリ323の前方予測画像部323a供給されて記憶される。
【0149】
動きベクトル検出回路310は、シーケンシャルに入力される各フレームの画像データを、たとえば、I,B,P,B,P,B・・・のピクチャとしてそれぞれ処理する場合、最初に入力されたフレームの画像データをIピクチャとして処理した後、次に入力されたフレームの画像をBピクチャとして処理する前に、さらにその次に入力されたフレームの画像データをPピクチャとして処理する。Bピクチャは、後方予測を伴うため、後方予測画像としてのPピクチャが先に用意されていないと、復号することができないからである。
【0150】
そこで動きベクトル検出回路310は、Iピクチャの処理の次に、後方原画像部311cに記憶されているPピクチャの画像データの処理を開始する。そして、上述した場合と同様に、マクロブロック単位でのフレーム間差分(予測誤差)の絶対値和が、動きベクトル検出回路310からFrame/Field予測モード切り替え回路312とコントローラ330に供給される。Frame/Field予測モード切り替え回路312とコントローラ330は、このPピクチャのマクロブロックの予測誤差の絶対値和に対応して、フレーム/フィールド予測モード、または画像内予測、前方予測、後方予測、もしくは両方向予測の予測モードを設定する。
【0151】
演算器313は、画像内予測モードが設定されたとき、スイッチ313dを上述したように接点a側に切り替える。したがって、このデータは、Iピクチャのデータと同様に、Frame/FieldDCTモード切り替え回路315、DCT回路316、量子化回路317、可変長符号化回路318、および送信バッファ319を介して伝送路に伝送される。また、このデータは、逆量子化回路320、IDCT回路321、および演算器322を介してフレームメモリ323の後方予測画像部323bに供給されて記憶される。
【0152】
また、前方予測モードが設定された場合、スイッチ313dが接点bに切り替えられるとともに、フレームメモリ323の前方予測画像部323aに記憶されている画像(いまの場合、Iピクチャの画像)データが読み出され、動き補償回路324により、動きベクトル検出回路310が出力する動きベクトルに対応して動き補償される。すなわち、動き補償回路324は、コントローラ330より前方予測モードの設定が指令されたとき、前方予測画像部323aの読み出しアドレスを、動きベクトル検出回路310が、現在、出力しているマクロブロックの位置に対応する位置から動きベクトルに対応する分だけずらしてデータを読み出し、予測画像データを生成する。
【0153】
動き補償回路324より出力された予測画像データは、演算器313aに供給される。演算器313aは、Frame/Field予測モード切り替え回路312より供給された参照画像のマクロブロックのデータから、動き補償回路324より供給された、このマクロブロックに対応する予測画像データを減算し、その差分(予測誤差)を出力する。この差分データは、Frame/FieldDCTモード切り替え回路315、DCT回路316、量子化回路317、可変長符号化回路318、および送信バッファ319を介して伝送路に伝送される。また、この差分データは、逆量子化回路320、およびIDCT回路321により局所的に復号され、演算器322に入力される。
【0154】
この演算器322にはまた、演算器313aに供給されている予測画像データと同一のデータが供給されている。演算器322は、IDCT回路321が出力する差分データに、動き補償回路324が出力する予測画像データを加算する。これにより、元の(復号した)Pピクチャの画像データが得られる。このPピクチャの画像データは、フレームメモリ323の後方予測画像部323bに供給されて記憶される。
【0155】
動きベクトル検出回路310は、このように、IピクチャとPピクチャのデータが前方予測画像部323aと後方予測画像部323bにそれぞれ記憶された後、次にBピクチャの処理を実行する。Frame/Field予測モード切り替え回路312とコントローラ330は、マクロブロック単位でのフレーム間差分の絶対値和の大きさに対応して、フレーム/フィールドモードを設定し、また、予測モードを画像内予測モード、前方予測モード、後方予測モード、または両方向予測モードのいずれかに設定する。
【0156】
上述したように、画像内予測モードまたは前方予測モードの時、スイッチ313dは接点aまたはbに切り替えられる。このとき、Pピクチャにおける場合と同様の処理が行われ、データが伝送される。
【0157】
これに対して、後方予測モードまたは両方向予測モードが設定された時、スイッチ313dは、接点cまたはdにそれぞれ切り替えられる。
【0158】
スイッチ313dが接点cに切り替えられている後方予測モードの時、後方予測画像部323bに記憶されている画像(いまの場合、Pピクチャの画像)データが読み出され、動き補償回路324により、動きベクトル検出回路310が出力する動きベクトルに対応して動き補償される。すなわち、動き補償回路324は、コントローラ330より後方予測モードの設定が指令されたとき、後方予測画像部323bの読み出しアドレスを、動きベクトル検出回路310が、現在、出力しているマクロブロックの位置に対応する位置から動きベクトルに対応する分だけずらしてデータを読み出し、予測画像データを生成する。
【0159】
動き補償回路324より出力された予測画像データは、演算器313bに供給される。演算器313bは、Frame/Field予測モード切り替え回路312より供給された参照画像のマクロブロックのデータから、動き補償回路324より供給された予測画像データを減算し、その差分を出力する。この差分データは、Frame/FieldDCTモード切り替え回路315、DCT回路316、量子化回路317、可変長符号化回路318、および送信バッファ319を介して伝送路に伝送される。
【0160】
スイッチ313dが接点dに切り替えられている両方向予測モードの時、前方予測画像部323aに記憶されている画像(いまの場合、Iピクチャの画像)データと、後方予測画像部323bに記憶されている画像(いまの場合、Pピクチャの画像)データが読み出され、動き補償回路324により、動きベクトル検出回路310が出力する動きベクトルに対応して動き補償される。
【0161】
すなわち、動き補償回路324は、コントローラ330より両方向予測モードの設定が指令されたとき、前方予測画像部323aと後方予測画像部323bの読み出しアドレスを、動きベクトル検出回路310がいま出力しているマクロブロックの位置に対応する位置から動きベクトル(この場合の動きベクトルは、前方予測画像用と後方予測画像用の2つとなる)に対応する分だけずらしてデータを読み出し、予測画像データを生成する。
【0162】
動き補償回路324より出力された予測画像データは、演算器313cに供給される。演算器313cは、動きベクトル検出回路310より供給された参照画像のマクロブロックのデータから、動き補償回路324より供給された予測画像データの平均値を減算し、その差分を出力する。この差分データは、Frame/FieldDCTモード切り替え回路315、DCT回路316、量子化回路317、可変長符号化回路318、および送信バッファ319を介して伝送路に伝送される。
【0163】
Bピクチャの画像は、他の画像の予測画像とされることがないため、フレームメモリ323には記憶されない。
【0164】
なお、フレームメモリ323において、前方予測画像部323aと後方予測画像部323bは、必要に応じてバンク切り替えが行われ、所定の参照画像に対して、一方または他方に記憶されているものを、前方予測画像あるいは後方予測画像として切り替えて出力することができる。
【0165】
上述した説明においては、輝度ブロックを中心として説明をしたが、色差ブロックについても同様に、マクロブロックを単位として処理されて伝送される。なお、色差ブロックを処理する場合の動きベクトルは、対応する輝度ブロックの動きベクトルを垂直方向と水平方向に、それぞれ1/2にしたものが用いられる。
【0166】
さらに、コントローラ330は、オペレータまたはホストコンピュータからGOP構造に関するインストラクションを受け取って、そのGOP構造に対応するように各ピクチャのピクチャタイプを決定する。また、このコントローラ330は、オペレータまたはホストコンピュータからタ−ゲットビットレートの情報を受け取り、このエンコーダ301から出力されるビットレートがこの指定されたターゲットビットレートになるように、量子化回路317を制御する。
【0167】
さらに、このコントローラ330は、ヒストリ情報分離装置115から出力された複数世代のヒストリ情報を受け取り、これらのヒストリ情報を再利用して参照ピクチャの符号化処理を行う。以下に詳しく説明する。
【0168】
まず、このコントローラ330は、オペレータによって指定されたGOP構造から決定された参照ピクチャのピクチャタイプと、ヒストリ情報に含まれるピクチャタイプが一致するか否かを判断する。つまり、指定されたピクチャタイプと同じピクチャタイプでこの参照ピクチャが過去において符号化されたことがあるか否かを判断する。
【0169】
図4に示された例をあげてよりわかりやすく説明するのであれば、このコントローラ330は、第4世代の符号化処理としてこの参照ピクチャにアサインされたピクチャタイプが、第1世代の符号化処理おけるこの参照ピクチャのピクチャタイプ、第2世代の符号化処理おけるこの参照ピクチャのピクチャタイプ、または第3世代の符号化処理おけるこの参照ピクチャのピクチャタイプのいずれかと一致するか否かを判断する。
【0170】
もし、第4世代の符号化処理としてこの参照ピクチャに指定されたピクチャタイプが、過去の符号化処理におけるどのピクチャタイプとも一致しないのであれは、このコントローラ330は、上述した「通常符号化処理」を行う。つまり、この場合には、第1世代、第2世代または第3世代のどの世代の符号化処理においても、第4世代の符号化処理としてアサインされたピクチャタイプで、この参照ピクチャが符号化処理されたことがないということになる。一方、もし、第4世代の符号化処理としてこの参照ピクチャに指定されたピクチャタイプが、過去の符号化処理におけるいずれかのピクチャタイプと一致するのであれば、このコントローラ330は、「パラメータ再利用符号化処理」を行う。つまり、この場合には、第1世代、第2世代または第3世代のいずれかの世代の符号化処理において、第4世代の符号化処理としてアサインされたピクチャタイプで、この参照ピクチャが符号化処理されたことがあるということになる。
【0171】
また、「パラメータ再利用符号化処理」を実行している場合であっても、比較装置114から供給される不連続パラメータが、画像が不連続であること(ベースバンドデジタルビデオ信号に含まれる画像が編集等によりつなぎ合わされた、所定のフレームが挿入された、またはフレームが削除されたなど)を示す値を有するとき、符号化パラメータを再利用して符号化処理を行うと、不連続な点の前後の画像が大きく劣化するので、コントローラ330は、「通常符号化処理」を行う。
【0172】
ヒストリ情報が無い場合のエンコーダ301の参照ピクチャの符号化処理と、一部、説明が重複するが、まず、最初にコントローラ330の通常符号化処理について説明する。
【0173】
動きベクトル検出回路310は、フレーム予測モードまたはフィールド予測モードのどちらが選択されるべきかを判断するために、フレーム予測モードにおける予測誤差とフィールド予測モードおける予測誤差をそれぞれ検出し、その予測誤差の値をコントローラ330に供給する。コントローラ330は、それらの予測誤差の値を比較し、その予測誤差の値が小さい方の予測モードを選択する。Frame/Field予測モード切り替え回路312は、コントローラ330によって選択された予測モードに対応するように信号処理を行い、それを演算器313に供給する。
【0174】
具体的には、Frame/Field予測モード切り替え回路312は、フレーム予測モードが選択された場合には、輝度信号に関しては、入力された状態のまま演算器313に出力するように信号処理を行い、色差信号に関しては、奇数フィールドラインと偶数フィールドラインとが混在するように信号処理する。一方、フィールド予測モードが選択された場合には、輝度信号に関しては、輝度ブロックY[1]とY[2]を奇数フィールドラインで構成し、輝度ブロックY[3]とY[4]を偶数フィールドラインで構成するように信号処理し、色差信号に関しては、上4ラインを奇数フィールドラインで構成し、下4ラインを偶数フィールドラインで構成するように信号処理する。
【0175】
さらに、動きベクトル検出回路310は、画像内予測モード、前方予測モード、後方予測モード、または両方向予測モードのうちのいずれの予測モードを選択するかを決定するために、各予測モードにおける予測誤差を生成し、各予測モードにおける予測誤差をコントローラ330にそれぞれ供給する。コントローラ330は、前方予測、後方予測および両方向予測の予測誤差のうちの最も小さいものを、インタ予測の予測誤差として選択する。さらに、このインタ予測の予測誤差と、画像内予測の予測誤差とを比較し、その小さい方を選択し、この選択した予測誤差に対応するモードを予測モードとして選択する。すなわち、画像内予測の予測誤差の方が小さければ、画像内予測モードが設定される。インタ予測の予測誤差の方が小さければ、前方予測、後方予測または両方向予測モードのうちの対応する予測誤差が最も小さかったモードが設定される。コントローラ330は、選択した予測モードに対応するように、演算器313及び動き補償回路324を制御する。
【0176】
DCTモード切り替え回路315は、フレームDCTモードまたはフィールドDCTモードのいずれかを選択するために、4個の輝度ブロックのデータを、奇数フィールドラインと偶数フィールドラインが混在するような信号形態(フレームDCTモード)に変換するとともに、奇数フィールドラインと偶数フィールドラインが分離された信号形態(フィールドDCTモード)に変換して、それぞれの信号をDCT回路316に供給する。DCT回路316は、奇数フィールドと偶数フィールドを混在してDCT処理した場合における符号化効率と、奇数フィールドと偶数フィールドを分離した状態においてDCT処理した場合の符号化効率を計算し、その結果をコントローラ330に供給する。コントローラ330は、DCT回路316から供給されたそれぞれの符号化効率を比較し、符号化効率の良い方のDCTモードを選択し、その選択したDCTモードとなるようにDCTモード切り替え回路315を制御する。
【0177】
コントローラ330は、オペレータまたはホストコンピュータから供給された目標ビットレートを示すターゲットビットレートと、送信バッファ319にバッファリングされているビット量を示す信号、つまり、バッファ残量を示す信号を受け取り、このターゲットビットレートとバッファ残量に基づいて、量子化回路317の量子化ステップサイズをコントロールするためのfeedback_q_scale_code を生成する。このfeedback_q_scale_codeは、この送信バッファ319がオーバーフローまたはアンダーフローしないように、この送信バッファ319のバッファ残量に応じて生成される制御信号であって、また、送信バッファ319から出力されるビットストリームのビットレートが、ターゲットビットレートになるように制御する信号でもある。
【0178】
具体的には、例えば、送信バッファ319にバッファリングされているビット量が少なくなってしまった場合には、次に符号化するピクチャの発生ビット量が増えるように、量子化ステップサイズを小さくし、一方、送信バッファ319にバッファリングされているビット量が多くなってしまった場合には、次に符号化するピクチャの発生ビット量が少なくなるように、量子化ステップサイズを大きくする。なお、feedback_q_scale_codeと量子化ステップサイズは比例し、feedback_q_scale_codeを大きくすると、量子化ステップサイズは大きくなり、feedback_q_scale_codeを小さくすると、量子化ステップサイズは小さくなる。
【0179】
次に、このトランスコーディングシステム1の特徴の1つでもある、パラメータ再利用符号化処理について説明する。この処理をより分かりやすく説明するために、参照ピクチャは、第1世代の符号化処理においてPピクチャとして符号化され、第2世代の符号化処理においてIピクチャとして符号化処理され、第3世代の符号化処理においてBピクチャとして符号化されていたものとし、今回の第4世代の符号化処理において、この参照ピクチャをPピクチャとして符号化しなければいけないものとする。
【0180】
この場合には、第4世代のピクチャタイプとしてアサインされたピクチャタイプと同じピクチャタイプ(Iピクチャ)で、この参照ピクチャは第1世代の符号化処理において符号化されているので、コントローラ330は、供給されたビデオデータから符号化パラメータを新しく作成するのではなく、第1世代の符号化パラメータを使用して符号化処理を行う。この第4の符号化処理において再利用する符号化パラメータは、代表的なパラメータとしては、量子化スケールステップサイズを示すquantiser_scale_code、予測方向モードを示すmacroblock_type、動きベクトルを示すmotion_vector、Frame予測モードかField予測モードかを示すframe/field_motion_type、及びFrameDCTモードかField DCTモードかを示すdct_type等である。
【0181】
コントローラ330は、ヒストリ情報として伝送されたすべての符号化パラメータを再利用するわけではなく、再利用した方が望ましいと想定される上述したような符号化パラメータについては再利用し、再利用しない方が望ましいと考えられる符号化パラメータについては、新しく生成する。
【0182】
次に、第4世代の符号化処理として、この参照ピクチャに指定されたピクチャタイプが、過去の符号化処理におけるいずれかのピクチャタイプと一致し、かつ、比較装置114から供給される不連続パラメータが、画像が連続であることを示す値を有するとき実行される、符号化パラメータ再利用符号化処理について、上述した通常符号化処理と異なる点を中心に説明する。
【0183】
動きベクトル検出回路310は、上述した通常符号化処理においては、参照ピクチャの動きベクトルの検出を行ったが、このパラメータ再利用符号化処理においては、動きベクトルmotion_vectorの検出処理は行わずに、第1世代のヒストリ情報として供給された動きベクトルmotion_vectorを再利用する。その理由について説明する。
【0184】
第3世代の符号化ストリームを復号したベースバンドのビデオデータは、少なくとも3回の復号及び符号化処理が行われているので、オリジナルビデオデータに比べると、明らかに画質が劣化している。画質が劣化しているビデオデータから動きベクトルを検出したとしても、正確な動きベクトルは検出できない。つまり、第4世代の符号化処理において検出された動きベクトルよりも、第1世代のヒストリ情報として供給されている動きベクトルの方が、明らかに、精度の高い動きベクトルである。つまり、第1世代の符号化パラメータとして伝送された動きベクトルを再利用することによって、第4世代の符号化処理を行ったとしても画質が劣化しない。コントローラ330は、この第1世代のヒストリ情報として供給された動きベクトルmotion_vectorを、第4世代の符号化処理において符号化されるこの参照ピクチャの動きベクトル情報として、動き補償回路324及び可変長符号化回路318に供給する。
【0185】
さらに、動きベクトル検出回路310は、フレーム予測モードとフィールド予測モードのどちらが選択されるかを判断するために、フレーム予測モードにおける予測誤差とフィールド予測モードおける予測誤差をそれぞれ検出したが、このパラメータ再利用符号化処理においては、このフレーム予測モードにおける予測誤差とフィールド予測モードおける予測誤差を検出する処理は行わずに、第1世代のヒストリ情報として供給されているFrame予測モードかField予測モードかを示すframe/field_motion_typeを再利用する。なぜなら、第4世代の符号化処理において検出された各予測モードにおける予測誤差よりも、第1世代において検出された各予測モードにおける予測誤差の方が精度が高いので、精度の高い予測誤差によって決定された予測モードを選択した方がより最適な符号化処理が行うことができるからである。
【0186】
具体的には、コントローラ330は、この第1世代のヒストリ情報として供給されているframe/field_motion_typeに対応する制御信号をFrame/Field予測モード切り替え回路312に供給し、Frame/Field予測モード切り替え回路312は、この再利用されたframe/field_motion_typeに対応した信号処理を行う。
【0187】
さらには、動きベクトル検出回路310は、通常符号化処理においては、画像内予測モード、前方予測モード、後方予測モード、または両方向予測モードのうちのいずれの予測モード(以下、この予測モードを、予測方向モードとも称する)を選択するかを決定するために、各予測方向モードにおける予測誤差を計算していたが、このパラメータ再利用符号化処理においては、各予測方向モードにおける予測誤差の計算は行わず、第1世代のヒストリ情報として供給されたmacroblock_typeに基づいて予測方向モードを決定する。なぜなら、第4世代の符号化処理における各予測方向モードにおける予測誤差よりも、第1世代の符号化処理における各予測方向モードにおける予測誤差の方がより精度が高いので、より精度の高い予測誤差によって決定された予測方向モードを選択した方が、より効率の良い符号化処理が行えるからである。具体的には、コントローラ330は、第1世代のヒストリ情報に含まれているmacroblock_typeによって示される予測方向モードを選択し、その選択した予測方向モードに対応するように、演算器313及び動き補償回路324をコントロールする。
【0188】
DCTモード切り替え回路315は、通常符号化処理においては、フレームDCTモードの符号化効率と、フィールドDCTモードの符号化効率を比較するために、フレームDCTモードの信号形態に変換した信号と、フィールドDCTモードの信号形態に変換した信号の両方をDCT回路316に供給していたが、このパラメータ再利用符号化処理では、フレームDCTモードの信号形態に変換した信号と、フィールドDCTモードの信号形態に変換した信号の両方を生成する処理は行っておらず、第1世代のヒストリ情報に含まれれているdct_typeによって示されたDCTモードに対応する処理のみを行っている。具体的には、コントローラ330は、第1世代のヒストリ情報に含まれているdct_typeを再利用し、DCTモード切り替え回路315がこのdct_typeによって示されるDCTモードに対応した信号処理を行うように、DCTモード切り替え回路315をコントロールする。
【0189】
コントローラ330は、通常符号化処理では、オペレータによって指定されたターゲットビットレートと送信バッファ残量に基づいて、量子化回路317の量子化ステップサイズをコントロールしていたが、このパラメータ再利用符号化処理では、ターゲットビットレート、送信バッファ残量及びヒストリ情報に含まれている過去の量子化スケールに基づいて、量子化回路317の量子化ステップサイズをコントロールする。なお、以下の説明において、ヒストリ情報に含まれている過去の量子化スケールをhistory_q_scale_code と記述することにする。また、後述するヒストリストリームにおいては、この量子化スケールを、quantiser_scale_codeと記述している。
【0190】
まず、コントローラ330は、通常符号化処理と同じように、現在の量子化スケールfeedback_q_scale_code を生成する。このfeedback_q_scale_codeは、この送信バッファ319がオーバーフロー及びアンダーフローしないように、この送信バッファ319のバッファ残量に応じて決定される値である。続いて、第1世代のヒストリストリームに含まれている過去の量子化スケールhistory_q_scale_codeの値と、この現在の量子化スケールfeedback_q_scale_codeの値を比較し、どちらの量子化スケールの方が大きいかを判断する。量子化スケールが大きいとは、量子化ステップが大きいことを意味する。もし、現在の量子化スケールfeedback_q_scale_codeが、過去の量子化スケールhistory_q_scale_codeよりも大きいのであれば、コントローラ330は、この現在の量子化スケールfeedback_q_scale_codeを量子化回路317に供給する。一方、過去の量子化スケールhistory_q_scale_codeが、現在の量子化スケールfeedback_q_scale_codeよりも大きいのであれば、コントローラ330は、この過去の量子化スケールhistory_q_scale_codeを量子化回路317に供給する。
【0191】
つまり、コントローラ330は、ヒストリ情報に含まれている複数の過去の量子化スケールと、送信バッファの残量から計算された現在の量子化スケールの中で、もっとも大きい量子化スケールコードを選択する。また、別の言葉で説明するのであれば、コントローラ330は、過去(第1、第2及び第3世代)の符号化処理における量子化ステップまたは現在(第4世代)の符号化処理において使用された量子化ステップの中で、もっとも大きい量子化ステップを使用して量子化を行うように量子化回路317を制御する。この理由を以下に説明する。
【0192】
たとえば、第3世代の符号化処理において生成されたストリームのビットレートが4[Mbps]であって、この第4世代の符号化処理を行うエンコーダ301に対して設定されたターゲットビットレートが15[Mbps]であったとする。このときに、ターゲットビットレートが上がっているので、単純に量子化ステップを小さくすれば良いかというと、実際にはそうではない。過去の符号化処理において大きい量子化ステップで符号化処理されたピクチャを、現在の符号化処理において、量子化ステップを小さくして符号化処理を行ったとしても、このピクチャの画質は向上することはない。つまり、過去の符号化処理における量子化ステップよりも小さい量子化ステップで符号化することは、単にビット量が増えるだけであって、画質を向上させることにはならない。よって、過去(第1、第2及び第3世代)の符号化処理における量子化ステップまたは現在(第4世代)の符号化処理において使用された量子化ステップの中で、もっとも大きい量子化ステップを使用して量子化を行うと、もっとも効率の良い符号化処理が行える。
【0193】
更に、エンコーダ301は、「パラメータ再利用符号化処理」を実行している場合、比較装置114から供給される不連続パラメータを基に、不連続な画像の前後で「通常符号化処理」を実行するので、不連続な点の前後の画像の劣化を防止することができる。
【0194】
次に、図4におけるヒストリデコーディング装置104とヒストリエンコーディング装置117についてさらに説明する。同図に示すように、ヒストリデコーディング装置104は、復号装置102より供給されるユーザデータをデコードするユーザデータデコーダ201、ユーザデータデコーダ201の出力を変換するコンバータ202、およびコンバータ202の出力から履歴情報を再生するヒストリVLD203により構成されている。
【0195】
また、ヒストリエンコーディング装置117は、ヒストリ情報分離装置115より供給される3世代分の符号化パラメータをフォーマット化するヒストリVLC211、ヒストリVLC211の出力を変換するコンバータ212、コンバータ212の出力をユーザデータのフォーマットにフォーマットするユーザデータフォーマッタ213により構成されている。
【0196】
ユーザデータデコーダ201は、復号装置102より供給されるユーザデータをデコードして、コンバータ202に出力する。詳細は図31を参照して後述するが、ユーザデータ(user_data())は、user_data_start_codeとuser_dataからなり、MPEG規格においてはuser_dataの中に、連続する23ビットの”0”(start_codeと同一のコード)を発生させることを禁止している。これは、そのデータが、start_codeとして誤検出されるのを防止するためである。履歴情報(history_stream())は、ユーザデータエリアに(MPEG規格のuser_dataの一種として)記述され、その中には、このような連続する23ビット以上の”0”が存在することがあり得るので、これを、連続する23ビット以上の”0”が発生しないように、所定のタイミングで“1”を挿入処理して、converted_history_stream()(後述する図18)に変換する必要がある。この変換を行うのは、ヒストリエンコーディング装置117のコンバータ212である。ヒストリデコーディング装置104のコンバータ202は、このコンバータ212と逆の変換処理を行う(連続する23ビット以上の”0”を発生させないために挿入された”1”を除去する)ものである。
【0197】
ヒストリVLD203は、コンバータ202の出力から履歴情報(いまの場合、第1世代の符号化パラメータと第2世代の符号化パラメータ)を生成し、ヒストリ情報多重化装置103に出力する。
【0198】
一方、ヒストリエンコーディング装置117においては、ヒストリVLC211がヒストリ情報分離装置115より供給される3世代分の(第1世代、第2世代、および第3世代の)符号化パラメータを履歴情報のフォーマットに変換する。このフォーマットには、固定長のもの(後述する図20乃至図26)と、可変長のもの(後述する図27)とがある。これらの詳細については後述する。
【0199】
ヒストリVLC211により、フォーマット化された履歴情報は、コンバータ212において、converted_history_stream()に変換される。これは、上述したように、user_data()のstart_codeが誤検出されないようにするための処理である。すなわち、履歴情報内には連続する23ビット以上の”0”が存在するが、user_data中には連続する23ビット以上の”0”を配置することができないので、この禁止項目に触れないようにコンバータ212によりデータを変換する(“1”を所定のタイミングで挿入する)のである。
【0200】
ユーザデータフォーマッタ213は、コンバータ212より供給されるconverted_history_stream()に、後述する図18に基づいて、History_Data_IDを付加し、さらに、user_data_stream_codeを付加して、video stream中に挿入できるMPEG規格のuser_dataを生成し、符号化装置116に出力する。
【0201】
図15は、例えば映像編集スタジオにおいて、複数のトランスコーディングシステム1−1乃至1−Nが直列に接続されて使用される状態を示している。各トランスコーディングシステム1−i(i=1乃至N)のヒストリ情報多重化装置103−iは、上述した符号化パラメータ用の領域の最も古い符号化パラメータが記録されている区画に、自己が用いた最新の符号化パラメータを上書きする。このことにより、ベースバンドの画像データには、同一のマクロブロックに対応する直近の4世代分の符号化パラメータ(世代履歴情報)が記録されることになる(図7)。
【0202】
各符号化装置116−iのエンコーダ301−i(図14)は、その可変長符号化回路318において、ヒストリ情報分離装置115−iから供給される今回用いる符号化パラメータに基づいて、量子化回路317より供給されるビデオデータを符号化する。このようにして生成されるビットストリーム(例えば、picture_header())中に、その現符号化パラメータは多重化される。
【0203】
可変長符号化回路318はまた、ヒストリエンコーディング装置117−iより供給されるユーザデータ(世代履歴情報を含む)を、出力するビットストリーム中に多重化する(図7に示すような埋め込み処理ではなく、ビットストリーム中に多重化する)。そして、符号化装置116−iの出力するビットストリームは、SDTI(Serial Data Transfer Interface)351−iを介して、後段のトランスコーディングシステム1−(i+1)に入力される。
【0204】
トランスコーディングシステム1−iとトランスコーディングシステム1−(i+1)は、それぞれ図4に示すように構成されている。従って、その処理は、図4を参照して説明した場合と同様となる。
【0205】
実際の符号化パラメータの履歴を利用した符号化として、現在Iピクチャとして符号化されていたものを、PもしくはBピクチャに変更したい場合、過去の符号化パラメータの履歴を見て、過去にPもしくはBピクチャであった場合を探し、これらの履歴が存在した場合は、その動きベクトルなどのパラメータを利用して、ピクチャタイプを変更する。反対に過去に履歴がない場合は、動き検出を行わないピクチャタイプの変更を断念する。もちろん履歴がない場合であっても、動き検出を行えばピクチャタイプを変更できる。
【0206】
なお、本実施の形態におけるトランスコーディングシステム1の内部においては、上述したように、復号側と符号側が粗結合されており、符号化パラメータを画像データに多重化させて伝送させたが、図16に示すように、復号装置102と符号化装置116を直接接続する(密結合する)ようにしてもよい。
【0207】
図4において説明したトランスコーディングシステム1は、第1世代から第3世代の過去の符号化パラメータを符号化装置116に供給するために、ベースバンドビデオデータに過去の符号化パラメータを多重化して伝送するようにしていた。しかしながら、本発明においては、ベースバンドビデオデータに過去の符号化パラメータを多重化する技術は必須ではなく、図16に示されたように、ベースバンドビデオデータとは異なる伝送路(たとえばデータ転送バス)を使用して、過去の符号化パラメータを伝送するようにしても良い。
【0208】
つまり、図16に示した、復号装置102、ヒストリデコーディング装置104、符号化装置116及びヒストリエンコーディング装置117は、図4において説明した復号装置102、ヒストリデコーディング装置104、符号化装置116及びヒストリエンコーディング装置117とまったく同じ機能及び構成を有している。
【0209】
復号装置102の可変長復号回路262は、第3世代の符号化ストリームST(3rd)のシーケンス層、GOP層、ピクチャ層、スライス層及びマクロブロック層から、第3世代の符号化パラメータを抽出し、それを、ヒストリエンコーディング装置117及び符号化装置116のコントローラ330にそれぞれ供給する。
【0210】
復号装置102の可変長復号回路262は、第3世代の符号化ストリームSTから分離されたカウンタ値をフォーマット変換装置361に供給するとともに、フレームまたはフィールドに同期したFrame/Field同期信号をカウンタ362に供給する。
【0211】
カウンタ362は、可変長復号回路262から供給されるフレームまたはフィールドに同期したFrame/Field同期信号を基に、カウントアップされる16ビットのカウンタである。カウンタ362は、0乃至65,535のいずれかのカウンタ値を比較装置363に出力する。
【0212】
カウンタ362は、65,535のカウンタ値を有する場合、可変長復号回路262からフレームまたはフィールドに同期したFrame/Field同期信号が供給されたとき、カウンタ値を0とし、その後も、可変長復号回路262から供給されるFrame/Field同期信号を基に、カウントアップを継続する。
【0213】
なお、カウンタ362は、可変長復号回路262から供給されるフレームまたはフィールドに同期したFrame/Field同期信号を基に、カウントダウン(1を減算)するようにしてもよい。
【0214】
図17は、カウンタ362の構成例を示す図である。カウンタ381は、Clock信号によりカウントアップされる、16ビットのバイナリカウンタである。カウンタ381の全ての出力が"1"になったとき(すなわち、出力が65,535となったとき)、AND回路382の出力が"1"になるので、カウンタ381は、リセットされる(すなわち、カウンタ値が0になる)。
【0215】
なお、カウンタ101、カウンタ113、および後述するカウンタ364も、カウンタ362と同様に構成することかできる。
【0216】
フォーマット変換装置361は、可変長復号回路262から供給された、第3世代の符号化ストリームSTから分離されたカウンタ値の方式を16ビットのカウンタ値(例えば、カウンタ362が出力するカウンタ値と同じ方式)に変換して、比較装置363に出力する。
【0217】
比較装置363は、フォーマット変換装置361から供給されたカウンタ値とカウンタ362から供給されたカウンタ値とを比較し、その値が同一であるとき、所定の値の不連続パラメータを符号化装置116に出力し、その値が異なるとき、他の値の不連続パラメータを符号化装置116に出力する。
【0218】
比較装置363にフォーマット変換装置361から供給されたカウンタ値とカウンタ362から供給されたカウンタ値とが異なる値をとるとき、カウンタ362は、フォーマット変換装置361が出力するカウンタ値をロードして、自己のカウンタ値として設定する。このようにすることで、比較装置363は、一旦、画像の不連続点を検出した後でも、再度、画像に不連続点が含まれていた場合、他の値の不連続パラメータを符号化装置116に出力することができる。
【0219】
ヒストリエンコーディング装置117は、受け取った第3世代の符号化パラメータをピクチャ層のユーザデータエリアに記述できるようにconverted_history_stream()に変換し、converted_history_stream()をユーザデータとして符号化装置116の可変長符号化回路318に供給する。
【0220】
さらに可変長復号回路262は、第3世代の符号化ストリームのピクチャ層のユーザデータエリアから、第1世代の符号化パラメータ及び第2の符号化パラメータを含んでいるユーザデータuser_data を抽出し、ヒストリデコーディング装置104及び符号化装置116の可変長符号化回路318に供給する。ヒストリデコーディング装置104は、ユーザデータエリアにconverted_history_stream()として記述されたヒストリストリームから、第1世代の符号化パラメータ及び第2世代の符号化パラメータを抽出し、それを符号化装置116のコントローラに供給する。
【0221】
符号化装置116のコントローラ330は、ヒストリデコーディング装置104から受け取った第1世代及び第2世代の符号化パラメータと、符号化装置102から受け取った第3世代の符号化パラメータとに基づいて、符号化装置116の符号化処理をコントロールする。
【0222】
符号化装置116の可変長符号化回路318は、復号装置102から第1世代の符号化パラメータ及び第2の符号化パラメータを含んでいるユーザデータuser_dataを受け取るとともに、ヒストリエンコーディング装置117から第3世代の符号化パラメータを含んでいるユーザデータuser_dataを受け取り、それらのユーザデータをヒストリ情報として、第4世代の符号化ストリームのピクチャ層のユーザデータエリアに記述する。
【0223】
また、符号化装置116は、カウンタ364にフレームまたはフィールドに同期したFrame/Field同期信号を供給する。
【0224】
カウンタ364は、符号化装置116から供給されるフレームまたはフィールドに同期したFrame/Field同期信号を基に、カウントアップされる16ビットのカウンタである。カウンタ364は、0乃至65,535のいずれかのカウンタ値をフォーマット変換装置365に出力する。
【0225】
カウンタ364は、65,535のカウンタ値を有する場合、符号化装置116からフレームまたはフィールドに同期したFrame/Field同期信号が供給されたとき、カウンタ値を0とし、その後も、符号化装置116から供給されるFrame/Field同期信号を基に、カウントアップを継続する。
【0226】
なお、カウンタ364は、符号化装置116から供給されるフレームまたはフィールドに同期したFrame/Field同期信号を基に、カウントダウン(1を減算)するようにしてもよい。
【0227】
フォーマット変換装置365は、カウンタ364から供給された16ビットのカウンタ値を、符号化ストリームSTに多重化できる方式に変換して、符号化装置116に出力する。
【0228】
符号化装置116は、フォーマット変換装置365から供給されたカウンタ値を第4世代の符号化ストリームに格納する。
【0229】
図18は、MPEGのビデオストリームをデコードするためのシンタックスを表わした図である。デコーダは、このシンタックスに従ってMPEGビットストリームをデコードすることによって、ビットストリームから意味のある複数のデータ項目(データエレメント)を抽出する。以下に説明するシンタックスは、図において、その関数や条件文は細活字で表わされ、そのデータエレメントは、太活字で表されている。データ項目は、その名称、ビット長、及びそのタイプと伝送順序を示すニーモニック(Mnemonic)で記述されている。
【0230】
まず、この図18に示されているシンタックスにおいて使用されている関数について説明する。
【0231】
next_start_code()関数は、ビットストリーム中に記述されているスタートコードを探すための関数である。この図18に示されたシンタックスにおいて、このnext_start_code()関数の次に、sequence_header()関数とsequence_extension()関数とが順に配置されているので、このビットストリームには、このsequence_header()関数とsequence_extension()関数によって定義されたデータエレメントが記述されている。従って、ビットストリームのデコード時には、このnext_start_code()関数によって、sequence_header()関数とsequence_extension()関数の先頭に記述されているスタートコード(データエレメントの一種)をビットストリーム中から見つけ、それを基準にして、 sequence_header()関数とsequence_extension()関数をさらに見つけ、それらによって定義された各データエレメントをデコードする。
【0232】
尚、sequence_header()関数は、MPEGビットストリームのシーケンス層のヘッダデータを定義するための関数であって、sequence_extension()関数は、MPEGビットストリームのシーケンス層の拡張データを定義するための関数である。
【0233】
sequence_extension()関数の次に配置されている do{ }while構文は、while文によって定義されている条件が真である間、do文の{ }内の関数に基いて記述されたデータエレメントをデータストリーム中から抽出するための構文である。すなわち、 do{ }while構文によって、while文によって定義されている条件が真である間、ビットストリーム中から、do文内の関数に基いて記述されたデータエレメントを抽出するデコード処理が行われる。
【0234】
このwhile文に使用されているnextbits()関数は、ビットストリーム中に現れるビット又はビット列と、次にデコードされるデータエレメントとを比較するための関数である。この図18のシンタックスの例では、nextbits()関数は、ビットストリーム中のビット列とビデオシーケンスの終わりを示すsequence_end_codeとを比較し、ビットストリーム中のビット列とsequence_end_codeとが一致しないときに、このwhile文の条件が真となる。従って、sequence_extension()関数の次に配置されている do{ }while構文は、ビットストリーム中に、ビデオシーケンスの終わりを示すsequence_end_codeが現れない間、do文中の関数によって定義されたデータエレメントがビットストリーム中に記述されていることを示している。
【0235】
ビットストリーム中には、sequence_extension()関数によって定義された各データエレメントの次には、extension_and_user_data(0)関数によって定義されたデータエレメントが記述されている。このextension_and_user_data(0)関数は、MPEGビットストリームのシーケンス層の拡張データとユーザデータを定義するための関数である。
【0236】
このextension_and_user_data(0)関数の次に配置されている do{ }while構文は、while文によって定義されている条件が真である間、do文の{ }内の関数に基いて記述されたデータエレメントを、ビットストリーム中から抽出するための関数である。このwhile文において使用されているnextbits()関数は、ビットストリーム中に現れるビット又はビット列と、picture_start_code又はgroup_start_codeとの一致を判断するための関数であって、ビットストリーム中に現れるビット又はビット列と、picture_start_code又はgroup_start_codeとが一致する場合には、while文によって定義された条件が真となる。よって、このdo{ }while構文は、ビットストリーム中において、picture_start_code又はgroup_start_codeが現れた場合には、そのスタートコードの次に、do文中の関数によって定義されたデータエレメントのコードが記述されているので、このpicture_start_code又はgroup_start_codeによって示されるスタートコードを探し出すことによって、ビットストリーム中からdo文中に定義されたデータエレメントを抽出することができる。
【0237】
このdo文の最初に記述されているif文は、ビットストリーム中にgroup_start_codeが現れた場合、という条件を示しいる。このif文による条件が真である場合には、ビットストリーム中には、このgroup_start_codeの次にgroup_of_picture_header(1)関数及びextension_and_user_data(1)関数によって定義されているデータエレメントが順に記述されている。
【0238】
このgroup_of_picture_header(1)関数は、MPEGビットストリームのGOP層のヘッダデータを定義するための関数であって、 extension_and_user_data(1)関数は、MPEGビットストリームのGOP層の拡張データ(extension_data)及びユーザデータ(user_data)を定義するための関数である。
【0239】
さらに、このビットストリーム中には、group_of_picture_header(1)関数及びextension_and_user_data(1)関数によって定義されているデータエレメントの次に、picture_header()関数とpicture_coding_extension()関数によって定義されたデータエレメントが記述されている。もちろん、先に説明したif文の条件が真とならない場合には、 group_of_picture_header(1)関数及びextension_and_user_data(1)関数によって定義されているデータエレメントは記述されていないので、 extension_and_user_data(0)関数によって定義されているデータエレメントの次に、 picture_header()関数とpicture_coding_extension()関数によって定義されたデータエレメントが記述されている。
【0240】
このpicture_header()関数は、 MPEGビットストリームのピクチャ層のヘッダデータを定義するための関数であって、 picture_coding_extension()関数は、MPEGビットストリームのピクチャ層の第1の拡張データを定義するための関数である。
【0241】
次のwhile文は、このwhile文によって定義されている条件が真である間、次のif文の条件判断を行うための関数である。このwhile文において使用されているnextbits()関数は、ビットストリーム中に現れるビット列と、extension_start_code又はuser_data_start_codeとの一致を判断するための関数であって、ビットストリーム中に現れるビット列と、 extension_start_code又はuser_data_start_codeとが一致する場合には、このwhile文によって定義された条件が真となる。
【0242】
第1のif文は、ビットストリーム中に現れるビット列とextension_start_codeとの一致を判断するための関数である。ビットストリーム中に現れるビット列と32ビットのextension_ start_codeとが一致する場合には、ビットストリーム中において、extension_start_codeの次にextension_data(2)関数によって定義されるデータエレメントが記述されている。
【0243】
第2のif文は、ビットストリーム中に現れるビット列とuser_data_start_codeとの一致を判断するための構文であって、ビットストリーム中に現れるビット列と32ビットのuser_data_start_codeとが一致する場合には、第3のif文の条件判断が行われる。このuser_data_start_codeは、MPEGビットストリームのピクチャ層のユーザデータエリアの開始を示すためのスタートコードである。
【0244】
video_continuity_counter_IDは、user_data()がvideo_continuity_counter()であることを識別するために利用される。marker_bit_1は、”1”が設定され、スタートコードのエミュレーションを防止する。video_continuity_counterには、カウンタ値が設定される。marker_bit_2は、”1”が設定され、スタートコードのエミュレーションを防止する。
【0245】
video_continuity_counterには、video_continuity_counter_ID乃至marker_bit_2に対応したエラーをチェックするための、CRC(Cyclic Redundancy Check)が設定される。
【0246】
第3のif文は、ビットストリーム中に現れるビット列とHistory_Data_IDとの一致を判断するための構文である。ビットストリーム中に現れるビット列とこの32ビットのHistory_Data_IDとが一致する場合には、このMPEGビットストリームのピクチャ層のユーザデータエリアにおいて、この32ビットのHistory_Data_IDによって示されるコードの次に、converted_history_stream()関数によって定義されるデータエレメントが記述されている。
【0247】
converted_history_stream()関数は、MPEG符号化時に使用したあらゆる符号化パラメータを伝送するための履歴情報及び履歴データを記述するための関数である。このconverted_history_stream()関数によって定義されているデータエレメントの詳細は、図20乃至図27を参照して、history_stream()として後述する。また、このHistory_Data_IDは、MPEGビットストリームのピクチャ層のユーザデータエリアに記述されたこの履歴情報及び履歴データが記述されている先頭を示すためのスタートコードである。
【0248】
else文は、第3のif文において、条件が非真であることを示すための構文である。従って、このMPEGビットストリームのピクチャ層のユーザデータエリアにおいて、converted_history_stream()関数によって定義されたデータエレメントが記述されていない場合には、user_data()関数によって定義されたデータエレメントが記述されている。
【0249】
図18において、履歴情報は、converted_history_stream()に記述され、user_data()に記述される訳ではないが、このconverted_history_stream()は、MPEG規格のuser_dataの一種として記述される。そこで、本明細書中においては、場合によって、履歴情報がuser_dataに記述されるとも説明するが、それは、MPEG規格のuser_dataの一種として記述されるということを意味する。
【0250】
picture_data()関数は、MPEGビットストリームのピクチャ層のユーザデータの次に、スライス層及びマクロブロック層に関するデータエレメントを記述するための関数である。通常は、このpicture_data()関数によって示されるデータエレメントは、ビットストリームのピクチャ層のユーザデータエリアに記述されたconverted_history_stream()関数によって定義されるデータエレメント又はuser_data()関数によって定義されたデータエレメントの次に記述されているが、ピクチャ層のデータエレメントを示すビットストリーム中に、extension_start_code又はuser_data_start_code が存在しない場合には、このpicture_data()関数によって示されるデータエレメントは、 picture_coding_extension()関数によって定義されるデータエレメントの次に記述されている。
【0251】
このpicture_data()関数によって示されるデータエレメントの次には、sequence_header()関数とsequence_extension()関数とによって定義されたデータエレメントが順に配置されている。このsequence_header()関数とsequence_extension()関数によって記述されたデータエレメントは、ビデオストリームのシーケンスの先頭に記述されたsequence_header()関数とsequence_extension()関数によって記述されたデータエレメントと全く同じである。このように同じデータをストリーム中に記述する理由は、ビットストリーム受信装置側でデータストリームの途中(例えばピクチャ層に対応するビットストリーム部分)から受信が開始された場合に、シーケンス層のデータを受信できなくなり、ストリームをデコード出来なくなることを防止するためである。
【0252】
この最後のsequence_header()関数とsequence_extension()関数とによって定義されたデータエレメントの次、つまり、データストリームの最後には、シーケンスの終わりを示す32ビットのsequence_end_codeが記述されている。
【0253】
以上のシンタックスの基本的な構成の概略を示すと、図19に示すようになる。
【0254】
次に、converted_history_stream()関数によって定義されたヒストリストリームに関して説明する。
【0255】
このconverted_history_stream()は、MPEGのピクチャ層のユーザデータエリアに履歴情報を示すヒストリストリームを挿入するための関数である。尚、「converted」の意味は、スタートエミュレーションを防止するために、ユーザエリアに挿入すべき履歴データから構成される履歴ストリームの少なくとも22ビット毎にマーカービット(1ビット)を挿入する変換処理を行ったストリームであることを意味している。
【0256】
このconverted_history_stream()は、以下に説明する固定長の履歴ストリーム(図20乃至図26)又は可変長の履歴ストリーム(図27)のいずれかの形式で記述される。エンコーダ側において固定長の履歴ストリームを選択した場合には、デコーダ側において履歴ストリームから各データエレメントをデコードするための回路及びソフトウエアが簡単になるというメリットがある。一方、エンコーダ側において可変長の履歴ストリームを選択した場合には、エンコーダにおいてピクチャ層のユーザエリアに記述される履歴情報(データエレメント)を必要に応じて任意に選択することができるので、履歴ストリームのデータ量を少なくすることができ、その結果、符号化されたビットストリーム全体のデータレートを低減することができる。
【0257】
本発明において説明する「履歴ストリーム」、「ヒストリストリーム」、「履歴情報」、「ヒストリ情報」、「履歴データ」、「ヒストリデータ」、「履歴パラメータ」、「ヒストリパラメータ」とは、過去の符号化処理において使用した符号化パラメータ(又はデータエレメント)を意味し、現在の(最終段の)符号化処理において使用した符号化パラメータを意味するものではない。例えば、第1世代の符号化処理において、あるピクチャをIピクチャで符号化して伝送し、次なる第2世代の符号化処理において、このピクチャを今度はPピクチャとして符号化して伝送し、さらに、第3世代の符号化処理において、このピクチャをBピクチャで符号化して伝送する例をあげて説明する。
【0258】
第3世代の符号化処理において使用した符号化パラメータが、第3世代の符号化処理において生成された符号化ビットストリームのシーケンス層、GOP層、ピクチャ層、スライス層及びマクロブロック層の所定位置に記述されている。一方、過去の符号化処理である第1世代及び第2世代の符号化処理において使用した符号化パラメータは、第3世代の符号化処理において使用した符号化パラメータが記述されるシーケンス層やGOP層に記述されるのでは無く、既に説明したシンタックスに従って、符号化パラメータの履歴情報として、ピクチャ層のユーザデータエリアに記述される。
【0259】
まず、固定長の履歴ストリームシンタックスについて図20乃至図26を参照して説明する。
【0260】
最終段(例えば第3世代)の符号化処理において生成されたビットストリームのピクチャ層のユーザデータエリアには、まず最初に、過去(例えば第1世代及び第2世代)の符号化処理において使用されていたシーケンス層のシーケンスヘッダに含められる符号化パラメータが、履歴ストリームとして挿入される。尚、過去の符号化処理において生成されたビットストリームのシーケンス層のシーケンスヘッダ等の履歴情報は、最終段の符号化処理において生成されたビットストリームのシーケンス層のシーケンスヘッダに挿入されることは無いという点に注意すべきである。
【0261】
過去の符号化処理で使用したシーケンスヘッダ(sequence_header)に含められるデータエレメントは、sequence_header_code、sequence_header_present_flag、horizontal_size_value、marker_bit、vertical_size_value、aspect_ratio_information、frame_rate_code、bit_rate_value、VBV_buffer_size_value、constrained_parameter_flag、load_intra_quantiser_matrix、load_non_intra_quantiser_matrix、intra_quantiser_matrix、及びnon_intra_quantiser_matrix等から構成される。
【0262】
sequence_header_codeは、シーケンス層のスタート同期コードを表すデータである。sequence_header_present_flagは、sequence_header内のデータが有効か無効かを示すデータである。 horizontal_size_valueは、画像の水平方向の画素数の下位12ビットから成るデータである。marker_bitは、スタートコードエミュレーションを防止するために挿入されるビットデータである。vertical_size_valueは、画像の縦のライン数の下位12ビットからなるデータである。aspect_ratio_informationは、画素のアスペクト比(縦横比)または表示画面アスペクト比を表すデータである。frame_rate_codeは、画像の表示周期を表すデータである。
【0263】
bit_rate_valueは、発生ビット量に対する制限のためのビット・レートの下位18ビット(400bsp単位で切り上げる)データである。VBV_buffer_size_valueは、発生符号量制御用の仮想バッファ(ビデオバッファベリファイヤー)の大きさを決める値の下位10ビットデータである。constrained_parameter_flagは、各パラメータが制限以内であることを示すデータである。load_intra_quantiser_matrixは、イントラMB用量子化マトリックス・データの存在を示すデータである。load_non_intra_quantiser_matrixは、非イントラMB用量子化マトリックス・データの存在を示すデータである。intra_quantiser_matrixは、イントラMB用量子化マトリックスの値を示すデータである。non_intra_quantiser_matrixは、非イントラMB用量子化マトリックスの値を表すデータである。
【0264】
最終段の符号化処理において生成されたビットストリームのピクチャ層のユーザデータエリアには、過去の符号化処理において使用されたシーケンス層のシーケンスエクステンションを表わすデータエレメントが、履歴ストリームとして記述される。
【0265】
この過去の符号化処理で使用したシーケンスエクステンション(sequence_extension)を表わすデータエレメントは、 extension_start_code、extension_start_code_identifier、sequence_extension_present_flag、profile_and_level_indication、progressive_sequence、chroma_format、horizontal_size_extension、vertical_size_extension、bit_rate_extension、vbv_buffer_size_extension、low_delay、frame_rate_extension_n 、及び frame_rate_extension_d等のデータエレメントである。
【0266】
extension_start_codeは、エクステンションデータのスタート同期コードを表すデータである。extension_start_code_identifierは、どの拡張データが送られるかを示すデータである。sequence_extension_present_flagは、シーケンスエクステンション内のデータが有効であるか無効であるかを示すデータである。profile_and_level_indicationは、ビデオデータのプロファイルとレベルを指定するためのデータである。progressive_sequenceは、ビデオデータが順次走査であることを示すデータである。chroma_formatは、ビデオデータの色差フォーマットを指定するためのデータである。
【0267】
horizontal_size_extensionは、シーケンスヘッダのhorizntal_size_valueに加える上位2ビットのデータである。vertical_size_extensionは、シーケンスヘッダのvertical_size_valueに加える上位2ビットのデータである。bit_rate_extensionは、シーケンスヘッダのbit_rate_valueに加える上位12ビットのデータである。vbv_buffer_size_extensionは、シーケンスヘッダのvbv_buffer_size_valueに加える上位8ビットのデータである。low_delayは、Bピクチャを含まないことを示すデータである。frame_rate_extension_nは、シーケンスヘッダのframe_rate_codeと組み合わせてフレームレートを得るためのデータである。frame_rate_extension_dは、シーケンスヘッダのframe_rate_codeと組み合わせてフレームレートを得るためのデータである。
【0268】
続いて、ビットストリームのピクチャ層のユーザエリアには、過去の符号化処理において使用されたシーケンス層のシーケンスディスプレイエクステンションを表わすデータエレメントが、履歴ストリームとして記述される。
【0269】
このシーケンスディスプレイエクステンション(sequence_display_extension)として記述されているデータエレメントは、extension_start_code、extension_start_code_identifier、sequence_display_extension_present_flag、video_format、colour_description、colour_primaries、transfer_characteristics、matrix_coeffients、display_horizontal_size、及びdisplay_vertical_sizeから構成される。
【0270】
extension_start_codeは、エクステンションデータのスタート同期コードを表すデータである。extension_start_code_identifierは、どの拡張データが送られるかを示すコードである。sequence_display_extension_present_flagは、シーケンスディスプレイエクステンション内のデータエレメントが有効か無効かを示すデータである。video_formatは、原信号の映像フォーマットを表すデータである。color_descriptionは、色空間の詳細データがあることを示すデータである。color_primariesは、原信号の色特性の詳細を示すデータである。transfer_characteristicsは、光電変換がどのように行われたのかの詳細を示すデータである。matrix_coeffientsは、原信号が光の三原色からどのように変換されたかの詳細を示すデータである。display_horizontal_sizeは、意図するディスプレイの活性領域(水平サイズ)を表すデータである。display_vertical_sizeは、意図するディスプレイの活性領域(垂直サイズ)を表すデータである。
【0271】
続いて、最終段の符号化処理において生成されたビットストリームのピクチャ層のユーザエリアには、過去の符号化処理において生成されたマクロブロックの位相情報を示すマクロブロックアサイメントデータ(macroblock_assignment_in_user_data)が、履歴ストリームとして記述される。
【0272】
このマクロブロックの位相情報を示すmacroblock_assignment_in_user_dataは、macroblock_assignment_present_flag、v_phase、h_phase等のデータエレメントから構成される。
【0273】
このmacroblock_assignment_present_flagは、macroblock_assignment_in_user_data内のデータエレメントが有効か無効かを示すデータである。v_phaseは、画像データからマクロブロックを切り出す際の垂直方向の位相情報を示すデータである。h_phaseは、画像データからマクロブロックを切り出す際の水平方向の位相情報を示すデータである。
【0274】
続いて、最終段の符号化処理によって生成されたビットストリームのピクチャ層のユーザエリアには、過去の符号化処理において使用されたGOP層のGOPヘッダを表わすデータエレメントが、履歴ストリームとして記述されている。
【0275】
このGOPヘッダ(group_of_picture_header)を表わすデータエレメントは、group_start_code、group_of_picture_header_present_flag、time_code、closed_gop、及びbroken_linkから構成される。
【0276】
group_start_codeは、GOP層の開始同期コードを示すデータである。group_of_picture_header_present_flagは、group_of_picture_header内のデータエレメントが有効であるか無効であるかを示すデータである。time_codeは、GOPの先頭ピクチャのシーケンスの先頭からの時間を示すタイムコードである。closed_gopは、GOP内の画像が他のGOPから独立再生可能なことを示すフラグデータである。broken_linkは、編集などのためにGOP内の先頭のBピクチャが正確に再生できないことを示すフラグデータである。
【0277】
続いて、最終段の符号化処理によって生成されたビットストリームのピクチャ層のユーザエリアには、過去の符号化処理において使用されたピクチャ層のピクチャヘッダを表わすデータエレメントが、履歴ストリームとして記述されている。
【0278】
このピクチャヘッダ(picture_header)に関するデータエレメントは、picture_start_code、temporal_reference、picture_coding_type、vbv_delay、full_pel_forward_vector、forward_f_code、full_pel_backward_vector、及びbackward_f_codeから構成される。
【0279】
具体的には、picture_start_codeは、ピクチャ層の開始同期コードを表すデータである。temporal_referenceは、ピクチャの表示順を示す番号でGOPの先頭でリセットされるデータである。picture_coding_typeは、ピクチャタイプを示すデータである。vbv_delayは、ランダムアクセス時の仮想バッファの初期状態を示すデータである。full_pel_forward_vectorは、順方向動きベクトルの精度が整数単位か半画素単位かを示すデータである。forward_f_codeは、順方向動きベクトル探索範囲を表すデータである。full_pel_backward_vectorは、逆方向動きベクトルの精度が整数単位か半画素単位かを示すデータである。backward_f_codeは、逆方向動きベクトル探索範囲を表すデータである。
【0280】
続いて、最終段の符号化処理によって生成されたビットストリームのピクチャ層のユーザエリアには、過去の符号化処理において使用されたピクチャ層のピクチャコーディングエクステンションが、履歴ストリームとして記述されている。
【0281】
このピクチャコーディングエクステンション(picture_coding_extension)に関するデータエレメントは、extension_start_code、extension_start_code_identifier、f_code[0][0]、f_code[0][1]、f_code[1][0]、f_code[1][1]、intra_dc_precision、picture_structure、top_field_first、frame_predictive_frame_dct、concealment_motion_vectors、q_scale_type、intra_vlc_format、alternate_scan、repeat_firt_field、chroma_420_type、progressive_frame、composite_display_flag、v_axis、field_sequence、sub_carrier、burst_amplitude、及びsub_carrier_phaseから構成される。
【0282】
extension_start_codeは、ピクチャ層のエクステンションデータのスタートを示す開始コードである。extension_start_code_identifierは、どの拡張データが送られるかを示すコードである。f_code[0][0]は、フォワード方向の水平動きベクトル探索範囲を表すデータである。f_code[0][1]は、フォワード方向の垂直動きベクトル探索範囲を表すデータである。f_code[1][0]は、バックワード方向の水平動きベクトル探索範囲を表すデータである。f_code[1][1]は、バックワード方向の垂直動きベクトル探索範囲を表すデータである。
【0283】
intra_dc_precisionは、DC係数の精度を表すデータである。picture_structureは、フレームストラクチャかフィールドストラクチャかを示すデータである。フィールドストラクチャの場合は、上位フィールドか下位フィールドかもあわせて示すデータである。top_field_firstは、フレームストラクチャの場合、最初のフィールドが上位か下位かを示すデータである。frame_predictive_frame_dctは、フレーム・ストラクチャの場合、フレーム・モードDCTの予測がフレーム・モードだけであることを示すデータである。concealment_motion_vectorsは、イントラマクロブロックに伝送エラーを隠蔽するための動きベクトルがついていることを示すデータである。
【0284】
q_scale_typeは、線形量子化スケールを利用するか、非線形量子化スケールを利用するかを示すデータである。intra_vlc_formatは、イントラマクロブロックに、別の2次元VLCを使うかどうかを示すデータである。alternate_scanは、ジグザグスキャンを使うか、オルタネート・スキャンを使うかの選択を表すデータである。repeat_firt_fieldは、2:3プルダウンの際に使われるデータである。chroma_420_typeは、信号フォーマットが4:2:0の場合、次のprogressive_frame と同じ値、そうでない場合は0を表すデータである。progressive_frameは、このピクチャが、順次走査できているかどうかを示すデータである。composite_display_flagは、ソース信号がコンポジット信号であったかどうかを示すデータである。
【0285】
v_axisは、ソース信号が、PALの場合に使われるデータである。field_sequenceは、ソース信号が、PALの場合に使われるデータである。sub_carrierは、ソース信号が、PALの場合に使われるデータである。burst_amplitudeは、ソース信号が、PALの場合に使われるデータである。sub_carrier_phaseは、ソース信号が、PALの場合に使われるデータである。
【0286】
続いて、最終段の符号化処理によって生成されたビットストリームのピクチャ層のユーザエリアには、過去の符号化処理において使用された量子化マトリックスエクステンションが、履歴ストリームとして記述されている。
【0287】
この量子化マトリックスエクステンション(quant_matrix_extension)に関するデータエレメントは、extension_start_code、extension_start_code_identifier、quant_matrix_extension_present_flag、load_intra_quantiser_matrix、intra_quantiser_matrix[64]、load_non_intra_quantiser_matrix、non_intra_quantiser_matrix[64]、load_chroma_intra_quantiser_matrix、chroma_intra_quantiser_matrix[64]、load_chroma_non_intra_quantiser_matrix、及びchroma_non_intra_quantiser_matrix[64] から構成される。
【0288】
extension_start_codeは、この量子化マトリックスエクステンションのスタートを示す開始コードである。extension_start_code_identifierは、どの拡張データが送られるかを示すコードである。quant_matrix_extension_present_flagは、この量子化マトリックスエクステンション内のデータエレメントが有効か無効かを示すためのデータである。load_intra_quantiser_matrixは、イントラマクロブロック用の量子化マトリックスデータの存在を示すデータである。intra_quantiser_matrixは、イントラマクロブロック用の量子化マトリックスの値を示すデータである。
【0289】
load_non_intra_quantiser_matrixは、非イントラマクロブロック用の量子化マトリックスデータの存在を示すデータである。non_intra_quantiser_matrixは、非イントラマクロブロック用の量子化マトリックスの値を表すデータである。load_chroma_intra_quantiser_matrixは、色差イントラマクロブロック用の量子化マトリックス・データの存在を示すデータである。chroma_intra_quantiser_matrixは、色差イントラマクロブロック用の量子化マトリックスの値を示すデータである。load_chroma_non_intra_quantiser_matrixは、色差非イントラマクロブロック用の量子化マトリックス・データの存在を示すデータである。chroma_non_intra_quantiser_matrixは、色差非イントラマクロブロック用の量子化マトリックスの値を示すデータである。
【0290】
続いて、最終段の符号化処理によって生成されたビットストリームのピクチャ層のユーザエリアには、過去の符号化処理において使用されたコピーライトエクステンションが、履歴ストリームとして記述されている。
【0291】
このコピーライトエクステンション(copyright_extension)に関するデータエレメントは、extension_start_code、extension_start_code_itentifier、copyright_extension_present_flag、copyright_flag、copyright_identifier、original_or_copy、copyright_number_1、copyright_number_2、及びcopyright_number_3から構成される。
【0292】
extension_start_codeは、コピーライトエクステンションのスタート示す開始コードである。extension_start_code_itentifierのどのエクステンションデータが送られるかを示すコードである。copyright_extension_present_flagは、このコピーライトエクステンション内のデータエレメントが有効か無効かを示すためのデータである。copyright_flagは、次のコピーライトエクステンション又はシーケンスエンドまで、符号化されたビデオデータに対してコピー権が与えられているか否かを示す。
【0293】
copyright_identifierは、ISO/IEC JTC/SC29によって指定されたコピー権の登録機関を識別するためのデータである。original_or_copyは、ビットストリーム中のデータが、オリジナルデータであるかコピーデータであるかを示すデータである。copyright_number_1は、コピーライトナンバーのビット44から63を表わすデータである。copyright_number_2は、コピーライトナンバーのビット22から43を表わすデータである。copyright_number_3は、コピーライトナンバーのビット0から21を表わすデータである。
【0294】
続いて、最終段の符号化処理によって生成されたビットストリームのピクチャ層のユーザエリアには、過去の符号化処理において使用されたピクチャディスプレイエクステンション(picture_display_extension)が、履歴ストリームとして記述されている。
【0295】
このピクチャディスプレイエクステンションを表わすデータエレメントは、extension_start_code、extension_start_code_identifier、picture_display_extension_present_flag、frame_center_horizontal_offset_1、frame_center_vertical_offset_1、frame_center_horizontal_offset_2、frame_center_vertical_offset_2、frame_center_horizontal_offset_3、及びframe_center_vertical_offset_3から構成される。
【0296】
extension_start_codeは、ピクチャディスプレイエクステンションのスタートを示すための開始コードである。extension_start_code_identifierは、どの拡張データが送られるかを示すコードである。picture_display_extension_present_flagは、ピクチャディスプレイエクステンション内のデータエレメントが有効か無効かを示すデータである。frame_center_horizontal_offsetは、表示エリアの水平方向のオフセットを示すデータであって、3つのオフセット値まで定義することができる。frame_center_vertical_offsetは、表示エリアを垂直方向のオフセットを示すデータであって、3つのオフセット値まで定義することができる。
【0297】
最終段の符号化処理において生成されたビットストリームのピクチャ層のユーザエリアには、既に説明したピクチャディスプレイエクステンションを表わす履歴情報の次に、過去の符号化処理において使用されたユーザデータ(user_data)が、履歴ストリームとして記述されている。
【0298】
このユーザデータの次には、過去の符号化処理において使用されたマクロブロック層に関する情報が、履歴ストリームとして記述されている。
【0299】
このマクロブロック層に関する情報は、macroblock_address_h、macroblock_address_v、slice_header_present_flag、skipped_macroblock_flag等のマクロブロック(macroblock)の位置に関するデータエレメントと、macroblock_quant、macroblock_motion_forward、macroblock_motion_backward、mocroblock_pattern、macroblock_intra、spatial_temporal_weight_code_flag、frame_motion_type、及びdct_type等のマクロブロックモード(macroblock_modes[])に関するデータエレメントと、quantiser_scale_code等の量子化ステップ制御に関するデータエレメントと、PMV[0][0][0]、PMV[0][0][1]、motion_vertical_field_select[0][0]、PMV[0][1][0]、PMV[0][1][1]、motion_vertical_field_select[0][1]、PMV[1][0][0]、PMV[1][0][1]、motion_vertical_field_select[1][0]、PMV[1][1][0]、PMV[1][1][1]、motion_vertical_field_select[1][1]等の動き補償に関するデータエレメントと、coded_block_pattern等のマクロブロックパターンに関するデータエレメントと、num_mv_bits、num_coef_bits、及びnum_other_bits等の発生符号量に関するデータエレメントから構成されている。
【0300】
以下にマクロブロック層に関するデータエレメントについて詳細に説明する。
【0301】
macroblock_address_hは、現在のマクロブロックの水平方向の絶対位置を定義するためのデータである。macroblock_address_vは、現在のマクロブロックの垂直方向の絶対位置を定義するためのデータである。slice_header_present_flagは、このマクロブロックがスライス層の先頭であり、スライスヘッダを伴なうか否かを示すデータである。skipped_macroblock_flagは、復号処理においてこのマクロブロックをスキップするか否かを示すデータでる。
【0302】
macroblock_quantは、後述する図43と図44に示されたマクロブロックタイプ( macroblock_type )から導かれるデータであって、quantiser_scale_codeがビットストリーム中に現れるか否かを示すデータである。macroblock_motion_forwardは、図43と図44に示されたマクロブロックタイプから導かれるデータであって、復号処理で使用されるデータである。macroblock_motion_backwardは、図43と図44に示されたマクロブロックタイプから導かれるデータであって、復号処理で使用されるデータである。mocroblock_patternは、図43と図44に示されたマクロブロックタイプから導かれるデータであって、coded_block_patternがビットストリーム中に現れるか否かを示すデータである。
【0303】
macroblock_intraは、図43と図44に示されたマクロブロックタイプから導かれるデータであって、復号処理で使用されるデータである。spatial_temporal_weight_code_flagは、図43と図44に示されたマクロブロックタイプから導かれるデータであって、時間スケーラビリティで下位レイヤ画像のアップサンプリング方法を示すspatial_temporal_weight_codeは、ビットストリーム中に存在するか否かを示すデータである。
【0304】
frame_motion_typeは、フレームのマクロブロックの予測タイプを示す2ビットのコードである。予測ベクトルが2個でフィールドベースの予測タイプであれば「00」であって、予測ベクトルが1個でフィールドベースの予測タイプであれば「01」であって、予測ベクトルが1個でフレームベースの予測タイプであれば「10」であって、予測ベクトルが1個でディアルプライムの予測タイプであれば「11」である。field_motion_typeは、フィールドのマクロブロックの動き予測を示す2ビットのコードである。予測ベクトルが1個でフィールドベースの予測タイプであれば「01」であって、予測ベクトルが2個で18×8マクロブロックベースの予測タイプであれば「10」であって、予測ベクトルが1個でディアルプライムの予測タイプであれば「11」である。dct_typeは、DCTがフレームDCTモードか、フィールドDCTモードかを示すデータである。quantiser_scale_codeはマクロブロックの量子化ステップサイズを示すデータである。
【0305】
次に動きベクトルに関するデータエレメントについて説明する。動きベクトルは、復号時に必要な動きベクトルを減少させるために、先に符号化されたベクトルに関し差分として符号化される。動きベクトルの復号を行うために復号器は、4個の動きベクトル予測値(それぞれ水平及び垂直成分を伴なう)を維持しなければいけない。この予測動きベクトルをPMV[r][s][v]と表わすことにしている。[r]は、マクロブロックにおける動きベクトルが第1のベクトルであるのか、第2のベクトルであるのかを示すフラグであって、マクロブロックにおけるベクトルが第1のベクトルである場合には「0」となって、マクロブロックにおけるベクトルが第2のベクトルである場合には「1」となる。[s]は、マクロブロックにおける動きベクトルの方向が、前方向であるのか後方向であるのかを示すフラグであって、前方向動きベクトルの場合には「0」となって、後方向動きベクトルの場合には「1」となる。[v]は、マクロブロックにおけるベクトルの成分が、水平方向であるのか垂直方向であるのかを示すフラグであって、水平方向成分の場合には「0」となって、垂直方向成分の場合には「1」となる。
【0306】
従って、PMV[0][0][0]は、第1のベクトルの前方向の動きベクトルの水平方向成分のデータを表わし、PMV[0][0][1]は、第1のベクトルの前方向の動きベクトルの垂直方向成分のデータを表わし、PMV[0][1][0]は、第1のベクトルの後方向の動きベクトルの水平方向成分のデータを表わし、PMV[0][1][1]は、第1のベクトルの後方向の動きベクトルの垂直方向成分のデータを表わし、 PMV[1][0][0]は、第2のベクトルの前方向の動きベクトルの水平方向成分のデータを表わし、PMV[1][0][1]は、第2のベクトルの前方向の動きベクトルの垂直方向成分のデータを表わし、 PMV[1][1][0]は、第2のベクトルの後方向の動きベクトルの水平方向成分のデータを表わし、PMV[1][1][1] は、第2のベクトルの後方向の動きベクトルの垂直方向成分のデータを表わしている。
【0307】
motion_vertical_field_select[r][s]は、予測の形式にいずれの参照フィールドを使用するのかを示すデータである。このmotion_vertical_field_select[r][s]が「0」の場合には、トップ参照フィールドを使用し、「1」の場合には、ボトム参照フィールドを使用することを示している。
【0308】
よって、motion_vertical_field_select[0][0]は、第1のベクトルの前方向の動きベクトルを生成する際の参照フィールドを示し、motion_vertical_field_select[0][1]は、第1のベクトルの後方向の動きベクトルを生成する際の参照フィールドを示し、motion_vertical_field_select[1][0]は、第2のベクトルの前方向の動きベクトルを生成する際の参照フィールドを示し、motion_vertical_field_select[1][1]は、第2ベクトルの後方向の動きベクトルを生成する際の参照フィールドを示している。
【0309】
coded_block_patternは、DCT係数を格納する複数のDCTブロックのうち、どのDCTブロックに、有意係数(非0係数)があるかを示す可変長のデータである。num_mv_bitsは、マクロブロック中の動きベクトルの符号量を示すデータである。num_coef_bitsは、マクロブロック中のDCT係数の符号量を示すデータである。num_other_bitsは、マクロブロックの符号量で、動きベクトル及びDCT係数以外の符号量を示すデータである。
【0310】
次に、可変長の履歴ストリームから各データエレメントをデコードするためのシンタックスについて、図27乃至図47を参照して説明する。
【0311】
この可変長の履歴ストリームは、next_start_code()関数、sequence_header()関数、sequence_extension()関数、extension_and_user_data(0)関数、group_of_picture_header()関数、extension_and_user_data(1)関数、picture_header()関数、picture_coding_extension()関数、re_coding_stream_info()関数、extension_and_user_data(2)関数、及びpicture_data()関数によって定義されたデータエレメントによって構成される。
【0312】
next_start_code()関数は、ビットストリーム中に存在するスタートコードを探すための関数であるので、履歴ストリームの最も先頭には、図28に示すような、過去の符号化処理において使用されたデータエレメントであってsequence_header()関数によって定義されたデータエレメントが記述されている。
【0313】
sequence_header()関数によって定義されたデータエレメントは、sequence_header_code、sequence_header_present_flag、horizontal_size_value、vertical_size_value、aspect_ratio_information、frame_rate_code、bit_rate_value、marker_bit、VBV_buffer_size_value、constrained_parameter_flag、load_intra_quantiser_matrix、intra_quantiser_matrix、load_non_intra_quantiser_matrix、及びnon_intra_quantiser_matrix等である。
【0314】
sequence_header_codeは、シーケンス層のスタート同期コードを表すデータである。sequence_header_present_flagは、sequence_header内のデータが有効か無効かを示すデータである。 horizontal_size_valueは、画像の水平方向の画素数の下位12ビットから成るデータである。vertical_size_valueは、画像の縦のライン数の下位12ビットからなるデータである。aspect_ratio_informationは、画素のアスペクト比(縦横比)または表示画面アスペクト比を表すデータである。frame_rate_codeは、画像の表示周期を表すデータである。bit_rate_valueは、発生ビット量に対する制限のためのビット・レートの下位18ビット(400bsp単位で切り上げる)データである。
【0315】
marker_bitは、スタートコードエミュレーションを防止するために挿入されるビットデータである。VBV_buffer_size_valueは、発生符号量制御用の仮想バッファ(ビデオバッファベリファイヤー)の大きさを決める値の下位10ビットデータである。constrained_parameter_flagは、各パラメータが制限以内であることを示すデータである。load_intra_quantiser_matrixは、イントラMB用量子化マトリックス・データの存在を示すデータである。intra_quantiser_matrixは、イントラMB用量子化マトリックスの値を示すデータである。load_non_intra_quantiser_matrixは、非イントラMB用量子化マトリックス・データの存在を示すデータである。non_intra_quantiser_matrixは、非イントラMB用量子化マトリックスの値を表すデータである。
【0316】
sequence_header()関数によって定義されたデータエレメントの次には、図29で示すような、sequence_extension()関数によって定義されたデータエレメントが、履歴ストリームとして記述されている。
【0317】
sequence_extension()関数によって定義されたデータエレメントとは、extension_start_code、extension_start_code_identifier、sequence_extension_present_flag、profile_and_level_indication、progressive_sequence、chroma_format、horizontal_size_extension、vertical_size_extension、bit_rate_extension、vbv_buffer_size_extension、low_delay、frame_rate_extension_n 、及び frame_rate_extension_d等のデータエレメントである。
【0318】
extension_start_codeは、エクステンションデータのスタート同期コードを表すデータである。extension_start_code_identifierは、どの拡張データが送られるかを示すデータである。sequence_extension_present_flagは、シーケンスエクステンション内のデータが有効であるか無効であるかを示すスデータである。profile_and_level_indicationは、ビデオデータのプロファイルとレベルを指定するためのデータである。progressive_sequenceは、ビデオデータが順次走査であることを示すデータである。chroma_formatは、ビデオデータの色差フォーマットを指定するためのデータである。horizontal_size_extensionは、シーケンスヘッダのhorizntal_size_valueに加える上位2ビットのデータである。vertical_size_extensionは、シーケンスヘッダのvertical_size_value加える上位2ビットのデータである。bit_rate_extensionは、シーケンスヘッダのbit_rate_valueに加える上位12ビットのデータである。vbv_buffer_size_extensionは、シーケンスヘッダのvbv_buffer_size_valueに加える上位8ビットのデータである。
【0319】
low_delayは、Bピクチャを含まないことを示すデータである。frame_rate_extension_nは、シーケンスヘッダのframe_rate_codeと組み合わせてフレームレートを得るためのデータである。frame_rate_extension_dは、シーケンスヘッダのframe_rate_codeと組み合わせてフレームレートを得るためのデータである。
【0320】
sequence_extension()関数によって定義されたデータエレメントの次には、図30に示すようなextension_and_user_data(0)関数によって定義されたデータエレメントが、履歴ストリームとして記述されている。 extension_and_user_data(i)関数は、「i」が1以外のときは、extension_data()関数によって定義されるデータエレメントは記述せずに、user_data()関数によって定義されるデータエレメントのみを履歴ストリームとして記述する。よって、 extension_and_user_data(0)関数は、 user_data()関数によって定義されるデータエレメントのみを履歴ストリームとして記述する。
【0321】
user_data()関数は、図31に示されたようなシンタックスに基いて、ユーザデータを履歴ストリームとして記述する。
【0322】
extension_and_user_data(0)関数によって定義されたデータエレメントの次には、図32に示すようなgroup_of_picture_header()関数によって定義されたデータエレメント、及びextension_and_user_data(1)関数によって定義されるデータエレメントが、履歴ストリームとして記述されている。但し、履歴ストリーム中に、GOP層のスタートコードを示すgroup_start_codeが記述されている場合にのみ、 group_of_picture_header()関数によって定義されたデータエレメント、及びextension_and_user_data(1)関数によって定義されるデータエレメントが記述されている。
【0323】
group_of_picture_header()関数によって定義されたデータエレメントは、group_start_code、group_of_picture_header_present_flag、time_code、closed_gop、及びbroken_linkから構成される。
【0324】
group_start_codeは、GOP層の開始同期コードを示すデータである。group_of_picture_header_present_flagは、group_of_picture_header内のデータエレメントが有効であるか無効であるかを示すデータである。 time_codeは、GOPの先頭ピクチャのシーケンスの先頭からの時間を示すタイムコードである。closed_gopは、GOP内の画像が他のGOPから独立再生可能なことを示すフラグデータである。broken_linkは、編集などのためにGOP内の先頭のBピクチャが正確に再生できないことを示すフラグデータである。
【0325】
extension_and_user_data(1)関数は、extension_and_user_data(0)関数と同じように、user_data()関数によって定義されるデータエレメントのみを履歴ストリームとして記述する。
【0326】
もし、履歴ストリーム中に、GOP層のスタートコードを示すgroup_start_codeが存在しない場合には、これらのgroup_of_picture_header()関数及びextension_and_user_data(1)関数によって定義されるデータエレメントは、履歴ストリーム中には記述されていない。その場合には、 extension_and_user_data(0)関数によって定義されたデータエレメントの次に、picture_headr()関数によって定義されたデータエレメントが履歴ストリームとして記述されている。
【0327】
picture_headr()関数によって定義されたデータエレメントは、図33に示すように、picture_start_code、temporal_reference、picture_coding_type、vbv_delay、full_pel_forward_vector、forward_f_code、full_pel_backward_vector、backward_f_code、extra_bit_picture、及びextra_information_pictureである。
【0328】
具体的には、picture_start_codeは、ピクチャ層の開始同期コードを表すデータである。temporal_referenceは、ピクチャの表示順を示す番号でGOPの先頭でリセットされるデータである。picture_coding_typeは、ピクチャタイプを示すデータである。vbv_delayは、ランダムアクセス時の仮想バッファの初期状態を示すデータである。full_pel_forward_vectorは、順方向動きベクトルの精度が整数単位か半画素単位かを示すデータである。forward_f_codeは、順方向動きベクトル探索範囲を表すデータである。full_pel_backward_vectorは、逆方向動きベクトルの精度が整数単位か半画素単位かを示すデータである。backward_f_codeは、逆方向動きベクトル探索範囲を表すデータである。extra_bit_pictureは、後続する追加情報の存在を示すフラグである。このextra_bit_pictureが「1」の場合には、次にextra_information_pictureが存在し、extra_bit_pictureが「0」の場合には、これに続くデータが無いことを示している。extra_information_pictureは、規格において予約された情報である。
【0329】
picture_headr()関数によって定義されたデータエレメントの次には、図34に示すようなpicture_coding_extension()関数によって定義されたデータエレメントが、履歴ストリームとして記述されている。
【0330】
このpicture_coding_extension()関数によって定義されたデータエレメントとは、extension_start_code、extension_start_code_identifier、f_code[0][0]、f_code[0][1]、f_code[1][0]、f_code[1][1]、intra_dc_precision、picture_structure、top_field_first、frame_predictive_frame_dct、concealment_motion_vectors、q_scale_type、intra_vlc_format、alternate_scan、repeat_firt_field、chroma_420_type、progressive_frame、composite_display_flag、v_axis、field_sequence、sub_carrier、burst_amplitude、及びsub_carrier_phaseから構成される。
【0331】
extension_start_codeは、ピクチャ層のエクステンションデータのスタートを示す開始コードである。extension_start_code_identifierは、どの拡張データが送られるかを示すコードである。 f_code[0][0]は、フォワード方向の水平動きベクトル探索範囲を表すデータである。f_code[0][1]は、フォワード方向の垂直動きベクトル探索範囲を表すデータである。f_code[1][0]は、バックワード方向の水平動きベクトル探索範囲を表すデータである。f_code[1][1]は、バックワード方向の垂直動きベクトル探索範囲を表すデータである。intra_dc_precisionは、DC係数の精度を表すデータである。
【0332】
picture_structureは、フレームストラクチャかフィールドストラクチャかを示すデータである。フィールドストラクチャの場合は、上位フィールドか下位フィールドかもあわせて示すデータである。top_field_firstは、フレームストラクチャの場合、最初のフィールドが上位か下位かを示すデータである。frame_predictive_frame_dctは、フレーム・ストラクチャの場合、フレーム・モードDCTの予測がフレーム・モードだけであることを示すデータである。concealment_motion_vectorsは、イントラマクロブロックに伝送エラーを隠蔽するための動きベクトルがついていることを示すデータである。q_scale_typeは、線形量子化スケールを利用するか、非線形量子化スケールを利用するかを示すデータである。intra_vlc_formatは、イントラマクロブロックに、別の2次元VLCを使うかどうかを示すデータである。
【0333】
alternate_scanは、ジグザグスキャンを使うか、オルタネート・スキャンを使うかの選択を表すデータである。repeat_firt_fieldは、2:3プルダウンの際に使われるデータである。chroma_420_typeは、信号フォーマットが4:2:0の場合、次のprogressive_frame と同じ値、そうでない場合は0を表すデータである。progressive_frameは、このピクチャが、順次走査できているかどうかを示すデータである。composite_display_flagは、ソース信号がコンポジット信号であったかどうかを示すデータである。v_axisは、ソース信号が、PALの場合に使われるデータである。field_sequenceは、ソース信号が、PALの場合に使われるデータである。sub_carrierは、ソース信号が、PALの場合に使われるデータである。burst_amplitudeは、ソース信号が、PALの場合に使われるデータである。sub_carrier_phaseは、ソース信号が、PALの場合に使われるデータである。
【0334】
picture_coding_extension()関数によって定義されたデータエレメントの次には、re_coding_stream_info()関数によって定義されたデータエレメントが履歴ストリームとして記述されている。このre_coding_stream_info()関数は、主に履歴情報の組み合わせを記述する場合に用いられるものであり、その詳細については、図51を参照して後述する。
【0335】
re_coding_stream_info()関数によって定義されたデータエレメントの次には、extensions_and_user_data(2)によって定義されたデータエレメントが、履歴ストリームとして記述されている。このextension_and_user_data(2)関数は、図30に示したように、ビットストリーム中にエクステンションスタートコード(extension_start_code)が存在する場合には、extension_data()関数によって定義されるデータエレメントが記述されている。このデータエレメントの次には、ビットストリーム中にユーザデータスタートコード(user_data_start_code)が存在する場合には、user_data()関数によって定義されるデータエレメントが記述されている。但し、ビットストリーム中にエクステンションスタートコード及びユーザデータスタートコードが存在しない場合には extension_data()関数 及びuser_data()関数によって定義されるデータエレメントはビットトリーム中には記述されていない。
【0336】
extension_data()関数は、図35に示すように、extension_start_codeを示すデータエレメントと、quant_matrix_extension()関数、copyright_extension()関数、及びpicture_display_extension()関数によって定義されるデータエレメンエトとを、ビットストリーム中に履歴ストリームとして記述するための関数である。
【0337】
quant_matrix_extension()関数によって定義されるデータエレメントは、図36に示すように、extension_start_code、extension_start_code_identifier、quant_matrix_extension_present_flag、load_intra_quantiser_matrix、intra_quantiser_matrix[64]、load_non_intra_quantiser_matrix、non_intra_quantiser_matrix[64]、load_chroma_intra_quantiser_matrix、chroma_intra_quantiser_matrix[64]、load_chroma_non_intra_quantiser_matrix、及びchroma_non_intra_quantiser_matrix[64] である。
【0338】
extension_start_codeは、この量子化マトリックスエクステンションのスタートを示す開始コードである。extension_start_code_identifierは、どの拡張データが送られるかを示すコードである。 quant_matrix_extension_present_flagは、この量子化マトリックスエクステンション内のデータエレメントが有効か無効かを示すためのデータである。load_intra_quantiser_matrixは、イントラマクロブロック用の量子化マトリックスデータの存在を示すデータである。intra_quantiser_matrixは、イントラマクロブロック用の量子化マトリックスの値を示すデータである。
【0339】
load_non_intra_quantiser_matrixは、非イントラマクロブロック用の量子化マトリックスデータの存在を示すデータである。non_intra_quantiser_matrixは、非イントラマクロブロック用の量子化マトリックスの値を表すデータである。load_chroma_intra_quantiser_matrixは、色差イントラマクロブロック用の量子化マトリックス・データの存在を示すデータである。chroma_intra_quantiser_matrixは、色差イントラマクロブロック用の量子化マトリックスの値を示すデータである。load_chroma_non_intra_quantiser_matrixは、色差非イントラマクロブロック用の量子化マトリックス・データの存在を示すデータである。chroma_non_intra_quantiser_matrixは、色差非イントラマクロブロック用の量子化マトリックスの値を示すデータである。
【0340】
copyright_extension()関数によって定義されるデータエレメントは、図37に示すように、 extension_start_code、extension_start_code_itentifier、copyright_extension_present_flag、copyright_flag、copyright_identifier、original_or_copy、copyright_number_1、copyright_number_2、及び copyright_number_3から構成される。
【0341】
extension_start_codeは、コピーライトエクステンションのスタート示す開始コードである。extension_start_code_itentifierどのエクステンションデータが送られるかを示すコードである。 copyright_extension_present_flagは、このコピーライトエクステンション内のデータエレメントが有効か無効かを示すためのデータである。
【0342】
copyright_flagは、次のコピーライトエクステンション又はシーケンスエンドまで、符号化されたビデオデータに対してコピー権が与えられているか否かを示す。copyright_identifierは、ISO/IEC JTC/SC29によって指定されたコピー権の登録機関を識別するためのデータである。original_or_copyは、ビットストリーム中のデータが、オリジナルデータであるかコピーデータであるかを示すデータである。copyright_number_1は、コピーライトナンバーのビット44から63を表わすデータである。copyright_number_2は、コピーライトナンバーのビット22から43を表わすデータである。copyright_number_3は、コピーライトナンバーのビット0から21を表わすデータである。
【0343】
picture_display_extension()関数によって定義されるデータエレメントは、図38に示すように、extension_start_code_identifier、frame_center_horizontal_offset、frame_center_vertical_offset等である。
【0344】
extension_start_code_identifierは、どの拡張データが送られるかを示すコードである。 frame_center_horizontal_offsetは、表示エリアの水平方向のオフセットを示すデータであって、number_of_frame_center_offsetsによって定義される数のオフセット値を定義することができる。frame_center_vertical_offsetは、表示エリアを垂直方向のオフセットを示すデータであって、 number_of_frame_center_offsetsによって定義される数のオフセット値を定義することができる。
【0345】
再び図27に戻って、extension_and_user_data(2)関数によって定義されるデータエレメントの次には、picture_data()関数によって定義されるデータエレメントが、履歴ストリームとして記述されている。但し、このpicture_data()関数は、red_bw_flagが1ではないか、または、red_bw_indicatorが2以下である場合に存在する。このred_bw_flagとred_bw_indicatorは、re_coding_stream_info()関数に記述されており、これらについては、図51と図52を参照して後述する。
【0346】
picture_data()関数によって定義されるデータエレメントは、図39に示すように、slice()関数によって定義されるデータエレメントである。このslice()関数によって定義されるデータエレメントはビットストリーム中に少なくとも1個記述されている。
【0347】
slice()関数は、図40に示されるように、slice_start_code、slice_quantiser_scale_code、intra_slice_flag、intra_slice、reserved_bits、extra_bit_slice、extra_information_slice、及びextra_bit_slice 等のデータエレメントと、macroblock()関数によって定義されるデータエレメントを、履歴ストリームとして記述するための関数である。
【0348】
slice_start_codeは、slice()関数によって定義されるデータエレメントのスタートを示すスタートコードである。slice_quantiser_scale_codeは、このスライス層に存在するマクロブロックに対して設定された量子化ステップサイズを示すデータである。しかし、各マクロブロック毎に、quantiser_scale_codeが設定されている場合には、各マクロブロックに対して設定されたmacroblock_quantiser_scale_codeのデータが優先して使用される。
【0349】
intra_slice_flagは、ビットストリーム中にintra_slice及びreserved_bitsが存在するか否かを示すフラグである。intra_sliceは、スライス層中にノンイントラマクロブロックが存在するか否かを示すデータである。スライス層におけるマクロブロックのいずれかがノンイントラマクロブロックである場合には、intra_sliceは「0」となり、スライス層におけるマクロブロックの全てがノンイントラマクロブロックである場合には、intra_sliceは「1」となる。reserved_bitsは、7ビットのデータであって「0」の値を取る。extra_bit_sliceは、履歴ストリームとして追加の情報が存在することを示すフラグであって、次にextra_information_sliceが存在する場合には「1」に設定される。追加の情報が存在しない場合には「0」に設定される。
【0350】
これらのデータエレメントの次には、macroblock()関数によって定義されたデータエレメントが、履歴ストリームとして記述されている。
【0351】
macroblock()関数は、図41に示すように、macroblock_escape、macroblock_address_increment、及びmacroblock_quantiser_scale_code、及びmarker_bit等のデータエレメントと、macroblock_modes()関数、motion_vectors(s)関数、及びcode_block_pattern()関数によって定義されたデータエレメントを記述するための関数である。
【0352】
macroblock_escapeは、参照マクロブロックと前のマクロブロックとの水平方向の差が34以上であるか否かを示す固定ビット列である。参照マクロブロックと前のマクロブロックとの水平方向の差が34以上の場合には、macroblock_address_incrementの値に33をプラスする。macroblock_address_incrementは、参照マクロブロックと前のマクロブロックとの水平方向の差を示すデータである。もし、このmacroblock_address_incrementの前にmacroblock_escapeが1つ存在するのであれば、このmacroblock_address_incrementの値に33をプラスした値が、実際の参照マクロブロックと前のマクロブロックとの水平方向の差分を示すデータとなる。
【0353】
macroblock_quantiser_scale_codeは、各マクロブロック毎に設定された量子化ステップサイズであり、macroblock_quantが”1”のときだけ存在する。各スライス層には、スライス層の量子化ステップサイズを示すslice_quantiser_scale_codeが設定されているが、参照マクロブロックに対してmacroblock_quantiser_scale_codeが設定されている場合には、この量子化ステップサイズを選択する。
【0354】
macroblock_address_incrementの次には、macroblock_modes()関数によって定義されるデータエレメントが記述されている。macroblock_modes()関数は、図42に示すように、macroblock_type、frame_motion_type、field_motion_type、dct_type等のデータエレメントを、履歴ストリームとして記述するための関数である。
【0355】
macroblock_typeは、マクログブロックの符号化タイプを示すデータである。その詳細は、図45乃至図47を参照して後述する。
【0356】
もし、macroblock_motion_forward又はmacroblock_motion_backwardが「1」であり、ピクチャ構造がフレームであり、さらにframe_pred_frame_dctが「0」である場合には、macroblock_typeを表わすデータエレメントの次にframe_motion_typeを表わすデータエレメントが記述されている。尚、このframe_pred_frame_dctは、 frame_motion_typeがビットストリーム中に存在するか否かを示すフラグである。
【0357】
frame_motion_typeは、フレームのマクロブロックの予測タイプを示す2ビットのコードである。予測ベクトルが2個でフィールドベースの予測タイプであれば「00」であって、予測ベクトルが1個でフィールドベースの予測タイプであれば「01」であって、予測ベクトルが1個でフレームベースの予測タイプであれば「10」であって、予測ベクトルが1個でディアルプライムの予測タイプであれば「11」である。
【0358】
frame_motion_typeを記述する条件が満足されない場合には、macroblock_typeを表わすデータエレメントの次にfield_motion_typeを表わすデータエレメントが記述されている。
【0359】
field_motion_typeは、フィールドのマクロブロックの動き予測を示す2ビットのコードである。予測ベクトルが1個でフィールドベースの予測タイプであれば「01」であって、予測ベクトルが2個で18×8マクロブロックベースの予測タイプであれば「10」であって、予測ベクトルが1個でディアルプライムの予測タイプであれば「11」である。
【0360】
もし、ピクチャ構造がフレームで、 frame_pred_frame_dctがframe_motion_typeがビットストリーム中に存在することを示し、且つ、frame_pred_frame_dctがdct_typeがビットストリーム中に存在することを示している場合には、macroblock_typeを表わすデータエレメントの次にdct_typeを表わすデータエレメントが記述されている。尚、dct_typeは、DCTがフレームDCTモードか、フィールドDCTモードかを示すデータである。
【0361】
再び図41に戻って、もし、参照マクロブロックが前方予測マクロブロックであるか、又は参照マクロブロックがイントラマクロブロックであって且つコンシール処理のマクロブロックのいずれかの場合には、motion_vectors(0)関数によって定義されるデータエレメントが記述される。また、参照マクロブロックが後方予測マクロブロックである場合には、motion_vectors(1)関数によって定義されるデータエレメントが記述される。尚、 motion_vectors(0)関数は、第1番目の動きベクトルに関するデータエレメントを記述するための関数であって、motion_vectors(1)関数は、第2番目の動きベクトルに関するデータエレメントを記述するための関数である。
【0362】
motion_vectors(s)関数は、図43に示されるように、動きベクトルに関するデータエレメントを記述するための関数である。
【0363】
もし、動きベクトルが1個でディアルプライム予測モードを使用していない場合には、motion_vertical_field_select[0][s]とmotion_vector(0,s)によって定義されるデータエレメントが記述される。
【0364】
このmotion_vertical_field_select[r][s]は、第1番目の動きベクトル(前方又は後方のどちらのベクトルであっても良い)が、ボトムフィールドを参照して作られたベクトルであるかトップフィールドを参照して作られたベクトルであるかを示すフラグである。この指標“r”は、第1番めのベクトル又は第2番めのベクトルのいずれのベクトルであるかを示す指標であって、“s”は、予測方向が前方又は後方予測のいずれであるかを示す指標である。
【0365】
motion_vector(r,s)関数は、図44に示されるように、motion_code[r][s][t]に関するデータ列と、motion_residual[r][s][t]に関するデータ列と、dmvector[t]を表わすデータとを記述するための関数である。
【0366】
motion_code[r][s][t]は、動きベクトルの大きさを−16〜+16の範囲で表わす可変長のデータである。 motion_residual[r][s][t]は、動きベクトルの残差を表わす可変長のデータである。よって、このmotion_code[r][s][t]と motion_residual[r][s][t]との値によって詳細な動きベクトルを記述することができる。 dmvector[t]は、ディユアルプライム予測モードのときに、一方のフィールド(例えばボトムフィールドに対してトップフィールドを一方のフィールドとする)における動きベクトルを生成するために、時間距離に応じて既存の動きベクトルがスケールされると共に、トップフィールドとボトムフィールドとのライン間の垂直方向のずれを反映させるために垂直方向に対して補正を行うデータである。この指標“r”は、第1番めのベクトル又は第2番めのベクトルのいずれのベクトルであるかを示す指標であって、“s”は、予測方向が前方又は後方予測のいずれであるかを示す指標である。“s”は、動きベクトルが垂直方向の成分であるか水平方向の成分であるかを示すデータである。
【0367】
図44に示されmotion_vector(r,s)関数によって、まず、水平方向のmotion_coder[r][s][0]を表わすデータ列が、履歴ストリームとして記述される。motion_residual[0][s][t]及びmotion_residual[1][s][t]の双方のビット数は、f_code[s][t]で示されるので、 f_code[s][t]が1でない場合には、 motion_residual[r][s][t] がビットストリーム中に存在することを示すことになる。水平方向成分のmotion_residual[r][s][0]が「1」でなくて、水平方向成分のmotion_code[r][s][0]が「0」でないということは、ビットストリーム中にmotion_residual[r][s][0]を表わすデータエレメントが存在し、動きベクトルの水平方向成分が存在するということを意味しているので、その場合には、水平方向成分のmotion_residual[r][s][0]を表わすデータエレメントが記述されている。
【0368】
続いて、垂直方向のmotion_coder[r][s][1]を表わすデータ列が、履歴ストリームとして記述される。同じようにmotion_residual[0][s][t]及びmotion_residual[1][s][t]の双方のビット数は、f_code[s][t]で示されるので、 f_code[s][t]が1でない場合には、 motion_residual[r][s][t] がビットストリーム中に存在することを表わすことになる。motion_residual[r][s][1]が「1」でなくて、motion_code[r][s][1]が「0」でないということは、ビットストリーム中にmotion_residual[r][s][1]を表わすデータエレメントが存在し、動きベクトルの垂直方向成分が存在するということを意味しているので、その場合には、垂直方向成分のmotion_residual[r][s][1]を表わすデータエレメントが記述されている。
【0369】
次に、図45乃至図47を参照して、macroblock_typeについて説明する。macroblock_typeは、macroblock_quant、dct_type_flag、macroblock_motion_forward、及びmacroblock_motion_backwardなどのフラグから生成された可変長データである。 macroblock_quantは、マクロブロックに対して量子化ステップサイズを設定するためのmacroblock_quantiser_scale_codeが設定されているか否かを示すフラグあって、ビットストリーム中にmacroblock_quantiser_scale_codeが存在する場合には、 macroblock_quantは「1」の値を取る。
【0370】
dct_type_flagは、参照マクロブロックがフレームDCT又はフィールドDCTで符号化されているかを示すdct_typeが存在するか否かを示すためのフラグ(言い換えるとDCTされているか否かを示すフラグ)であって、ビットストリーム中にdct_typeが存在する場合には、このdct_type_flagは「1」の値を取る。 macroblock_motion_forwardは、参照マクロブロックが前方予測されているか否かを示すフラグであって、前方予測されている場合には「1」の値を取る。macroblock_motion_backwardは、参照マクロブロックが後方予測されているか否かを示すフラグであって、後方予測されている場合には「1」の値を取る。
【0371】
なお、可変長フォーマットにおいては、伝送するビットレートを減少させるために、履歴情報を削減することができる。
【0372】
すなわち、macroblock_typeとmotion_vectors()は転送するが、quantiser_scale_codeを転送しない場合には、slice_quantiser_scale_codeを”00000”とすることで、ビットレートを減少させることができる。
【0373】
また、macroblock_typeのみ転送し、motion_vectors()、quantiser_scale_code、およびdct_typeを転送しない場合には、macroblock_typeとして、”not coded”を使用することで、ビットレートを減少することができる。
【0374】
さらにまた、picture_coding_typeのみ転送し、slice()以下の情報は全て転送しない場合には、slice_start_codeを持たないpicture_data()を使用することで、ビットレートを減少させることができる。
【0375】
以上においては、user_data内の23ビットの連続する”0”が出ないようにする場合に、22ビット毎に”1”を挿入するようにしたが、22ビット毎でなくてもよい。また、連続する”0”の個数を数えて”1”を挿入するのではなく、Byte_allignを調べて挿入するようにすることも可能である。
【0376】
さらに、MPEGにおいては、23ビットの連続する”0”の発生を禁止しているが、実際には、バイトの先頭から23ビット連続する場合だけが問題とされ、バイトの先頭ではなく、途中から0が23ビット連続する場合は、問題とされない。従って、例えば24ビット毎に、LSB以外の位置に”1”を挿入するようにしてもよい。
【0377】
また、以上においては、履歴情報を、video elementary streamに近い形式にしたが、packetized elementary streamやtransport streamに近い形式にしてもよい。また、Elementary Streamのuser_dataの場所を、picture_dataの前としたが、他の場所にすることもできる。
【0378】
図4のトランスコーディングシステム1においては、4世代分の符号化パラメータを履歴情報として後段に出力するようにしたが、実際には、履歴情報の全てが必要となるわけではなく、アプリケーション毎に必要な履歴情報は異なってくる。また、実際の伝送路あるいは記録媒体(伝送メディア)には、容量に制限があり、圧縮しているとはいえ、全ての履歴情報を伝送するようにすると、容量的に負担となり、結果的に画像ビットストリームのビットレートを抑圧してしまい、履歴情報伝送の有効性が損なわれることになる。
【0379】
そこで、履歴情報として伝送する項目の組み合わせを記述する記述子を履歴情報に組み込んで後段に送信するようにし、全ての履歴情報を伝送するのではなく、様々なアプリケーションに対応した情報を伝送するようにすることができる。図48は、このような場合のトランスコーディングシステム1の構成例を表している。
【0380】
図48において、図4における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。図48の構成例においては、ヒストリ情報分離装置115と符号化装置116の間、及びヒストリエンコーディング装置117と符号化装置116の間に、符号化パラメータ選択回路501が挿入されている。
【0381】
符号化パラメータ選択回路501は、ヒストリ情報分離装置115が出力するベースバンドビデオ信号から符号化パラメータを算出する符号化パラメータ算出部512、ヒストリ情報分離装置115が出力する、このトランスコーディングシステム1において、符号化するのに最適と判定された符号化パラメータ(例えば、第2世代の符号化パラメータ)に関する情報から、符号化パラメータと記述子(red_bw_flag,red_bw_indicator)(図52を参照して後述する)を分離する組合せ記述子分離部511、並びに符号化パラメータ算出部512が出力する符号化パラメータと、組合せ記述子分離部511が出力する符号化パラメータのうち、いずれか一方を、組合せ記述子分離部511で分離された記述子に対応して選択し、符号化装置116に出力するスイッチ513を有している。その他の構成は、図4における場合と同様である。
【0382】
ここで、履歴情報として伝送する項目の組み合わせについて説明する。履歴情報は、分類すると、picture単位の情報と、macroblock単位の情報に分けることができる。slice単位の情報は、それに含まれるmacroblockの情報を収集することで得ることができ、GOP単位の情報は、それに含まれるpicture単位の情報を収集することで得ることができる。
【0383】
picture単位の情報は、1フレーム毎に1回伝送されるだけなので、情報伝送に占めるビットレートは、それほど大きくはない。これに対して、macroblock単位の情報は、各macroblock毎に伝送されるため、例えば1フレームの走査線数が525本で、フィールドレートが60フィールド/秒のビデオシステムの場合、1フレームの画素数を720×480とすると、macroblock単位の情報は、1フレームあたり1350(=(720/16)×(480/16))回伝送することが必要となる。このため、履歴情報の相当の部分がmacroblock毎の情報で占められることになる。そこで、履歴情報としては、少なくともpicture単位の情報は常に伝送するが、macroblock単位の情報は、アプリケーションに応じて選択して伝送するようにすることで、伝送する情報量を抑制することができる。
【0384】
履歴情報として転送されるmacroblock単位の情報には、例えばnum_coef_bits,num_mv_bits,num_other_bits,q_scale_code,q_scale_type,motion_type,mv_vert_field_sel[][],mv[][][],mb_mfwd,mb_mbwd,mb_pattern,coded_block_pattern,mb_intra,slice_start,dct_type,mb_quant,skipped_mbなどがある。これらは、macroblock rate informationの要素を用いて表現されたものである。
【0385】
num_coef_bitsは、macroblockの符号量のうち、DCT係数に要した符号量を表す。num_mv_bitsは、macroblockの符号量のうち、動きベクトルに要した符号量を表す。num_other_bitsは、macroblockの符号量のうち、num_coef_bits及びnum_mv_bits以外の符号量を表す。
【0386】
q_scale_codeは、macroblockに適用されたq_scale_codeを表す。motion_typeは、macroblockに適用された動きベクトルのtypeを表す。mv_vert_field_sel[][]は、macroblockに適用された動きベクトルのfield selectを表す。
【0387】
mv[][][]は、macroblockに適用された動きベクトルを表す。mb_mfwdは、macroblockの予測モードが前方向予測であることを示すフラグである。mb_mbwdは、macroblockの予測モードが後方向予測であることを示すフラグである。mb_patternは、macroblockのDCT係数の非0のものの有無を示すフラグである。
【0388】
coded_block_patternは、macroblockのDCT係数の非0のものの有無をDCTブロック毎に示すフラグである。mb_intraは、macroblockがintra_macroかそうでないかを示すフラグである。slice_startは、macroblockがsliceの先頭であるか否かを示すフラグである。dct_typeは、macroblockがfield_dctかflame_dctかを示すフラグである。
【0389】
mb_quantは、macroblockがquantiser_scale_codeを伝送するか否かを示すフラグである。skipped_mbは、macroblockがskipped macroblockであるか否かを示すフラグである。
【0390】
これらの項目は、常に全て必要であるわけではなく、アプリケーションに応じて必要となる項目が変化する。例えば、num_coef_bitsやslice_startといった項目は、再エンコードした際のビットストリームをできる限り元の形に戻したいというtransparentという要求を有するアプリケーションにおいて必要となる。換言すれば、ビットレートを変更するようなアプリケーションにおいては、これらの項目は必要ではない。また、非常に伝送路の制限が厳しい場合には、各ピクチャの符号化タイプが判るだけでもよいようなアプリケーションも存在する。このような状況から、履歴情報を伝送する項目の組み合わせの例として、例えば図49に示すような組み合わせが考えられる。
【0391】
図49において、各組み合わせの中の項目に対応する値「2」は、その情報が存在し、利用可能であることを意味し、「0」は、その情報が存在しないことを意味する。「1」は、他の情報の存在を補助する目的のため、あるいは、構文上存在するが、元のビットストリーム情報とは関係がないなど、その情報自身には意味がないことを表している。例えば、slice_startは、履歴情報を伝送する際のsliceの先頭のmacroblockにおいて、「1」になるが、本来のビットストリームに対して、sliceが必ずしも同一位置関係にあるわけではない場合には、履歴情報としては無意味になる。
【0392】
図49の例においては、(num_coef_bits,num_mv_bits,num_other_bits),(q_scale_code,q_scale_type),(motion_type,mv_vert_field_sel[][],mv[][][]),(mb_mfwd,mb_mbwd),(mb_pattern),(coded_block_pattern),(mb_intra),(slice_start),(dct_type),(mb_quant),(skipped_mb)の各項目の有無により、組み合わせ1乃至組み合わせ5の5つの組み合わせが用意されている。
【0393】
組み合わせ1は、完全にtransparentなビットストリームを再構成することを目的とした組み合わせである。この組み合わせによれば、発生符号量情報を用いることによる精度の高いトランスコーディングが実現できる。組み合わせ2も、完全にtransparentなビットストリームを再構成することを目的とした組み合わせである。組み合わせ3は、完全にtransparentなビットストリームを再構成することはできないが、視覚的にほぼtransparentなビットストリームを再構成できるようにするための組み合わせである。組み合わせ4は、transparentという観点からは組み合わせ3よりも劣るが、視覚上問題がないビットストリームの再構成ができる組み合わせである。組み合わせ5は、transparentという観点からは組み合わせ4よりも劣るが、少ない履歴情報でビットストリームの完全ではない再構成ができる組み合わせである。
【0394】
これらの組み合わせのうち、組み合わせの番号の数字が小さいものほど、機能的には上位であるが、履歴を転送するのに必要となる容量が多くなる。従って、想定するアプリケーションと履歴に使用できる容量を考慮することによって、伝送する組み合わせを決定する必要がある。
【0395】
次に、図50のフローチャートを参照して、図48のトランスコーディングシステム1の動作について説明する。ステップS41において、トランスコーディングシステム1の復号装置102は、入力されたビットストリームを復号し、そのビットストリームを符号化する際に使用された符号化パラメータ(4th)を抽出し、その符号化パラメータ(4th)をヒストリ情報多重化装置103に出力するとともに、復号したビデオデータをやはりヒストリ情報多重化装置103に出力する。ステップS42において、復号装置102はまた、入力されたビットストリームからuser_dataを抽出し、ヒストリデコーディング装置104に出力する。ヒストリデコーディング装置104は、ステップS43において、入力されたuser_dataから、組み合わせ情報(記述子)を抽出し、さらにそれを用いて、履歴情報としての符号化パラメータ(1st,2nd,3rd)を抽出し、ヒストリ情報多重化装置103に出力する。
【0396】
ヒストリ情報多重化装置103は、ステップS44において、ステップS41で取り出された復号装置102から供給される現在の符号化パラメータ(4th)と、ステップS43でヒストリデコーディング装置104が出力した過去の符号化パラメータ(1st,2nd,3rd)とを、復号装置102から供給されるベースバンドのビデオデータに、図7または図35に示すようなフォーマットに従って多重化し、ヒストリ情報分離装置115に出力する。
【0397】
ヒストリ情報分離装置115は、ステップS45において、ヒストリ情報多重化装置103より供給されたベースバンドのビデオデータから符号化パラメータを抽出し、その中から今回の符号化に最も適している符号化パラメータ(例えば、第2世代の符号化パラメータ)を選択し、記述子とともに、組合せ記述子分離部511に出力する。また、ヒストリ情報分離装置115は、今回の符号化に最適と判定された符号化パラメータ以外の符号化パラメータ(例えば、最適な符号化パラメータが第2世代の符号化パラメータであると判定された場合には、それ以外の第1世代、第3世代、及び第4世代の符号化パラメータ)をヒストリエンコーディング装置117に出力する。ヒストリエンコーディング装置117は、ヒストリ情報分離装置115より入力された符号化パラメータをステップS46において、user_dataに記述し、そのuser_data(converted_history_stream())を符号化装置116に出力する。
【0398】
符号化パラメータ選択回路501の組合せ記述子分離部511は、ヒストリ情報分離装置115より供給されたデータから、符号化パラメータと記述子を分離し、符号化パラメータ(2nd)をスイッチ513の一方の接点に供給する。スイッチ513の他方の接点には、符号化パラメータ算出部512が、ヒストリ情報分離装置115が出力するベースバンドのビデオデータから、符号化パラメータを算出し、供給している。スイッチ513は、ステップS48において、組合せ記述子分離部511が出力した記述子に対応して、組合せ記述子分離部511が出力した符号化パラメータ、または符号化パラメータ算出部512が出力した符号化パラメータのいずれかを選択し、符号化装置116に出力する。すなわち、スイッチ513では、組合せ記述子分離部511から供給された符号化パラメータが有効である場合には、組合せ記述子分離部511が出力する符号化パラメータが選択されるが、組合せ記述子分離部511が出力する符号化パラメータが無効であると判定された場合には、符号化パラメータ算出部512がベースバンドビデオを処理することで算出した符号化パラメータが選択される。この選択は、伝送メディアの容量に対応して行われる。
【0399】
符号化装置116は、ステップS49において、スイッチ513から供給された符号化パラメータに基づいて、ヒストリ情報分離装置115より供給されたベースバンドビデオ信号を符号化する。また、ステップS50において、符号化装置116は、符号化したビットストリームに、ヒストリエンコーディング装置117より供給されたuser_dataを多重化し、出力する。
【0400】
このようにして、各履歴によって得られる符号化パラメータの組み合わせが異なっているような場合でも、支障なくトランスコーディングすることが可能となる。
【0401】
このように、履歴情報は、図18に示したように、ビデオストリームのuser_data()関数の一種としてのhistory_stream()(より正確には、converted_history_stream())で伝送される。そのhistory_stream()のシンタックスは、図27に示した通りである。履歴情報の項目の組み合わせを表す記述子(red_bw_flag,red_bw_indicator)、およびMPEGのストリームではサポートされていない項目(num_other_bits,num_mv_bits,num_coef_bits)は、この図27の中のre_coding_stream_info()関数により伝送される。
【0402】
re_coding_stream_info()関数は、図51に示すように、user_data_start_code,re_coding_stream_info_ID,red_bw_flag,red_bw_indicator,marker_bit,num_other_bits,num_mv_bits,num_coef_bitsなどのデータエレメントより構成される。
【0403】
user_data_start_codeは、user_dataが開始することを表すスタートコードである。re_coding_stream_info_IDは、16ビットの整数であり、re_coding_stream_info()関数の識別のために用いられる。その値は、具体的には、”1001 0001
1110 1100”(0x91ec)とされる。
【0404】
red_bw_flagは、1ビットのフラグであり、履歴情報が全ての項目を伝送する場合には0とされ、このフラグの値が1である場合、このフラグに続くred_bw_indicatorを調べることにより、図49に示した5個の組み合わせのうち、どの組み合わせで項目が送られているのかを決定することができる。
【0405】
red_bw_indicatorは、2ビットの整数であり、項目の組み合わせを図52に示すように記述する。
【0406】
即ち、図49に示した5つの組み合わせのうち、組み合わせ1の場合、red_bw_flagは0とされ、組み合わせ2乃至組み合わせ5のとき、red_bw_flagは1とされる。これに対して、red_bw_indicatorは、組み合わせ2の場合0とされ、組み合わせ3の場合1とされ、組み合わせ4の場合2とされ、組み合わせ5の場合3とされる。
【0407】
従って、red_bw_indicatorは、red_bw_flagが1の場合に(組み合わせ2乃至組み合わせ5の場合に)規定される。
【0408】
さらに、図51に示すように、red_bw_flagが0である場合(組み合わせ1の場合)、マクロブロック毎に、marker_bit,num_other_bits,num_mv_bits,num_coef_bitsが記述される。これら4つのデータエレメントは、組み合わせ2乃至組み合わせ5の場合(red_bw_flagが1の場合)規定されない。
【0409】
図39に示したように、picture_data()関数は、1個以上のslice()関数から構成される。しかしながら、組み合わせ5の場合、picture_data()関数を含めて、それ以下のシンタックス要素は伝送されない(図49)。この場合、履歴情報は、picture_typeなどのpicture単位の情報の伝送を意図したものとなる。
【0410】
組み合わせ1乃至組み合わせ4の場合、図40に示したslice()関数が存在する。しかしながら、このslice()関数によって決定されるsliceの位置情報と、元のビットストリームのsliceの位置情報は、履歴情報の項目の組み合わせに依存する。組み合わせ1または組み合わせ2の場合、履歴情報の元となったビットストリームのsliceの位置情報と、slice()関数によって決定されるsliceの位置情報とは、同一である必要がある。
【0411】
図41に示すmacroblock()関数のシンタックス要素は、履歴情報の項目の組み合わせに依存する。macroblock_escape,macroblock_address_increment,macroblock_modes()関数は、常に存在する。しかしながら、macroblock_escapeとmacroblock_address_incrementの情報としての有効性は、組み合わせによって決定される。履歴情報の項目の組み合わせが、組み合わせ1または組み合わせ2の場合、元のビットストリームのskipped_mb情報と同じものが伝送される必要がある。
【0412】
組み合わせ4の場合、motion_vectors()関数は存在しない。組み合わせ1乃至組み合わせ3の場合、macroblock_modes()関数のmacroblock_typeによって、motion_vectors()関数の存在が決定される。組み合わせ3または組み合わせ4の場合には、coded_block_pattern()関数は存在しない。組み合わせ1と組み合わせ2の場合、macroblock_modes()関数のmacroblock_typeによって、coded_block_pattern()関数の存在が決定される。
【0413】
図42に示したmacroblock_modes()関数のシンタックス要素は、履歴情報の項目の組み合わせに依存する。macroblock_typeは、常に存在する。組み合わせが組み合わせ4である場合、flame_motion_type,field_motion_type,dct_typeは存在しない。
【0414】
macroblock_typeより得られるパラメータの情報としての有効性は、履歴情報の項目の組み合わせによって決定される。
【0415】
履歴情報の項目の組み合わせが組み合わせ1または組み合わせ2である場合、macroblock_quantは、元のビットストリームと同じである必要がある。組み合わせ3または組み合わせ4の場合、macroblock_quantは、macroblock()関数内のquantiser_scale_codeの存在を表し、元のビットストリームと同じである必要はない。
【0416】
組み合わせが組み合わせ1乃至組み合わせ3である場合、macroblock_motion_forwardとmacroblock_motion_backwardは、元のビットストリームと同一である必要がある。組み合わせが組み合わせ4または組み合わせ5である場合、その必要はない。
【0417】
組み合わせが組み合わせ1または組み合わせ2である場合、macroblock_patternは、元のビットストリームと同一である必要がある。組み合わせ3の場合、macroblock_patternは、dct_typeの存在を示すのに用いられる。組み合わせが組み合わせ4である場合、組み合わせ1乃至組み合わせ3における場合のような関係は成立しない。
【0418】
履歴情報の項目の組み合わせが組み合わせ1乃至組み合わせ3の場合、macroblock_intraは、元のビットストリームと同一である必要がある。組み合わせ4の場合には、その限りでない。
【0419】
図27のhistory_stream()は、履歴情報を可変長とする場合のシンタックスであるが、図20乃至図26に示すように、固定長のシンタックスとする場合、固定長の履歴情報内に、伝送される項目中のどれが有効であるかを示す情報としての記述子(red_bw_flagとred_bw_indicator)をベースバンド画像に重畳し、伝送するようにする。その結果、この記述子を調べることにより、フィールドとして存在するが、その内容は無効であるといった判断をすることが可能となる。
【0420】
このため、図24に示すように、re_coding_stream_informationとして、user_data_start_code,re_coding_stream_info_ID,red_bw_flag,red_bw_indicator,marker_bitが配置されている。それぞれの意味は、図51における場合と同様である。
【0421】
このように履歴として伝送する符号化パラメータの要素をアプリケーションに応じた組み合わせで伝送するようにすることで、アプリケーションに応じた履歴を適当なデータ量で伝送するようにすることができる。
【0422】
以上のように、履歴情報を可変長符号として伝送する場合、re_coding_stream_info()関数は、図51に示すように構成され、図27に示すように、history_stream()関数の一部として伝送される。これに対して、履歴情報を固定長符号として伝送する場合には、図24に示したように、history_stream()関数の一部として、re_coding_stream_information()が伝送される。図24の例では、re_coding_stream_informationとして、user_data_start_code,re_coding_stream_info_ID,red_bw_flag,red_bw_indicatorが伝送される。
【0423】
また、図48のヒストリ情報多重化装置103が出力するベースバンドの信号中における履歴情報の伝送のために、図53に示すようなRe_Coding information Bus macroblock formatが規定される。このマクロブロックは、16×16(=256)ビットで構成される。そして、そのうちの図53において上から3行目と4行目に示す32ビットが、picrate_elementとされる。このpicrate_elementには、図54乃至図56に示すPicture rate elementsが記述される。図54の上から2行目に1ビットのred_bw_flagが規定されており、また、3行目に3ビットのred_bw_indicatorが規定されている。即ち、これらのフラグred_bw_flag,red_bw_indicatorは、図53のpicrate_elementとして伝送される。
【0424】
図53のその他のデータについて説明すると、SRIB_sync_codeは、このフォーマットのマクロブロックの最初の行が左詰めにアライメントされていることを表すコードであり、具体的には、”11111”に設定される。fr_fl_SRIBは、picture_structureがフレームピクチャ構造の場合(その値が”11”である場合)、1に設定され、Re_Coding Information Bus macroblockが16ラインを超えて伝送されることを表し、picture_structureがフレーム構造ではない場合、0に設定され、Re_Coding Information Busが16ラインを超えて伝送されることを意味する。この機構により、Re_Coding Information Busが、空間的かつ時間的にデコードされたビデオフレームまたはフィールドの対応する画素にロックされる。
【0425】
SRIB_top_field_firstは、元のビットストリームに保持されているtop_field_firstと同じ値に設定され、関連するビデオのRe_Coding Information Busの時間的アライメントをrepeat_first_fieldとともに表している。SRIB_repeat_first_fieldは、元のビットストリームに保持されているrepeat_first_fieldと同じ値に設定される。first fieldのRe_Coding Information Busの内容は、このフラグに示されるように繰り返される必要がある。
【0426】
422_420_chromaは、元のビットストリームが4:2:2または4:2:0のいずれであるかを表す。その値の0は、ビットストリームが4:2:0であり、色差信号のアップサンプリングが、4:2:2のビデオが出力されるように行われたことを表す。その値の0は、色差信号のフィルタリング処理が実行されていないことを表す。
【0427】
rolling_SRIB_mb_refは、16ビットのモジュロ65521を表し、この値は、毎マクロブロック毎にインクリメントされる。この値は、フレームピクチャ構造のフレームに渡って連続している必要がある。さもなくば、この値は、フィールドに渡って連続している必要がある。この値は、0から65520の間の所定の値に初期化される。これにより、レコーダのシステムに、ユニークなRe_Coding Information Busの識別子を組み込むことが許容される。
【0428】
Re_Coding Information Bus macroblockのその他のデータの意味は、上述した通りであるので、ここでは省略する。
【0429】
図57に示すように、図53の256ビットのRe_Coding Information Busのデータは、1ビットずつ、色差データのLSBであるCb[0][0],Cr[0][0],Cb[1][0],Cr[1][0]に配置される。図57に示すフォーマットにより、4ビットのデータを送ることができるので、図53の256ビットのデータは、図57のフォーマットを64(=256/4)個送ることで伝送することができる。
【0430】
本発明のトランスコーディングシステムによれば、過去の符号化処理において生成された符号化パラメータを、現在の符号化処理において再利用するようにしているので、復号処理及び符号化処理を繰り返したとしても画質劣化が発生しない。つまり、復号処理及び符号化処理の繰り返しによる画質劣化の蓄積を低減することができる。
【0431】
本発明のトランスコーディングシステムによれば、過去の符号化処理において生成された符号化パラメータを、現在の符号化処理において生成された符号化ストリームのユーザデータエリアに記述するようにし、生成されたビットストリームは、MPEG規格に準じた符号化ストリームであるので、既存のどのデコーダでも復号処理を行うことができる。さらには、本発明のトランスコーディングシステムによれば、過去の符号化処理における符号化パラメータを伝送するために専用線のようなものを設ける必要がないので、従来のデータストリーム伝送環境をそのまま使用して、過去の符号化パラメータを伝送することができる。
【0432】
本発明のトランスコーディングシステムによれば、過去の符号化処理において生成された符号化パラメータを、選択的に現在の符号化処理において生成された符号化ストリーム中に記述するようにしているので、出力されるビットストリームのビットレートを極端に上げることなく、過去の符号化パラメータを伝送することができる。
【0433】
本発明のトランスコーディングシステムによれば、過去の符号化パラメータと現在の符号化ラメータの中から、現在の符号化処理に最適な符号化パラメータを選択して符号化処理を行うようにしているので、復号処理及び符号化処理を繰り返したとしても、画質劣化が蓄積されることはない。
【0434】
本発明のトランスコーディングシステムによれば、過去の符号化パラメータの中から、ピクチャタイプに応じて現在の符号化処理に最適な符号化パラメータを選択して符号化処理を行うようにしているので、復号処理及び符号化処理を繰り返したとしても、画質劣化が蓄積されることはない。
【0435】
本発明のトランスコーディングシステムによれば、過去の符号化パラメータに含まれるピクチャタイプに基づいて、過去の符号化パラメータを再利用するか否かを決定しているので、最適な符号化処理を行うことができる。
【0436】
なお、カウンタ101、カウンタ113、カウンタ362、およびカウンタ364は、バイナリーカウンタであるとして説明したが、グレーコード(巡回2進符号)のカウンタでもよい。
【0437】
また、ビデオ復号システム11または復号装置102は、ベースバンドデジタルビデオ信号を出力し、ビデオ符号化システム12または符号化装置116は、ベースバンドデジタルビデオ信号を入力するとして説明したが、ビデオ復号システム11または復号装置102は、アナログビデオ信号を出力し、ビデオ符号化システム12または符号化装置116は、アナログビデオ信号を入力するようにしてもよい。
【0438】
なお、カウンタ値は、画像に多重化するとして説明したが、画像に関連付けられている信号、例えば、オーディオ信号に多重化するようにしてもよい。
【0439】
また、上記各処理を行うコンピュータプログラムは、磁気ディスク、光ディスク、光磁気ディスク、半導体メモリなどの記録媒体に記録して提供するほか、インターネット、デジタル衛星などのネットワークを介して伝送し、ユーザの記録媒体に記録させることで提供することができる。
【0440】
【発明の効果】
本発明の再符号化装置及び再符号化方法、並びに、第1の記録媒体に記録されているプログラムによれば、入力された符号化ストリームを再符号化することができ、特に、符号化ストリームとともに、符号化ストリームの過去の符号化処理により生成された過去の符号化パラメータを入力し、画像データに対して施される編集に伴うつなぎ目を識別する情報として、アクセスユニット毎にカウントアップまたはカウントダウンされるカウンタ値である識別情報を生成して、識別情報に基づいて、過去の符号化パラメータおよび生成される現在の符号化パラメータのうち、編集に伴うつなぎ目を含む所定区間では、現在の符号化パラメータを選択し、編集に伴うつなぎ目を含む所定区間以外の区間では、過去の符号化パラメータを選択し、選択した符号化パラメータを利用して再符号化処理が行われるようにしたので、再符号化を繰り返したとしても画質が劣化しない。
本発明の符号化装置及び符号化方法、並びに、第2の記録媒体に記録されているプログラムによれば、入力された画像データを符号化することができ、特に、編集に伴うつなぎ目を識別する識別情報に基づいて、過去の符号化パラメータおよび符号化処理する際に生成する現在の符号化パラメータのうち、編集に伴うつなぎ目を含む所定区間では、現在の符号化パラメータを選択し、編集に伴うつなぎ目を含む所定区間以外の区間では、過去の符号化パラメータを選択し、選択した符号化パラメータを利用して符号化処理が実行されるようにしたので、符号化を繰り返したとしても画質が劣化しない。
本発明の復号装置及び復号方法、並びに、第3の記録媒体に記録されているプログラムによれば、入力された符号化ストリームを復号することができ、特に、入力された過去の符号化パラメータを、復号処理された画像データを再符号化する際に再利用するかを判断するために利用可能な情報として、復号処理された画像データに対して施される編集に伴うつなぎ目を識別する情報であって、アクセスユニット毎にカウントアップまたはカウントダウンされるカウンタ値である識別情報が生成され、復号処理された画像データが、過去の符号化パラメータおよび識別情報とともに出力されるようにしたので、復号された画像データが後段で符号化されるとき、その符号化処理において画質が劣化しない。
【図面の簡単な説明】
【図1】画像の編集を説明する図である。
【図2】 VBV Bufferのオーバーフローを説明する図である。
【図3】本発明を適用したトランスコーディングシステム1の構成を示すブロック図である。
【図4】図3のトランスコーディングシステム1のより詳細な構成を示すブロック図である。
【図5】図3の復号装置102に内蔵されるデコーダ251の構成を示すブロック図である。
【図6】マクロブロックの画素を説明する図である。
【図7】符号化パラメータが記録される領域を説明する図である。
【図8】 Ancillary Data Packetの例を示す図である。
【図9】カウンタ値を分割して格納するデータを説明する図である。
【図10】カウンタ値を分割して格納するデータを説明する図である。
【図11】カウンタ値を分割して格納するデータを説明する図である。
【図12】ベースバンドデジタルビデオ信号のLSBに多重化されている符号化パラメータにカウンタ値を多重化するときの、ヒストリ情報多重化装置103およびカウンタ値多重化装置105に対応する機能の構成を説明する図である。
【図13】ベースバンドデジタルビデオ信号の輝度または色差のブランキング部分に多重化されている符号化パラメータにカウンタ値を多重化するときの、ヒストリ情報多重化装置103およびカウンタ値多重化装置105に対応する機能の構成を説明する図である。
【図14】図3の符号化装置116に内蔵されるエンコーダ301の構成を示すブロック図である。
【図15】図3のトランスコーディングシステム1が実際に使用される状態を示す図である。
【図16】密結合されたトランスコーディングシステム1の構成を示すブロック図である。
【図17】カウンタ362の構成例を示す図である。
【図18】ビデオシーケンスのストリームのシンタックスを説明する図である。
【図19】図18のシンタックスの構成を説明する図である。
【図20】固定長の履歴情報を記録するhistory_stream()のシンタックスを説明する図である。
【図21】固定長の履歴情報を記録するhistory_stream()のシンタックスを説明する図である。
【図22】固定長の履歴情報を記録するhistory_stream()のシンタックスを説明する図である。
【図23】固定長の履歴情報を記録するhistory_stream()のシンタックスを説明する図である。
【図24】固定長の履歴情報を記録するhistory_stream()のシンタックスを説明する図である。
【図25】固定長の履歴情報を記録するhistory_stream()のシンタックスを説明する図である。
【図26】固定長の履歴情報を記録するhistory_stream()のシンタックスを説明する図である。
【図27】可変長の履歴情報を記録するhistory_stream()のシンタックスを説明する図である。
【図28】 sequence_header()のシンタックスを説明する図である。
【図29】 sequence_extension()のシンタックスを説明する図である。
【図30】 extension_and_user_data()のシンタックスを説明する図である。
【図31】 user_data()のシンタックスを説明する図である。
【図32】 group_of_pictures_header()のシンタックスを説明する図である。
【図33】 picture_header()のシンタックスを説明する図である。
【図34】 picture_coding_extension()のシンタックスを説明する図である。
【図35】 extension_data()のシンタックスを説明する図である。
【図36】 quant_matrix_extension()のシンタックスを説明する図である。
【図37】 copyright_extension()のシンタックスを説明する図である。
【図38】 picture_display_extension()のシンタックスを説明する図である。
【図39】 picture_data()のシンタックスを説明する図である。
【図40】 slice()のシンタックスを説明する図である。
【図41】 macroblock()のシンタックスを説明する図である。
【図42】 macroblock_modes()のシンタックスを説明する図である。
【図43】 motion_vectors(s)のシンタックスを説明する図である。
【図44】 motion_vector(r,s)のシンタックスを説明する図である。
【図45】Iピクチャに対するmacroblock_typeの可変長符号を説明する図である。
【図46】Pピクチャに対するmacroblock_typeの可変長符号を説明する図である。
【図47】Bピクチャに対するmacroblock_typeの可変長符号を説明する図である。
【図48】本発明を適用したトランスコーディングシステム1の他の構成を示すブロック図である。
【図49】履歴情報の項目の組み合わせを説明する図である。
【図50】図48のトランスコーディングシステム1の動作を説明するフローチャートである。
【図51】 re_coding_stream_info()のシンタックスを説明する図である。
【図52】 red_bw_flag,red_bw_indicatorを説明する図である。
【図53】 Re_Coding Information Bus macroblock formationを説明する図である。
【図54】 Picture rate elementsを説明する図である。
【図55】 Picture rate elementsを説明する図である。
【図56】 Picture rate elementsを説明する図である。
【図57】 Re_Coding Information Busが記録される領域を説明する図である。
【符号の説明】
1 トランスコーディングシステム, 11 ビデオ復号システム, 12 ビデオ符号化システム, 101 カウンタ, 102 復号装置, 103 ヒストリ情報多重化装置, 104 ヒストリデコーディング装置, 105 カウンタ値多重化装置, 111 カウンタ値分離装置, 112 フォーマット変換装置, 113 カウンタ, 114 比較装置, 115 ヒストリ情報分離装置, 116 符号化装置, 117 ヒストリエンコーディング装置, 201 ユーザデータデコーダ, 202 コンバータ, 203 ヒストリVLD, 211 ヒストリVLC, 212 コンバータ, 213 ユーザデータフォーマッタ, 251 デコーダ, 261 受信バッファ, 262 可変長復号回路, 263 逆量子化回路, 264 IDCT回路, 265演算器, 266 動き補償回路, 267 フレームメモリ, 271 タイミング信号発生装置, 272 カウンタ値フォーマット変換装置, 273符号化パラメータフォーマット変換装置, 274 シリアル−パラレル変換装置, 275 スイッチ, 281 タイミング信号発生回路, 282 スイッチ, 301 エンコーダ, 310 動きベクトル検出回路, 311 フレームメモリ, 312 Frame/Field予測モード切り替え回路, 313 演算器, 315 Frame/FieldDCTモード切り替え回路, 316 DCT回路,317 量子化回路, 318 可変長符号化回路, 319 送信バッファ, 320 逆量子化回路, 321 IDCT回路, 322 演算器, 323フレームメモリ, 324 動き補償回路, 330 コントローラ, 351 SDTI, 361 フォーマット変換装置, 362 カウンタ, 363 比較装置, 364 カウンタ, 365 フォーマット変換装置, 381 カウンタ, 382 AND回路

Claims (23)

  1. 画像データを符号化処理した符号化ストリームを再符号化処理する再符号化装置において、
    前記符号化ストリームに対する過去の符号化処理において生成された過去の符号化パラメータを、前記符号化ストリームとともに入力する入力手段と、
    前記入力手段により入力された前記符号化ストリームを復号処理するとともに、復号処理された画像データに対して施される編集に伴うつなぎ目を識別する情報として、アクセスユニット毎にカウントアップまたはカウントダウンされるカウンタ値である識別情報を生成し、復号処理された画像データを、前記入力手段により入力された前記過去の符号化パラメータおよび生成された前記識別情報とともに出力する復号手段と、
    前記復号手段により復号された前記画像データを再符号化処理して再符号化ストリームを生成する再符号化手段と、
    前記復号手段により生成された前記識別情報に基づいて、前記復号手段により出力された前記過去の符号化パラメータおよび再符号化処理する際に生成する現在の符号化パラメータのうち、編集に伴うつなぎ目を含む所定区間では、前記現在の符号化パラメータを選択し、編集に伴うつなぎ目を含む所定区間以外の区間では、前記過去の符号化パラメータを選択し、選択した符号化パラメータを利用して再符号化処理するように、前記再符号化手段を制御する制御手段と
    を備える再符号化装置。
  2. 前記アクセスユニットはフレームまたはフィールドである 請求項1に記載の再符号化装置。
  3. 前記復号手段は、前記アクセスユニットに同期する同期信号を生成するとともに、前記同期信号に基づいてカウントアップまたはカウントダウンを実行することにより得られるカウンタ値を基に、前記識別情報を生成する
    請求項1に記載の再符号化装置。
  4. 前記過去の符号化パラメータは、前記符号化ストリームに多重化されており、
    前記復号手段は、前記符号化ストリームから前記過去の符号化パラメータを取得する 請求項1に記載の再符号化装置。
  5. 前記復号手段は、前記識別情報を前記画像データに多重化して出力する
    請求項1に記載の再符号化装置。
  6. 前記復号手段は、前記識別情報をアンシラリデータパケットに格納して、前記アンシラリデータパケットを前記画像データに多重化して出力する
    請求項5に記載の再符号化装置。
  7. 前記復号手段は、前記識別情報を前記画像データのブランキング部分に多重化して出力する
    請求項6に記載の再符号化装置。
  8. 前記復号手段は、前記過去の符号化パラメータを前記画像データに多重化して出力する
    請求項1に記載の再符号化装置。
  9. 前記復号手段は、前記過去の符号化パラメータを前記画像データのブランキング部分に多重化して出力する
    請求項8に記載の再符号化装置。
  10. 前記復号手段は、前記識別情報を、前記画像データのブランキング部分に多重化されている前記過去の符号化パラメータに多重化して出力する
    請求項9に記載の再符号化装置。
  11. 前記再符号化手段により生成された前記再符号化ストリームを出力する出力手段
    を更に備える請求項1に記載の再符号化装置。
  12. 前記再符号化手段により利用された前記過去の符号化パラメータおよび前記現在の符号化パラメータのうちのいずれかを、前記再符号化ストリームとともに出力する出力手段
    を更に備える請求項1に記載の再符号化装置。
  13. 前記再符号化手段により利用された前記過去の符号化パラメータおよび前記現在の符号化パラメータのうちのいずれかを、前記再符号化ストリームに多重化する多重化手段を更に備え、
    前記出力手段は、前記多重化手段により前記過去の符号化パラメータおよび前記現在の符号化パラメータのうちのいずれかが多重化された前記再符号化ストリームを出力する 請求項12に記載の再符号化装置。
  14. 前記再符号化手段は、ビットレート、または、GOP構造を変更して再符号化処理を行う
    請求項1に記載の再符号化装置。
  15. 前記再符号化手段は、シーケンスレイヤ、GOPレイヤ、ピクチャレイヤ、スライスレイヤ、および、マクロブロックレイヤを有するMPEG方式で再符号化を行う
    請求項1に記載の再符号化装置。
  16. 画像データを符号化処理した符号化ストリームを再符号化処理する再符号化方法において、
    前記符号化ストリームに対する過去の符号化処理により生成された過去の符号化パラメータを、前記符号化ストリームとともに入力する入力工程と、
    前記入力工程により入力された前記符号化ストリームを復号処理するとともに、復号処理された画像データに対して施される編集に伴うつなぎ目を識別する情報として、アクセスユニット毎にカウントアップまたはカウントダウンされるカウンタ値である識別情報を生成し、復号処理された画像データを、前記入力工程により入力された前記過去の符号化パラメータおよび生成された前記識別情報とともに出力する復号工程と、
    前記復号工程により復号された前記画像データを再符号化処理して再符号化ストリームを生成する再符号化工程と、
    前記復号工程により生成された前記識別情報に基づいて、前記復号工程により出力された前記過去の符号化パラメータおよび再符号化処理する際に生成する現在の符号化パラメータのうち、編集に伴うつなぎ目を含む所定区間では、前記現在の符号化パラメータを選択し、編集に伴うつなぎ目を含む所定区間以外の区間では、前記過去の符号化パラメータを選択し、選択した符号化パラメータを利用して再符号化処理するように、前記再符号化工程の再符号化処理を制御する制御工程と
    を含む再符号化方法。
  17. 画像データを符号化処理した符号化ストリームを再符号化する処理をコンピュータに実行させるプログラムにおいて、
    前記符号化ストリームに対する過去の符号化処理により生成された過去の符号化パラメータを、前記符号化ストリームとともに入力する入力工程と、
    前記入力工程により入力された前記符号化ストリームを復号処理するとともに、復号処理された画像データに対して施される編集に伴うつなぎ目を識別する情報として、アクセスユニット毎にカウントアップまたはカウントダウンされるカウンタ値である識別情報を生成し、復号処理された画像データを、前記入力工程により入力された前記過去の符号化パラメータおよび生成された前記識別情報とともに出力する復号工程と、
    前記復号工程により復号された前記画像データを再符号化処理して再符号化ストリームを生成する再符号化工程と、
    前記復号工程により生成された前記識別情報に基づいて、前記復号工程により出力された前記過去の符号化パラメータおよび再符号化処理する際に生成する現在の符号化パラメータのうち、編集に伴うつなぎ目を含む所定区間では、前記現在の符号化パラメータを選択し、編集に伴うつなぎ目を含む所定区間以外の区間では、前記過去の符号化パラメータを選択し、選択した符号化パラメータを利用して再符号化処理するように、前記再符号化工程の再符号化処理を制御する制御工程と
    を含む処理をコンピュータに実行させるプログラムを記録した記録媒体。
  18. 符号化ストリームを復号して得られた画像データを符号化処理する符号化装置において、
    前記符号化ストリームに対する過去の符号化処理において生成された過去の符号化パラメータおよび前記画像データに対して施された編集に伴うつなぎ目を識別する識別情報を、前記画像データとともに入力する入力手段と、
    前記入力手段により入力された前記画像データを符号化処理して符号化ストリームを生成する符号化手段と、
    前記入力手段により入力された前記識別情報に基づいて、前記入力手段により入力された前記過去の符号化パラメータおよび符号化処理する際に生成する現在の符号化パラメータのうち、編集に伴うつなぎ目を含む所定区間では、前記現在の符号化パラメータを選択し、編集に伴うつなぎ目を含む所定区間以外の区間では、前記過去の符号化パラメータを選択し、選択した符号化パラメータを利用して符号化処理するように、前記符号化手段を制御する制御手段と
    を備える符号化装置。
  19. 符号化ストリームを復号して得られた画像データを符号化処理する符号化方法において、
    前記符号化ストリームに対する過去の符号化処理において生成された過去の符号化パラメータおよび前記画像データに対して施された編集に伴うつなぎ目を識別する識別情報を、前記画像データとともに入力する入力工程と、
    前記入力工程により入力された前記画像データを符号化処理して符号化ストリームを生成する符号化工程と、
    前記入力工程により入力された前記識別情報に基づいて、前記入力工程により入力された前記過去の符号化パラメータおよび符号化処理する際に生成する現在の符号化パラメータのうち、編集に伴うつなぎ目を含む所定区間では、前記現在の符号化パラメータを選択し、編集に伴うつなぎ目を含む所定区間以外の区間では、前記過去の符号化パラメータを選択し、選択した符号化パラメータを利用して符号化処理するように、前記符号化工程の符号化処理を制御する制御工程と
    を含む符号化方法。
  20. 符号化ストリームを復号して得られた画像データを符号化する処理をコンピュータに実行させるプログラムにおいて、
    前記符号化ストリームに対する過去の符号化処理において生成された過去の符号化パラメータおよび前記画像データに対して施された編集に伴うつなぎ目を識別する識別情報を、前記画像データとともに入力する入力工程と、
    前記入力工程により入力された前記画像データを符号化処理して符号化ストリームを生成する符号化工程と、
    前記入力工程により入力された前記識別情報に基づいて、前記入力工程により入力された前記過去の符号化パラメータおよび符号化処理する際に生成する現在の符号化パラメータのうち、編集に伴うつなぎ目を含む所定区間では、前記現在の符号化パラメータを選択し、編集に伴うつなぎ目を含む所定区間以外の区間では、前記過去の符号化パラメータを選択し、選択した符号化パラメータを利用して符号化処理するように、前記符号化工程の符号化処理を制御する制御工程と
    を含む処理をコンピュータに実行させるプログラムを記録した記録媒体。
  21. 画像データを符号化処理した符号化ストリームを復号処理する復号装置において、
    前記符号化ストリームに対する過去の符号化処理において生成された過去の符号化パラメータを、前記符号化ストリームとともに入力する入力手段と、
    前記入力手段により入力された前記符号化ストリームを復号処理するとともに、前記入力手段により入力された前記過去の符号化パラメータを、復号処理された画像データを再符号化する際に再利用するかを判断するために利用可能な情報として、復号処理された画像データに対して施される編集に伴うつなぎ目を識別する情報であって、アクセスユニット毎にカウントアップまたはカウントダウンされるカウンタ値である識別情報を生成し、復号処理された前記画像データを、前記入力手段により入力された前記過去の符号化パラメータおよび生成された前記識別情報とともに出力する復号手段と
    を備える復号装置。
  22. 画像データを符号化処理した符号化ストリームを復号処理する復号方法において、
    前記符号化ストリームに対する過去の符号化処理において生成された過去の符号化パラメータを、前記符号化ストリームとともに入力する入力工程と、
    前記入力工程により入力された前記符号化ストリームを復号処理するとともに、前記入力工程により入力された前記過去の符号化パラメータを、復号処理された画像データを再符号化する際に再利用するかを判断するために利用可能な情報として、復号処理された画像データに対して施される編集に伴うつなぎ目を識別する情報であって、アクセスユニット毎にカウントアップまたはカウントダウンされるカウンタ値である識別情報を生成し、復号処理された前記画像データを、前記入力工程により入力された前記過去の符号化パラメータおよび生成された前記識別情報とともに出力する復号工程と
    を含む復号方法。
  23. 画像データを符号化処理した符号化ストリームを復号する処理をコンピュータに実行させるプログラムにおいて、
    前記符号化ストリームに対する過去の符号化処理において生成された過去の符号化パラメータを、前記符号化ストリームとともに入力する入力工程と、
    前記入力工程により入力された前記符号化ストリームを復号処理するとともに、前記入力工程により入力された前記過去の符号化パラメータを、復号処理された画像データを再符号化する際に再利用するかを判断するために利用可能な情報として、復号処理された画像データに対して施される編集に伴うつなぎ目を識別する情報であって、アクセスユニット毎にカウントアップまたはカウントダウンされるカウンタ値である識別情報を生成し、復号処理された前記画像データを、前記入力工程により入力された前記過去の符号化パラメータおよび生成された前記識別情報とともに出力する復号工程と
    を含む処理をコンピュータに実行させるプログラムを記録した記録媒体。
JP34633099A 1999-12-06 1999-12-06 再符号化装置および再符号化方法、符号化装置および符号化方法、復号装置および復号方法、並びに、記録媒体 Expired - Fee Related JP3874153B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP34633099A JP3874153B2 (ja) 1999-12-06 1999-12-06 再符号化装置および再符号化方法、符号化装置および符号化方法、復号装置および復号方法、並びに、記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP34633099A JP3874153B2 (ja) 1999-12-06 1999-12-06 再符号化装置および再符号化方法、符号化装置および符号化方法、復号装置および復号方法、並びに、記録媒体

Publications (2)

Publication Number Publication Date
JP2001169278A JP2001169278A (ja) 2001-06-22
JP3874153B2 true JP3874153B2 (ja) 2007-01-31

Family

ID=18382688

Family Applications (1)

Application Number Title Priority Date Filing Date
JP34633099A Expired - Fee Related JP3874153B2 (ja) 1999-12-06 1999-12-06 再符号化装置および再符号化方法、符号化装置および符号化方法、復号装置および復号方法、並びに、記録媒体

Country Status (1)

Country Link
JP (1) JP3874153B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7505485B2 (en) 2002-01-22 2009-03-17 Microsoft Corporation Methods and systems for start code emulation prevention and data stuffing
US7425986B2 (en) 2002-03-29 2008-09-16 Canon Kabushiki Kaisha Conversion apparatus for image data delivery
CN100380976C (zh) * 2002-04-26 2008-04-09 日本电气株式会社 运动画面数据的代码转换/发送方法和装置和运动画面数据的代码转换/接收方法和装置
CN1739299A (zh) * 2003-01-20 2006-02-22 松下电器产业株式会社 图像编码方法
JP4329416B2 (ja) * 2003-06-06 2009-09-09 ソニー株式会社 データ処理装置及びデータ処理方法、編集処理装置及び編集処理方法、プログラム、記録媒体
JP4232588B2 (ja) 2003-09-19 2009-03-04 ソニー株式会社 画像処理装置および画像処理方法、並びに、プログラム
JP4573511B2 (ja) * 2003-10-15 2010-11-04 ルネサスエレクトロニクス株式会社 トランスコーダ、トランスコーディング方法、データ記録装置及び方法、並びに放送データ受信・記録装置
JP4496499B2 (ja) * 2006-12-14 2010-07-07 ソニー株式会社 ストリーム変換装置およびストリーム変換方法、プログラム、並びに記録媒体
US10271069B2 (en) 2016-08-31 2019-04-23 Microsoft Technology Licensing, Llc Selective use of start code emulation prevention

Also Published As

Publication number Publication date
JP2001169278A (ja) 2001-06-22

Similar Documents

Publication Publication Date Title
JP3694888B2 (ja) 復号装置および方法、符号化装置および方法、情報処理装置および方法、並びに記録媒体
JP3672185B2 (ja) コーディングシステム及びこれを用いた装置並びに記録媒体
KR100729541B1 (ko) 부호화 히스토리 정보를 이용하는 트랜스코딩 시스템
JP3724205B2 (ja) 復号装置および方法、並びに記録媒体
JP3874153B2 (ja) 再符号化装置および再符号化方法、符号化装置および符号化方法、復号装置および復号方法、並びに、記録媒体
JP2005304065A (ja) 復号装置および復号方法、符号化装置および符号化方法、情報処理装置および情報処理方法、並びに、記録媒体
JP3724204B2 (ja) 符号化装置および方法、並びに記録媒体
JP3724203B2 (ja) 符号化装置および方法、並びに記録媒体
JP3890838B2 (ja) 符号化ストリーム変換装置、および、符号化ストリーム変換方法、並びに、記録媒体
JP4139983B2 (ja) 符号化ストリーム変換装置、および、符号化ストリーム変換方法、並びに、ストリーム出力装置、および、ストリーム出力方法
JP4016290B2 (ja) ストリーム変換装置およびストリーム変換方法、符号化装置および符号化方法、並びに、記録媒体
JP4539637B2 (ja) ストリーム記録装置およびストリーム記録方法、ストリーム再生装置およびストリーム再生方法、ストリーム伝送装置およびストリーム伝送方法、並びに、プログラム格納媒体
JP4543321B2 (ja) 再生装置及び方法
JP4482811B2 (ja) 記録装置及び方法
JP3817951B2 (ja) ストリーム伝送装置および方法、並びに記録媒体
JP4016294B2 (ja) 符号化装置および符号化方法、ストリーム変換装置およびストリーム変換方法、並びに記録媒体
JP4478630B2 (ja) 復号装置および復号方法、プログラム、並びに記録媒体
JP3817952B2 (ja) 再符号化装置および方法、符号化装置および方法、並びに記録媒体
JP3724202B2 (ja) 画像データ処理装置および方法、並びに記録媒体
JP4016349B2 (ja) ストリーム変換装置およびストリーム変換方法、並びに、記録媒体
JP4016347B2 (ja) ストリーム変換装置およびストリーム変換方法、並びに、記録媒体
JP4016293B2 (ja) 符号化装置および符号化方法、並びに記録媒体
JP4016348B2 (ja) ストリーム変換装置およびストリーム変換方法、並びに、記録媒体
JP2007124703A (ja) 復号装置および復号方法、伝送装置および伝送方法、並びに記録媒体
JP2007259492A (ja) 情報処理装置および方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20020514

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050324

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050329

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050530

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060123

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060818

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060831

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060904

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060904

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061005

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061018

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091102

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101102

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111102

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121102

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees