JP3867342B2 - 符号化装置および方法、伝送方法、並びに信号記録媒体 - Google Patents

符号化装置および方法、伝送方法、並びに信号記録媒体 Download PDF

Info

Publication number
JP3867342B2
JP3867342B2 JP11159997A JP11159997A JP3867342B2 JP 3867342 B2 JP3867342 B2 JP 3867342B2 JP 11159997 A JP11159997 A JP 11159997A JP 11159997 A JP11159997 A JP 11159997A JP 3867342 B2 JP3867342 B2 JP 3867342B2
Authority
JP
Japan
Prior art keywords
access unit
virtual
video
size
video stream
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP11159997A
Other languages
English (en)
Other versions
JPH1083632A (ja
Inventor
幹太 安田
勝己 田原
義明 大石
愼治 根岸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP11159997A priority Critical patent/JP3867342B2/ja
Publication of JPH1083632A publication Critical patent/JPH1083632A/ja
Application granted granted Critical
Publication of JP3867342B2 publication Critical patent/JP3867342B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、動画像信号及び音響信号などを、例えば光磁気ディスクや磁気テープなどの記録媒体に記録し、これを再生してディスプレイなどに表示したり、テレビ会議システム、テレビ電話システム、放送用機器など、動画像信号及び音響信号などを伝送路を介して送信側から受信側に伝送し、受信側において、これを受信し、表示する場合などに用いて好適な、符号化装置および方法、伝送方法、並びに信号記録媒体に関する。
【0002】
【従来の技術】
映像信号や音声信号などを、光磁気ディスクや磁気テープなどの記録媒体に記録し、それらを再生してディスプレイなどに表示したり、テレビ会議システム、テレビ電話システムなどにおいて、送信側が、所定の伝送路を介して、それらの信号を伝送し、受信側が、それらの信号を受信し、表示する場合などにおいて、最近、これらの信号は、A/D変換した後、いわゆるMPEG(Moving Picture Experts Group)方式で符号化して取り扱われることが多くなりつつある。
【0003】
ここで、上記MPEGとは、ISO/IEC JTC1/SC29(International Organization for Standardization / International Electrotechnical Commission, Joint Technical Commitee 1 / Sub Commitee 29:国際標準化機構/国際電気標準会議、合同技術委員会1/専門部会29)の蓄積用動画像符号化の検討組織の略称であり、MPEG1標準としてISO11172が、MPEG2標準としてISO13818がある。これらの国際標準において、マルチメディア多重化の項目でISO11172-1及びISO13818-1が、映像の項目でISO11172-2及びISO13818-2が、また音声の項目でISO11172-3及びISO13818-3がそれぞれ標準化されている。
【0004】
通常、映像と音声は同時に扱うので、一般的なシステムにおいては、映像信号、音声信号および、関連するデータといった複数のデータをまとめて(多重化して)記録・伝送する。そして、再生するときに、多重化されたデータを、映像信号や音声信号といったデータの種類別に分離した後復号して、それらのデータを同期させて再生する。
【0005】
データを多重化する場合、所定の数の映像信号および音声信号を個別に符号化し、各信号に対する符号化ストリームを生成した後、それらの符号化ストリームが多重化される。
【0006】
MPEGシステム(ISO/IEC13818-1 あるいは ISO/IEC11172-1)では、この多重化ストリームを規定している。以下にこのMPEGシステムにおけるデコーダモデルおよび多重化ストリームの構造について説明する。ここでは説明を簡単にするためMPEG2(ISO/IEC13818-1)プログラムストリームおよびMPEG1システム(ISO/IEC11172-1)ストリームについて述べるが、MPEG2システムのトランスポートストリーム(ISO/IEC13818-1)もMPEG2プログラムストリームと同様の原理によりデコードされる。
【0007】
MPEGシステムでは、仮想的なデコーダのモデル(STD:システムターゲットデコーダ)が規定されていて、多重化システムストリームは、このSTDにおいて正しく、すなわちバッファの破綻をきたさないように、復号されるものとして定義されている。
【0008】
ここでこのSTD(システムターゲットデコーダ)の動作を説明する。図6はSTD(システムターゲットデコーダ)の一例の概略構成を表し、図7(A)及び(B)は、MPEG2システムのプログラムストリームの構造及びMPEG2トランスポートストリームの構造をそれぞれ示す。
【0009】
STDは内部にシステムタイムクロック(STC:System Time Clock)16と呼ばれる基準時計を持っている。このSTC16はある時間間隔で増加している。一方MPEG2システムのプログラムストリームは複数のアクセスユニットで構成されており、そのストリームには、図7に示すようにシステムクロックリファレンス(SCR:System Clock Reference)と呼ばれる時間情報がパックヘッダとよばれる領域にエンコードされている。デコーダはSTCがSCRに等しくなるとその該当するパック、すなわちプログラムストリームの構成単位を、あるレート、すなわちパックヘッダの mux_rate field にエンコードされている値で読み出す。
【0010】
読み出されたパックは直ちにその構成単位であるパケットの種類に応じて、分離器11で各エレメンタリーストリーム、すなわちビデオストリームやオーディオストリームなどに分離され、各エレメンタリーストリームのデコーダバッファ、すなわちビデオバッファ12やオーディオバッファ14に入力される。
【0011】
パケットヘッダには、図7に示すように、デコーディングタイムスタンプ(DTS:Decoding Time Stamp)、プレゼンテーションタイムスタンプ(PTS:Presentation Time Stamp)と呼ばれる時間情報を記述するフィールドが用意されていて、それぞれエレメンタリーストリームのデコード単位(アクセスユニット)のデコードされるべき時刻と表示されるべき時刻を表している。特に、PTSは、アクセスユニットが表示される時刻を表しており、DTSは、アクセスユニットが復号される時刻を表している。ただし、DTS=PTSとなるアクセスユニットについては、PTSの値のみエンコードされる。デコーダバッファ12に入力されたアクセスユニットは、このSTCの値がDTSの値に等しくなったときにバッファから引き抜かれて各デコーダ、すなわちビデオデコーダ13やオーディオデコーダ15に入力されデコードされる。
【0012】
このようにSTD(システムターゲットデコーダ)においては、同じ基準時計STC16に対するデコード時刻の情報が、各エレメンタリーストリームのパケットにエンコードされているため、ビデオ、オーディオ、その他のデータを同期させて再生することが可能となっている。
【0013】
また、多重化においては、このSTDの各エレメンタリーストリームのデコーダバッファがオーバーフローおよびアンダーフローしないように、STDへのパックの供給時刻SCR(システムクロックリファレンス)が決定され、アクセスユニットをパケット化することが要求される。ここで、上記オーバーフローとは、バッファに供給されるデータがバッファ容量を越えてしまうことを意味し、アンダーフローは、アクセスユニットがデコードされるべき時刻にバッファにまだ到達していない状態を示す。このようなデコード時のバッファの破綻なく、上記オーバーフローやアンダーフローを生じさせないように、複数のビットストリームを多重化する技術を、本件出願人は、先に特願平7−341951号の明細書および図面において提案している。
【0014】
以上は、図7の(A)のMPEG2プログラムストリームについての説明であるが、図7の(B)のMPEG2トランスポートストリームについても同様な構造を持つ。図7の(B)のトランスポートストリームヘッダは、上記ISO/IEC13818-1において規定される、同期バイト(sync_byte) から巡回カウンタ(continuity_counter)までの4バイトのことである。クロックリファレンス及びデコード時刻は、図7の(A)のMPEGプログラムストリームの場合と同様である。
【0015】
MPEGビデオにはGOP(Group of Pictures :グループオブピクチャ)という構造があり、この単位で独立して、すなわち該当するGOPをデコードするのに前のGOPに属するピクチャを必要としないように、エンコーディングを行うことができる。よって複数のビデオストリームがある時、GOPを切り替えの単位として複数のビデオストリームを切り替えることができる。
【0016】
いま、上記の条件、すなわちビデオストリームがGOPで閉じている条件でエンコードされている2種類の異なるプログラムストリームがあって、それぞれを独立に多重化を行う場合を考える。ただし、プログラムストリームの切り替えを可能とするために、GOPの境界が同一のビデオパケット中に含まれることがないように制約を与える。
【0017】
図8は、このような条件で2本のプログラムストリームのそれぞれを独立に多重化する場合の例及びその2つのプログラムストリームを選択的に切り換えて出力する場合の例を示している。図8の(a)に示すように、プログラムストリームPS0のパックPK0とパックPK1にビデオストリームV0のGOP0のデータが、プログラムストリームPS0のパックPK2とパックPK3にビデオV0のGOP1のデータが多重化されている。また、図8の(b)に示すように、プログラムストリームPS1のパックPK0、PK1、PK2にビデオV1のGOP0のデータが、プログラムストリームPS1のパックPK3にビデオV1のGOP1のデータが多重化されている。
【0018】
これらの図8の(a)、(b)に示すような別々に多重化された2本のプログラムストリームが1つの記録媒体に記録されていて、例えば図6の読取装置10が選択的にプログラムストリームをパック単位で切り替えて出力することができるシステムを想定するとき、上述したGOP(グループオブピクチャ)の独立性により、プログラムストリームを切り替え点において切り替えたとき、ビデオ再生を途切れさせることなく連続的に再生することが可能となる。
【0019】
例えば、図8の(c)に示すように、プログラムストリームPS0のパックPK0、PK1を読み出した後、続けてプログラムストリームPS1のパックPK3を読み出せば、図6のビデオバッファ12には、ビデオV0のGOP0のデータが入力された後、ビデオV1のGOP1のデータが入力されるので、ビデオV0からビデオV1に映像が切り替わっても連続的に再生することが可能になる。この例では2本のプログラムストリームが記録媒体に記録されているとしたが、2本以上でも同様である。以下これらのGOPの切替え点のパックをエントリーポイントと呼ぶ。
【0020】
【発明が解決しようとする課題】
ところで、記録媒体に複数のプログラムストリームが記録されていて、読取装置がエントリーポイントにおいて読み出すプログラムストリームを選択的に切り替える機能を持っているとき、媒体に記録される複数のプログラムストリームの多重化を、各々独立に通常の方法で行うと、デコーダで正しくデコードできない場合が生じる。これは次の2つの理由による。
【0021】
理由1.SCR(システムクロックリファレンス)の不整合
パックヘッダにエンコードされるSCRは、デコーダへの読み出し開始時間を示すので、読み出されてデコーダに入力される2つの隣接するパックについて、
(後のパックにエンコードされているSCR)
≧(前のパックにエンコードされているSCR)
+(前パックの転送時間)
すなわち、
(後のパックにエンコードされているSCR)
≧(前のパックにエンコードされているSCR)
+(前パックの大きさ)/(読み出しレート)
の条件を満足しなければならない。従って、プログラムストリームPS0をパックPK0,PK1,PK2,PK3,…と順に読み出す場合には上記の条件が成り立っても(個々のプログラムストリームは上記条件が成り立つように多重化されている)、図8の(c)に示すように、プログラムストリームPS0をパックPK0,PK1と読み出した後に、エントリーポイントでプログラムストリームを切り替えて、プログラムストリームPS1のパックPK3を読み出してデコーダに入力しようとすると、プログラムストリームPS0とプログラムストリームPS1の多重化はそれぞれ独立に行われているので、上記の条件を満足できなくなること、すなわち前のパックを読み終わったときに、STC(システムタイムクロック)が後のパックにエンコードされているSCR(システムクロックリファレンス)の値より大きくなり、後のパックを読み出すことができなくなることがある。
【0022】
理由2.バッファの破綻
読取装置が読み出すプログラムストリームの切り替えを行うと、結果としてデコーダバッファの破綻(オーバーフロー、アンダーフロー)が生じる可能性がある。
【0023】
この理由2を、図9を参照しながら説明する。図9は、ビデオデコーダバッファにおけるデータの占有量の遷移を表している。ここで図9の(a)は、例えば図8の(a)に示すようなプログラムストリームPS0をパックPK0,PK1,PK2,PK3,…と順に読み出した時のバッファの状態であり、(ア)はビデオV0のGOP0のデータ、(イ)はビデオV0のGOP1のデータである。図9の(b)は、例えば図8の(b)に示すようなプログラムストリームPS1をパックPK0,PK1,PK2,PK3,…と順に読み出した時のバッファの状態であり、(ウ)はビデオV1のGOP0のデータ、(エ)はビデオV1のGOP1のデータである。図9の(a),(b)ともに、それぞれ連続したプログラムストリームであるから、当然バッファは破綻することなく多重化されているはずである。ところが、この例のように多重化されたプログラムストリームを、例えば図8の(c)に示すように、読取装置がプログラムストリームPS0のパックPK0,PK1と読んだ後、ビデオを切り替えるために、プログラムストリームPS1のパックPK3を読んだとすると、バッファにはビデオV0のGOP0のデータが入力された後ビデオV1のGOP1のデータが供給されるので、バッファの占有量の遷移は、図9の(c)のようになる。ここで(オ)はビデオV0のGOP0のデータであり、(カ)はビデオV1のGOP1のデータである。
【0024】
ビデオV1のGOP1のデータをデコードするときに、読み出しはSCR(システムクロックリファレンス)によって、バッファからの引き抜きはDTS(デコーディングタイムスタンプ)によって決まり、データの入力および引き抜きタイミングは(カ)と同様になるので、図9の(c)のようにバッファのオーバーフローが発生してしまう。
【0025】
本発明は、上述した実情に鑑みてなされたものであり、アクセスユニットの読みだしタイミングとそのデコードされた後のバッファの状態を複数のプログラムストリームについて同じにすることにより、複数のプログラムストリームをエントリーポイントにおいて切り替えて読み出したときに、SCRの不整合が発生することなく、またバッファの破綻が起こらないようなプログラムストリームを生成し得るような符号化装置および方法、伝送方法、並びにこれらの方法や装置により得られたディジタル信号が記録されたディジタル信号記録媒体の提供を目的とする。
【0026】
【課題を解決するための手段】
本発明は、上述したような課題を解決するために、アクセスユニット単位で選択的に切り替えられる複数のビデオデータを可変長符号化して得られる複数のビデオストリームから、アクセスユニット毎のデコード時刻と同一のデコード時刻に対するアクセスユニットの大きさをそれぞれ検出し、検出された複数のアクセスユニットの大きさをデコード時刻毎に比較して、アクセスユニットの最大値を仮想アクセスユニットとし、仮想アクセスユニットから構成される仮想ビデオストリームを構成し、ビデオストリームのバッファ占有量が仮想ビデオストリームのバッファ占有量以下となるように、ビデオストリームのアクセスユニットの大きさと仮想アクセスユニットの大きさとの差分を調整しながら、複数のビデオストリームをパケット化することを特徴とする。
【0027】
すなわち、本発明は、複数のディジタル信号のビットストリームの符号化単位であるアクセスユニットの大きさとデコード時刻とを検出し、デコード時刻毎に、得られる複数のアクセスユニットの大きさを比較して、それらの最大値を選択し、デコード時刻においてアクセスユニットの大きさが上記選択された最大値に等しくなるような仮想ストリームを構成し、各々のディジタル信号のビットストリームを符号化する際に、アクセスユニットが上記仮想ストリームのアクセスユニットの大きさに満たないときに、その差分と大きさの等しいパディングパケットを用いてパケット化することを特徴とする。この場合、上記パケット化する際、アクセスユニットが仮想的なビデオストリームのアクセスユニットの大きさに満たない場合には、その差分と大きさの等しいパディングパケットをパケット化するか、あるいは差分の大きさがパックの大きさよりも大きいときは何もパケット化しないことが好ましい。
【0028】
また本発明は、さらに、パケット化して得られるストリームを1つのチャネルとして複数のチャネルを持つトランスポートストリームに符号化して伝送することを特徴とする。
【0029】
具体的には、複数のいわゆるMPEGビデオストリームのアクセスユニットの大きさとデコード(表示)時刻を検出する手段と、デコード時刻毎に各々のビデオストリームに属するアクセスユニットの最大値を選択する手段と、デコード時刻においてアクセスユニットの大きさが選ばれた最大値に等しくなるような1つの仮想的なビデオストリームを構成する手段と、この仮想的なビデオストリームをあたかも実在するビデオストリームのように扱いデコーダへの供給時刻(クロックリフレンス)およびパケットの大きさ決定する手段と、実際に各々のビデオストリームをパケット化する際、アクセスユニットが仮想的なビデオストリームのアクセスユニットの大きさに満たない場合には、その差分と大きさの等しいパディングパケットをパケット化する手段と、差分の大きさがパックの大きさよりも大きいときはなにもパケット化しない手段をもつ。
【0030】
また、本発明の他の具体的な構成としては、複数のMPEGビデオストリームのアクセスユニットの大きさとデコード(表示)時刻を検出する手段と、デコード時刻毎に、得られる複数のアクセスユニットの大きさを比較して、それらの最大値を選択する手段と、デコード時刻においてアクセスユニットの大きさが選ばれた最大値に等しくなるような1つの仮想的なビデオストリームを構成する手段と、ビデオストリームとしてこの仮想的なビデオストリームをあたかも実在するビデオストリームのように扱い、オーディオその他のストリームと共に、それらのデコーダへの供給時刻(クロックリファレンス)およびパケットの大きさ決定する手段と、実際に各々のビデオストリームをパケット化する際、アクセスユニットが仮想的なビデオストリームのアクセスユニットの大きさに満たない場合には、その差分と大きさの等しいパディングパケットをパケット化する手段と、パケット化して得られるストリームを1つのチャンネルとして、複数のチャンネル持つMPEGトランスポートストリームに符号化して伝送する手段をもつ。
【0031】
【発明の実施の形態】
以下、本発明に係る実施の形態について、図面を参照しながら説明する。
【0032】
図1は、本発明に係るディジタル信号符号化装置の実施の形態の概略構成を示している。この第1の実施の形態においては、同一シーンを異なるカメラアングルから撮影した複数のビデオ、例えば3種類のビデオストリームVS0〜VS2についての符号化を考える。
【0033】
同じシーンを撮影したものであるから、当然オーディオや字幕データなどのような、上記ビデオストリームVS0〜VS2と一緒に多重化すべきデータ(オーディオストリームASや、その他のストリームTS等)は、3つのビデオストリームVS0〜VS2に対して全く同一のものを使うことができるため、それぞれ1つのストリームが3つのビデオストリームVS0〜VS2と多重化される。最終的に得られるプログラムストリーム(PS0〜PS2)を復号側においてGOP(グループオブピクチャ)毎に切り替えて再生するとき、切替え点において連続的にビデオが再生可能であるためには、切替え点の時刻とフィールドパリティ(トップフィールドで始まるかボトムフィールドで始まるか)がビデオストリーム毎に同一である必要がある。この条件を満たすために、ここではビデオのピクチャタイプ、トップフィールドファーストフラグ、リピートファーストフィールドフラグはカメラアングルの異なるビデオで同じようにコーディングを行うが、実際には必ずしも同一にする必要はない。
【0034】
なお、トップフィールドファーストフラグ及びリピートファーストフラグは、MPEG2において定義されているフラグであり、トップフィールドファーストフラグはインターレースフレームを画面表示する場合、トップフィールドとボトムフィールドのどちらを始めに出力するかを示すフラグである。また、リピートファーストフラグは、例えば映画等のフィルムソース(24コマ)をインターレースビデオ信号(30フレーム)に変換する場合、3:2プルダウン手法を用いて生成された信号を符号化する際に除去される冗長フィールドを示すフラグのことである。
【0035】
本実施の形態のシステムでは、異なるカメラアングルに対するビデオストリームをデコードするとき、どのビデオストリームをデコードしてもバッファからアクセスユニットを引き抜いた(デコード)後のビデオバッファの状態が同じになるように多重化することが可能である。これにより、GOP単位でプログラムストリームを切り替えたときにバッファの状態を同じにすることができ、その結果、バッファの破綻無くシームレスなビデオ再生が可能となっている。以下、本実施の形態のシステムを説明する。
【0036】
図1において、アクセスユニット検出器50,51,52a〜52cは、各エレメンタリーストリームのアクセスユニットの大きさとそのアクセスユニットのデコード時刻DTS(表示時刻とデコード時刻が異なる場合は表示時刻PTSも)を検出する。エレメンタリーストリームのエンコーダと多重化器が一体のシステムでは、これらの情報はエンコーダが出力できる可能性が大きく、その時はエンコーダの出力値を用いることができる。図1の例では、オーディオストリームASがアクセスユニット検出器50に送られ、異なるカメラアングルから撮影されエンコードされた例えば3種類のビデオストリームVS0,VS1,VS2 がそれぞれアクセスユニット検出器52a,52b,52c に送られ、その他のストリームTSがアクセスユニット検出器51に送られる。そして、各アクセスユニット検出器50,51,52a〜52cにおいて、それぞれのエレメンタリーストリームのアクセスユニットの大きさとデコード時刻DTS(必要に応じてPTS)等が検出される。
【0037】
最大値検出器53は、アクセスユニット検出器52a,52b,52c からの、3種類のビデオストリームVS0,VS1,VS2 より各々得られるアクセスユニットの大きさを比較し、アクセスユニットの最大値をデコード時刻毎に選択する。
【0038】
図2にこの選択の様子を示す。図2ではわかりやすいように各々のビデオストリームVS0,VS1,VS2 に対するアクセスユニットを時間的にずらして書いているが、これらは同一のデコード時刻tn (n=1,2,・・・)に対するアクセスユニットの大きさを表している。デコード時刻tN 毎にアクセスユニットの最大値が仮想的なビデオストリームPVSのアクセスユニットとして選ばれている。仮想的なビデオストリームPVSは、このデコード間隔とアクセスユニットの大きさをもつものと考える。
【0039】
スケジューラ54は、この仮想的なビデオストリームPVSとその他の多重化すべきエレメンタリーストリーム、すなわちオーディオストリームASと、字幕データなどのその他のストリームTSについての、アクセスユニットの大きさとデコード時刻の情報を受け取って、パケット化すべきエレメンタリーストリームの種類、パケットの大きさ、パックに付けるSCR(システムクロックリファレンス)などの制御情報を出力する。このスケジューラ54は通常の多重化方式において用いるものと同一でよい。例えば、このスケジューリングの技術として、本件出願人が先に特願平7−341951号の明細書および図面に開示した技術等を用いることができる。また、他のスケジューリングの技術を用いてもよい。
【0040】
パケット化器55a,55b,55c は、スケジューラ54によって出力された制御情報を用いて、エレメンタリーストリームのパケット化を行う。ただしスケジューラ54は仮想的なビデオストリーム(仮想ビデオ)PVSに対してスケジューリングを行っているので、得られる制御情報をそのまま用いて実際のビデオストリーム(実ビデオ)をパケット化しても、アクセスユニットの引き抜き時におけるバッファの占有量は必ずしも同じにならない。ところが、
(実ビデオのアクセスユニットの大きさ)
≦(仮想ビデオのアクセスユニットの大きさ)
が常に成り立つので、パケット化を行う際、ビデオのアクセスユニットの大きさが仮想ビデオのアクセスユニットの大きさに満たない場合にパディングパケットをパケット化すると、バッファから引き抜かれた(デコードされた)後のバッファの状態は、異なるアングルのビデオによらず一定になる。
【0041】
図3を用いてこれらのパケット化器55a〜55cの動作を説明する。
【0042】
図3の(a)は仮想的なビデオのアクセスユニットPVAUの大きさを表し、図3の(b)は実際に多重化すべきビデオのアクセスユニットVAUの大きさを表す。図3の(c)の実線は、多重化スケジューラによって、仮想ビデオがパケットにどのように分割されるかを示している。このスケジューラの出力情報を用いて実際にビデオパケットVPをパケット化するときは、仮想ビデオと実際のビデオストリームの各アクセスユニットPVAUとVAUとの大きさに差があるため、図3の斜線(ハッチング)が施された部分を調整しなければならない。パケット化器55a〜55cは、図3の(c)で斜線が施された部分において、図3の(d)に示すように、パディングパケットPPを出力する機能を持つ。ビデオストリームが図3の(d)のようにパケット化されることにより、他のエレメメンタリーストリームを多重化して生成されるプログラムストリームは図3の(e)のようになる。この例では、各パケット化器においてビデオ、オーディオ、字幕データそれぞれ1ストリームについての多重化を行った例を示している。
【0043】
また、このように仮想ビデオと実際のビデオストリームのアクセスユニットの差分を調整するとき、パディングパケットPPそれ自体でパックを構成している場合には、このパディングパケットPPを転送しなくても、各エレメンタリーストリームのバッファの遷移には全く影響を与えない。多重化におけるオーバーヘッドを減らすため、すなわち無駄なデータの蓄積を防ぐため、このような場合には、パケット化器55a〜55cはパディングパケットPPをパケット化しない機能をもつ。本例において、図3の(d)のxで示す部分のパディングパケットPPは、それ自体がパックを構成しているので、図3の(e)のプログラムストリーム中にはパケット化されていない。ただし、パケット化器55a〜55cのハードウェアを簡略化したいようなときには、パディングパケットPPを全てパケット化しても差し支えないが、多重化のオーバーヘッドは増える。
【0044】
本例の多重化器によって多重化を行ったときのバッファの挙動は、例えば図4のようになる。この図4において、点線は仮想的なビデオに対してスケジューリングを行ったときのビデオバッファの状態の遷移を表す。実線は、仮想的なビデオストリームに対してスケジューリングを行って得られる情報をもとに実際のビデオストリームを多重化したときのビデオバッファの状態を表している。また、時刻t1,t2,t3,・・・は、デコード時刻を表している。
【0045】
この図4中の×印までは、仮想ビデオと同じタイミングでビデオバッファへのロードが行われる。一方、図4中の×印から○印までの区間では、上記したように仮想ビデオと実ビデオ(実際のビデオストリーム)のアクセスユニットとの差分がパディングパケットで置き換えられるので、ビデオバッファへのロードは行われず、次のアクセスユニットのロードの開始点(図中○印のところ)、あるいはデコード時刻tn (n=1,2,・・・)になるまでバッファのデータ量は変わらない。
【0046】
この結果、全ての時刻において、
(実際のビデオのバッファ占有量)
≦(仮想的なビデオのバッファ占有量)
が常に成り立つ。
【0047】
したがって、異なるカメラアングルから撮影されたビデオデータを符号化し、本方法により多重化を行って生成される複数のプログラムストリームは、全ての時刻によって上記の関係式を満足する。よって、仮想ビデオがバッファの破綻無く多重化されているならば、これらのプログラムストリームをエントリーポイントで切り替えてデコードしても、バッファの破綻は起きない。
【0048】
そして、これらのプログラムストリームPS0,PS1及びPS2 が、例えばディスク等の記録媒体56に記録される。
【0049】
次に、2つの異なるカメラアングルから撮影されエンコードされたビデオを多重化する様子を図5に表す。図5の(a)はビデオV0のアクセスユニットの大きさを表し、(b)はビデオV1のビデオアクセスユニットの大きさを表す。この例では、GOP0,GOP1両方とも4枚のアクセスユニットから構成されている。GOPは、MPEG2に定義されているグループオブピクチャの意味である。図5の(c)は、アクセスユニットの大きさのどちらか大きな方を選択することによって得られる、仮想ビデオのアクセスユニットの大きさを表す。図5の(d)は、仮想ビデオに対してスケジューリングを行った結果、仮想ビデオがどのようにパケッタイズされるかを示している。実際のビデオを多重化するときは、図5の(e),(f)に示すように、仮想ビデオとの差分が生じるときはパディングを行う。ただし、仮想ビデオのパケットが3つ以上のパケットに分割されるときには、図5の(e),(f)のようにパディングパケットを後詰めして2つのパケットにしてしまってもよい。スケジューリングの結果として、仮想ビデオに対するプログラムストリームが図5の(g)のように多重化されるとすると、本実施の形態を用いて実ビデオを多重化してできるプログラムストリームは図5の(h),(i)のようになる。
【0050】
こうしてできるプログラムストリームは、図5の(h),(i)のどの矢印に従って切り替えてデコーダに入力しても、上に示したようにバッファの破綻を引き起こすことなく、映像・音声のシームレスな再生が可能になる。なお、この例では2つのビデオを考えたが3つ以上のビデオに対しても同様である。
【0051】
以上説明した例においては、プログラムストリームに対して本発明の実施の形態の方法を適用したが、伝送用途に使われるトランスポートストリームに対しても、本方法は有効である。トランスポートストリームでは、一本のストリームが複数のチャネルで構成され、各チャネルが一つの独立したストリームに相当している。また各チャネルは、各々独立してタイムベースをもつことができる。したがって、上記の複数プログラムストリームに対する方法をそのまま各チャネルに対して行い、複数チャネルのストリームの一本のトランスポートストリームに多重化し、その多重化されたトランスポートストリームを伝送する。それにより、複数のチャンネルを切り替えたときに、異なるカメラアングルから撮影された映像にシームレスに切り替えることが可能になる。
【0052】
また、上述した実施の形態では、異なるカメラアングルから撮影された映像を多重化することを考えたが、全く内容の関係の無い画像に関しても本発明は適用可能である。また、本発明は、ビデオにとどまらずオーディオやその他のデータについても適用可能である。
【0053】
【発明の効果】
本発明によれば、複数のディジタル信号のビットストリームの符号化単位であるアクセスユニットの大きさとデコード時刻とを検出し、デコード時刻毎に、得られる複数のアクセスユニットの大きさを比較して、それらの最大値を選択し、デコード時刻においてアクセスユニットの大きさが上記選択された最大値に等しくなるような仮想ストリームを構成し、各々のディジタル信号のビットストリームをパケット化する際に、アクセスユニットが上記仮想ストリームのアクセスユニットの大きさに満たないときに、その差分と大きさの等しいパディングパケットを用いてパケット化しているため、複数のディジタル信号のビットストリームを切り替えて復号しても、復号バッファを破綻させずに連続的に再生することができる。
【0054】
すなわち、本発明によれば、複数の多重化ストリームを切り替えて再生する機能をもつシステム用に多重化を行う際、エレメンタリーストリームからアクセスユニットの大きさとデコード時刻を求め、各デコード時刻毎にアクセスユニットの最大値を選び、その最大値をアクセスユニットの大きさとする仮想的なビデオストリームを考えて多重化のスケジューリングを行い、実際のビデオを多重化するときに仮想ビデオと実ビデオの差分が生じるときはパディングを行うことにより、複数の多重化ストリームを切り替えて再生するときに、バッファの破綻を起こさず、かつ映像や音声を途切れさせることが無いようにできる。ここで、この複数の多重化ストリームは蓄積媒体の各部に記録されていても良いし、複数ストリームをさらに一本のトランスポートストリームにまとめられて放送に用いられても良い。
【図面の簡単な説明】
【図1】本発明の実施の形態となるディジタル信号符号化装置の概略構成を示すブロック図である。
【図2】仮想ビデオのアクセスユニットの決定を説明するための図である。
【図3】上記実施の形態によって生成されるプログラムストリームの一例を説明するための図である。
【図4】上記実施の形態によって生成されるプログラムストリームをデコードしたときのバッファの挙動を説明するための図である。
【図5】上記実施の形態を2つの異なるカメラアングルに対するビデオデータに対して適用したときに得られるプログラムストリームを説明するための図である。
【図6】いわゆるMPEG規格におけるシステムターゲットデコーダ(STD)の概略構成を示すブロック図である。
【図7】いわゆるMPEG規格におけるプログラムストリームおよびトランスポートストリームの構造の一例を示す図である。
【図8】2本のプログラムストリームをそれぞれ独立に多重化したときに得られるストリーム及び2本のプログラムストリームを切り替えたときに得られるストリームの一例を説明するための図である。
【図9】プログラムストリーム切り替え時におけるバッファの挙動を説明するための図である。
【符号の説明】
50,51,52a〜52c アクセスユニット検出器、 53 最大値検出器、 54 スケジューラ、 55a〜55c パケット化器

Claims (13)

  1. アクセスユニット単位で選択的に切り替えられる複数のビデオデータを可変長符号化して得られる複数のビデオストリームから、上記アクセスユニット毎のデコード時刻と同一のデコード時刻に対するアクセスユニットの大きさをそれぞれ検出するアクセスユニット検出手段と、
    上記アクセスユニット検出手段により検出された複数のアクセスユニットの大きさをデコード時刻毎に比較して、アクセスユニットの最大値を仮想アクセスユニットとする最大値検出手段と、
    記仮想アクセスユニットから構成される仮想ビデオストリームを構成する仮想ビデオストリーム構成手段と、
    上記ビデオストリームのバッファ占有量が上記仮想ビデオストリームのバッファ占有量以下となるように、上記ビデオストリームのアクセスユニットの大きさと上記仮想アクセスユニットの大きさとの差分を調整しながら、上記複数のビデオストリームをパケット化するパケット化手段と
    を有することを特徴とする符号化装置。
  2. 上記パケット化手段は、上記差分に対してパディングパケットを用いてパケット化することを特徴とする請求項1記載の符号化装置。
  3. 上記パケット化手段は、上記パディングパケット自体でパックを構成している場合には、パケット化しないことを特徴とする請求項2記載の符号化装置。
  4. 上記仮想ビデオストリーム構成手段は、上記仮想ビデオストリームを用いて、デコーダへの供給時刻及びパケットの大きさを決定し、
    上記パケット化手段は、上記デコーダへの供給時刻及びパケットの大きさの情報を使用して、上記ビデオストリームをパケット化する
    ことを特徴とする請求項1記載の符号化装置。
  5. 上記ビデオストリームはMPEG規格のエレメンタリストリームであることを特徴とする請求項1記載の符号化装置。
  6. 上記パケット化手段によりパケット化されて生成されたストリームは、MPEG規格のプログラムストリームであることを特徴とする請求項1記載の符号化装置。
  7. 上記複数のビデオデータは、異なるカメラアングルから撮像されたデータであることを特徴とする請求項1記載の符号化装置。
  8. アクセスユニット単位で選択的に切り替えられる複数のビデオデータを可変長符号化して得られる複数のビデオストリームから、上記アクセスユニット毎のデコード時刻と同一のデコード時刻に対するアクセスユニットの大きさをそれぞれ検出するアクセスユニット検出工程と、
    上記アクセスユニット検出工程により検出された複数のアクセスユニットの大きさをデコード時刻毎に比較して、アクセスユニットの最大値を仮想アクセスユニットとする最大値検出工程と、
    上記仮想アクセスユニットから構成される仮想ビデオストリームを構成する仮想ビデオストリーム構成工程と、
    上記ビデオストリームのバッファ占有量が上記仮想ビデオストリームのバッファ占有量以下となるように、上記ビデオストリームのアクセスユニットの大きさと上記仮想アクセスユニットの大きさとの差分を調整しながら、上記複数のビデオストリームをパケット化するパケット化工程と
    を有することを特徴とする符号化方法。
  9. 上記パケット化工程では、上記差分に対してパディングパケットを用いてパケット化することを特徴とする請求項8記載の符号化方法。
  10. アクセスユニット単位で選択的に切り替えられる複数のビデオデータを可変長符号化して得られる複数のビデオストリームから、上記アクセスユニット毎のデコード時刻と同一のデコード時刻に対するアクセスユニットの大きさをそれぞれ検出する アクセスユニット検出工程と、
    上記アクセスユニット検出工程により検出された複数のアクセスユニットの大きさをデコード時刻毎に比較して、アクセスユニットの最大値を仮想アクセスユニットとする最大値検出工程と、
    上記仮想アクセスユニットから構成される仮想ビデオストリームを構成する仮想ビデオストリーム構成工程と、
    上記ビデオストリームのバッファ占有量が上記仮想ビデオストリームのバッファ占有量以下となるように、上記ビデオストリームのアクセスユニットの大きさと上記仮想アクセスユニットの大きさとの差分を調整しながら、上記複数のビデオストリームをパケット化するパケット化工程と、
    上記夫々パケット化された複数のストリームを1つのストリームとして伝送する工程と
    を有することを特徴とする伝送方法。
  11. 上記パケット化工程では、上記差分に対してパディングパケットを用いてパケット化することを特徴とする請求項10記載の伝送方法。
  12. 記録信号が記録される信号記録媒体において、
    上記記録信号は、
    アクセスユニット単位で選択的に切り替えられる複数のビデオデータを可変長符号化して得られる複数のビデオストリームから、上記アクセスユニット毎のデコード時刻と同一のデコード時刻に対するアクセスユニットの大きさをそれぞれ検出するアクセスユニット検出工程と、
    上記アクセスユニット検出工程により検出された複数のアクセスユニットの大きさをデコード時刻毎に比較して、アクセスユニットの最大値を仮想アクセスユニットとする最大値検出工程と、
    上記仮想アクセスユニットから構成される仮想ビデオストリームを構成する仮想ビデオストリーム構成工程と、
    上記ビデオストリームのバッファ占有量が上記仮想ビデオストリームのバッファ占有量以下となるように、上記ビデオストリームのアクセスユニットの大きさと上記仮想アクセスユニットの大きさとの差分を調整しながら、上記複数のビデオストリームをパケット化するパケット化工程と
    により得られるものであることを特徴とする信号記録媒体。
  13. 上記パケット化工程では、上記差分に対してパディングパケットを用いてパケット化することを特徴とする請求項12記載の信号記録媒体。
JP11159997A 1996-05-02 1997-04-28 符号化装置および方法、伝送方法、並びに信号記録媒体 Expired - Fee Related JP3867342B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11159997A JP3867342B2 (ja) 1996-05-02 1997-04-28 符号化装置および方法、伝送方法、並びに信号記録媒体

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP8-111682 1996-05-02
JP11168296 1996-05-02
JP11159997A JP3867342B2 (ja) 1996-05-02 1997-04-28 符号化装置および方法、伝送方法、並びに信号記録媒体

Publications (2)

Publication Number Publication Date
JPH1083632A JPH1083632A (ja) 1998-03-31
JP3867342B2 true JP3867342B2 (ja) 2007-01-10

Family

ID=26450953

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11159997A Expired - Fee Related JP3867342B2 (ja) 1996-05-02 1997-04-28 符号化装置および方法、伝送方法、並びに信号記録媒体

Country Status (1)

Country Link
JP (1) JP3867342B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999028902A1 (en) * 1997-11-29 1999-06-10 Koninklijke Philips Electronics N.V. Method and device for recording audio, a record carrier and playback device
EP1098314A4 (en) * 1998-07-15 2010-04-14 Panasonic Corp DECODING METHOD AND DEVICE
US8094994B2 (en) 2003-04-10 2012-01-10 Panasonic Corporation Information recording medium, and apparatus and method for recording information to information recording medium

Also Published As

Publication number Publication date
JPH1083632A (ja) 1998-03-31

Similar Documents

Publication Publication Date Title
KR100476135B1 (ko) 디지털신호부호화방법및장치,디지털신호전송방법,기록매체
JP3603364B2 (ja) ディジタルデータ記録/再生装置及び方法
US7881584B2 (en) Reproducing apparatus and method, and recording medium
JPH08340541A (ja) デジタルデータの伝送方法、伝送装置、記録方法、記録装置、再生方法、再生装置、記録再生方法及び記録再生装置
KR101014664B1 (ko) 복수의 데이터 스트림 간의 연속 재생을 보장하는 재생방법 및 그 재생 장치
JP2008123693A (ja) 再生装置、再生方法及びその記録媒体
JP3867342B2 (ja) 符号化装置および方法、伝送方法、並びに信号記録媒体
JP2000331421A (ja) 情報記録装置及び情報再生装置
JPH08340514A (ja) デジタルデータの記録方法、記録装置及び再生システム
RU2411596C2 (ru) Способ воспроизведения
JP3823426B2 (ja) 情報信号処理装置及び方法
JPH09162829A (ja) 符号化・多重化装置,多重化前処理装置及び符号化・多重化方法
JP2005198349A (ja) 記録媒体
JP2005245006A (ja) アフレコ信号再生装置
JP2005253093A (ja) アフレコ信号伝送装置
JP2005198347A (ja) アフレコ信号生成方法
JP2005260978A (ja) アフレコ信号生成用プログラム
JP2005260979A (ja) アフレコ信号伝送方法
JP2004158921A (ja) データ送信装置及びデータ受信装置
JP2005237021A (ja) アフレコ信号再生用プログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060523

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060724

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060919

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061002

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091020

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101020

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111020

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121020

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131020

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees