JP3918332B2 - 多重化装置、多重化方法及び記録媒体 - Google Patents
多重化装置、多重化方法及び記録媒体 Download PDFInfo
- Publication number
- JP3918332B2 JP3918332B2 JP34594698A JP34594698A JP3918332B2 JP 3918332 B2 JP3918332 B2 JP 3918332B2 JP 34594698 A JP34594698 A JP 34594698A JP 34594698 A JP34594698 A JP 34594698A JP 3918332 B2 JP3918332 B2 JP 3918332B2
- Authority
- JP
- Japan
- Prior art keywords
- video
- stream
- time
- pack
- picture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/102—Programmed access in sequence to addressed parts of tracks of operating record carriers
- G11B27/105—Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B2220/00—Record carriers by type
- G11B2220/20—Disc-shaped record carriers
Landscapes
- Television Signal Processing For Recording (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
【発明の属する技術分野】
本発明は、ビデオ符号ストリームの多重化装置、多重化方法及び記録媒体に関するものである。
【0002】
【従来の技術】
従来の光ディスク等の記録再生装置では、一般に、MPEG(Moving Picture Experts Group)方式で画像の圧縮及び伸張を行うエンコーダ及びデコーダを備え、このMPEG方式で画像圧縮又は伸張を行って、映像信号の記録再生をしている。
【0003】
このMPEG方式では、動画像を構成する画面(フレーム或いはフィールドの画面)を、Iピクチャ,Pピクチャ,Bピクチャのいずれかのピクチャタイプに符号化して、画像圧縮を行っている。
【0004】
Iピクチャは、画面内で符号化が完結しているもので、他画面とは独立して符号化したものである。このため、このIピクチャは、例えば、ランダムアクセスのエントリーポイントとして用いられたり、エラーを回復するために用いられたりする。
【0005】
Pピクチャは、時間的に過去に存在するIピクチャ或いはPピクチャから予測符号化したものである。従って、このPピクチャを復号するためには、時間的に過去のIピクチャ或いはPピクチャが復号されていなければならない。
【0006】
Bピクチャは、時間的に過去に存在するIピクチャ或いはPピクチャと、時間的に未来に存在するIピクチャ或いはPピクチャから、前方向、後方向又は双方向の予測符号化がされたものである。このため、このBピクチャを復号するためには、時間的に過去及び未来のIピクチャ又はPピクチャが復号されていなければならない。
【0007】
このようにMPEG方式では、ピクチャ間予測符号化して画像圧縮を行い、動画像を効率的に圧縮するとともに、圧縮した動画像に対してランダムにアクセスができるようになっている。
【0008】
また、MPEG方式では、これらの各ピクチャを任意の枚数でグループ化した画面群(GOP:Group of pictures)単位で構成されるデータストリームに圧縮している。MPEG方式では、このGOP内に少なくとも1枚のIピクチャを設けることを規定している。そのため、このGOP単位で圧縮した動画像に対してランダムアクセスができるようになっている。
【0009】
ここで、上述したような従来の記録再生装置で、MPEG方式で画像圧縮された信号を再生する場合について考えてみる。
【0010】
例えば、記録媒体には、図10(A)に示すようなデータストリームの符号化データが記録されている。従来の記録再生装置は、この図10(A)に示すように記録されているデータストリームを復号して、図10(B)に示すようなピクチャの順番で表示を行う。ここで、各ピクチャに符号として付けている“I”,“P”,“B”は、Iピクチャ、Pピクチャ、Bピクチャの区別を示しており、各添字は、GOP(Group of Pictures)内の表示順序を表すいわゆるテンポラリリファレンスを示している。
【0011】
従来の記録再生装置は、図10(A)に示すようなデータストリームの符号化データを再生する為に、まず、I0の復号を行う。Iピクチャは画面内で符号化が完結しているものであるので、従来の記録再生装置では他のピクチャを復号することなくI0を単独で復号することができる。続いて、従来の記録再生装置は、復号したI0に基づき、順方向予測符号化がされたP2の復号を行う。Pピクチャは時間的に前のIピクチャ又はPピクチャから予測符号化がされるものであるので、従来の記録再生装置はこのP2を復号する前にI0を復号していなければならない。続いて、従来の記録再生装置は、復号したI0及びP2に基づき、双方向予測符号化がされたB1の復号を行う。Bピクチャは時間的に前後のIピクチャ又はPピクチャから双方向符号化がされるものであるので、従来の記録再生装置はこのB1を復号する前にI0とP2を復号していなければならない。このように、この従来の記録再生装置では、図10(A)に示すようなデータストリームの符号化データを、I0→P2→B1→P4→B3→P6→B5→I8→B7→P10→B9→・・・といった順序で復号を行う。
【0012】
そして、従来の記録再生装置では、このような順序で復号した各ピクチャを表示する場合には、図10(B)に示すようにその順序を入れ換えて、I0→B1→P2→B3→P4→B5→P6→B7→I8→B9→P10→・・・といった順序で表示を行う。
【0013】
【発明が解決しようとする課題】
ところで、従来の記録再生装置では、記録媒体がランダムアクセス可能となっていれば、MPEG方式で記録された符号化データに対してランダムアクセスが可能となる。従って、従来の記録再生装置は、例えば、図11で示しているストリームを、まずSA点で示すPピクチャまで再生し、これ以降の各ピクチャの再生をせず、SB点で示すBピクチャ(ピクチャB3)から再生を再開するといったピクチャを一部跳ばして再生することが可能である。ここで、ピクチャを一部跳ばすことを以後スキップと呼び、あるピクチャから別の離れたピクチャまでスキップさせて再生することをスキップ再生と呼ぶ。また、スキップが開始する直前のピクチャ(例えば図11に示すSAのピクチャ)をアウト点ピクチャと呼び、スキップが終了して最初に再生が開始するピクチャ(例えば図11に示すSBのピクチャ)をイン点ピクチャと呼ぶ。
【0014】
ところが、このような従来の記録再生装置でこのスキップ再生を行った場合には、再生した映像の時間的な連続性が途切れてしまう場合がある。
【0015】
例えば、イン点ピクチャがBピクチャである場合には、このBピクチャを復号するために必要なIピクチャ又はPピクチャを復号しておかなければならず、この場合には、再生した映像の時間的な連続性が途切れてしまう。具体的に図11で示した例を用いて説明すると、従来の記録再生装置は、イン点ピクチャがB3であるので、このB3を復号するために少なくともI0,P2,P4を復号しなければならない。そのため、従来の記録再生装置では、このI0,P2,P4を復号している間は、ピクチャを表示することができず、映像の連続性が途切れてしまうこととなる。
【0016】
以上のように従来の記録再生装置では、スキップ再生をした場合に、スキップした前後のピクチャをシームレスに再生することができない。
【0017】
なお、以上の例においては、MPEG方式で画像圧縮した場合について考えたが、例えば、画像間に相関があることを利用し、画像間の差分を求め、この差分を符号化するようなピクチャ間予測符号化を用いた場合であっても、同様にスキップ再生時における時間的な連続性が途切れてしまう。
【0018】
本発明は、このような実情を鑑みてなされたものであり、スキップ点の前後における動画像の連続性を保ちスキップ再生をすることができる動画像データを符号化する多重化装置、多重化方法及び記録媒体を提供することを目的とする。
【0019】
【課題を解決するための手段】
本発明にかかる多重化装置は、第1のピクチャで表示終了する第1のビデオ符号化ストリームと、スキップ再生の際にこの第1のピクチャに続けて表示される第2のピクチャから表示開始する第2のビデオ符号化ストリームの符号化をするビデオ符号化手段と、上記第1のビデオ符号化ストリームとこの上記第1のビデオ符号化ストリームに同期したオーディオ符号化ストリームとをパック化して第1の多重化ストリームを生成し、上記第2のビデオ符号化ストリームとこの第2のビデオ符号化ストリームに同期したオーディオ符号化ストリームとをパック化して第2の多重化ストリームを生成する多重化手段と、上記第1のビデオ符号化ストリームの時間軸上における上記第1のピクチャの表示終了時刻( PTS_Pout_end )と、上記第2のビデオ符号化ストリームの時間軸上における上記第2のピクチャの表示開始時刻( PTS_Pin )との時間差( STC_delta=PTS_Pout_end-PTS_Pin )を求め、上記第1の多重化ストリームの最後のビデオパックをデコーダのビデオバッファへ入力終了する上記第1のビデオ符号化ストリームの時間軸上における時刻( SCR_video1_end )を求め、上記第1の多重化ストリームの最後のビデオパックの次のパックからこの第1の多重化ストリームの最後のパックまでのデータ量( N1 )を求め、上記データ量 (N1) を上記デコーダへ入力する際に要する時間(Δ T1 )を求め、上記第2の多重化ストリームの最初のビデオパックを上記デコーダのビデオバッファへ入力開始する上記第2のビデオ符号化ストリームの時間軸上における時刻( SCR_video2_start )が、 SCR_video2_start>SCR_video1_end - STC_delta + Δ T1 の関係を満たすように上記ビデオ符号化手段を制御する制御手段とを備えることを特徴とする。
【0020】
この多重化装置では、第2のビデオ符号化ストリームがデコーダのビデオバッファへ入力開始する時刻から、上記第1のビデオ符号化ストリームの第1のピクチャの復号終了する時刻までの間におけるこのビデオバッファのビット占有量を、上記ビデオバッファの容量以下で0以上となるように符号化する。
【0021】
本発明にかかる多重化方法は、第1のピクチャで表示終了する第1のビデオ符号化ストリームの時間軸上における上記第1のピクチャの表示終了時刻( PTS_Pout_end )とスキップ再生の際にこの第1のピクチャに続けて表示される第2のビデオ符号化ストリームの時間軸上における上記第2のピクチャの表示開始時刻( PTS_Pin )との時間差( STC_delta=PTS_Pout_end-PTS_Pin )を求め、上記第1のビデオ符号化ストリームとこの上記第1のビデオ符号化ストリームに同期したオーディオ符号化ストリームとがパック化され生成される第1の多重化ストリームの最後のビデオパックをデコーダのビデオバッファへ入力終了する上記第1のビデオ符号化ストリームの時間軸上における時刻( SCR_video1_end )を求め、上記第1の多重化ストリームの最後のビデオパックの次のパックからこの第1の多重化ストリームの最後のパックまでのデータ量( N1 )を求め、上記データ量 (N1) を上記デコーダへ入力する際に要する時間(Δ T1 )を求め、上記第2のビデオ符号化ストリームとこの第2のビデオ符号化ストリームに同期したオーディオ符号化ストリームとをパック化して生成される第2の多重化ストリームの最初のビデオパックを上記デコーダのビデオバッファへ入力開始する上記第2のビデオ符号化ストリームの時間軸上における時刻( SCR_video2_start )が、 SCR_video2_start>SCR_video1_end - STC_delta + Δ T1 の関係を満たすように上記第1のビデオ符号化ストリーム及び上記第2のビデオ符号化ストリームの符号化をし、上記第1の多重化ストリームと第2の多重化ストリームとを生成することを特徴とする。
【0022】
この多重化方法では、第2のビデオ符号化ストリームがデコーダのビデオバッファへ入力開始する時刻から、上記第1のビデオ符号化ストリームの第1のピクチャの復号終了する時刻までの間におけるこのビデオバッファのビット占有量を、上記ビデオバッファの容量以下で0以上となるように符号化する。
【0023】
本発明にかかる記録媒体は、第1のピクチャで表示終了する第1のビデオ符号化ストリームの時間軸上における上記第1のピクチャの表示終了時刻( PTS_Pout_end )とスキップ再生の際にこの第1のピクチャに続けて表示される第2のビデオ符号化ストリームの時間軸上における上記第2のピクチャの表示開始時刻( PTS_Pin )との時間差( STC_delta=PTS_Pout_end-PTS_Pin )と、上記第1のビデオ符号化ストリームとこの上記第1のビデオ符号化ストリームに同期したオーディオ符号化ストリームとをパック化して多重化された第1の多重化ストリームの最後のビデオパックをデコーダのビデオバッファへ入力終了する上記第1のビデオ符号化ストリームの時間軸上における時刻( SCR_video1_end )と、上記第1の多重化ストリームの最後のビデオパックの次のパックからこの第1の多重化ストリームの最後のパックまでのデータ量( N1 )と、上記データ量 (N1) を上記デコーダへ入力する際に要する時間(Δ T1 )とに基づき、上記第2のビデオ符号化ストリームとこの第2のビデオ符号化ストリームに同期したオーディオ符号化ストリームとをパック化して多重化された第2の多重化ストリームの最初のビデオパックを上記デコーダのビデオバッファへ入力開始する上記第2のビデオ符号化ストリームの時間軸上における時刻( SCR_video2_start )が、 SCR_video2_start>SCR_video1_end - STC_delta + Δ T1 の関係を満たすように上記第1のビデオ符号化ストリーム及び上記第2のビデオ符号化ストリームの符号化を行い、上記第1の多重化ストリームと上記第2の多重化ストリームとを生成する多重化方法により生成されるデータが記録された領域を有し記録可能であることを特徴とする。
【0024】
この記録媒体には、第2のビデオ符号化ストリームがデコーダのビデオバッファへ入力開始する時刻から、上記第1のビデオ符号化ストリームの第1のピクチャの復号終了する時刻までの間におけるこのビデオバッファのビット占有量を、上記ビデオバッファの容量以下で0以上となるように、第1のビデオ符号化ストリーム及び第2のビデオ符号化ストリームが記録される領域を有し記録可能であることを特徴とする。
【0025】
【発明の実施の形態】
以下、本発明の実施の形態として、本発明を適用した動画像記録再生装置について、図面を参照しながら説明する。
【0026】
図1に、上記本発明を適用した動画像記録再生装置のブロック図を示す。
【0027】
この図1に示す動画像記録再生装置1は、光ディスク2に記録されているMPEG2方式で圧縮符号化された動画像データを編集することによって、復号装置側でスキップ再生がシームレスに行えるような動画像データを生成し、この動画像データを再度光ディスク2に記録する装置である。
【0028】
以下この動画像記録再生装置1を説明するにあたり、光ディスク2には、MPEG2方式で符号化したビデオデータ及びオーディオデータがパック化されており、このパック単位で時分割多重化された多重化ストリームが記録されているものとする。また、スキップ再生の際のアウト点ピクチャが含まれる動画像プログラムをアウト点側プログラムと呼び、イン点ピクチャが含まれる動画像プログラムをイン点側プログラムと呼ぶ。また、スキップ再生の際のアウト点ピクチャが含まれるGOPをアウト点側GOPとも呼び、また、イン点ピクチャが含まれるGOPをイン点側GOPとも呼ぶものとする。
【0029】
この動画像記録再生装置1は、光ディスク2から多重化ストリームを読み出す読み出し部3と、読み出し部3により読み出された多重化ストリームを復調する復調部4と、復調部4により復調された多重化ストリームに誤り訂正を施す誤り訂正処理部5と、誤り訂正処理部5により誤り訂正が施された多重化ストリームを一時格納するバッファ6と、編集処理をして生成された多重化ストリームに誤り訂正符号を付加する誤り訂正符号付加部7と、誤り訂正符号付加部7により誤り訂正符号が付加された多重化ストリームを変調する変調部8と、変調部8により変調された多重化ストリームを光ディスク2に書き込む書き込み部9とを備えている。
【0030】
また、この動画像記録再生装置1は、バッファ6に格納されている多重化ストリームをビデオストリームとオーディオストリームとに分離するデマルチプレクサ11と、デマルチプレクサ11により分離されたビデオストリームを復号して画像データを生成するビデオデコーダ12と、ビデオデコーダ12により復号された画像データを再符号化してビデオストリームを生成するビデオエンコーダ13と、ビデオストリームとオーディオストリームと時分割多重化して多重化ストリームを生成するマルチプレクサ14とを備えている。
【0031】
また、この動画像記録再生装置1は、イン点ピクチャの情報及びアウト点ピクチャの情報等のスキップ再生をする際に必要となる編集情報を読み出し部3に入力する編集情報入力部15を備えている。
【0032】
また、この動画像記録再生装置1は、編集情報入力部15により入力された編集情報、デマルチプレクサ11から供給される多重化ストリーム等を解析し、復号装置でスキップ再生をシームレスに行わせるために必要な編集処理(ビデオストリームの再エンコード処理及び再多重化処理)方法を決定して、ビデオデコーダ12、ビデオエンコーダ13及びマルチプレクサ14を制御する解析制御部16を備えている。
【0033】
また、この動画像記録再生装置1は、デマルチプレクサ11により分離されたビデオストリームの供給先を切り換える第1の切換器17とマルチプレクサ14に供給するビデオストリームの供給元を切り換える第2の切換器18とを備えている。第1の切換器17及び第2の切換器18は、解析制御部16の制御に応じて、デマルチプレクサ11により分離されたビデオストリームをビデオデコーダ12及びビデオエンコーダ13により復号及び再符号化させてマルチプレクサ14に供給するか、或いは、デマルチプレクサ11により分離されたビデオストリームをそのままマルチプレクサ14に供給するかを切り換える。なお、デマルチプレクサ11により分離されたオーディオストリームは、復号及び再符号化されずにそのままマルチプレクサ14に供給される。
【0034】
以上のような構成の動画像記録再生装置1では、解析制御部16が光ディスク2に記録されている多重化ストリームを解析して、読み出し部3、ビデオデコーダ12、ビデオエンコーダ13、マルチプレクサ14、第1の切換器17、及び第2の切換器18を制御することにより、復号装置でスキップ再生をシームレスに行うためのブリッジシーケンス(詳細は後述する。)を生成し、このブリッジシーケンスを光ディスク2に記録する。
【0035】
つぎに、動画像記録再生装置1でのビデオストリームの再エンコード処理について説明する。
【0036】
この動画像記録再生装置1では、復号装置において動画像プログラムの一部分をスキップ再生する際に、スキップ再生開始点であるアウト点ピクチャより時間的に前側のプログラムであるアウト点側プログラムと、スキップ再生到達点であるイン点ピクチャより時間に後側のプログラムであるイン点側プログラムとをシームレスに接続できるように、ビデオストリームの再エンコード処理を行う。
【0037】
MPEG2規格に準じた画像群の単位であるGOP(group of pictures )には、他の画像からの予測符号化なしに画像が符号化された参照画像である少なくとも1つのI(Intra)ピクチャと、表示順序に順方向の予測符号化を用いて画像が符号化された順方向予測符号化画像であるP(predictive)ピクチャと、順方向及び逆方向の予測符号化を用いて画像が符号化された双方向予測符号化画像であるB(bidirectionally)ピクチャとの3種類の符号化画像が含まれている。
【0038】
例えば、図2(A)に示すように、アウト点ピクチャPoutが含まれるアウト点側GOPをGOP(0)とし、アウト点ピクチャをその中のBピクチャであるB04とする。このGOP(0)は、GOP(−1)から続くGOPである。また、図2(B)に示すように、イン点ピクチャPinが含まれるイン点側GOPをGOP(n)とし、イン点ピクチャをその中のPピクチャであるPn5とする。このGOP(n)には、GOP(n+1)が後に続いている。なお、ここでは、表示順序がi番目のGOPをGOP−iと表記する。また、i番目のGOPにおける表示順序がj番目(すなわち、テンポラルリファレンスがj)のIピクチャをIijと表記し、i番目のGOPにおける表示順序がj番目のPピクチャをPijと表記し、表示順序がj番目のBピクチャをBijと表記する。
【0039】
具体的に、アウト点側GOPであるGOP(0)には、I02,B00,B01,P05,B03,B04,P08,B06,B07の順序で配列されたピクチャが含まれている。また、イン点側GOPであるGOP−nには、In2,Bn0,Bn1,Pn5,Bn3,Bn4,Pn8,Bn6,Bn7の順序で配列されたピクチャが含まれいている。
【0040】
この図2(A),(B)に示したようなプログラムを例にとって、動画像記録再生装置1における再エンコード処理を説明する。
【0041】
まず、アウト点ピクチャPoutを含むアウト点側GOPであるGOP−0を復号する。続いて、上記アウト点ピクチャPoutが、表示順序でアウト点ピクチャPoutよりも後ろの符号化画像を予測参照しなくても復号できるようにこのGOP−0を再びエンコードする。例えば、図2(A)のようにアウト点側GOPであるGOP−0のピクチャB04がアウト点ピクチャPoutである場合、ピクチャP05に基づき予測符号化されているピクチャB03、B04を、このピクチャP05に基づき予測参照しないで作れるように再エンコードを行い、新たなGOPであるGOP(new−0)を生成する。具体的に、このGOP(new−0)を生成するには、まず始めに、ピクチャI02,B00,B01,P05,B03,B04を復号して圧縮していない画像データに戻してから、ピクチャB04をピクチャI02に基づき予測符号化されたPピクチャのピクチャP04xに再エンコードする。続いて、ピクチャB03をピクチャI02とピクチャP04xに基づき予測符号化されるBピクチャのB03xに再エンコードする。そして、ピクチャI02,B00,B02は再エンコードを行わないで、GOP−0からコピーする。なお、これらのピクチャI02,B00,B02についても再エンコードしても良い。このように再エンコードされた結果、図2(C)に示すような、I02,B00,B02,P04x,B03xから構成されたGOP(new−0)が生成される。
【0042】
次に、イン点ピクチャPinを含むイン点側GOPであるGOP−nを復号する。続いて、上記イン点ピクチャPinが、表示順序でイン点ピクチャより前の符号化画像を予測参照しなくても復号できるようにこのGOP−nを再び符号化する。すなわち、図2(B)のようにイン点側GOPであるGOP−nのピクチャPn5がイン点ピクチャPinである場合、ピクチャIn2に基づき予測符号化されているピクチャPn5を、このピクチャIn2を予測参照しないで作れるように再エンコードを行い、新たなGOPであるGOP(new−n)を生成する。具体的に、このGOP(new−n)を生成するには、まず始めに、ピクチャIn2,Bn0,Bn1,Pn5を復号して圧縮されていない画像データに戻してから、ピクチャPn5を独立に復号することができるIピクチャのピクチャIn5xに再エンコードする。そして、ピクチャPn8,Bn6,Bn7については、再エンコードを行わないで、GOP−nからコピーする。なお、これらのピクチャPn8,Bn6,Bn7についても再エンコードしても良い。このように再エンコードされた結果、図2(C)に示すような、In5x,Pn8,Bn6,Bn7から構成されたGOP(new−n)が生成される。
【0043】
動画像記録再生装置1では、以上のようなイン点側GOP及びアウト点側GOPの再エンコード処理を、解析制御部16がビデオデコーダ12及びビデオエンコーダ13並びに第1の切換器17及び第2の切換器18を制御して行う。そして、この動画像記録再生装置1では、アウト点ピクチャB04より表示順序で前側の画像(・・・I02,B00,B01,B03,B04)と、イン点ピクチャPn5より表示順序で後ろ側の画像(Pn5,Pn8,Bn6,Bn7・・・)とを再エンコードすることにより、図2(D)に示すように、・・・B00,B01,I02,B03x,P04x,In5x,Bn6,Bn7,Pn8・・・といった順序で表示される動画像を生成することができる。そのため、動画像記録再生装置1では、イン点ピクチャより前側の動画像とアウト点の後ろ側の動画像を継ぎ目なくシームレスに再生させることができる。
【0044】
つぎに、動画像記録再生装置1での多重化ストリームの再多重化処理について説明する。
【0045】
この動画像記録再生装置1では、復号装置において動画像プログラムの一部分をスキップ再生する際に、スキップ再生開始点であるアウト点ピクチャより時間的に前側のプログラムであるアウト点側プログラムと、スキップ再生到達点であるイン点ピクチャより時間に後側のプログラムであるイン点側プログラムとをシームレスに接続できるように、多重化ストリームの再多重化処理を行う。
【0046】
図3(A)に、アウト点側プログラムの多重化ストリームの構造の一例を示す。Clip−Aは、アウト点側プログラムが含まれている多重化ストリームであって、例えば、MPEG2システム規格(ISO/IEC 13818-1)で定義されてる連続したSCR(System Clock Reference)が付加されているプログラムストリームである。Clip−Aには、1本のビデオストリームと1本のオーディオストリームがパック単位で時分割多重化されている。図4において、v0,v1,v2,v3はGOP長のビデオストリームであり、a0,a1,a2,a3はGOP長のオーディオストリームである。例えば、Clip−Aの中のバイト位置BaからBjoの間に、v1とa0とがパック単位で時分割多重化されている。なお、1パックの大きさは、例えば、2048バイトである。
【0047】
Clip−Aの中のオーディオストリームは、同期再生されるビデオストリームに対して所定のバイト量(audio skew:AV多重化位相差)の距離を離れたバイト位置に存在している。この図3(A)に示す例では、このaudio skewを一定にしているが、この値はプログラムストリーム中で変化しても良い。本例では、v0とa0が同期しており、同様にv1とa1、v2とa2、v3とa3が同期している。
【0048】
ここで、Clip−Aのv3のGOPの中からアウト点ピクチャPoutが選択されたとする。この場合、動画像記録再生装置1では、以下に示す手順でアウト点側のブリッジシーケンス(bridge sequence)を生成する。ブリッジシーケンスとは、編集点付近のビデオストリームを再エンコードして生成したビデオストリームを、再多重化した多重化ストリームである。
【0049】
まず、第1に、上述したビデオストリームの再エンコード処理に基づいて、アウト点ピクチャが含まれたv3のGOPを再エンコードする。この場合、v3のGOPを再エンコードして、新たにv3′のGOPを生成する。このv3′の時間長は、v3の時間長よりも短い。
【0050】
第2に、Clip−Aからアウト点側のブリッジシーケンスへのジャンプ点をBjoとして、このBjo以降のバイト位置に存在するビデオストリームであってv3より前のビデオストリーム(この場合v2)をClip−Aからコピーする。また、このBjo以降のバイト位置に存在するオーディオストリームであってv3′と同期したオーディオストリームより前のオーディオストリーム(この場合a1,a2)をClip−Aからコピーする。続いて、v3′に同期するオーディオストリームを、a3内からコピーして、オーディオストリームa3′を生成する。
【0051】
第3に、上記第1及び第2の処理で生成したビデオストリーム及びオーディオストリームを再多重化する。この場合、v2,v3′と、a1, a2,a3′とを再多重化して、図3(B)に示すようなbridge sequence-Aを生成し、光ディスク2に記録する。
【0052】
このようにbridge sequence-Aが記録された光ディスク2を復号装置でスキップ再生時に読み出す場合、アウト点側の多重化ストリームを再生するときにClip−AをBjo点まで読み出した後、このbridge sequence-Aを読み出すようにする。
【0053】
なお、動画像記録再生装置1では、Bjo点までのClip−Aからbridge sequence-Aへと続くストリームを、SCRが連続したプログラムストリームとするように多重化を行わなければならない。
【0054】
図4(A)に、イン点側プログラムの多重化ストリームの構造の一例を示す。Clip−Bは、イン点側プログラムが含まれている多重化ストリームであって、例えば、MPEG2システム規格で定義されてる連続したSCRが付加されているプログラムストリームである。Clip−Bには、1本のビデオストリームと1本のオーディオストリームがパック単位で時分割多重化されている。図3と同様にして図4において、v5,v6,v7はGOP長のビデオストリームであり、a6,a7,a8はGOP長のオーディオストリームである。例えば、Clip−Bのバイト位置BjiからBbの間にv8とa7がパック単位で時分割多重化されている。Clip−Bの中のオーディオストリームは、同期再生されるビデオストリームに対して所定のバイト量(audio skew)の距離を離れたバイト位置に存在している。この図4(A)に示す例も、audio skewを一定にしているが、この値はプログラムストリーム中で変化しても良い。また、本例では、v5とa5が同期しており、同様にv6とa6、v7とa7、v8とa8が同期している。
【0055】
ここで、Clip−Bのv5の中からイン点ピクチャPinが選択されたとする。この場合、動画像記録再生装置1では、以下に示す手順でイン点側のブリッジシーケンスを生成する。
【0056】
まず、第1に、上述したビデオストリームの再エンコード処理に基づいて、イン点ピクチャが含まれたv5のGOPを再エンコードする。この場合、v5のGOPを再エンコードして、新たにV5′のGOPを生成する。このv5′の時間長は、v5の時間長よりも短い。
【0057】
第2に、イン点側のブリッジシーケンスからClip−Bへのジャンプ点をBjiとして、v5より後のビデオパックであってこのBji以前のバイト位置に存在するビデオストリーム(この場合v6,v7)をClip−Bからコピーする。また、v5′と同期したオーディオストリームより後のオーディオストリームであってこのBji以前のバイト位置に存在するオーディオストリーム(この場合a6)をClip−Bからコピーする。続いて、v5′に同期するオーディオストリームを、a5内からコピーして、オーディオストリームa5′を生成する。
【0058】
第3に、上記第1及び第2の処理で生成したビデオストリーム及びオーディオストリームを再多重化する。v5′,v6,v7と、a5′,a6とを再多重化して、図4(B)に示すようなbridge sequence-Bを生成し、光ディスク2に記録する。
【0059】
このようにbridge sequence-Bが記録された光ディスク2を復号装置でスキップ再生時に読み出す場合、イン点側プログラムを再生するときにこのbridge sequence-Bを読み出した後、Clip−BをBji点から読み出すようにする。
【0060】
なお、動画像記録再生装置1では、Bridge sequence-BからBji点以後のClip−Bへと続くストリームを、SCRが連続したプログラムストリームとするように多重化を行わなければならない。
【0061】
動画像記録再生装置1では、以上のような再多重化をすることによって、図3(B)に示すようなbridge sequence-Aと、図4(B)に示すようなbridge sequence-Bを生成することができる。
【0062】
図5に、Bjo点以前のClip−Aからbridge sequence-Aへと続く多重化ストリームをClip−1とし、bridge sequence-BからBji点以後のClip−Bへと続く多重化ストリームをClip−2としたときの、編集点前後での多重化ストリームの構造を示す。復号装置側では、このClip−1からClip−2へ続く多重化ストリームを連続してデコードしたとき、シームレスにビデオ及びオーディオを表示する必要がある。動画像記録再生装置1では、復号装置側でビデオ及びオーディオをシームレスに再生させるために、Clip−1とClip−2とのオーディオストリームに以下の制限を設けて、符号化及び多重化を行う。
【0063】
Clip−1の終端部とClip−2の始端部の境界において、オーディオの表示時間のギャップが存在しないよう制限をする。すなわち、Clip−1のオーディオストリームはClip−1のビデオが表示終了する時刻に表示されるオーディオサンプルを含むように再多重化をし、Clip−2のオーディオストリームはClip−2のビデオが表示開始する時刻に表示されるオーディオサンプルを含むように再多重化をする。従って、この境界において、2 audio frame以下の表示時間のオーバーラップが存在する可能性がある。ここで、1 audio frameは、例えば、MPEG1のオーディオストリームの場合、24msecの長さの表示時間のオーディオストリームである。
【0064】
なお、図5に示すV1LBI、A1LBI、V2FBI、A2FBIは以下のとおりである。
V1LBI : Clip−1の中のvideo-1の最後のpackの最終バイト位置
A1LBI : Clip−1の中のaudio-1の最後のpackの最終バイト位置
V2FBI : Clip−2の中のvideo-2の最初のpackの第1バイト位置
A2FBI : Clip−2の中のaudio-2の最初のpackの第1バイト位置
【0065】
また、これらV1LBI、A1LBI、V2FBI、A2FBIの関係は以下のとおりである。
V1LBI < A1LBI
V2FBI < A2FBI
なお、上記以外の関係になることは、MPEGの規格上では可能であるが、実用上では、ほとんど存在しない。
【0066】
つぎに、この動画像記録再生装置1により生成した上記Clip−1及びClip−2を再生する仮想的なデコーダモデルであるシステムターゲットデコーダのブロック図を図6に示し、このシステムターゲットデコーダにおけるスキップ再生処理について説明する。
【0067】
この図6に示すシステムターゲットデコーダ20は、光ディスク2から再生した多重化ストリーム(Clip−1及びClip−2)が入力され、この多重化ストリームをビデオストリームとオーディオストリームに分離するデマルチプレクサ21と、デマルチプレクサ21により分離されたビデオストリームを一時格納するビデオバッファ22と、デマルチプレクサ21により分離されたオーディオストリームを一時格納するオーディオバッファ23と、ビデオバッファ22に格納されたビデオストリームを抜き出して復号するビデオデコーダ24と、復号した画像データを一時格納するリオーダバッファ25と、オーディオバッファ23に格納されたオーディオストリームを抜き出して復号するオーディオデコーダ26と、ビデオデコーダ24により復号された画像データとリオーダバッファ25に格納されている画像データとを切り換えて出力する出力スイッチ27とを備えている。
【0068】
また、システムターゲットデコーダ20は、デマルチプレクサ21の切り換えタイミング、ビデオデコーダ24の復号タイミング、オーディオデコーダ26の復号及び出力タイミング、出力スイッチ27の出力タイミングを制御するための基準同期信号(STC:Systemu Time Clock)を供給する時間制御部28を備えている。
【0069】
また、システムターゲットデコーダ20は、時間制御部28から供給されるSTCを切り換える第1から第4のSTCスイッチSW1〜SW4を備えている。
【0070】
デマルチプレクサ21には、多重化ストリームに付加されているSCR(System Clock Reference)に応じてこの多重化ストリームを構成する各パケットが入力される。デマルチプレクサ21は、この多重化ストリームを時間制御部28から供給されるSTCに基づいてビデオストリームとオーディオストリームとに分離する。
【0071】
ビデオデコーダ25は、ビデオストリームに付加されているDTS(Decoding Time Stamp)と、時間制御部28から供給されたSTCとが一致したときに、ビデオバッファ24から所定のピクチャのデータを抜き出して復号する。復号した画像データは、このビデオデコーダ24から直接出力スイッチ27を介して外部に出力されるか、或いは、リオーダバッファ25に一旦格納された後出力スイッチ27を介して出力される。
【0072】
オーディオデコーダ26は、オーディオストリームを復号し、このオーディオストリームに付加されているPTS(Presentation Time Stamp)と、時刻制御部29から供給されたSTCとが一致したときに、復号したオーディオデータを出力する。
【0073】
なお、このオーディオデコーダ26の前段にあるオーディオバッファ23のバッファサイズ(additional_buffer_size)は、MPEG~2 CSPS=1に規定されたバッファサイズに比べて、次に示すだけの大きさが必要である。
【0074】
additional_buffer_size = (program_mux_rate ~ Ra)*Ra / program_mux_rate
ここで、“Ra”は、オーディオストリームの最大ビットレートである。“program_mux_rate”は、Clip−1 とClip−2のプログラムストリームの最大ビットレートのうち、大きいほうの値である。例えば、 program_mux_rate=10 Mbps, Ra=256 kbpsであれば、オーディオバッファ23のバッファサイズ(additional_buffer_size)は、0.249Mbitとなる。
【0075】
出力スイッチ27は、ビデオストリームに付加されているPTSと、時刻制御部29から供給されたSTCとが一致したときに、復号したビデオデータを出力する。なお、この出力スイッチ27は、必要に応じて、リオーダバッファ25に格納されたビデオデータを出力する。
【0076】
時間制御部28は、スキップ再生の際のアウト点側プログラムからイン点側プログラムへの切り換え時に、アウト点側プログラムのSCRに同期したSTCと、イン点側プログラムのSCRに同期したSTCとの2つのSTCを発生する。
【0077】
時間制御部28は、例えば、STCを発生するSTC発生器28aと、STC発生器28aが発生したSTCから所定のオフセット値(STC_delta)を減算する減算器28bとを有しており、オフセット値が減算されていないSTC発生器28aから直接出力されたSTC(これはアウト点側プログラムのSCRに同期したSTCであり、以下STC−1と呼ぶ。)と、STC発生器28aから直接出力されるSTC−1からオフセット値(STC_delta)を減算したSTC(これはイン点側プログラムのSCRに同期したSTCであり、以下STC−2と呼ぶ。)との2つのSTCを出力する。
【0078】
すなわち、このオフセット値(STC delta)は、Clip−1とClip−2との多重化ストリームの時間軸のオフセット量を示しており、Clip−1のビデオを表示終了する時のClip−1の時間軸上での時刻とClip−2のビデオを表示開始する時のClip−2の時間軸上での時刻の差を示している。
【0079】
例えば、ここで、Clip−1の時間軸上におけるアウト点ピクチャPoutのPTSを“PTS_Pout”とし、アウト点ピクチャPoutの表示期間を“Tpp”とし、Clip−2の時間軸上におけるイン点ピクチャPinのPTSを“PTS_Pin”とすると、オフセット値“STC delta”は、以下の式に示すようになる。
【0080】
PTS_Pout_end = PTS_Pout + Tpp
STC_delta = PTS_Pout_end ~ PTS_Pin ・・・(1)
この時間制御部28から出力される2つのSTC(STC−1,STC−2)は、第1から第4のSTCスイッチSW1〜SW4によりいずれか一方が選択されて、デマルチプレクサ21、ビデオデコーダ24、オーディオデコーダ26、出力スイッチ27に供給される。第1のSTCスイッチSW1は、端子AにSTC−1が入力され、端子BにSTC−2が入力され、いずれか一方の端子を選択して選択した端子に入力されたSTCをデマルチプレクサ21に供給する。第2のSTCスイッチSW2は、端子AにSTC−1が入力され、端子BにSTC−2が入力され、いずれか一方の端子を選択して選択した端子に入力されたSTCをビデオデコーダ24に供給する。第3のSTCスイッチSW3は、端子AにSTC−1が入力され、端子BにSTC−2が入力され、いずれか一方の端子を選択して選択した端子に入力されたSTCをオーディオデコーダ26に供給する。第4のSTCスイッチSW4は、端子AにSTC−1が入力され、端子BにSTC−2が入力され、いずれか一方の端子を選択して選択した端子に入力されたSTCを出力スイッチ27に供給する。
【0081】
続いてこのように構成されるシステムターゲットデコーダ20の動作について説明する。
【0082】
図7にClip−1からClip−2へと連続して続く2つの多重化ストリームが入力されたときのシステムターゲットデコーダ20の動作タイミングを表すタイミングチャートを示す。
【0083】
まず、Clip−1の最初のパックに示されているSCRがSTC発生器28aにSTCとしてセットされる。第1から第4の各STCスイッチSW1〜SW4は全て端子A側に切り換えられ、STC−1(Clip−1のSCRに同期したSTC)がデマルチプレクサ21、ビデオデコーダ24、オーディオデコーダ26及び出力スイッチ27に供給されている。すなわち、Clip−1に付加されたSCRに基づき全ての機能が動作している。
【0084】
時刻T1以前では、デマルチプレクサ21には、Clip−1の各パックに付加されているsystem_clock_referenceと第1のSTCスイッチの端子Aから供給されるオフセットが加算されていないSTC−1とが一致したタイミングで入力される。
【0085】
続いて時刻T1となると、Clip−1の最後のvideo packのデマルチプレクサ21への入力が終了する。
【0086】
続いて時刻T1から時刻T2の間では、デマルチプレクサ21には、Clip−1の各packが、各packに付加されたsystem_clock_referenceを無視して、Clip−1の最大ビットレートprogram_mux_rate1で入力される。この最大ビットレートprogram_mux_rate1は、例えば、光ディスク2からデータを読み出す際の最大転送レートであってもよい。
【0087】
ここで、Clip−1の最後のビデオパックの次のパックから、Clip−1の最後のパックまでのデータ量を“N1”とすると、時刻T1から時刻T2までの時間“ΔT1”は、以下のようになる。
【0088】
ΔT1 =T2 ~ T1 = N1 / program_mux_rate1 ・・・(2)
続いて時刻T2となると、Clip−1の最後のpack(audio pack)のデマルチプレクサ21への入力が終了する。この時刻T2において、第1のSTCスイッチSW1は端子B側に切り換えられ、デマルチプレクサ21にSTC−2(Clip−2のSCRに同期したSTC)が供給される。そのため、デマルチプレクサ21は、Clip−2に付加されたSCRに基づき動作を開始する。
【0089】
続いて時刻T2から時刻T3の間では、Clip−2の最初のパケットがvideo packでない場合、デマルチプレクサ21には、Clip−2の最初のpackからClip−2の最初のvideo packの前のパックまでのパックが、各packのsystem_clock_referenceを無視して、Clip−2の最大ビットレートprogram_mux_rate2で入力される。この最大ビットレートprogram_mux_rate2は、例えば、光ディスク2からデータを読み出す際の最大転送レートであってもよい。
【0090】
ここで、Clip−2の最初のパックから、Clip−2の最初のビデオパックの前のパックまでのデータ量を“N2”とすると、時刻T2から時刻T3までの時間“ΔT2”は、以下のようになる。
【0091】
ΔT2 =T3 ~ T2 = N2 / program_mux_rate2 ・・・(3)
なお、MPEG2プログラムストリームは、一般的に、最初のパックがvideo packであるため、ΔT2=0である。
【0092】
続いて時刻T3となると、Clip−2の最初のvideo packのデマルチプレクサ21への入力が開始し、以後デマルチプレクサ21には、Clip−2の各packのsystem_clock_referenceと第1のSTCスイッチSW1の端子Bから供給されるオフセットが加算されたSTC−1とが一致したタイミングで入力される。
【0093】
ここで、Clip−2の最初のvideo packの system_clock_referenceは、次の不等式を満たさなければならない。
【0094】
SCR_video2_start > SCR_video1_end ~ STC_delta +ΔT1+ΔT2・・・(4)
SCR_video1_end = SCR_last_video1 + pack_length/program_mux_rate1
【0095】
“SCR_video2_start”はClip−2の最初のvideo packのsystem_clock_referenceであり、“SCR_video1_end”はClip−1の最後のvideo packがデマルチプレクサ21へ入力終了する時のClip−1の時間軸上での時刻である。これは、Clip−1の最後のvideo packのsystem_clock_reference(SCR_last_video1)とprogram_mux_rate1とパック長(pack_length)から以下のように計算することができる値である。pack_lengthは、例えば、2048 byteである。
【0096】
SCR_video1_end=SCR_last_video1 + pack_length/program_mux_rate1
【0097】
続いて時刻T4にとなると、第2のSTCスイッチSW2が端子A側から端子B側に切り換えられ、ビデオデコーダ24が参照しているSTCがSTC−1からSTC−2に切り換えられる。ビデオデコーダ24は、ビデオストリームの各ピクチャに付けられているdecoding_time_stampを参照するためのSTCが切り換えられることにより、Clip−2のビデオストリームの復号を開始する。
【0098】
続いて時刻T5となると、第3のSTCスイッチSW3が端子A側から端子B側に切り換えられ、オーディオデコーダ26が参照しているSTCがSTC−1からSTC−2に切り換えられる。オーディオデコーダ26は、オーディオストリームに付けられているpresentation_time_stampを参照するためのSTCが切り換えられることにより、Clip−2のオーディオストリームの出力を開始する。なお、オーディオデコーダ26は、Clip−1の終了部分のオーディオデータとClip−2の開始部のオーディオデータに、データのオーバーラップがあるときには、どちらのオーディオのサンプルを表示するか選択する必要がある。
【0099】
続いて時刻T6となると、第4のSTCスイッチSW4が端子A側から端子B側に切り換えられ、出力スイッチ27が参照しているSTCがSTC−1からSTC−2に切り換えられる。出力スイッチ27は、ビデオストリームの各ピクチャに付けられているpresentation_time_stampを参照するためのSTCが切り換えられることにより、Clip−2のビデオストリームの出力を開始する。
【0100】
そして、この時刻T6において、第1から第4のSTCスイッチSW1〜SW4が全て端子B側に切り換えられると、STC発生器28aから発生されるSTCの値が、[STC~STC_delta]にリセットされ、それとともに、第1から第4のSTCスイッチSW1〜SW4がすべて端子A側に切り換えられ、上述した時刻T1以前の状態と同一となる。
【0101】
つぎに、動画像記録再生装置1において再エンコードして生成するブリッジシーケンスのレートコントロールと、ブリッジシーケンスの再多重化処理の制限について説明する。
【0102】
光ディスク2に記録するClip−1とClip−2は、ともにMPEG2システムで定義されるP−STD(Program stream System Target Decoder)の動作を満たすプログラムストリームとなるように再エンコード及び再多重化をしなければならない。動画像記録再生装置1では、Clip−1及びClip−2の再エンコード及び再多重化を以下のような制限のもとで行う。
【0103】
動画像記録再生装置1は、Clip−1からClip−2へ多重化ストリームを連続してデコードするときにP−STDのビデオバッファがアンダーフローおよびオーバーフローしないように再エンコード及び再多重化を行う。例えば、上述したシステムターゲットデコーダ20であれば、Clip−1に続いてClip−2のビデオパケットをビデオバッファ22へ入力する場合に、このビデオバッファ22がオーバーフローおよびアンダーフローしないように、Clip−1の時間軸とClip−2の時間軸とを同じ時間軸に換算してClip−2のビデオパケットがビデオバッファ22へ入力される時刻を制限し、ブリッジシーケンスの再エンコード及び再多重化を行う。
【0104】
上記システムターゲットデコーダ20のビデオバッファ22のビット占有量を図示し、ブリッジシーケンスのレートコントロールとその再多重化処理の制限について具体的に説明する。
【0105】
図8に、Clip−1の多重化ストリームのシステムターゲットデコーダ20におけるビデオバッファ22のビット占有量の変化を示す。ここで、横軸time1は、Clip−1の時間軸上での時刻を表す。縦軸は、ビデオバッファ22のビット占有量を示し、BSの値は、例えば、MPEG2 MP@MLでは232 kByteである。
【0106】
図8中のa1(i)は、Clip−1 の復号順でi番目の符号化ピクチャのビット量を表す。t1(i)は、a1(i)が復号される時刻を表し、この値はDTSとしてビットストリーム中に付加されている。また、a1(n)は、Clip−1の最後に復号されるピクチャのビット量を表し、t1(n)は、a1(n)がデコードされる時刻を表す。図中のバッファ占有量の軌跡が、右上がりになっている時間帯は、ビデオバッファ22へデータが、Clip−1のビットレートprogram_mux_rate1で入力されていることを表す。また、傾きゼロの直線(水平)の時間帯は、ビデオバッファ22へのデータ入力が停止していることを表す。
【0107】
時刻SCR_video1_endは、Clip−1の最後のビデオパック(図3に示すbridge sequence~Aの最後のvideo pack)のデータがビデオバッファ22に入力終了する時刻である。Bbは、時刻SCR_video1_endにおけるビデオバッファ22のビット占有量である。時刻SCR_video1_end以降は、DTSで決められた時刻にデータがバッファから引き抜かれるだけで、ビデオバッファ22にはデータが入力されず、ビット占有量が減少していく。
【0108】
t1(n+1)は、a1(n)がデコード終了する時刻を表す。t1(n+1)は、ビットストリーム中には現れない時間である。(t1(n+1)~t1(n))は、a1(n)のpicture_structure, picture_coding_type, repeat_first_field, a1(n)の直前のcoded~I~frameまたはcode~P~frameのrepeat_first_fieldであるprev_IP_repeat_firat_fieldから次のように計算できる。
【0109】
【数1】
【0110】
図9は、Clip−2の多重化ストリームのシステムターゲットデコーダ20におけるビデオバッファ22のビット占有量の変化を示す。ここで、横軸time2は、Clip−2の時間軸上での時刻を表す。縦軸は、ビデオバッファ22のビット占有量を示し、BSの値は、例えば、MPEG2 MP@MLでは232 kByteである。
【0111】
図9中のa2(i)は、Clip−2の復号順でi番目の符号化ピクチャのビット量を表す。t2(i)は、a2(i)が復号される時刻を表し、この値はDTSとしてビットストリーム中に付加されている。また、a2(0)は、Clip−2の最初に復号されるピクチャのビット量を表し、t2(0)は、a2(0)がデコードされる時刻を表す。図中のバッファ占有量の軌跡が、右上がりになっている時間帯は、ビデオバッファ22へデータが、Clip−2のビットレートprogram_mux_rate2で入力されていることを表す。また、傾きゼロの直線(水平)の時間帯は、ビデオバッファ22へのデータ入力が停止していることを表す。
【0112】
時刻SCR_video2_startは、Clip−2の最初のビデオパック(図4に示すbridge sequence-Bの最初のvideo pack)がビデオバッファ22に入力開始する時刻である。時刻SCR_video2_startは、Clip−2の最初のビデオパックに符号化されているSCRに示されている時刻である。SCR_video2_startは、上述した(4)式を満たさねばならない。
【0113】
また、Clip−2のビット占有量の軌跡は、Clip−1の終端部分でのビデオバッファ22のビット占有量から制限を受ける。すなわち、Clip−1とClip−2のそれぞれの時間軸を同じ時間軸に換算して、Clip−1に続いてClip−2のビデオパケットを同一のビデオバッファ22へ入力する場合に、このビデオバッファ22がオーバーフローおよびアンダーフローしないように、Clip−2のビデオパケットがビデオバッファへ入力される時刻が制限されていなければならない。
【0114】
この図9において、time2=SCR_video1_end - STC_delta は、time1=SCR_video1_endをtime2上の値に換算した時刻である。ここで、STC_deltaは、上述した式(1)により定義される値である。時刻time2=SCR_video1_end - STC_deltaから始まる階段状の軌跡の図面上側の斜線領域は、Clip−1の終端部分におけるビデオデータのビット占有量の変化を表す。Clip−1からClip−2へ続けて、ビデオパケットをビデオバッファ22へ入力するときに、このビデオバッファ22がオーバーフローしないためには、この図9に示すClip−2のビット占有量の軌跡が図面の斜線領域の下側となっているようにbridge sequence-Bを再エンコードと多重化しなければならない。
【0115】
この関係を式で表すと次のようになる。
【0116】
b1(time1) + b2(time1-STC_delta) <= BS
ここで、“b1”は、Clip-1の時間軸上の時刻time1におけるP-STDのビデオバッファのビット占有量の変化である。また、“b2”は、Clip-2の時間軸上の時刻time2= time1-STC_deltaにおけるP-STDのビデオバッファのビット占有量の変化である。
【0117】
以上のように動画像記録再生装置1では、再エンコードして生成するブリッジシーケンスのレートコントロールとブリッジシーケンスの再多重化処理の制限することによって、Clip−2のビデオストリームがデコーダのビデオバッファに入力開始する時刻から、Clip−1のビデオストリームがデコーダのビデオバッファに入力開始する時刻までの間におけるこのビデオバッファのビット占有量を、上記ビデオバッファの容量以下で0以上となるように符号化して、スキップ点の前後における動画像の連続性を保ちスキップ再生をし、スキップ再生時にデコーダのビデオバッファをオーバーフロー及びアンダーフローさせることなく再生の連続性を確保することができる。
【0118】
なお、デコードしたブリッジシーケンスが高画質となるようにエンコードするための例を以下に挙げる。
【0119】
例えば、図8における (t(n+1)~ SCR_video1_end)をできるだけ大きくする。
【0120】
そのためには、Clip~1のビデオのバッファへの入力をできるだけ早く終了するように、プログラムストリームを多重化する必要がある。
【0121】
また、例えば、図9における斜線領域を、Clip~1の画質を考慮してできるだけ小さくする。
【0122】
この斜線領域が大きいほどtime2=SCR_video2_startからt2(0)までの間にビデオバッファへ入力できるデータ量が制限を受ける。すなわち、この斜線領域が大きいほど、Clip~2のBridge sequenceのビデオの再エンコードにおいて、ピクチャのビット量を小さくしなければならなくなる。具体的には、Clip~1の最後のピクチャから2、3フレーム以内にI~pictureがある場合、上記斜線領域が大きくなる場合がある。このような場合、以下に示すように、そのIピクチャをPピクチャに変更して再エンコードすることにより、発生ビット量を小さくすることができるので、上記斜線領域を小さくすることができる。
【0123】
改善前 I2 B0 B1 P5 B3 B4 P8 B6 B7 I11 B9 B10
改善後 I2 B0 B1 P5 B3 B4 P8 B6 B7 P11 B9 B10
【0124】
【発明の効果】
本発明にかかる多重化装置及び多重化方法では、第2の多重化ストリームの最初のビデオパックをデコーダのビデオバッファへ入力開始する上記第2のビデオ符号化ストリームの時間軸上における時刻( SCR_video2_start )が、 SCR_video2_start>SCR_video1_end - STC_delta + Δ T1 の関係を満たすように第1のビデオ符号化ストリーム及び上記第2のビデオ符号化ストリームを符号化する。
【0125】
このことにより本発明にかかる多重化装置及び多重化方法では、デコーダ側で、スキップ点の前後における動画像の連続性を保ちスキップ再生をし、スキップ再生時にデコーダのビデオバッファをオーバーフロー及びアンダーフローさせることなく再生の連続性を確保することができる。
【0126】
また、本発明にかかる記録媒体は、第2の多重化ストリームの最初のビデオパックをデコーダのビデオバッファへ入力開始する上記第2のビデオ符号化ストリームの時間軸上における時刻( SCR_video2_start )が、 SCR_video2_start>SCR_video1_end - STC_delta + Δ T1 の関係を満たすように第1のビデオ符号化ストリーム及び上記第2のビデオ符号化ストリームの符号化を行い、上記第1の多重化ストリームと上記第2の多重化ストリームとを生成する多重化方法により生成されるデータが記録された領域を有する。
【0127】
このことにより本発明にかかる記録媒体では、この記録媒体の再生装置に対して、スキップ点の前後における動画像の連続性を保ちスキップ再生をし、スキップ再生時にデコーダのビデオバッファをオーバーフロー及びアンダーフローさせることなく再生の連続性を確保させることができる。
【図面の簡単な説明】
【図1】本発明を適用した動画像記録再生装置のブロック図である。
【図2】上記動画像記録再生装置が再エンコードするビデオストリーム及び再エンコードしたビデオストリームを示す図である。
【図3】上記動画像記録再生装置が再多重化するアウト点側プログラムの多重化ストリーム及び再多重化して生成したブリッジシーケンスを示す図である。
【図4】上記動画像記録再生装置が再多重化するイン点側プログラムの多重化ストリーム及び再多重化して生成したブリッジシーケンスを示す図である。
【図5】アウト点側プログラムとイン点側プログラムの編集点前後の多重化ストリームの構造を示す図である。
【図6】上記動画像記録再生装置が多重化した多重化ストリームを復号するシステムターゲットデコーダのブロック図である。
【図7】上記動画像記録再生装置により多重化された多重化ストリームが入力されたときの上記システムターゲットデコーダの動作タイミングを表すタイミングチャートである。
【図8】上記システムターゲットデコーダのビデオバッファにアウト点側プログラムが入力されたときのビット占有量の変位を表す図である。
【図9】上記システムターゲットデコーダのビデオバッファにイン点側プログラムが入力されたときのビット占有量の変位を表す図である。
【図10】MPEG方式で符号化された各ピクチャを説明する図である。
【図11】MPEG方式で符号化された符号化データのスキップ再生について説明する図である。
【符号の説明】
1 動画像記録再生装置、2 光ディスク、11 デマルチプレクサ、12 ビデオデコーダ、13 ビデオエンコーダ、14 マルチプレクサ、15 編集情報入力部、16 解析制御部、20 システムターゲットデコーダ、21 デマルチプレクサ、22 ビデオバッファ、23 オーディオバッファ、24 ビデオデコーダ、26 オーディオデコーダ、28 時間管理部
Claims (6)
- 第1のピクチャで表示終了する第1のビデオ符号化ストリームと、スキップ再生の際にこの第1のピクチャに続けて表示される第2のピクチャから表示開始する第2のビデオ符号化ストリームとの符号化をするビデオ符号化手段と、
上記第1のビデオ符号化ストリームとこの上記第1のビデオ符号化ストリームに同期したオーディオ符号化ストリームとをパック化して第1の多重化ストリームを生成し、上記第2のビデオ符号化ストリームとこの第2のビデオ符号化ストリームに同期したオーディオ符号化ストリームとをパック化して第2の多重化ストリームを生成する多重化手段と、
上記第1のビデオ符号化ストリームの時間軸上における上記第1のピクチャの表示終了時刻( PTS_Pout_end )と、上記第2のビデオ符号化ストリームの時間軸上における上記第2のピクチャの表示開始時刻( PTS_Pin )との時間差( STC_delta=PTS_Pout_end-PTS_Pin )を求め、上記第1の多重化ストリームの最後のビデオパックをデコーダのビデオバッファへ入力終了する上記第1のビデオ符号化ストリームの時間軸上における時刻( SCR_video1_end )を求め、上記第1の多重化ストリームの最後のビデオパックの次のパックからこの第1の多重化ストリームの最後のパックまでのデータ量( N1 )を求め、上記データ量 (N1) を上記デコーダへ入力する際に要する時間(Δ T1 )を求め、上記第2の多重化ストリームの最初のビデオパックを上記デコーダのビデオバッファへ入力開始する上記第2のビデオ符号化ストリームの時間軸上における時刻( SCR_video2_start )が、
SCR_video2_start>SCR_video1_end - STC_delta + Δ T1
上式の関係を満たすように上記ビデオ符号化手段を制御する制御手段とを備えること
を特徴とする多重化装置。 - 上記制御手段は、上記第2の多重化ストリームの最初のパックがビデオパックでない場合には、上記第2の多重化ストリームの最初のパックからこの第2の多重化ストリームの最初のビデオパックの直前のパックまでのデータ量(N2)を求め、上記データ量(N2)を上記デコーダへ入力する際に要する時間(ΔT2)を求め、上記第2の多重化ストリームの最初のビデオパックを上記デコーダのビデオバッファへ入力開始する上記第2のビデオ符号化ストリームの時間軸上における時刻(SCR_video2_start)が、
SCR_video2_start>SCR_video1_end - STC_delta + ΔT1+ ΔT2
上式の関係を満たすように上記ビデオ符号化手段を制御することを特徴とする請求項1記載の多重化装置。 - 第1のピクチャで表示終了する第1のビデオ符号化ストリームの時間軸上における上記第1のピクチャの表示終了時刻(PTS_Pout_end)とスキップ再生の際にこの第1のピクチャに続けて表示される第2のビデオ符号化ストリームの時間軸上における上記第2のピクチャの表示開始時刻(PTS_Pin)との時間差(STC_delta=PTS_Pout_end-PTS_Pin)を求め、
上記第1のビデオ符号化ストリームとこの上記第1のビデオ符号化ストリームに同期したオーディオ符号化ストリームとがパック化され生成される第1の多重化ストリームの最後のビデオパックをデコーダのビデオバッファへ入力終了する上記第1のビデオ符号化ストリームの時間軸上における時刻(SCR_video1_end)を求め、
上記第1の多重化ストリームの最後のビデオパックの次のパックからこの第1の多重化ストリームの最後のパックまでのデータ量(N1)を求め、
上記データ量(N1)を上記デコーダへ入力する際に要する時間(ΔT1)を求め、
上記第2のビデオ符号化ストリームとこの第2のビデオ符号化ストリームに同期したオーディオ符号化ストリームとをパック化して生成される第2の多重化ストリームの最初のビデオパックを上記デコーダのビデオバッファへ入力開始する上記第2のビデオ符号化ストリームの時間軸上における時刻(SCR_video2_start)が、
SCR_video2_start>SCR_video1_end - STC_delta +ΔT1
上式の関係を満たすように上記第1のビデオ符号化ストリーム及び上記第2のビデオ符号化ストリームの符号化をし、
上記第1の多重化ストリームと第2の多重化ストリームとを生成すること
を特徴とする多重化方法。 - 上記第2の多重化ストリームの最初のパックがビデオパックでない場合には、
上記第2の多重化ストリームの最初のパックからこの第2の多重化ストリームの最初のビデオパックの直前のパックまでのデータ量(N2)を求め、
上記データ量(N2)を上記デコーダへ入力する際に要する時間(ΔT2)を求め、
上記第2の多重化ストリームの最初のビデオパックを上記デコーダのビデオバッファへ入力開始する上記第2のビデオ符号化ストリームの時間軸上における時刻(SCR_video2_start)が、
SCR_video2_start>SCR_video1_end - STC_delta + ΔT1+ ΔT2
上式の関係を満たすように上記第1のビデオ符号化ストリーム及び上記第2のビデオ符号化ストリームの符号化をすること
を特徴とする請求項3記載の多重化方法。 - 第1のピクチャで表示終了する第1のビデオ符号化ストリームの時間軸上における上記第1のピクチャの表示終了時刻(PTS_Pout_end)とスキップ再生の際にこの第1のピクチャに続けて表示される第2のビデオ符号化ストリームの時間軸上における上記第2のピクチャの表示開始時刻(PTS_Pin)との時間差(STC_delta=PTS_Pout_end-PTS_Pin)と、上記第1のビデオ符号化ストリームとこの上記第1のビデオ符号化ストリームに同期したオーディオ符号化ストリームとをパック化して多重化された第1の多重化ストリームの最後のビデオパックをデコーダのビデオバッファへ入力終了する上記第1のビデオ符号化ストリームの時間軸上における時刻(SCR_video1_end)と、上記第1の多重化ストリームの最後のビデオパックの次のパックからこの第1の多重化ストリームの最後のパックまでのデータ量(N1)と、上記データ量(N1)を上記デコーダへ入力する際に要する時間(ΔT1)とに基づき、上記第2のビデオ符号化ストリームとこの第2のビデオ符号化ストリームに同期したオーディオ符号化ストリームとをパック化して多重化された第2の多重化ストリームの最初のビデオパックを上記デコーダのビデオバッファへ入力開始する上記第2のビデオ符号化ストリームの時間軸上における時刻(SCR_video2_start)が、
SCR_video2_start>SCR_video1_end - STC_delta +ΔT1
上式の関係を満たすように上記第1のビデオ符号化ストリーム及び上記第2のビデオ符号化ストリームの符号化を行い、上記第1の多重化ストリームと上記第2の多重化ストリームとを生成する多重化方法により生成されるデータが記録された領域を有し記録可能であることを特徴とする記録媒体。 - 上記第2の多重化ストリームの最初のパックがビデオパックでない場合には、上記第2の多重化ストリームの最初のパックからこの第2の多重化ストリームの最初のビデオパックの直前のパックまでのデータ量(N2)と、上記データ量(N2)を上記デコーダへ入力する際に要する時間(ΔT2)とに基づき、上記第2の多重化ストリームの最初のビデオパックを上記デコーダのビデオバッファへ入力開始する上記第2のビデオ符号化ストリームの時間軸上における時刻(SCR_video2_start)が、
SCR_video2_start>SCR_video1_end - STC_delta + ΔT1+ ΔT2
上式の関係を満たすように上記第1のビデオ符号化ストリーム及び上記第2のビデオ符号化ストリームの符号化を行い、上記第1の多重化ストリームと上記第2の多重化ストリームとを生成する多重化方法により生成されるデータが記録された領域を有し記録可能であることを特徴とする請求項5記載の記録媒体。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP34594698A JP3918332B2 (ja) | 1998-12-04 | 1998-12-04 | 多重化装置、多重化方法及び記録媒体 |
US09/454,956 US6785464B1 (en) | 1998-12-04 | 1999-12-03 | Multiplexing method for continuous reproduction of encoded pictures during skipping |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP34594698A JP3918332B2 (ja) | 1998-12-04 | 1998-12-04 | 多重化装置、多重化方法及び記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000175152A JP2000175152A (ja) | 2000-06-23 |
JP3918332B2 true JP3918332B2 (ja) | 2007-05-23 |
Family
ID=18380084
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP34594698A Expired - Lifetime JP3918332B2 (ja) | 1998-12-04 | 1998-12-04 | 多重化装置、多重化方法及び記録媒体 |
Country Status (2)
Country | Link |
---|---|
US (1) | US6785464B1 (ja) |
JP (1) | JP3918332B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW518844B (en) * | 2001-03-21 | 2003-01-21 | Ind Tech Res Inst | Transmission method of multimedia data packet in network system |
US7577333B2 (en) * | 2001-08-04 | 2009-08-18 | Samsung Electronics Co., Ltd. | Method and apparatus for recording and reproducing video data, and information storage medium in which video data is recorded by the same |
WO2004091204A1 (ja) * | 2003-04-04 | 2004-10-21 | Victor Company Of Japan, Limited | オーディオ/ビデオ記録装置、記録方法、再生装置、再生方法、再生プログラム及び記録プログラム |
JP4902935B2 (ja) * | 2003-05-08 | 2012-03-21 | ソニー株式会社 | 情報処理装置、情報処理方法、プログラム、及び記録媒体 |
JP2005057657A (ja) * | 2003-08-07 | 2005-03-03 | Canon Inc | 画像処理装置 |
US7706377B2 (en) * | 2004-03-03 | 2010-04-27 | Nxp B.V. | Video processing circuit and method of video processing |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69422960T2 (de) * | 1993-12-01 | 2000-06-15 | Matsushita Electric Ind Co Ltd | Verfahren und Vorrichtung zum Editieren oder zur Mischung von komprimierten Bildern |
US5534944A (en) * | 1994-07-15 | 1996-07-09 | Matsushita Electric Corporation Of America | Method of splicing MPEG encoded video |
JP3752694B2 (ja) * | 1995-04-07 | 2006-03-08 | ソニー株式会社 | 圧縮映像信号編集装置、編集方法、及び復号化装置 |
JP2795223B2 (ja) * | 1995-07-18 | 1998-09-10 | 日本電気株式会社 | 画像信号の符号化方法 |
US6400886B1 (en) * | 1996-11-15 | 2002-06-04 | Futuretel, Inc. | Method and apparatus for stitching edited video segments |
JP3763172B2 (ja) * | 1996-12-16 | 2006-04-05 | ソニー株式会社 | ディジタル信号復号方法及び装置、並びにディジタル信号再生装置 |
JP4099547B2 (ja) * | 1997-01-23 | 2008-06-11 | ソニー株式会社 | ディジタル信号編集装置及び方法 |
US5982436A (en) * | 1997-03-28 | 1999-11-09 | Philips Electronics North America Corp. | Method for seamless splicing in a video encoder |
JPH10285548A (ja) * | 1997-04-03 | 1998-10-23 | Sony Corp | 符号化装置及び方法、復号装置及び方法、編集方法 |
JPH10285529A (ja) * | 1997-04-04 | 1998-10-23 | Sony Corp | 画像編集装置および画像編集方法 |
JPH1169301A (ja) * | 1997-08-08 | 1999-03-09 | Sony Corp | 復号方法及び復号再生装置、並びに記録媒体 |
WO1999014756A2 (en) * | 1997-09-17 | 1999-03-25 | Matsushita Electric Industrial Co., Ltd. | Video data editing apparatus and computer-readable recording medium storing an editing program |
US6301428B1 (en) * | 1997-12-09 | 2001-10-09 | Lsi Logic Corporation | Compressed video editor with transition buffer matcher |
JP3305999B2 (ja) * | 1997-12-26 | 2002-07-24 | 日本ビクター株式会社 | 画像圧縮ストリーム編集装置及びその方法 |
-
1998
- 1998-12-04 JP JP34594698A patent/JP3918332B2/ja not_active Expired - Lifetime
-
1999
- 1999-12-03 US US09/454,956 patent/US6785464B1/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
US6785464B1 (en) | 2004-08-31 |
JP2000175152A (ja) | 2000-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4487374B2 (ja) | 符号化装置及び符号化方法並びに多重化装置及び多重化方法 | |
JP4538908B2 (ja) | データ変換装置及び方法 | |
US6240137B1 (en) | Encoding apparatus and method, decoding apparatus and method, and editing method | |
JP4902935B2 (ja) | 情報処理装置、情報処理方法、プログラム、及び記録媒体 | |
JP3918332B2 (ja) | 多重化装置、多重化方法及び記録媒体 | |
KR100975170B1 (ko) | 화상 데이터 재생 장치 및 방법 | |
JP2003052040A (ja) | Mpegデータ再生装置 | |
US20080260026A1 (en) | Moving-picture coding apparatus, method and program | |
JP2003052010A (ja) | Mpegデータ記録方法 | |
KR20040010173A (ko) | 화상 데이터 재생 장치 및 방법 | |
JP2005198350A (ja) | アフレコ信号再生方法 | |
JP2000316158A (ja) | 符号化装置及び符号化方法 | |
JP3748243B2 (ja) | Mpegデータ記録装置 | |
JP2001268513A (ja) | 動画像再生装置および動画像記録再生システム | |
JP2005198349A (ja) | 記録媒体 | |
JP2004297829A (ja) | Mpegデータ再生装置 | |
JP2003052018A (ja) | Mpegデータ記録装置 | |
JP2003111026A (ja) | Mpegデータ記録方法 | |
JP2003052021A (ja) | Mpegデータ再生方法 | |
JP2003092734A (ja) | Mpegデータ記録装置 | |
JP2003116106A (ja) | Mpegデータ記録方法 | |
JP2003116107A (ja) | Mpegデータ記録方法 | |
JP2005245006A (ja) | アフレコ信号再生装置 | |
JP2005237021A (ja) | アフレコ信号再生用プログラム | |
JP2005198351A (ja) | アフレコ信号再生装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051130 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20061012 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20061024 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061222 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070123 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070205 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100223 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110223 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120223 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130223 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130223 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140223 Year of fee payment: 7 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |