JP4910065B2 - 復号システム - Google Patents

復号システム Download PDF

Info

Publication number
JP4910065B2
JP4910065B2 JP2010195100A JP2010195100A JP4910065B2 JP 4910065 B2 JP4910065 B2 JP 4910065B2 JP 2010195100 A JP2010195100 A JP 2010195100A JP 2010195100 A JP2010195100 A JP 2010195100A JP 4910065 B2 JP4910065 B2 JP 4910065B2
Authority
JP
Japan
Prior art keywords
picture
information
random access
unit
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010195100A
Other languages
English (en)
Other versions
JP2011019270A (ja
Inventor
正真 遠間
眞也 角野
智之 岡田
洋 矢羽田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2010195100A priority Critical patent/JP4910065B2/ja
Publication of JP2011019270A publication Critical patent/JP2011019270A/ja
Application granted granted Critical
Publication of JP4910065B2 publication Critical patent/JP4910065B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/005Reproducing at a different information rate from the information rate of recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/426Internal components of the client ; Characteristics thereof
    • H04N21/42646Internal components of the client ; Characteristics thereof for reading from or writing on a non-volatile solid state storage medium, e.g. DVD, CD-ROM
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/432Content retrieval operation from a local storage medium, e.g. hard-disk
    • H04N21/4325Content retrieval operation from a local storage medium, e.g. hard-disk by playing back content from the storage medium
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/433Content storage operation, e.g. storage operation in response to a pause request, caching operations
    • H04N21/4332Content storage operation, e.g. storage operation in response to a pause request, caching operations by placing content in organized collections, e.g. local EPG data repository
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/433Content storage operation, e.g. storage operation in response to a pause request, caching operations
    • H04N21/4334Recording operations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8451Structuring of content, e.g. decomposing content into time segments using Advanced Video Coding [AVC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • H04N21/85406Content authoring involving a specific file format, e.g. MP4 format
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/78Television signal recording using magnetic recording
    • H04N5/782Television signal recording using magnetic recording on tape
    • H04N5/783Adaptations for reproducing at a rate different from the recording rate
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/25Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
    • G11B2220/2537Optical discs
    • G11B2220/2541Blu-ray discs; Blue laser DVR discs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/84Television signal recording using optical recording
    • H04N5/85Television signal recording using optical recording on discs or drums
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/806Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal
    • H04N9/8063Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal using time division multiplex of the PCM audio and PCM video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
    • H04N9/8227Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal the additional signal being at least another television signal

Description

本発明は、動画像を符号化したストリームを生成する動画像ストリームを記録する領域を有する記録媒体とその復号装置とから構成される復号システム等に関し、特に、飛び込み再生、可変速あるいは逆再生等の特殊再生が可能なストリームを生成する動画像ストリームを記録する領域を有する記録媒体等に関する。
近年、音声、画像、その他の画素値を統合的に扱うマルチメディア時代を迎え、従来からの情報メディア、つまり新聞、雑誌、テレビ、ラジオ、電話等の情報を人に伝達する手段がマルチメディアの対象として取り上げられるようになってきた。一般に、マルチメディアとは、文字だけでなく、図形、音声、特に画像等を同時に関連づけて表すことをいうが、上記従来の情報メディアをマルチメディアの対象とするには、その情報をディジタル形式にして表すことが必須条件となる。
ところが、上記各情報メディアの持つ情報量をディジタル情報量として見積もってみると、文字の場合1文字当たりの情報量は1〜2バイトであるのに対し、音声の場合1秒当たり64Kbits(電話品質)、さらに動画については1秒当たり100Mbits(現行テレビ受信品質)以上の情報量が必要となり、上記情報メディアでその膨大な情報をディジタル形式でそのまま扱うことは現実的では無い。例えば、テレビ電話は、64Kbit/s〜1.5Mbits/sの伝送速度を持つサービス総合ディジタル網(ISDN:Integrated Services Digital Network)によってすでに実用化されているが、テレビ・カメラの映像をそのままISDNで送ることは不可能である。
そこで、必要となってくるのが情報の圧縮技術であり、例えば、テレビ電話の場合、ITU−T(国際電気通信連合 電気通信標準化部門)で勧告されたH.261やH.263規格の動画圧縮技術が用いられている。また、MPEG−1規格の情報圧縮技術によると、通常の音楽用CD(コンパクト・ディスク)に音声情報とともに画像情報を入れることも可能となる。
ここで、MPEG(Moving Picture Experts Group)とは、ISO/IEC(国際標準化機構 国際電気標準会議)で標準化された動画像信号圧縮の国際規格であり、MPEG−1は、動画像信号を1.5Mbpsまで、つまりテレビ信号の情報を約100分の1にまで圧縮する規格である。また、MPEG−1規格では対象とする品質を伝送速度が主として約1.5Mbpsで実現できる程度の中程度の品質としたことから、さらなる高画質化の要求をみたすべく規格化されたMPEG−2では、動画像信号を2〜15MbpsでTV放送品質を実現する。さらに現状では、MPEG−1、MPEG−2と標準化を進めてきた作業グループ(ISO/IEC JTC1/SC29/WG11)によって、MPEG−1、MPEG−2を上回る圧縮率を達成し、更に物体単位で符号化・復号化・操作を可能とし、マルチメディア時代に必要な新しい機能を実現するMPEG−4が規格化された。MPEG−4では、当初、低ビットレートの符号化方法の標準化を目指して進められたが、現在はインタレース画像も含む高ビットレートも含む、より汎用的な符号化に拡張されている。その後、ISO/IECとITU−Tが共同でより高圧縮率の次世代画像符号化方式として、MPEG−4 AVC(Advanced Video Coding)が標準化され、次世代の光ディスク関連機器、あるいは携帯端末向けの放送などで使用される見込みである。
一般に、動画像の符号化では、時間方向および空間方向の冗長性を削減することによって情報量の圧縮を行う。そこで時間的な冗長性の削減を目的とする画面間予測符号化では、前方または後方のピクチャを参照してブロック単位で動きの検出および予測画像の作成を行い、得られた予測画像と符号化対象ピクチャとの差分値に対して符号化を行う。ここで、ピクチャとは1枚の画面を表す用語であり、プログレッシブ画像ではフレームを意味し、インタレース画像ではフレームもしくはフィールドを意味する。ここで、インタレース画像とは、1つのフレームが時刻の異なる2つのフィールドから構成される画像である。インタレース画像の符号化や復号化処理においては、1つのフレームをフレームのまま処理したり、2つのフィールドとして処理したり、フレーム内のブロック毎にフレーム構造またはフィールド構造として処理したりすることができる。
参照画像を持たず画面内予測符号化を行うものをIピクチャと呼ぶ。また、1枚のピクチャのみを参照し画面間予測符号化を行うものをPピクチャと呼ぶ。また、同時に2枚のピクチャを参照して画面間予測符号化を行うことのできるものをBピクチャと呼ぶ。Bピクチャは表示時間が前方もしくは後方から任意の組み合わせとして2枚のピクチャを参照することが可能である。参照画像(参照ピクチャ)は符号化および復号化の基本単位であるブロックごとに指定することができるが、符号化を行ったビットストリーム中に先に記述される方の参照ピクチャを第1参照ピクチャ、後に記述される方を第2参照ピクチャとして区別する。ただし、これらのピクチャを符号化および復号化する場合の条件として、参照するピクチャが既に符号化および復号化されている必要がある。
PピクチャまたはBピクチャの符号化には、動き補償画面間予測符号化が用いられている。動き補償画面間予測符号化とは、画面間予測符号化に動き補償を適用した符号化方式である。動き補償とは、単純に参照フレームの画素値から予測するのではなく、ピクチャ内の各部の動き量(以下、これを動きベクトルと呼ぶ)を検出し、当該動き量を考慮した予測を行うことにより予測精度を向上すると共に、データ量を減らす方式である。例えば、符号化対象ピクチャの動きベクトルを検出し、その動きベクトルの分だけシフトした予測値と符号化対象ピクチャとの予測残差を符号化することによりデータ量を減している。この方式の場合には、復号化の際に動きベクトルの情報が必要になるため、動きベクトルも符号化されて記録または伝送される。
動きベクトルはマクロブロック単位で検出されており、具体的には、符号化対象ピクチャ側のマクロブロックを固定しておき、参照ピクチャ側のマクロブロックを探索範囲内で移動させ、基準ブロックと最も似通った参照ブロックの位置を見つけることにより、動きベクトルが検出される。
図1は、従来のMPEG−2のストリームの構成図である。図1に示すようにMPEG−2のストリームは以下のような階層構造を有している。ストリーム(Stream)は複数のグループ・オブ・ピクチャ(Group Of Picture)から構成されており、これを符号化処理の基本単位とすることで動画像の編集やランダムアクセスが可能になっている。GOPは、複数のピクチャから構成され、各ピクチャは、Iピクチャ、PピクチャまたはBピクチャがある。ストリーム、GOPおよびピクチャはさらにそれぞれの単位の区切りを示す同期信号(sync)と当該単位に共通のデータであるヘッダ(header)から構成されている。
図2は、MPEG−2で使用されているピクチャ間の予測構造例である。同図で斜線をつけたピクチャは他のピクチャから参照されるピクチャである。図2(a)に示すように、MPEG−2ではPピクチャ(P0、P6、P9、P12、P15)は表示時刻が直前1枚のIピクチャもしくはPピクチャのみ参照した予測符号化が可能である。また、Bピクチャ(B1、B2、B4、B5、B7、B8、B10、B11、B13、B14、B16、B17、B19、B20)は表示時刻が直前1枚と直後1枚のIピクチャもしくはPピクチャを参照した予測符号化が可能である。更に、ストリームに配置される順序も決まっており、IピクチャおよびPピクチャは表示時刻の順序、Bピクチャは直後に表示されるIピクチャもしくはPピクチャの直後に配置される。GOP構造としては、例えば、図2(b)に示すように、I3からB14までのピクチャをまとめて1つのGOPとすることができる。
図3は、MPEG4 AVCのストリームの構成図である。MPEG4 AVCでは、GOPに相当する概念は無いが他のピクチャに依存せずに復号化できる特別なピクチャ単位でデータを分割すればGOPに相当するランダムアクセス可能な単位が構成できるので、これをランダムアクセス単位RAU(Random Access Unit)と呼ぶことにする。つまり、ランダムアクセス単位RAUは、他のピクチャに依存せずに復号化できる画面内符号化されたピクチャが先頭に配置されたピクチャの集まりである。
次に、ストリームを扱う際の基本単位であるアクセス単位(以下、単に「AU(Access Unit)」と呼ぶ。)について説明する。AUとは、1ピクチャ分の符号化データを格納する単位であり、パラメータセットPSや、スライスデータなどを含む。パラメータセットPSは各ピクチャのヘッダに相当するデータであるピクチャパラメータセットPPS(以下、単に「PPS」と呼ぶ。)とMPEG−2のGOP以上の単位のヘッダに相当するシーケンスパラメータセットSPS(以下、単に「SPS」と呼ぶ。)がある。SPSには、最大参照可能ピクチャ数、画像サイズ等が含まれており、PPSには、可変長符号化の方式、量子化ステップの初期値、参照ピクチャ数等が含まれている。各ピクチャには前記PPSおよびSPSの何れを参照するかを示す識別子が付与される。また、スライスデータには、ピクチャを識別するための識別番号であるフレーム番号FNが含まれる。なお、シーケンスは、以下に説明するように、復号するために必要な全ての状態がリセットされる特別なピクチャを先頭とし、復号順で直後となる前記特別なピクチャの直前ピクチャまでのピクチャから構成される。
MPEG−4 AVCにおけるIピクチャには、IDR(Instantaneous Decoder Refresh)ピクチャと、IDRピクチャではないIピクチャの2種類がある。IDRピクチャとは、復号化順でIDRピクチャより後の全ピクチャを、復号化順でIDRピクチャより前のピクチャを参照することなしに復号化することのできる、つまり、復号に必要な状態がリセットされるIピクチャであり、MPEG−2のclosed GOPの先頭Iピクチャに相当する。MPEG−4 AVCのシーケンスはIDRピクチャから開始する。IDRではないIピクチャにおいては、復号化順でIピクチャより後のピクチャが、復号化順で当該Iピクチャより前のピクチャを参照してもよい。ここで、IDRピクチャとIピクチャは、Iスライスのみから構成されるピクチャ、PピクチャはPスライスあるいはIスライスから構成されるピクチャ、BピクチャはBスライス、Pスライス、あるいはIスライスから構成されるピクチャを指すものとする。なお、IDRピクチャのスライスと、非IDRピクチャのスライスとは異なるタイプのNALユニットに格納される。
MPEG−4 AVCにおけるAUには、ピクチャの復号化に必須のデータに加えて、スライスデータの復号化に必須でないSEI(Supplemental Enhancement Information)と呼ばれる補助情報や、AUの境界情報なども含めることができる。パラメータセットPS、スライスデータ、SEIなどのデータは、全てNAL(Network Abstraction Layer)ユニットNALUに格納される。NALユニットは、ヘッダとペイロードから構成され、ヘッダには、ペイロードに格納されるデータのタイプ(以降、NALユニットタイプと呼ぶ)を示すフィールドなどが含まれる。NALユニットタイプは、スライスやSEIなどデータの種類別に値が定義されており、NALユニットタイプを参照することにより、NALユニットに格納されるデータの種類を特定できる。NALユニットのヘッダには、nal_ref_idcと呼ばれるフィールドも含まれる。nal_ref_idcフィールドとは、NALユニットのタイプ毎に0あるいは1以上の値をとることが定められた2ビットのフィールドであり、例えばSPSやPPSのNALユニットでは1以上の値をとる。また、スライスのNALユニットでは、他のスライスから参照されるスライスでは1以上の値をとり、参照されないスライスでは0となる。SEIのNALユニットでは常に0となる。
SEIのNALユニットには、1以上のSEIメッセージを格納することができる。SEIメッセージもヘッダとペイロードから構成され、ペイロードに格納される情報の種類は、ヘッダにおいて示されるSEIメッセージのタイプにより識別される。以降で、AUを復号化するとは、AUにおけるスライスデータを復号化することを示し、AUを表示するとは、AUにおけるスライスデータの復号化結果を表示することを示すものとする。
ここで、NALユニットにはNALユニット境界を識別するための情報が存在しないため、AUとして格納する際には、各NALユニットの先頭に境界情報を付加できる。MPEG−2 TS(Transport Stream)やPS(Program Stream)においてMPEG−4 AVCのストリームを扱う際には、NALユニットの先頭に、0x000001の3バイトで示されるスタートコードプレフィックスが付加される。また、MPEG−2 TSおよびPSにおいては、AUの先頭にAccess Unit Delimiterと呼ばれる、AU境界を示すNALユニットを必ず挿入することが規定されている。
従来、このような動画像の符号化に関連した様々な技術が提案されている(例えば、特許文献1等参照)。
図4は、従来の動画像符号化装置のブロック図である。
動画像符号化装置1は、入力される画像信号Vinを圧縮符号化して可変長符号化等のビットストリームに変換した画像符号化信号Strを出力する装置であり、予測構造決定部PTYPE、動き検出部ME、動き補償部MC、減算部Sub、直交変換部T、量子化部Q、逆量子化部IQ、逆直交変換部IT、加算部Add、ピクチャメモリPicMem、スイッチSWおよび可変長符号化部VLCを備えている。
画像信号Vinは、減算部Subおよび動き検出部MEに入力される。減算部Subは、入力された画像信号Vinと予測画像の差分値を計算し、直交変換部Tに出力する。直交変換部Tは、差分値を周波数係数に変換し、量子化部Qに出力する。量子化部Qは、入力された周波数係数を量子化し、量子化値Qcoefを可変長符号化部に出力する。
逆量子化部IQは、量子化値Qcoefを逆量子化して周波数係数に復元し、逆直交変換部ITに出力する。逆直交変換部ITは、周波数係数から画素差分値に逆周波数変換し、加算部Addに出力する。加算部Addは、画素差分値と動き補償部MCから出力される予測画像とを加算して復号化画像とする。スイッチSWは、当該復号化画像の保存が指示された場合にONになり、復号化画像はピクチャメモリPicMemに保存される。
一方、画像信号Vinがマクロブロック単位で入力された動き検出部MEは、ピクチャメモリPicMemに格納されている復号化画像を探索対象とし、最も入力画像信号に近い画像領域を検出することによってその位置を指し示す動きベクトルMVを決定する。動きベクトル検出はマクロブロックをさらに分割したブロック単位で行われる。このとき、複数のピクチャを参照ピクチャとして使用することができるため、参照するピクチャを指定するための識別番号(相対インデックスIndex)がブロックごとに必要となる。相対インデックスIndexによって、ピクチャメモリPicMem中の各ピクチャが有するピクチャ番号との対応を取ることにより参照ピクチャを指定することが可能となる。
動き補償部MCでは、上記処理によって検出された動きベクトルおよび相対インデックスIndexを用いて、ピクチャメモリPicMemに格納されている復号化画像から予測画像に最適な画像領域を取り出す。
ピクチャ予測構造決定部PTYPEはランダムアクセス単位開始ピクチャRAUinによって対象ピクチャがランダムアクセス単位RAUの開始位置であれば、対象ピクチャをランダムアクセスが可能な特別なピクチャとして符号化(画面内符号化)するように、ピクチャタイプPtypeで動き検出部MEおよび動き補償部MCに指示し、更にそのピクチャタイプPtypeを可変長符号化部VLCで符号化する。
可変長符号化部VLCは量子化値Qcoef、相対インデックスIndex、ピクチャタイプPtypeおよび動きベクトルMVを可変長符号化して符号化ストリームStrとする。
図5は、従来の動画像復号化装置2のブロック図である。この動画像復号化装置2は、可変長復号化部VLD、ピクチャメモリPicMem、動き補償部MC、加算部Add、逆直交変換部ITおよび逆量子化部IQを備える。なお、同図において、図4に示される従来の動画像符号化装置のブロック図と同じ動作をする処理部は同じ記号を付し、説明を省略する。
可変長復号化部VLDは符号化ストリームStrを復号化し、量子化値Qcoef、相対インデックスIndex、ピクチャタイプPtypeおよび動きベクトルMVを出力する。量子化値Qcoef、相対インデックスIndexおよび動きベクトルMVは、ピクチャメモリPicMem、動き補償部MCおよび逆量子化部IQに入力され復号化処理が行われるが、その動作は図4の従来の動画像符号化装置のブロック図で説明済みである。
特開2003−18549号公報
ランダムアクセス単位RAUは、その先頭AUから復号化が可能であることを示す。しかしながら、従来のMPEG−4 AVCのストリームでは、予測構造が非常に柔軟であるため、光ディスクやハードディスクを有する蓄積装置において、可変速再生や逆再生時に復号、あるいは表示するAUを決定するための情報を取得することができない。
図6は、AUの予測構造の例である。ここで、1枚のピクチャは、それぞれ1つのAUに格納される。図6(a)はMPEG−2で使用されているAU間の予測構造である。同図で斜線をつけたピクチャは他のAUから参照されるピクチャである。MPEG−2ではPピクチャのAU(P4、P7)は表示時刻が直前1枚のIピクチャもしくはPピクチャのAUのみ参照した予測符号化が可能である。また、BピクチャのAU(B1、B2、B3、B5、B6)は表示時刻が直前1枚と直後1枚のIピクチャもしくはPピクチャのAUを参照した予測符号化が可能である。更に、ストリームに配置される順序も決まっており、IピクチャおよびPピクチャのAUは表示時刻の順序、BピクチャのAUは直後に表示されるIピクチャもしくはPピクチャのAUの直後に配置される。従って、(1)全てのピクチャを復号化、(2)IピクチャとPピクチャのAUのみ復号化してIピクチャとPピクチャのAUのみ表示、(3)IピクチャのAUのみ復号化して表示、の3通りで復号化できるため、(1)の通常の再生から(2)の中速再生、(3)の高速再生の3通りが容易に実現できる。
MPEG−4 AVCではBピクチャのAUからBピクチャのAUを参照した予測も可能である。図6(b)はMPEG−4 AVCの予測構造の例であり、BピクチャのAU(B1、B3)はBピクチャのAU(B2)を参照している。この例では、(1)全てのピクチャを復号化、(2)Iピクチャ、Pピクチャ、Bピクチャの参照されるAUのみ復号化して表示、(3)IピクチャとPピクチャのAUのみ復号化してIピクチャとPピクチャのAUのみ表示、(4)IピクチャのAUのみ復号化して表示、の4通りが実現できる。
しかしながら、MPEG−4 AVCでは更にPピクチャのAUからBピクチャのAUを参照することも可能になっており、図7に示すように、PピクチャのAU(P7)がBピクチャのAU(B2)を参照することもできる。この場合は、PピクチャのAU(P7)はBピクチャのAU(B2)が復号化できていなければ復号化ができないため、(1)全てのピクチャを復号化、(2)Iピクチャ、Pピクチャ、Bピクチャの参照されるAUのみ復号化して表示、(3)IピクチャのAUのみ復号化して表示、の3通りが実現できる。
このようにMPEG−4 AVCでは非常に柔軟な予測構造が許容されるため、スライスデータを解析して予測構造を判別しなければAU間の参照関係が不明である。このため、飛び込み再生や可変速再生、逆再生を行う際に、MPEG−2のように、再生速度に応じて予め規定されたルールに基づいて復号、あるいは表示するAUを決定できないという課題がある。
そこで、本発明は、MPEG−4 AVCのような柔軟な予測構造が許容される符号化方式であっても、飛び込み再生や可変速再生、逆再生等の特殊再生をすることが可能な動画像ストリームを生成する動画像ストリームを記録する領域を有する記録媒体とその復号装置とから構成される復号システム等を提供することを目的とする。
上記目的を達成するために、本発明に係る復号システムは、少なくとも、画素データを格納するための画素データ格納単位と、前記画素データを格納する格納単位の前に位置し、補助情報を格納するための補助情報格納単位とから構成されるピクチャを含むストリームを生成する動画像ストリームを記録する領域を有する記録媒体と、前記記録媒体から、前記動画像ストリームを読み込み復号する復号装置とから構成される復号システムであって、前記動画像ストリームは、ランダムアクセスポイントとなる第1のIピクチャから、前記ランダムアクセスポイントとは別のランダムアクセスポイントとなる第2のIピクチャの直前のピクチャまでに属する複数のピクチャで構成されるランダムアクセス単位に含まれる、各ピクチャのピクチャタイプ情報をピクチャの復号順に並べた第1の補助情報と、前記ランダムアクセス単位に含まれる、各ピクチャのピクチャ構造情報をピクチャの復号順に並べた第2の補助情報と、前記ランダムアクセス単位に含まれる、各ピクチャの復号に使用されるシーケンスパラメータセットとが、前記第1のIピクチャの補助情報格納単位に格納された構造を有しており、前記復号装置は、特殊再生をする旨の指示を取得する指示取得手段と、前記第1の補助情報と、前記第2の補助情報とを、前記第1のIピクチャの前記補助情報格納単位から分離して解析する解析手段と、前記解析手段による解析結果に基づいて、前記ランダムアクセス単位に含まれるピクチャのうち、前記特殊再生に必要なピクチャを特定する再生ピクチャ特定手段と、前記第1のIピクチャの前記補助情報格納単位から、前記ランダムアクセス単位に含まれる、各ピクチャの復号に使用されるシーケンスパラメータセットを抽出し、復号化する第1の復号化手段と、前記シーケンスパラメータセットを使用して、前記再生ピクチャ特定手段で特定されたピクチャを復号化する第2の復号化手段とを備えることを特徴とする。これによって、ランダムアクセス単位RAU毎に、当該ランダムアクセス単位に含まれるピクチャを特殊再生する場合に復号化するピクチャを特定する情報が含まれるので、再生時においては、複雑な予測構造を解析することなく、補助情報を参照するだけで、特殊再生に必要なピクチャを即座に決定することができ、MPEG−4 AVCのような柔軟な予測構造が許容される符号化方式であっても、可変速再生や逆再生等の特殊再生が可能となる。
ここで、前記特殊再生には、飛び込み再生、可変速再生、および、逆再生の少なくとも1つが含まれる。また、前記各ピクチャは、1以上のサブピクチャ単位、例えば、NALユニットから構成され、前記ストリーム生成手段は、具体的には、ピクチャの画素値を格納するサブピクチャ単位とは異なるサブピクチャ単位に、前記補助情報を格納する。このとき、前記ランダムアクセス単位は、ピクチャの並びからなり、前記ストリーム生成手段は、前記ランダムアクセス単位に含まれる先頭ピクチャに、前記補助情報を格納するのが好ましい。
なお、前記補助情報は、前記ランダムアクセス単位を特定の速度(例えば、2倍速)で再生する際に復号化するピクチャを特定する情報を含んでもよいし、前記ランダムアクセス単位の再生におけるピクチャの優先度を示す情報を含んでもよいし、前記ランダムアクセス単位に含まれる全てのピクチャについて、ピクチャの復号順に、各ピクチャのタイプを示す情報が並べられたものを含んでもよい。ここで、前記ピクチャのタイプには、少なくとも、画面内符号化されるIピクチャ、符号化の基本単位であるブロック毎に1枚のピクチャを参照して画面間符号化されるPピクチャ、符号化の基本単位であるブロック毎に2枚のピクチャを参照して画面間符号化されるBピクチャであって符号化のために他のピクチャから参照されるBピクチャ、および、他のピクチャから参照されないBピクチャが含まれる。
また、前記補助情報は、前記ランダムアクセス単位に含まれる全てのピクチャについて、ピクチャの復号順に、各ピクチャの構造を示す情報が並べられたものを含んでもよい。このとき、前記ピクチャの構造には、少なくとも、フィールド構造、および、フレーム構造が含まれる。あるいは、前記ピクチャの構造には、ピクチャがフレーム構造をもつ際に、2枚分の表示フィールドを有するか、3枚分の表示フィールドを有するかを示す情報が含まれてもよい。
また、前記動画像ストリームの生成においては、ピクチャの並びからなるシーケンスに関するパラメータの集まりであるシーケンスパラメータセットを、前記ランダムアクセス単位毎に付加してもよい。より詳細には、前記ランダムアクセス単位は、ピクチャの並びからなり、前記ランダムアクセス単位に含まれる先頭ピクチャに、前記シーケンスパラメータセットを格納してもよい。これによって、シーケンスパラメータセットは、シーケンスの情報を示すだけでなく、ランダムアクセス単位の境界情報としても利用され得る。ここで、シーケンスは、復号するために必要な全ての状態がリセットされる特別なピクチャを先頭とし、復号順で直後となる前記特別なピクチャの直前ピクチャまでのピクチャから構成される。
なお、本発明は、以上のような復号システムとして実現することができるだけでなく、そのような符号化ストリームを生成する動画像符号化装置として実現したり、符号化ストリームをパケット化して補助情報とともに多重化する動画像多重化装置として実現したり、そのような符号化ストリームを復号化して特殊再生をする動画像復号化装置として実現することもできる。さらに、本発明は、それら各装置が備える処理手段をステップとする方法として実現したり、コンピュータで実行されるプログラム、あるいは、動画像ストリーム生成装置によって生成されたデータストリームとして実現したり、プログラム、あるいは、データストリームが記録されたコンピュータ読み取り可能なCD−ROM等の記録媒体、さらに、LSI等の半導体ICとして実現することもできる。
以上のように、本発明によれば、ランダムアクセス単位RAUの先頭AUにおける特定のNALユニットを参照することにより、可変速再生や逆再生などの特殊再生時に復号化するAUを決定できるため、特殊再生機能に優れた復号システムを容易に実現することができ、その実用的価値が高い。
図1は、従来技術におけるMPEG2のストリーム構造を示す図である。 図2は、従来技術におけるMPEG2のGOP構造を示す図である。 図3は、従来技術におけるMPEG4 AVCのストリーム構造を示す図である。 図4は、従来の符号化装置の構成を示すブロック図である。 図5は、従来の復号化装置の構成を示すブロック図である。 図6は、従来技術におけるMPEG4 AVCにおける予測構造の例1を示す図である。 図7は、従来技術におけるMPEG4 AVCにおける予測構造の例2を示す図である。 図8は、本発明に係るMPEG−4 AVCのストリーム構造を示す図である。 図9は、ランダムアクセス単位RAUにおいて復号化するAUを示す第1の例を示す図である。 図10は、ランダムアクセス単位RAUにおいて復号化するAUを示す第2の例を示す図である。 図11は、ランダムアクセス単位RAUにおいて復号化するAUを示す第3の例を示す図である。 図12は、ランダムアクセス単位RAUにおいて復号化するAUを特定する方法を示す例を示す図である。 図13は、可変速再生情報のテーブルのシンタックス例を示す図である。 図14は、可変速再生情報のテーブルの拡張例を示す図である。 図15は、可変速再生情報として、ランダムアクセス単位RAU内のIピクチャ、およびPピクチャのAUを示す例を示す図である。 図16は、可変速再生情報として、AUの優先度を用いる際に、バッファ滞留時間を優先度の指標として用いる例を示す図である。 図17は、(a)と(b)は、RAU内において、フレーム構造とフィールド構造のAUが混在する際の例を示す図である。(c)は、RAU内のAUがフレーム、フィールドのどちらであるのかを示す第1のマップ(RAU_map1)のシンタックス例を示す図である。(d)は、図17(b)のRAUについてのRAU_map1を示す図である。 図18は、特再情報としてのマップの別の例を示す図である。 図19は、ランダムアクセス単位RAUにおいて境界情報を示す方法を説明する図である。 図20は、ランダムアクセス単位RAUにおけるピクチャの予測構造例を示す図である。 図21は、本発明に係る動画像符号化装置の構成を示すブロック図である。 図22は、動画像符号化方法のフローチャートである。 図23は、本発明に係る動画像多重化装置の構成を示すブロック図である。 図24は、支援情報HLPの内容例を示す図である。 図25は、支援情報HLPにおいて、特再情報が格納されるNALユニットを示す例を示す図である。 図26は、動画像多重化装置の動作を示すフローチャートである。 図27は、本発明に係る動画像復号化装置の構成を示すブロック図である。 図28は、動画像復号化方法のフローチャートである。 図29は、本発明の動画像復号化方法において、復号化するAUを決定する際のフローチャートである。 図30は、本発明の動画像復号化方法において、復号化するAUと表示するAUが異なる場合の処理を示すフローチャートである。 図31は、HD−DVDのデータ階層図である。 図32は、HD−DVD上の論理空間の構成図である。 図33は、VOB情報ファイル構成図である。 図34は、タイムマップの説明図である。 図35は、プレイリストファイルの構成図である。 図36は、プレイリストに対応するプログラムファイルの構成図である。 図37は、BDディスク全体管理情報ファイルの構成図である。 図38は、グローバルイベントハンドラを記録するファイルの構成図である。 図39は、HD−DVDプレーヤの概要ブロック図である。 図40は、本発明の動画像符号化方法および動画像復号化方法を実現するためのプログラムを記録した記録媒体を示す図である。
以下、本発明の実施の形態について、図面を参照しながら説明する。
(AVCストリームの構造)
まず、本発明に係る動画像ストリーム生成装置、動画像符号化装置および動画像多重化装置が生成するAVCストリーム、言い換えると、本発明に係る動画像復号化装置に入力されるAVCストリームの構造について説明する。
図8は、本発明に係るAVCストリームの構造を示す。なお、図中ではNALユニットの先頭に付加される境界情報は省略している。従来のAVCストリームとの違いは、飛び込み再生、可変速再生あるいは逆再生などの特殊再生時に復号化するAUを示す特再情報を付加したことである。特再情報は、特再情報を格納するためのNALユニットに格納される(図8(a))。MPEG−4 AVCでは、特定のNALユニットタイプについては、格納する情報とNALユニットタイプの関係をアプリケーションによって設定できる。具体的には、0、および、24から31までの値が使用可能であり、これらのNALユニットタイプをユーザ設定可能なNALユニットタイプと呼ぶことにする。従って、特再情報は、ユーザ設定可能なNALユニットタイプをもつNALユニットに格納される。ここで、特再情報以外の情報を格納するために特定のNALユニットタイプが予約されている場合には、当該NALユニットタイプと異なるNALユニットタイプを特再情報に割り当てる。特再情報のNALユニットは、ランダムアクセス単位RAUの先頭AUに格納される。AU内での配置順については、PPS NALユニットが存在すれば、その直後に配置するものとするが、MPEG−4 AVC、あるいは他の運用規格で定められた配置順を満たせば、他の位置に配置してもよい。また、特再情報のNALユニットを解釈できない場合には、後続NALユニットの開始位置までスキップすることにより当該NALユニットのデータを読み飛ばすことができるため、特再情報のNALユニットを解釈できない端末においても、破綻なく復号化処理を行うことができる。
なお、特再情報のNALユニットを、ランダムアクセス単位RAUの先頭AUではなく、最終AUなど他のAUに含めてもよい。あるいは、ランダムアクセス単位RAUを構成する各AUに特再情報のNALユニットを含めてもよい。
図9から図11は、可変速再生時に復号化するAUの例を示す。図9(a)は、表示順でのAUの並びを示す。ここで、斜線をつけたAUは他のAUから参照されるAUであり、矢印は予測構造を示す。I0より前に表示されるAUにはマイナスの符号を、B15より後に表示されるAUについてはプラスの符号が振られている。図9(b)は、図9(a)に示す各AUの復号化順を示し、I0からB11までをランダムアクセス単位RAUとしている。このとき、2倍速で再生するにはI0、−B14、P4、B2、P8、P6、P12、B10が復号化され(図9(c))、4倍速で再生するにはI0、P4、P8、P12が復号化される(図9(d))。図9(c)、および図9(d)は、"*"でマークされたAUが、2倍速、4倍速再生時に復号化されることを示すものであり、これらの情報が特再情報のNALユニットに格納される。図10の例では、復号化順でI0からB11までのAUがランダムアクセス単位RAUとされる。1.5倍速で再生するにはI0、−B13、P3、B1、P6、B4、P9、B7、P12、B10が復号化され、3倍速で再生するにはI0、P3、P6、P9、P12が復号される。図11の例では、3倍速で再生するにはI0、P3、P6、P9、P12が復号化される。
ここで、上記の再生速度は、厳密な再生速度を示すものではなく、再生速度の目安としてもよい。例えば、図11(c)の例では、3倍速再生時に復号化することが示されるAUを全て復号化すると、16/5=3.2倍速となり、厳密には3倍速とはならない。また、M倍速で再生する際に、特再情報として示される再生速度のうちM以上で最小の値がNであれば、N倍速再生時に復号化が必要なAUについては復号化し、それ以外のAUをどのように復号化するかについては復号化装置の実装依存としてもよい。また、再生速度が大きい場合に復号化が必要なAUほど優先度が高いとみなし、優先度に基づいて復号化するAUを決定してもよい。
なお、可変速再生時に復号されるAUにおいて、表示されないAUがあってもよい。例えば、2倍速再生時にはN番目のAUを表示するが、M番目のAUは表示しないとする。このとき、N番目のAUを復号化するためにM番目のAUを復号化する必要があれば、M番目のAUは、2倍速再生時に復号化されるが表示はされないことになる。
次に、可変速再生時に復号化するAUを特定する方法について、図12を参照して説明する。図12は、図9と同一のランダムアクセス単位RAUにおいて、複号化するAUを特定する際の例を示す。図12(d)に示すように、2倍速再生時にはI0、−B14、P4、B2、P8、P6、P12、B10が復号化される。これらのAUは、ランダムアクセス単位RAUの先頭から数えると、それぞれ1、2、5、6、9、10、13、14番目のAUに相当する。このように、ランダムアクセス単位RAUにおいて何番目のAUであるかを示すことにより、可変速再生時に復号化するAUを一意に指定することができる。AVCストリームをMPEG−2 TS(Transport Stream)により多重化する際には、AUの先頭には必ずAccess Unit Delimiterが配置される。可変速再生時に復号化するAUデータを取得する際には、Access Unit DelimiterをサーチしてAU境界を順に検索すればよく、スライスデータなど、NALユニットのペイロードを解析する必要がないため、処理が容易である。
なお、可変速再生時には、Iピクチャ、あるいはPピクチャのAUといった、他のAUから参照されるAU(以降、参照AUと呼ぶ。)を復号化することにして、ランダムアクセス単位RAUにおいて何番目の参照AUであるかにより、復号化するAUを特定してもよい。図12(b)のランダムアクセス単位RAUでは、図12(c)に示すように、I0、−B14、P4、B2、P8、P6、P12、B10が参照AUとなる。2倍速再生時には、I0、−B14、P4、B2、P8、P6、P12、B10が復号化されるが、これらのAUを参照AUの順で表すと、図12(f)に示すように、それぞれ1、2、3、4、5、6、7、8番目の参照AUに相当する。AUが参照AUであるかどうかは、スライスのNALユニットのヘッダにおける特定のフィールドを参照することにより判別できる。具体的には、nal_ref_idcフィールドの値が0でなければ参照AUとなる。なお、フレーム番号からも参照AUを識別することができるため、フレーム番号により、復号化する参照AUを特定してもよい。
さらに、ランダムアクセス単位RAUの先頭AUの開始位置から、復号化するAUの開始位置までのバイト長のオフセット値を指定することにより、復号化するAUを特定してもよい。例えば、図12で、I0がストリーム先頭から10000バイトの位置から開始し、P4が20000バイトの位置から開始する場合には、P4に対するオフセット値は、20000−10000=10000バイトとなる。MPEG−2 TSなどで多重化されたストリームを扱う際には、TSパケット、あるいはPES(Packetized Elementary Stream)パケットのヘッダのオーバーヘッドを含めたオフセット値を指定してもよいし、アプリケーションによりデータのパディング処理などを行う際には、それらを含めたオフセット値を指定してもよい。また、フレーム番号FNによりAUを特定することにしてもよい。
なお、MPEG−2 TSで多重化されたストリームを扱う際には、復号化するAUの先頭データを含むTSパケットを識別するためのインデックス番号、アドレス情報、あるいは、ランダムアクセス単位RAUの先頭データを格納するTSパケットから当該TSパケットまでのTSパケットの個数によりAUを特定してもよい。また、MPEG−2 TSあるいはPSにおいては、PESパケットについてのインデックス番号などを使用してもよい。ここで、TSパケットの代わりに、BD(Blu−ray Disc)の記録フォーマットにおいて使用されるSource Packetについての情報を用いても良い。Source Packetとは、TSパケットに、TSパケットについての時刻情報やコピー制御情報などを含む4バイトのヘッダを付加したパケットである。
図13(a)は、可変速再生用の情報を示すテーブルのシンタックス例である。num_pic_in_RAUはランダムアクセス単位RAUを構成するAUの総数、num_speedは復号化されるAUが示される再生速度の数、play_speedは再生速度、num_dec_picはplay_speedに示される再生速度で再生する際に復号化するAUの総数、dec_picは復号化するAUがランダムアクセス単位RAUの先頭から何番目に相当するかを示す番号、をそれぞれ示す。図13(b)は、図9に示すランダムアクセス単位RAUにおいて2倍速、4倍速再生時に復号化するAUの情報を格納した場合の例である。なお、num_pic_in_RAUは、復号化するAUの個数と、ランダムアクセス単位RAU内のAUの総数とから正確な再生速度を算出する、あるいはランダムアクセス単位RAU毎にスキップする際に使用できるが、ランダムアクセス単位RAUの先頭をサーチすることにより同様の情報が得られるため、省略してもよい。また、テーブルのサイズを示すフィールドをテーブル内に追加してもよい。なお、図13(a)のシンタックス例では、復号化するAUがランダムアクセス単位RAUの先頭から何番目であるかを直接示したが、各AUを復号する必要があるかどうかを、各AUに対応するビットのオン、オフにより示してもよい。例えば、図9の例では、ランダムアクセス単位RAUは16個のAUから構成されるため、1ビットを1AUに割り当てると、16ビット必要になる。4倍速再生時には、0b1000100010001000(0bは2進数表現を示す)となる16ビット情報を与えることにより、1、5、9、13番目のAUを復号化することが示される。ここで、先頭ビット、最終ビットはそれぞれランダムアクセス単位RAUの先頭AUと最終AUに対応するものとする。
なお、図13のシンタックス例ではテーブルのサイズは可変であるが、ランダムアクセス単位RAUを構成するAUの個数の最大値、およびnum_speedの最大値が規定されていれば、テーブルサイズの最大値が決まるため、テーブルのサイズは前記決定された最大値に固定し、可変速再生用の情報のサイズが最大値に満たない場合にはパディングすることとしてもよい。このように、テーブルのサイズを固定とすることにより、可変速再生情報を取得する際には常に固定サイズのデータを取得すればよく、情報の取得処理が高速化できる。なお、テーブルサイズ、あるいはテーブルを格納するNALユニットのサイズを管理情報として示してもよい。また、特再情報を格納するNALユニットのサイズを予め定めておき、可変速再生用の情報が1NALユニットに格納できない際には、複数のNALユニットに分割して格納してもよい。このとき、最終NALユニットのペイロードは、NALユニットのサイズが予め定められたサイズになるようにパディングする。また、テーブルサイズの値としていくつかの規定値を定めておき、テーブルのサイズを示す規定値へのインデックス番号をテーブル内、あるいはアプリケーションの管理情報により示してもよい。
また、再生速度毎に復号化するAUを全て列挙するのではなく、差分情報を示すことにしてもよい。M(<N)倍速再生時の情報としては、N倍速再生時に復号するAUに加えて復号化する必要のあるAUのみを示す。図13(b)の例では、2倍速再生時には、4倍速再生時に復号化するAUに加えて、2、6、10、14番目のAUを復号化するため、2倍速再生用の情報としては、2、6、10、14番目のAUについてのみ示せばよい。
なお、上記の説明では、可変速再生時に復号化が必要なAUを示すこととしたが、さらに、復号化が必要なAUの表示順を示す情報を示してもよい。例えば、図9の例では、2倍速と4倍速再生時の情報が示されるが、このランダムアクセス単位RAUを3倍速で再生するとする。4倍速再生時に表示するAUに加えて、2倍速再生時に表示するAUの一部を表示することにより3倍速再生が実現できる。ここで、4倍速再生時に表示するI0とP4の間に、さらに1つのAUを表示するケースを考えると、2倍速再生用の情報から、−B14、B2、B6、B10が候補となるが、MPEG−4 AVCでは、これら4つのAUの表示順はスライスのヘッダ情報を解析しなければ得ることができない。ここで、表示順の情報を与えれば、−B14のみがI0とP4の間に表示されることが分かるため、−B14を復号化すると決定できる。図14は、表示順の情報を示すシンタックスの例であり、図13のシンタックスに表示順の情報を追加したものである。pts_dts_flagは、当該再生速度において復号化されるAUの復号化順と表示順が一致するかどうかを示し、一致しない場合にのみ、表示順の情報をdisplay_orderフィールドにより示すものとする。
なお、可変速再生の情報に示されない再生速度で再生する際には、端末において予め定められたルールに基づいて復号化、表示するAUを決定してもよい。例えば、図9の例において3倍速で再生する際には、4倍速再生時に表示するAUに加えて、2倍速再生時に表示するAUの一部を表示するとはせずに、I0、B3、B6、B9、P12を表示してもよい。ここで、Bピクチャについては、参照AUにおけるBピクチャを優先的に復号化、あるいは表示してもよい。
また、IピクチャのAUのみ、あるいは、IおよびPピクチャのAUのみを再生することにより可変速再生などの特殊再生を実現することがある。このため、IピクチャとPピクチャの一覧を特再情報として格納してもよい。図15に一例を示す。ここでは、図15(b)に示すようにI0からB14までがランダムアクセス単位RAUに含まれ、このうち、IおよびPピクチャのAUは、図15(c)に示すようにI0、P3、P6、P9、P12、P15である。従って、I0、P3、P6、P9、P12、P15を特定するための情報を特再情報に格納する。このとき、IピクチャのAUとPピクチャのAUとを識別するための情報を付加してもよい。あるいは、Iピクチャ、Pピクチャ、参照されるBピクチャ、参照されないBピクチャを識別するための情報を示してもよい。
さらに、AU毎の優先度情報を特再情報として格納して、可変速再生時には優先度の高いAUから順に復号あるいは表示されることにしてもよい。優先度情報としては、ピクチャのタイプを使用することができる。例えば、Iピクチャ、Pピクチャ、参照されるBピクチャ、参照されないBピクチャの順に、AUの優先度を割り当てることができる。また、AUを復号化してから表示するまで、あるいは他のAUから参照されなくなるまでの時間(以降、バッファ滞留時間と呼ぶ。)が長いほど優先度が高いとして、優先度情報を設定してもよい。図16は、バッファ滞留時間に応じて優先度を設定する例を示す。図16(a)はAUの予測構造を示し、P3は、B7およびP9からも参照される。このとき、ランダムアクセス単位RAUは、I0からB11までのAUから構成されるとすると(図16(b))、各AUのバッファ滞留時間は図16(c)に示すようになる。ここで、バッファ滞留時間はフレーム数を基準に示しており、例えばP3はP9が復号化されるまで必要なので、バッファ滞留時間は6枚分となる。従って、バッファ滞留時間が3以上のAUを復号化すれば、全てのIおよびPピクチャが復号化されることになり、3倍速再生が実現される。ここでは、P3のバッファ滞留時間がI0よりも大きくなっているが、IピクチャのAUの優先度を高く設定するために、IピクチャのAUにオフセット値を加えてもよい。また、高速で再生する際に復号化することが必要なAUほど優先度が高いとみなし、N倍速再生時に復号化が必要なAUにおけるNを優先度情報として使用してもよい。なお、復号化された後、あるいは表示後も他のAUから参照される際には、どのAUからも参照されなくなるまでの時間を示してもよい。
なお、特再情報は、SEIメッセージに格納してもよい(図8(b))。この場合は、特再情報用にSEIメッセージのタイプを定義して、前記定義したタイプのSEIメッセージに特再情報を格納する。特再情報用のSEIメッセージは、他のSEIメッセージと一緒に、あるいは単独でSEI NALユニットに格納される。なお、ユーザが独自定義した情報を格納するためのSEIメッセージであるuser_data_registered_itu_t_t35 SEIメッセージやuser_data_unregistered SEIメッセージに、特再情報を格納してもよい。これらのSEIを使用する際には、SEIのペイロード部分において、格納される情報の識別情報を付加することで、特再情報が格納されること、あるいは特再情報の種類を示すことができる。
なお、ランダムアクセス単位RAUの先頭以外のAUに特再情報を格納してもよい。また、特定の再生速度で再生する際に復号化が必要となるAUを識別するための値を予め定めておき、AU毎に前記定められた値を付加してもよい。例えば、N倍速以下の再生速度において復号するAUについては、再生速度情報としてNを与える。また、AU内のピクチャがフレーム、フィールドのどちらであるか、さらに、フィールドである際にはトップフィールド、ボトムフィールドのどちらであるかであるかを、スライスのNALユニットのnal_ref_idcなどにより示してもよい。例えば、インタレースで表示する際には、トップフィールド、ボトムフィールドを交互に表示する必要があるため、高速再生時などフィールドをスキップしながら復号する際には、次に復号するフィールドがトップフィールドであるかボトムフィールドであるかを容易に判別できることが望ましい。NALユニットのヘッダから判別することができれば、スライスヘッダを解析する必要がないため、判別に係る処理量を削減することができる。
なお、ランダムアクセス単位RAUを構成する各AUがフィールド、あるいはフレームであるかを示す情報を、ランダムアクセス単位RAUの先頭AUに格納してもよい。ランダムアクセス単位の先頭AUに格納することにより、フィールド構造とフレーム構造のAUが混在する際にも、特殊再生時に復号するAUを容易に決定することができる。図17(a)と(b)は、ランダムアクセス単位RAU内において、フレーム構造とフィールド構造のAUが混在する際の例であり、それぞれ表示順、復号化順のAUの並びを示す。B2とB3、I4とP5、B9とB10、B11とB12、P13とP14、B15とB16、B17とB18、およびP19とP20は、フィールド・ペアとして符号化されており、その他のAUはフレームとして符号化されているものとする。このとき、IピクチャとPピクチャのAUのみを再生する際には、I4とP5のフィールド・ペア、P8のフレーム、P13とP14のフィールド・ペア、P19とP20のフィールド・ペアを順に復号して再生することができるが、復号するAUを予め決定する際には、各AUがフィールド・ペアの一方のフィールドであるのか、フレームであるのかを判定する必要があり、これらを示す情報を付加することは有効である。
図17(c)は、ランダムアクセス単位RAU内のAUがフレーム、フィールドのどちらであるのかを示す第1のマップ(RAU_map1)のシンタックス例である。num_AU_in_RAUは、ランダムアクセス単位を構成するAUの個数を示し、続くループにおいては、各AUについての情報が復号順で示される。frame_field_flagは、AUに格納されるピクチャがフレームであるかフィールドであるかを示し、pic_typeはピクチャの符号化タイプについての情報を示す。符号化タイプとしては、IあるいはIDRピクチャ、Pピクチャ、参照されるBピクチャ、および参照されないBピクチャなどを示すことができる。従って、本マップを参照することにより、特殊再生時に復号するピクチャを決定することができる。なお、IおよびPピクチャについても、参照されるかどうかに基づいて区別してもよい。さらに、予測構造に所定の制約が適用されているかどうかを判別するための情報を示してもよい。
図17(d)は、図17(b)のランダムアクセス単位RAUについてのRAU_map1を示す。ここでは、I、P、参照されるBピクチャ、参照されないBピクチャのpic_typeを、それぞれ0、1、2、3としている。ここで、特殊再生時には、フレーム、あるいはフィールド・ペア単位で再生されるため、これらの単位でピクチャの符号化タイプを示す情報を格納してもよい。
図17(f)は、フレーム、あるいはフィールド・ペア単位ピクチャの符号化タイプを示す第2のマップ(RAU_map2)のシンタックス例である。num_frame_in_RAUは、ランダムアクセス単位RAUを構成するフレーム、およびフィールド・ペアの個数を示す。frame_flagは、ピクチャがフレームであるかどうかを示し、フレームである際に1にセットされる。frame_flagが1にセットされる際には、frame_typeにおいてフレームの符号化タイプについての情報が示される。frame_flagが0である場合、すなわち、フィールド・ペアである際には、field_pair_typeにおいて、フィールド・ペアを構成する各フィールドの符号化タイプを示す。
図17(e)は、図17(b)のランダムアクセス単位RAUについてのRAU_map2を示す。図17(e)において、frame_typeとしては、I、P、参照されるBピクチャ、参照されないBピクチャの値を、それぞれ0、1、2、3としている。また、field_pair_typeとしては、復号順での各フィールドのタイプを示す。フィールドのタイプは、I、P、参照されるBピクチャ、参照されないBピクチャをそれぞれ、I、P、Br、Bnとする。例えば、第1フィールドがIピクチャであり、第2フィールドがPピクチャである際にはIPと示し、第1、第2フィールドが共に参照されないBピクチャである際にはBnBnと示す。ここで、IP、PP、PI、BrBr、BnBnなどの組み合わせを示す値を設定しておく。なお、フィールド・ペアの符号化タイプを示す情報としては、フィールド・ペアが、
・IあるいはPピクチャを含むかどうか
・参照されるBピクチャを含むかどうか
・参照されないBピクチャを含むかどうか
を用いてもよい。さらに、IおよびPピクチャについても、参照されるかどうかに基づいて区別してもよい。
例えば、図18(a)に示されるシンタックスのようなランダムアクセス単位RAUのマップを特殊再生情報としてもよい。このマップには、そのランダムアクセス単位RAUに含まれる全ピクチャについて、ピクチャごとに、ピクチャの構造を示すpicture_structureと、ピクチャのタイプを示すpicture_typeとが含まれる。picture_structureは、図18(b)に示されるように、そのピクチャがフィールド構造であるか、フレーム構造であるか、などを示し、picture_typeは、図18(c)に示されるように、そのピクチャがIピクチャであるか、参照されるBピクチャであるか、参照されないBピクチャであるか、Pピクチャであるか、などを示す。これによって、このマップを受信した動画像復号化装置は、このマップを参照することによって、特殊再生すべきAUを容易に特定することができる。一例として、IピクチャとPピクチャのみ、あるいは、IピクチャとPピクチャに加えて参照されるBピクチャを復号、再生するなどの高速再生が可能である。
なお、ランダムアクセス単位RAUを構成するAUに3−2プルダウンなどのピクチャ構造を示す情報が含まれる際には、上記第1あるいは第2のマップにピクチャ構造を示す情報を含めてもよい。例えば、各ピクチャが3枚分の表示フィールドをもつのか、2枚分の表示フィールドをもつのかを示すことができる。さらに、3枚分の表示フィールドをもつ場合には、第1フィールドを繰り返し表示するのかどうか、あるいは、第1フィールドがトップフィールドであるかどうかを示す情報を示してもよい。また、2枚分の表示フィールドをもつ場合にも、第1フィールドがトップフィールドであるかどうかを示してもよい。ここで、MPEG−4 AVCでは、3−2プルダウンなどのピクチャ構造をもつかどうかは、SPS(Sequence Parameter Set)のpic_struct_present_flag、あるいは、MPEG−2システム規格において規定されたAVC timing and HRD descriptorにおけるpicture_to_display_conversion_flagなどにより示すことができ、さらに、各ピクチャのピクチャ構造は、Picture Timing SEIのpic_structフィールドにより示される。従って、pic_structフィールドが特定の値をもつ、例えば、ピクチャが3枚分のディスプレイフィールドをもつ場合にのみフラグをセットすることにより、ピクチャ構造を示してもよい。つまり、各ピクチャについて下記3種類の情報を示すことができれば、ランダムアクセス単位RAUの途中に飛び込む場合や、可変速再生時においても、特定の時刻において表示されるフィールド、あるいはフィールドが格納されるフレームを決定する際に有効である。
・フィールド
・フレーム (3−2プルダウン非使用、あるいは、3−2プルダウン使用時には2枚分の表示フィールドをもつ)
・3−2プルダウン使用時に3枚分の表示フィールドを持つフレーム
なお、これらの情報は、図18(a)に示すRAUマップのpicture_structureにおいても示すことができる。
このように、RAUを構成する各ピクチャのピクチャタイプの一覧情報を示すことにより、可変速再生、飛び込み再生、あるいは逆再生などの特殊再生時に復号、あるいは表示すべきピクチャを容易に決定できる。特に、
・IピクチャとPピクチャのみを再生
・Iピクチャ、Pピクチャ、および参照されるBピクチャを再生
するような高速再生、
あるいは、
・予測構造が特別に制約されたピクチャをピクチャタイプにより識別し、特殊再生時に復号が必要なピクチャを選択して特殊再生
するようなケースにおいて有効である。
さらに、特再情報のデフォルト値をアプリケーションレベルの管理情報などAVCストリームとは別の領域に格納しておき、デフォルト値と異なる場合にのみ特再情報をランダムアクセス単位RAUに含めてもよい。
上記では、可変速再生についての特再情報について述べたが、同様の情報を逆再生時の補助情報として使用することもできる。逆再生時には、表示するピクチャを全てメモリに保持できれば、復号化動作が一度で済むため、復号化に係る処理が軽減できる。図9の例においてP12、P8、P4、I0の順に逆再生するケースを考えると、これら4つのAUの復号結果を全て保持しておくことができれば、I0、P4、P8、P12の順に一度復号化すれば逆再生が可能となる。従って、N倍速再生時に復号化、あるいは表示するAUの個数から、当該AUの復号化済みデータを全てメモリに保持できるかどうか判定し、判定結果に基づいて逆再生時に表示するAUを決定してもよい。
同様に、特再情報を飛び込み再生時の補助情報として使用することもできる。ここで、飛び込み再生とは、動画像を早送り再生等をしながら、ランダムに決定した箇所から動画像を通常再生することである。このような飛び込み再生時においても、補助情報を用いて早送り再生の対象となるピクチャを決定することで、早送り再生をしたり、飛び込み再生の開始ピクチャを決定したりすることができる。
なお、特再情報において、ランダムアクセス単位を構成する各AUの参照先AUを直接示してもよい。参照先のAUが複数存在する際には、それらを全て示す。ここで、参照先のAUが参照元のAUと異なるランダムアクセス単位に属する場合には、N個前あるいは後のランダムアクセス単位に属するM番目のAUと具体的に示してもよいし、N個前あるいは後のランダムアクセス単位に属することのみを示してもよい。なお、参照先のAUが、復号化順で何番目前あるいは後のAUであるかを示してもよい。このとき、AUは参照AU、全てのAU毎、あるいはI、P、Bなど特定タイプのピクチャのAU毎にカウントする。また、各AUは、復号化順で前後最大N個までのAUのみ参照できることを示してもよい。なお、前後N個よりも前あるいは後のAUを参照する場合には、その旨を示す情報を付加してもよい。
なお、MP4など、NALユニットの境界情報としてスタートコードプレフィックスではなく、NALユニットのサイズを使用する多重化方式においても、上記特再情報を同様に扱うことができる。
なお、MPEG−2 TS(Transport Stream)パケットやRTP(Real Time Transmission Protocol)パケットなどによりパケット化された符号化ストリームを受信して記録する際には、パケットロスが発生する。このように、パケットロスの発生する環境で受信したデータを記録する際には、パケットロスによりストリーム内のデータが欠落していることを示す情報を補助情報として符号化ストリーム、あるいは管理情報として格納してもよい。パケットロスによるデータの欠落は、ストリームのデータが欠落しているかどうかを示すフラグ情報、あるいは欠落部分を通知するための特別なエラー通知コードを挿入することにより示すことができる。なお、データが欠落している場合にエラー隠匿処理を行う際には、隠匿処理の有無、あるいは隠匿処理の方法を示す識別情報などを格納してもよい。
以上では、特殊再生時に復号、あるいは表示するAUを決定するための特再情報について説明した。ここで、ランダムアクセス単位RAUの境界が検出できるようにするためのデータ構造について、図19を参照しながら、示す。
ランダムアクセス単位RAUの先頭AUには、ランダムアクセス単位RAUを構成するAUから参照されるSPSのNALユニットが必ず格納される。一方、MPEG−4 AVCの規格では、復号順がN番目のAUから参照されるSPSのNALユニットを、復号順がN番目、あるいはN番目よりも若い任意のAUに格納することができる。これは、通信や放送などでストリームを伝送する際にパケットロスによりSPSのNALユニットが欠落してしまう場合などに備えて、SPSのNALユニットを繰り返し伝送できるようにするためである。しかしながら、蓄積用途などではストリームデータが確実に取得できるため、ランダムアクセス単位RAUの先頭AUにおいて、当該ランダムアクセスユニットRAUの全てのAUから参照されるSPSのNALユニットを1つのみ格納し、ランダムアクセス単位RAU内の後続AUにはSPSのNALユニットを格納しないとしてもよい。こうすることで、SPSのNALユニットを含むAUがランダムアクセス単位RAUの先頭AUであることが保証でき、ストリーム内でSPSのNALユニットを検出した際には、当該AUからランダムアクセス単位RAUが開始すると判定できる。タイムマップなどストリームの管理情報は、全てのランダムアクセス単位RAUについてのアクセス情報の提供を保証しておらず、アクセス情報が提供されないランダムアクセス単位RAUの途中のピクチャへ飛び込む場合などには、ストリーム内でSPSのNALユニットを検索してランダムアクセス単位RAUの開始位置を取得することが特に有効である。
ここで、ランダムアクセス単位RAUの先頭AUがIDRピクチャのAUである際には、ランダムアクセス単位RAU内のAUは、復号順で前のランダムアクセス単位RAU内のAUを参照しない。このタイプのランダムアクセス単位RAUをクローズド型のランダムアクセス単位RAUと呼ぶことにする。一方、ランダムアクセス単位RAUの先頭AUがIDRでないIピクチャのAUである際には、ランダムアクセス単位RAU内のAUは、復号順で前のランダムアクセス単位RAU内のAUを参照できる。このタイプのランダムアクセス単位RAUをオープン型のランダムアクセス単位RAUと呼ぶことにする。ここで、光ディスク機器などにおいて、再生中にアングルを切替える際などには、クローズド型のランダムアクセス単位RAUから切替えを行うため、ランダムアクセス単位RAUの先頭部分でオープン型かクローズ型の判定ができると有効である。例えば、SPSのNALユニットのnal_ref_idcフィールドにより、オープン型かクローズ型かを判別するためのフラグ情報を示すことができる。SPSのNALユニットではnal_ref_idcの値は1以上と規定されているため、上位1ビットを常に1として、下位1ビットでフラグ情報を示す。なお、先頭AUがIDRでないIピクチャのAUであっても、ランダムアクセス単位RAU内のAUが、復号順で前のランダムアクセス単位RAU内のAUを参照しないことがある。このようなランダムアクセス単位RAUは、クローズ型とみなしてもよい。なお、nal_ref_idc以外のフィールドを用いてフラグ情報を示してもよい。
なお、ランダムアクセス単位RAUの先頭AUにのみ格納されるSPS以外のNALユニットに基づいて、ランダムアクセス単位RAUの開始位置を特定してもよいし、それらのNALユニットのnal_ref_idcフィールドによりオープン型かクローズ型のどちらであるかを示してもよい。
最後に、ランダムアクセス単位RAUを構成するAUの予測構造例を図20に示す。図20(a)は表示順、図20(b)は復号順でAUの配置を示したものである。図中に示すように、ランダムアクセス単位RAUの先頭AUであるI3よりも前に表示されるB1とB2は、I3よりも後に表示されるAUを参照することができる。図中では、B1がP6を参照している。ここで、表示順がI3およびI3以降のAUが正しく復号できることを保証するために、表示順がI3よりも後のAUが、表示順でI3よりも前のAUを参照することは禁止する。
(動画像符号化装置)
図21は、本発明の動画像符号化方法を実現する動画像符号化装置100のブロック図である。この動画像符号化装置100は、図8〜図20に示された符号化ストリーム、つまり、飛び込み再生、可変速再生、および、逆再生等の特殊再生可能な動画像の符号化ストリームを生成する装置であり、図4に示された従来の動画像符号化装置1の構成に加えて、特再情報作成部TrickPlayを備える。なお、同図において、図4に示される従来の動画像符号化装置のブロック図の各処理部と同じ動作をする処理部は同じ番号を付し、説明を省略する。
特再情報作成部TrickPlayは、1以上のピクチャを含むランダムアクセス単位毎に、当該ランダムアクセス単位の再生時に参照される補助情報を作成する手段の一例であり、ピクチャタイプPtypeに基づいて特再情報を作成し、可変長符号化部VLCに通知する。
可変長符号化部VLCは、作成された補助情報を、対応するランダムアクセス単位毎に付加することによって、補助情報とピクチャとを含むストリームを生成するストリーム生成手段の一例であり、ランダムアクセス単位RAUの先頭AU内に特再情報を格納するNALユニットを符号化して配置する。
図22は、図21に示された動画像符号化装置100(主に、特再情報作成部TrickPlay)による特再情報を含む符号化ストリームの作成手順、つまり、本発明の動画像符号化方法のフローチャートである。
まず、ステップS10において、符号化対象のAUがランダムアクセス単位RAUの先頭AUであるかどうかを判定し、先頭AUであればステップS11に進み、そうでなければステップS12に進む。ステップS11では、当該ランダムアクセス単位RAUの特再情報を作成するための初期化処理を行うとともに、特再情報を格納するための領域をランダムアクセス単位RAUの先頭AU内に確保する。ステップS12ではAUデータを符号化し、ステップS13に進む。ステップS13では、AUがIピクチャ、Pピクチャ、参照されるBピクチャ、あるいは参照されないBピクチャのいずれであるか、あるいは、N倍速再生時に当該AUを復号化する必要があるかどうかなど、特再情報を作成する際に必要な情報を取得し、ステップS14に進む。ステップS14では、AUがランダムアクセス単位RAUの最終AUであるかどうかを判定し、最終AUであると判定された際にはステップS15に進み、そうでなければステップS16に進む。ステップS15では、特再情報を確定して、特再情報を格納するためのNALユニットを作成し、ステップS11において確保しておいた領域に前記作成したNALユニットを格納する。ステップS15の処理終了後は、ステップS16に進む。ステップS16では、続いて符号化すべきAUがあるかどうかを判定し、符号化すべきAUがあればステップS10以降を繰り返し、なければ処理を終了する。ここで、ステップS16において符号化すべきAUがないと判定された際には、最終ランダムアクセス単位RAUについての特再情報を格納してから処理を終了する。
例えば、図18(a)に示す特殊再生情報を作成する際には、ステップS13において、ピクチャのタイプ、ピクチャがフィールド構造であるかフレーム構造であるか、また、および符号化ストリーム内に3−2プルダウンの情報が含まれる際には、当該ピクチャについての表示フィールドが2枚分であるか3枚分であるかを取得する。ステップS15では、ランダムアクセス単位RAU内の全ピクチャについて、復号順にpicture_structureとpicture_typeを設定する。
なお、ランダムアクセス単位RAUの先頭AUの符号化開始時点で特再情報を格納するNALユニットのサイズが既知でない場合などには、ステップS11において特再情報を格納するための領域を確保する処理を省略してもよい。このとき、ステップS15において、作成した特再情報格納用のNALユニットを先頭AU内に挿入する。
また、特再情報を格納するかどうかを符号化ストリーム単位で切替えてもよい。特に、ランダムアクセス単位を構成するAU間の予測構造についてアプリケーションで規定される場合などには、特再情報を格納しないことにしてもよい。例えば、MPEG−2と同一の予測構造をもつ場合には、特再情報がなくても特殊再生時に復号化が必要なAUを決定できるため、特再情報を格納しなくてもよい。なお、切替えは、ランダムアクセス単位RAU毎に行ってもよい。
(動画像多重化装置)
図23は、本発明の動画像多重化装置108の構成を示すブロック図である。この動画像多重化装置108は、映像データを入力してMPEG−4 AVCのストリームに符号化し、ストリームを構成するAUへのアクセス情報、および特殊再生時の動作を決定するための補助情報を含む管理情報を、ストリームと共に多重化して記録する動画像多重化装置であり、ストリーム属性決定部101、符号化部102、管理情報作成部103、多重化部106、および記録部107から構成される。ここで、符号化部102は、図21に示された動画像符号化装置100における特再情報の付加機能を有する。
ストリーム属性決定部101は、MPEG−4 AVCを符号化する際の特殊再生に関連した制約事項を決定し、これらを属性情報TYPEとして符号化部102と再生支援情報作成部105に出力する。ここで、特殊再生に関連した制約事項とは、MPEG−4 AVCのストリームにおいてランダムアクセス単位を構成するための制約を適用するかどうか、可変速再生や逆再生時に復号化、あるいは表示するAUを示す情報をストリームに含めるかどうか、あるいは、AU間の予測構造を制約するかどうかを示す情報を含む。ストリーム属性決定部101は、さらに、圧縮方式や解像度など管理情報の作成に必要な情報である一般管理情報を一般管理情報作成部104に出力する。符号化部102は、属性情報TYPEに基づいて、入力された映像データをMPEG−4 AVCのストリームに符号化し、符号化データを多重化部106に出力するとともに、ストリームにおけるアクセス情報を一般管理情報作成部104に出力する。ここで、可変速再生や逆再生時に復号化、あるいは表示するAUを示す情報をストリームに含めないことが属性情報TYPEにより示される際には、符号化ストリームに特再情報を含めない。なお、アクセス情報は、ストリームにアクセスする際の基本単位であるアクセス単位の情報を指し、アクセス単位の先頭AUの開始アドレスやサイズ、および表示時刻などを含む。一般管理情報作成部104は、アクセス情報と一般管理情報とから、ストリームにアクセスする際に参照されるテーブルデータ、および圧縮方式などの属性情報を格納したテーブルデータを作成し、管理情報INFOとして多重化部106に出力する。再生支援情報作成部105は、前記入力された属性情報TYPEに基づいて、ランダムアクセス構造をもつかどうかなどを示す支援情報HLPを作成し、多重化部106に出力する。多重化部106は、符号化部102から入力された符号化データ、管理情報INFO、および支援情報HLPを多重化して多重化データを作成し、記録部107に出力する。記録部107は、多重化部106から入力された多重化データを光ディスク、ハードディスク、あるいはメモリなどの記録媒体に記録する。なお、符号化部102においては、MPEG−4 AVCのストリームをMPEG−2 TS(トランスポートストリーム)や、PS(プログラムストリーム)などにパケット化してから出力してもよい。あるいはまた、BDなどのアプリケーションにより規定された方式でパケット化してもよい。
なお、管理情報の内容は、特再情報を符号化ストリーム内に格納するかどうかに依存しなくてもよい。このとき、支援情報HLPは不要としてもよく、動画像多重化装置108は、再生支援情報作成部105を省いた構成としてもよい。
図24は、支援情報HLPにより示される情報の例を示す。支援情報HLPは、図24(a)のようにストリームについての情報を直接示す方法と、図24(b)のようにストリームが特定のアプリケーション規格により規定された制約を満たすかどうかを示す方法とがある。
図24(a)では、ストリームの情報として、以下を示す。
・ストリームがランダムアクセス構造をもつかどうか
・AUに格納されるピクチャ間の予測構造に制約があるかどうか
・特殊再生時に復号化するAU、あるいは表示するAUを示す情報があるかどうか
ここで、特殊再生時に復号化、あるいは表示するAUの情報は、復号化あるいは表示するAUを直接示すものであってもよいし、復号化あるいは表示する際の優先度を示すものでもよい。例えば、ランダムアクセス単位毎に復号化、あるいは表示するAUを示す情報が、アプリケーションにより規定された特別なタイプをもつNALユニット、あるいはSEIメッセージなどに格納されると示すことができる。なお、ランダムアクセス単位を構成するAU間の予測構造を示す情報があるかどうかを示してもよい。また、特殊再生時に復号化、あるいは表示するAUの情報は、1つ以上のランダムアクセス単位毎にまとめて付加されるものであってもよいし、ランダムアクセス単位を構成するAU毎に付加されるものであってもよい。
さらに、復号化あるいは表示するAUを示す情報が特別なタイプをもつNALユニットに格納される際には、当該NALユニットのNALユニットタイプを示してもよい。図25の例では、支援情報HLPにおいて、NALユニットタイプが0であるNALユニットに特殊再生時に復号化あるいは表示するAUについての情報が含まれる。このとき、ストリームのAUデータからNALユニットタイプが0であるNALユニットを分離することにより、特殊再生に関する情報を取得できる。SEIメッセージにより特殊再生に関する情報を格納する場合にも、当該SEIメッセージを識別するための情報を示すことができる。
また、予測構造の制約としては、予め定められた1以上の制約事項を満たすかどうかを示してもよいし、以下のような個別の制約を満たすかどうかをそれぞれ示してもよい。
・IピクチャとPピクチャのAUについては、復号順と表示順が一致する。
・PピクチャのAUはBピクチャのAUを参照しない。
・表示順がランダムアクセス単位の先頭AUよりも後のAUは、当該ランダムアクセス単位に含まれるAUのみを参照する。
・各AUは、復号化順で前後最大N個のAUしか参照できない。このとき、AUは参照AU、あるいは全てのAU毎にカウントするものとし、Nの値を支援情報HLPにおいて示してもよい。
なお、MPEG−4 AVCでは、画質向上のために、参照用のピクチャとしては復号化後にブロック歪みを除去するためのフィルタ処理(デブロック処理)を施した画像を使用し、表示用としてはデブロック処理を施す前の画像を使用することができる。このとき、動画像復号化装置ではデブロック処理を施す前後の画像データを保持しておく必要がある。そこで、デブロック処理を施す前の画像を表示用として保持しておく必要があるかどうかを示す情報を支援情報HLPに格納してもよい。MPEG−4 AVC規格では、参照用、あるいは表示待ちピクチャの復号結果を保存するために必要なバッファのサイズ(DPB:Decoded Picture Buffer)上限値が定められている。従って、DPBのサイズ上限値、あるいはアプリケーションで別途定められたサイズ上限値のバッファを持てば、参照用ピクチャの表示用画像を保存しても破綻なく復号処理が行えるかどうかを示す情報を示してもよい。なお、参照用ピクチャのデブロック処理前の画像を保持するために、DPBとして必要なサイズに加えて確保する必要のあるバッファのサイズを、バイト数あるいはフレーム数などで示してもよい。ここで、各ピクチャにデブロック処理を行うかどうかはストリーム、あるいは管理情報などストリーム外の情報から取得できるものとする。ストリームから取得する際には、例えば、SEIから取得することができる。さらに、MPEG−4 AVCのストリーム復号時には、復号手段において使用可能なバッファサイズと、上記の情報とから、参照用ピクチャについてデブロック処理前の画像を表示に使用できるかどうかを判定し、表示方法を決定してもよい。
なお、支援情報HLPとしては、上記の情報を全て含めてもよいし、一部を含むことにしてもよい。また、予測構造の制約がない場合にのみ特殊再生情報の有無についての情報を含めるなど、予め定めた条件に基づいて、必要な情報を含めてもよい。また、上記以外の情報を支援情報HLPに含めてもよい。
図24(b)では、ストリームの構造に関する情報を直接示すのではなく、ストリームがBD−ROM(Blu−ray Disc)規格や、HD(High Definition)の高精細な画像をDVDに格納するための規格であるHD DVD規格により定めされたストリーム構造に関する制約を満たすかどうかを示すものである。また、BD−ROMなどのアプリケーション規格において、ストリームの構造の制約について複数のモードが規定されている際には、どのモードが適用されているかを示す情報を格納してもよい。例えば、モード1は全く制約なし、モード2はランダムアクセス構造をもち、特殊再生時に復号化するAUを特定するための情報がストリームに含まれる、などの使い方ができる。なお、ダウンロードやストリーミングなどの通信サービス、あるいは放送規格において定められた制約を満たすかどうか示してもよい。
なお、図24(a)と図24(b)に示される情報を両方とも示すこととしてもよい。また、ストリームが特定のアプリケーション規格における制約を満たすことが既知である際に、アプリケーション規格を満たすかどうかを示すのではなく、アプリケーション規格における制約を、図24(a)のようにストリーム構造を直接記述する方式に変換して格納してもよい。
なお、特殊再生時に復号化あるいは表示するAUを示す情報は管理情報として格納されていてもよい。また、支援情報HLPの内容がストリーム内で切り替わる際には、区間毎に支援情報HLPを示してもよい。
図26は、動画像多重化装置108の動作を示すフローチャートである。ステップS51では、ストリーム属性決定部101は、ユーザ設定、あるいは予め定められた条件に基づいて属性情報TYPEを決定する。ステップS52では、符号化部102は、属性情報TYPEに基づいてストリームを符号化し、ステップS53では、再生支援情報作成部105は、属性情報TYPEに基づいて支援情報HLPを作成する。続いて、ステップS54では、符号化部102は、前記符号化されたストリームのアクセス単位毎にアクセス情報を作成し、一般管理情報作成部104は、そのアクセス情報と他の必要な情報(一般管理情報)とを合わせて管理情報INFOを作成する。ステップS55では、多重化部106は、ストリーム、支援情報HLP、および管理情報INFOを多重化し、ステップS56において、記録部107は、前記多重化された多重化データを記録する。なお、ステップS53はステップS52の前に行ってもよいし、ステップS54の後に行ってもよい。
なお、上記支援情報HLPに示される情報を符号化部102によりストリーム内に格納してもよい。このとき、特再情報を格納するNALユニットに、支援情報HLPに示される情報を格納する。例えば、PピクチャがBピクチャを参照しない場合には、可変速再生時にIピクチャとPピクチャのみを復号化することができる。従って、IピクチャとPピクチャのみを復号化して表示できるかどうかを示すフラグ情報を格納する。また、可変速再生時に復号化するAUからは、当該AUが参照するSPSやPPSを取得できないことがある。IピクチャとPピクチャのみを復号化する際に、Pピクチャが参照するPPSがBピクチャのAUにのみ格納されるようなケースである。この際には、Pピクチャの復号化に必要なPPSをBピクチャのAUから取得する必要がある。従って、可変速再生時に復号化するAUから参照されるSPSあるいはPPSが、可変速再生時に復号化するAUから必ず取得できるかどうかを示すフラグ情報を含めてもよい。こうすることで、フラグがセットされていない場合にのみ、可変速再生時に復号化しないピクチャのAUからもSPSあるいはPPSを検出するなどの動作が可能となる。また、IピクチャとPピクチャのみを復号化して表示できることが示される際に、Bピクチャ、特に他のピクチャから参照されるBピクチャも復号することにより、再生速度を調節してもよい。
また、特再情報を格納するNALユニットを使用せずに、SPS、PPS、あるいはスライスなど他のNALユニットのヘッダ内に上記フラグ情報を格納してもよい。例えば、ランダムアクセス単位RAUを構成するAUが参照するSPSが、ランダムアクセス単位RAUの先頭AUに格納される際には、SPSのNALユニットのnal_ref_idcフィールドによりフラグ情報を示すことができる。SPSのNALユニットではnal_ref_idcの値は1以上と規定されているため、上位1ビットを常に1として、下位1ビットでフラグ情報を示すことができる。
なお、支援情報HLPの内容は、ストリームあるいは管理情報のいずれか一方にのみ格納してもよいし、両方に格納してもよい。例えば、ストリーム内において支援情報HLPの内容が固定である際には管理情報において示し、可変である際にはストリーム内で示すことができる。また、管理情報内に、支援情報HLPが固定であるかどうかを示すフラグ情報を格納してもよい。さらに、支援情報HLPの内容が固定であるかどうかが不明であることを示すフラグ情報を格納してもよい。また、BD ROMやRAMなどのアプリケーション規格において支援情報HLPが予め定められている際、あるいは、通信や放送により支援情報HLPが別途提供される際には、支援情報HLPを格納しないことにしてもよい。
(動画像復号化装置)
図27は、本発明の動画像復号化方法を実現する動画像復号化装置200のブロック図である。この動画像復号化装置200は、図8〜図20に示された符号化ストリームを再生する装置であり、符号化ストリームを通常再生するだけでなく、飛び込み再生、可変速再生、および、逆再生等の特殊再生をすることが可能な装置であり、図5に示された従来の動画像復号化装置2の構成に加えて、ストリーム抽出部EXTおよび復号化AU選択部AUSelを備える。なお、同図において、図5に示される従来の動画像復号化装置2のブロック図の各処理部と同じ動作をする処理部には同じ番号を付し、説明を省略する。
復号化AU選択部AUSelは外部から入力される特殊再生の指示に従って、復号化が必要なAUを、可変長復号化部VLDで復号化された特再情報GrpInfに基づいて決定する。さらに、決定した復号化が必要なAUを示す情報であるDecAUをストリーム抽出部EXTに通知する。ストリーム抽出部EXTは復号化AU選択部AUSelで復号化が必要と判断されたAUに対応するストリームのみを抽出して可変長復号化部VLDに伝送する。
図28は、図27に示された動画像復号化装置200(主に、復号化AU選択部AUSel)による特再情報を含むストリームにおいて特殊再生を行う際の復号化手順、つまり、本発明の動画像復号化方法のフローチャートである。
まず、ステップS20において、復号化AU選択部AUSelは、ストリーム中のSPS等を検出することで、当該AUがランダムアクセス単位RAUの先頭AUであるかどうか判定し、先頭AUであればステップS21に進み、そうでなければステップS22に進む。ここで、タイムマップなど管理情報からランダムアクセス単位RAUの開始位置を取得してもよい。特に、飛び込み再生における再生開始位置の決定や、ランダムアクセス単位RAUの先頭ピクチャのみを選択して高速再生するケースでは、タイムマップを参照してランダムアクセス単位RAUの開始位置を決定できる。ステップS21では、復号化AU選択部AUSelは、AUデータから特再情報を取得して解析し、復号化するAUを決定した後にステップS22に進む。ステップS22では、当該AUが、ステップS21において復号化すると決定されたAUであるかどうか判定し、復号化すると決定されたAUであれば、ステップS23において、動画像復号化装置200は、そのAUを復号化し、そうでなければステップS24に進む。ステップS24では、動画像復号化装置200は、復号化するAUが残っているかどうか判定し、残っていればステップS20以降の処理を繰り返し、残っていなければ処理を終了する。なお、全てのAUを順に復号化して表示する通常再生時には、ステップS21およびステップS22の処理を省略する、あるいはステップS21において決定処理を省略し、全てのAUを復号する旨の情報を出力することにしてもよい。
図29は、ステップS21における処理(復号化AU選択部AUSelによる処理)を示すフローチャートである。まず、ステップS30においてAUデータの先頭バイトから順にスタートコードプレフィックスをサーチすることにより、AUを構成するNALユニットの開始位置を検出し、ステップS31に進む。なお、AUデータの先頭バイトからでなく、例えば、Access Unit Delimiterの終了位置など、他の位置からサーチしてもよい。ステップS31では、NALユニットのNALユニットタイプを取得し、ステップS32に進む。ステップS32では、ステップS31において取得したNALユニットタイプが、特再情報を格納するNALユニットであるかどうか判定し、特再情報が格納されている場合にはステップS33に進み、特再情報が格納されていなければステップS30以降の処理を繰り返す。ここで、特再情報がSEIメッセージに格納される際には、SEIのNALユニットをまず取得し、さらに、NALユニット内に特再情報格納用のSEIメッセージが含まれるかどうか判定する。次に、ステップS33では特再情報を取得し、ステップS34に進む。ステップS34では、指示された特殊再生動作を行う際に復号が必要なピクチャを決定する。例えば、2倍速再生が指示されたとする。Iピクチャ、Pピクチャ、および参照されるBピクチャのみを復号、再生することにより2倍速再生が実現できることが特再情報から示される場合には、これら3種類のピクチャを復号し、再生すると決定する。なお、ステップS30からステップS32までの処理において、ランダムアクセス単位RAUの先頭ピクチャに特再情報が検出されなければ、所定の方法において、指示された特殊再生動作を行うために復号が必要なピクチャを決定する。一例として、Access Unit Delimiter内のピクチャのタイプを示すフィールドを参照する、あるいは、NALユニットのヘッダのnal_ref_idcを調べることによりピクチャが参照ピクチャであるかどうかを判定することが可能である。例えば、両者を参照すれば、参照されるBピクチャと参照されないBピクチャとを区別できる。
図30は、復号化する全てのAUを表示するとは限らない場合の処理(復号化AU選択部AUSelによる処理)を示すフローチャートである。図28におけるフローチャートと同様の処理を行うステップについては、同一の符号を付し、説明を省略する。ステップS41では、特再情報を取得して解析し、指示された特殊再生動作において復号化するAUと表示するAUを決定し、ステップS42に進む。ステップS42では、復号化するAUと表示するAUが完全に一致するかどうか判定し、一致する場合にはステップS22に進み、一致しない場合にはステップS43に進む。ステップS43では、表示するAUの一覧情報を出力し、ステップS22に進む。前記出力されたAUの一覧情報は、復号化されたAUの中から表示するAUを決定するステップ(図示しない)において使用される。
なお、MPEG−4 AVCでは、画質向上のために、参照用のピクチャとしては復号化後にブロック歪みを除去するためのフィルタ処理(デブロック処理)を施した画像を使用し、表示用としてはデブロック処理を施す前の画像を使用することができる。このとき、動画像復号化装置200ではデブロック処理を施す前後の画像データを保持しておく必要がある。ここで、動画像復号化装置200は復号化後の画像データを4枚分保持できるメモリを備えるとすると、デブロック処理を施す前後の画像データをメモリに保持した場合、参照ピクチャのデブロック処理前の画像を保持しておくために画像2枚分のメモリが必要となる。しかしながら、逆再生時には、上述したように、なるべく多くのピクチャを同時にメモリに保持できることが望ましい。表示用にもデブロック処理を施した後の画像を使用するとすれば、デブロック処理後の画像のみを保持すればよいため、4枚分のピクチャをメモリに保持できる。したがって、通常の順方向再生時には高画質化を図るためにデブロック処理を施す前の画像を表示し、逆再生時にはデブロック処理後の画像を表示することにすれば、より多くのピクチャをメモリに保持でき、逆再生時の処理量を軽減できる。例えば、特再情報としてIピクチャとPピクチャのAUの一覧が示される図15の例では、I0、P3、P6、P9のうち順方向再生時に同時にメモリに保持できるのは(I0、P3)、(P3、P6)、(P6、P9)の各2枚であるが、逆再生時には4枚のデータを全てメモリに保持できる。
(特再情報の光ディスクでの記録フォーマット例)
特殊再生機能は、パッケージメディアを再生する光ディスク機器においては特に重要である。ここで、次世代の光ディスクであるBD(Blu−ray Disc)において、上述した特再情報を記録する例について述べる。
まず、BD−ROMの記録フォーマットについて説明する。
図31は、BD−ROMの構成、特にディスク媒体であるBDディスク114と、ディスクに記録されているデータ111、112および113の構成を示す図である。BDディスク114に記録されるデータは、AVデータ113と、AVデータに関する管理情報およびAV再生シーケンスなどのBD管理情報112と、インタラクティブを実現するBD再生プログラム111である。ここでは、説明の都合上、映画のAVコンテンツを再生するためのAVアプリケーションを主眼においてのBDディスクの説明を行うが、他の用途として用いても勿論同様である。
図32は、上述したBDディスクに記録されている論理データのディレクトリ・ファイル構成を示した図である。BDディスクは、他の光ディスク、例えばDVDやCDなどと同様にその内周から外周に向けてらせん状に記録領域を持ち、内周のリード・インと外周のリード・アウトの間に論理データを記録できる論理アドレス空間を有している。また、リード・インの内側にはBCA(Burst Cutting Area)と呼ばれるドライブでしか読み出せない特別な領域がある。この領域はアプリケーションから読み出せないため、例えば著作権保護技術などに利用されることがある。
論理アドレス空間には、ファイルシステム情報(ボリューム)を先頭に映像データなどのアプリケーションデータが記録されている。ファイルシステムとは従来技術で説明した通り、UDFやISO9660などのことであり、通常のPCと同じように記録されている論理データをディレクトリ、ファイル構造を使って読み出しする事が可能になっている。
本実施の形態では、BDディスク上のディレクトリ、ファイル構造は、ルートディレクトリ(ROOT)直下にBDVIDEOディレクトリが置かれている。このディレクトリはBDで扱うAVコンテンツや管理情報などのデータ(図32で説明した101、102、103)が格納されているディレクトリである。
BDVIDEOディレクトリの下には、次の7種類のファイルが記録されている。
・BD.INFO(ファイル名固定)
「BD管理情報」の一つであり、BDディスク全体に関する情報を記録したファイルである。BDプレーヤは最初にこのファイルを読み出す。
・BD.PROG(ファイル名固定)
「BD再生プログラム」の一つであり、BDディスク全体に関わる再生制御情報を記録したファイルである。
・XXX.PL(「XXX」は可変、拡張子「PL」は固定)
「BD管理情報」の一つであり、シナリオ(再生シーケンス)であるプレイリスト情報を記録したファイルである。プレイリスト毎に1つのファイルを持っている。
・XXX.PROG(「XXX」は可変、拡張子「PROG」は固定)
「BD再生プログラム」の一つであり、前述したプレイリスト毎の再生制御情報を記録したファイルである。プレイリストとの対応はファイルボディ名(「XXX」が一致する)によって識別される。
・YYY.VOB(「YYY」は可変、拡張子「VOB」は固定)
「AVデータ」の一つであり、VOB(従来例で説明したVOBと同じ)を記録した ファイルである。VOB毎に1つのファイルを持っている。
・YYY.VOBI(「YYY」は可変、拡張子「VOBI」は固定)
「BD管理情報」の一つであり、AVデータであるVOBに関わるストリーム管理情 報を記録したファイルである。VOBとの対応はファイルボディ名(「YYY」が一致 する)によって識別される。
・ZZZ.PNG(「ZZZ」は可変、拡張子「PNG」は固定)
「AVデータ」の一つであり、字幕およびメニューを構成するためのイメージデータ PNG(W3Cによって標準化された画像フォーマットであり「ピング」と読む)を記 録したファイルである。1つのPNGイメージ毎に1つのファイルを持つ。
図33から図38を用いて、BDのナビゲーションデータ(BD管理情報)構造について説明をする。
図33は、VOB管理情報ファイル("YYY.VOBI")の内部構造を示した図である。VOB管理情報は、当該VOBのストリーム属性情報(Attribute)とタイムマップ(TMAP)を有している。ストリーム属性は、ビデオ属性(Video)、オーディオ属性(Audio#0〜Audio#m)個々に持つ構成となっている。特にオーディオストリームの場合は、VOBが複数本のオーディオストリームを同時に持つことができることから、オーディオストリーム数(Number)によって、データフィールドの有無を示している。
下記はビデオ属性(Video)の持つフィールドと夫々が持ち得る値である。
・圧縮方式(Coding):
MPEG1
MPEG2
MPEG4
MPEG4−AVC(Advanced Video Coding)
・解像度(Resolution):
1920x1080
1440x1080
1280x720
720x480
720x565
・アスペクト比(Aspect):
4:3
16:9
・フレームレート(Framerate):
60
59.94(60/1.001)
50
30
29.97(30/1.001)
25
24
23.976(24/1.001)
下記はオーディオ属性(Audio)の持つフィールドと夫々が持ち得る値である。
・圧縮方式(Coding):
AC3
MPEG1
MPEG2
LPCM
・チャンネル数(Ch):
1〜8
・言語属性(Language):
タイムマップ(TMAP)はVOBU毎の情報を持つテーブルであって、当該VOBが有するVOBU数(Number)と各VOBU情報(VOBU#1〜VOBU#n)を持つ。個々のVOBU情報は、VOBU先頭TSパケット(Iピクチャ開始)のアドレスI_startと、そのIピクチャの終了アドレスまでのオフセットアドレス(I_end)、およびそのIピクチャの再生開始時刻(PTS)から構成される。
図34はVOBU情報の詳細を説明する図である。広く知られているように、MPEGビデオストリームは高画質記録するために可変ビットレート圧縮されることがあり、その再生時間とデータサイズ間に単純な相関はない。逆に、音声の圧縮規格であるAC3は固定ビットレートでの圧縮を行っているため、時間とアドレスとの関係は1次式によって求めることができる。しかしながら、MPEGビデオデータの場合は、個々のフレームは固定の表示時間、例えばNTSCの場合は1フレームは1/29.97秒の表示時間を持つが、個々のフレームの圧縮後のデータサイズは絵の特性や圧縮に使ったピクチャタイプ、いわゆるI/P/Bピクチャによってデータサイズは大きく変わってくる。従って、MPEGビデオの場合は、時間とアドレスの関係は一次式の形で表現することは不可能である。
当然の事として、MPEGビデオデータを多重化しているMPEGシステムストリーム、即ちVOBも時間とデータサイズとを一次式の形で表現することは不可能である。このため、VOB内での時間とアドレスとの関係を結びつけるのがタイムマップ(TMAP)である。
このようにして、ある時刻情報が与えられた場合、先ずは当該時刻がどのVOBUに属するのかを検索(VOBU毎のPTSを追っていく)して、当該時刻の直前のPTSをTMAPに持つVOBUに飛びこみ(I_startで指定されたアドレス)、VOBU先頭のIピクチャから復号を開始し、当該時刻のピクチャから表示を開始する。
次に図35を使って、プレイリスト情報("XXX.PL")の内部構造を説明する。プレイリスト情報は、セルリスト(CellList)とイベントリスト(EventList)から構成されている。
セルリスト(CellList)は、プレイリスト内の再生セルシーケンスであり、本リストの記述順でセルが再生される事になる。セルリスト(CellList)の中身は、セルの数(Number)と各セル情報(Cell#1〜Cell#n)である。
セル情報(Cell#)は、VOBファイル名(VOBName)、当該VOB内での開始時刻(In)および終了時刻(Out)と、字幕テーブル(SubtitleTable)を持っている。開始時刻(In)および終了時刻(Out)は、夫々当該VOB内でのフレーム番号で表現され、前述したタイムマップ(TMAP)を使うことによって再生に必要なVOBデータのアドレスを得る事ができる。
字幕テーブル(SubtitleTable)は、当該VOBと同期再生される字幕情報を持つテーブルである。字幕は音声同様に複数の言語を持つことができ、字幕テーブル(SubtitleTable)最初の情報も言語数(Number)とそれに続く個々の言語ごとのテーブル(Language#1〜Language#k)から構成されている。
各言語のテーブル(Language#)は、言語情報(Lang)と、個々に表示される字幕の字幕情報数(Number)と、個々に表示される字幕の字幕情報(Speech#1〜Speech#j)から構成され、字幕情報(Speech#)は対応するイメージデータファイル名(Name)、字幕表示開始時刻(In)および字幕表示終了時刻(Out)と、字幕の表示位置(Position)から構成されている。
イベントリスト(EventList)は、当該プレイリスト内で発生するイベントを定義したテーブルである。イベントリストは、イベント数(Number)に続いて個々のイベント(Event#1〜Event#m)から構成され、個々のイベント(Event#)は、イベントの種類(Type)、イベントのID(ID)、イベント発生時刻(Time)と有効期間(Duration)から構成されている。
図36は、個々のプレイリスト毎のイベントハンドラ(時間イベントと、メニュー選択用のユーザイベント)を持つイベントハンドラテーブル("XXX.PROG")である。イベントハンドラテーブルは、定義されているイベントハンドラ/プログラム数(Number)と個々のイベントハンドラ/プログラム(Program#1〜Program#n)を有している。各イベントハンドラ/プログラム(Program#)内の記述は、イベントハンドラ開始の定義(<event_handler>タグ)と前述したイベントのIDと対になるイベントハンドラのID(ID)を持ち、その後に当該プログラムもFunctionに続く括弧"{"と"}"の間に記述する。前述の"XXX.PL"のイベントリスト(EventList)に格納されたイベント(Event#1〜Event#m)は"XXX.PROG"のイベントハンドラのID(ID)を用いて特定される。
次に図37を用いてBDディスク全体に関する情報("BD.INFO")の内部構造を説明する。BDディスク全体情報は、タイトルリスト(TitleList)とグローバルイベント用のイベントテーブル(EventList)から構成されている。
タイトルリスト(TitleList)は、ディスク内のタイトル数(Number)と、これに続く各タイトル情報(Title#1〜Title#n)から構成されている。個々のタイトル情報(Title#)は、タイトルに含まれるプレイリストのテーブル(PLTable)とタイトル内のチャプタリスト(ChapterList)を含んでいる。プレイリストのテーブル(PLTable)はタイトル内のプレイリストの数(Number)と、プレイリスト名(Name)即ちプレイリストのファイル名を有している。
チャプタリスト(ChapterList)は、当該タイトルに含まれるチャプタ数(Number)と個々のチャプタ情報(Chapter#1〜Chapter#n)から構成され、個々のチャプタ情報(Chapter#)は当該チャプタが含むセルのテーブル(CellTable)を持ち、セルのテーブル(CellTable)はセル数(Number)と個々のセルのエントリ情報(CellEntry#1〜CellEntry#k)から構成されている。セルのエントリ情報(CellEntry#)は当該セルを含むプレイリスト名と、プレイリスト内でのセル番号によって記述されている。
イベントリスト(EventList)は、グローバルイベントの数(Number)と個々のグローバルイベントの情報を持っている。ここで注意すべきは、最初に定義されるグローバルイベントは、ファーストイベント(FirstEvent)と呼ばれ、BDディスクがプレーヤに挿入された時、最初に呼ばれるイベントである。グローバルイベント用イベント情報はイベントタイプ(Type)とイベントのID(ID)だけを持っている。
図38は、グローバルイベントハンドラのプログラムのテーブル("BD.PROG")である。本テーブルは、図36で説明したイベントハンドラテーブルと同一内容である。
以上のようなBD−ROMフォーマットにおいて、上述した特再情報を格納する際には、VOBUが1以上のランダムアクセス単位RAUから構成されるとみなし、VOBUの先頭AUに特再情報を格納する。なお、MPEG−4 AVCでは、特再情報を格納したNALユニットを含める。
なお、特再情報をBD管理情報内に格納してもよい。例えば、VOB管理情報のタイムマップを拡張して、VOBU毎の特再情報を格納できる。あるいは、特再情報を格納するためのマップを新規に定義してもよい。
また、特再情報は、VOBU内、あるいはBD管理情報内のどちらか一方にのみ格納することとしてもよい。
また、特再情報のデフォルト値のみBD管理情報内に格納し、VOBUについての特再情報がデフォルト値と異なる場合にのみ、VOBU内に特再情報を格納してもよい。
また、1つ以上の特再情報のセットをストリームに共通の情報としてBD管理情報内に格納し、VOBUからはBD管理情報内に格納された特再情報のうちいずれか1つを参照することにしてもよい。このとき、VOBUが参照する特再情報のインデックス情報は、VOBU単位の管理情報、あるいはVOBU内に格納される。
(光ディスク再生プレーヤ)
図39は、図31等で示されたBDディスクを再生するプレーヤの大まかな機能構成を示すブロック図である。BDディスク201上のデータは、光ピックアップ202を通して読み出される。読み出されたデータは夫々のデータの種類に応じて専用のメモリに転送される。BD再生プログラム(「BD.PROG」または「XXX.PROG」ファイルの中身)はプログラム記録メモリ203に、BD管理情報(「BD.INFO」、「XXX.PL」または「YYY.VOBI」)は管理情報記録メモリ204に、AVデータ(「YYY.VOB」または「ZZZ.PNG」)はAV記録メモリ205に夫々転送される。
プログラム記録メモリ203に記録されたBD再生プログラムは、プログラム処理部206によって、管理情報記録メモリ204に記録されたBD管理情報は管理情報処理部207によって、また、AV記録メモリ205に記録されたAVデータはプレゼンテーション処理部208によって夫々処理される。
プログラム処理部206は、管理情報処理部207より再生するプレイリストの情報やプログラムの実行タイミングなどのイベント情報を受け取りプログラムの処理を行う。また、プログラムでは再生するプレイリストを動的に変える事が可能であり、この場合は管理情報処理部207に対してプレイリストの再生命令を送ることで実現する。プログラム処理部206は、ユーザからのイベント、即ちリモコンキーからのリクエストを受け、ユーザイベントに対応するプログラムがある場合は、それを実行する。
管理情報処理部207は、プログラム処理部206の指示を受け、対応するプレイリストおよびプレイリストに対応したVOBの管理情報を解析し、プレゼンテーション処理部208に対象となるAVデータの再生を指示する。また、管理情報処理部207は、プレゼンテーション処理部208より基準時刻情報を受け取り、時刻情報に基づいてプレゼンテーション処理部208にAVデータ再生の停止指示を行い、また、プログラム処理部206に対してプログラム実行タイミングを示すイベントを生成する。
プレゼンテーション処理部208は、映像、音声、字幕/イメージ(静止画)の夫々に対応するデコーダを持ち、管理情報処理部207からの指示に従い、AVデータのデコードおよび出力を行う。映像データ、字幕/イメージの場合は、デコード後に夫々の専用プレーン、ビデオプレーン210およびイメージプレーン209に描画され、合成処理部211によって映像の合成処理が行われTVなどの表示デバイスへ出力される。
飛び込み再生、可変速再生、あるいは逆再生などの特殊再生時には、ユーザから要求された特殊再生動作をプレゼンテーション処理部208が解釈し、再生速度などの情報を管理情報処理部207に通知する。管理情報処理部207は、VOBUの先頭AUに格納された特再情報を解析することにより、ユーザが指定した特殊再生動作を満足するように、復号化、および表示するAUを決定する。なお、管理情報処理部207は特再情報を取得してプレゼンテーション処理部208に出力し、プレゼンテーション処理部208において復号化、および表示するAUを決定してもよい。
なお、本実施の形態で示した動画像符号化方法および動画像復号化方法を実現するためのプログラムを、フレキシブルディスク等の記録媒体に記録するようにすることにより、本実施の形態で示した処理を、独立したコンピュータシステムにおいて簡単に実施することが可能となる。
図40は、本実施の形態の動画像符号化方法および動画像復号化方法を、フレキシブルディスク等の記録媒体に記録されたプログラムを用いて、コンピュータシステムにより実施する場合の説明図である。
図40(b)は、フレキシブルディスクの正面からみた外観、断面構造、およびフレキシブルディスクを示し、図40(a)は、記録媒体本体であるフレキシブルディスクの物理フォーマットの例を示している。フレキシブルディスクFDはケースF内に内蔵され、該ディスクの表面には、同心円状に外周からは内周に向かって複数のトラックTrが形成され、各トラックは角度方向に16のセクタSeに分割されている。従って、上記プログラムを格納したフレキシブルディスクでは、上記フレキシブルディスクFD上に割り当てられた領域に、上記プログラムが記録されている。
また、図40(c)は、フレキシブルディスクFDに上記プログラムの記録再生を行うための構成を示す。動画像符号化方法および動画像復号化方法を実現する上記プログラムをフレキシブルディスクFDに記録する場合は、コンピュータシステムCsから上記プログラムをフレキシブルディスクドライブを介して書き込む。また、フレキシブルディスク内のプログラムにより動画像符号化方法および動画像復号化方法を実現する上記動画像符号化方法および動画像復号化方法をコンピュータシステム中に構築する場合は、フレキシブルディスクドライブによりプログラムをフレキシブルディスクから読み出し、コンピュータシステムに転送する。
なお、上記説明では、記録媒体としてフレキシブルディスクを用いて説明を行ったが、光ディスクを用いても同様に行うことができる。また、記録媒体はこれに限らず、ICカード、ROMカセット等、プログラムを記録できるものであれば同様に実施することができる。
以上、本発明に係る動画像ストリーム生成装置、動画像符号化装置、動画像多重化装置および動画像復号化装置について、実施の形態に基づいて説明したが、本発明は、これら実施の形態に限定されるものではない。本発明の主旨を逸脱しない範囲内で、当業者が思いつく変形を本実施の形態に施したものも、本発明に含まれる。
例えば、本実施の形態における動画像ストリーム生成装置、動画像符号化装置および動画像多重化装置のいずれかを備える光ディスク記録装置、動画像送信装置、デジタルテレビ放送送出装置、Webサーバ、通信装置、携帯情報端末等や、本実施の形態における動画像復号化装置を備える動画像受信装置、デジタルテレビ放送受信装置、通信装置、携帯情報端末等も、本発明に含まれるのは言うまでもない。
なお、図21、図23、図27及び図39に示されるブロック図の各機能ブロックは典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されても良いし、一部又は全てを含むように1チップ化されても良い。例えば、メモリ以外の機能ブロックが1チップ化されていても良い。また、ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。そして、集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセッサーで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサーを利用しても良い。さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適応等が可能性としてありえる。また、各機能ブロックのうち、符号化または復号化の対象となるデータを格納する手段だけ1チップ化せずに別構成としても良い。
本発明は、特殊再生可能な動画像ストリームを生成する動画像ストリーム生成装置、特殊再生可能な動画像ストリームを符号化して生成する動画像符号化装置、特殊再生可能な動画像ストリームをパケット多重化して生成する動画像多重化装置、および、それらの動画像ストリームを特殊再生する動画像復号化装置として、特に、MPEG−4 AVCのストリームを再生するとともに、可変速再生や逆再生などの特殊再生モードで再生するシステムを構成する機器として、例えば、特殊再生機能が重視される光ディスク関連機器として有用である。
100 動画像符号化装置
PTYPE 予測構造決定部
ME 動き検出部
MC 動き補償部
Sub 減算部
T 直交変換部
Q 量子化部
IQ 逆量子化部
IT 逆直交変換部
add 加算部
PicMem ピクチャメモリ
SW スイッチ
VLC 可変長符号化部
TrickPlay 特再情報作成部
101 ストリーム属性決定部
102 符号化部
103 管理情報作成部
104 一般管理情報作成部
105 再生支援情報作成部
106 多重化部
107 記録部
108 動画像多重化装置
200 動画像復号化装置
EXT ストリーム抽出部
AUSel 復号化AU選択部
VLD 可変長復号化部
201 BDディスク
202 光ピックアップ
203 プログラム記録メモリ
204 管理情報記録メモリ
205 AV記録メモリ
206 プログラム処理部
207 管理情報処理部
208 プレゼンテーション処理部
209 イメージプレーン
210 ビデオプレーン
211 合成処理部

Claims (1)

  1. 少なくとも、画素データを格納するための画素データ格納単位と、前記画素データを格納する格納単位の前に位置し、補助情報を格納するための補助情報格納単位とから構成されるピクチャを含むストリームを生成する動画像ストリームを記録する領域を有する記録媒体と、前記記録媒体から、前記動画像ストリームを読み込み復号する復号装置とから構成される復号システムであって、
    前記動画像ストリームは、
    ランダムアクセスポイントとなる第1のIピクチャから、前記ランダムアクセスポイン
    トとは別のランダムアクセスポイントとなる第2のIピクチャの直前のピクチャまでに属
    する複数のピクチャで構成されるランダムアクセス単位に含まれる、各ピクチャのピクチャタイプ情報をピクチャの復号順に並べた第1の補助情報と、
    前記ランダムアクセス単位に含まれる、各ピクチャのピクチャ構造情報をピクチャの復号順に並べた第2の補助情報と、
    前記ランダムアクセス単位に含まれる、各ピクチャの復号に使用されるシーケンスパラメータセットとが、前記第1のIピクチャの補助情報格納単位に格納された構造を有しており、
    前記復号装置は、
    特殊再生をする旨の指示を取得する指示取得手段と、
    前記第1の補助情報と、前記第2の補助情報とを、前記第1のIピクチャの前記補助情報格納単位から分離して解析する解析手段と、
    前記解析手段による解析結果に基づいて、前記ランダムアクセス単位に含まれるピクチャのうち、前記特殊再生に必要なピクチャを特定する再生ピクチャ特定手段と、
    前記第1のIピクチャの前記補助情報格納単位から、前記ランダムアクセス単位に含まれる、各ピクチャの復号に使用されるシーケンスパラメータセットを抽出し、復号化する第1の復号化手段と、
    前記シーケンスパラメータセットを使用して、前記再生ピクチャ特定手段で特定されたピクチャを復号化する第2の復号化手段とを備える
    ことを特徴とする復号システム。
JP2010195100A 2004-04-28 2010-08-31 復号システム Expired - Fee Related JP4910065B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010195100A JP4910065B2 (ja) 2004-04-28 2010-08-31 復号システム

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
JP2004134212 2004-04-28
JP2004134212 2004-04-28
JP2004165005 2004-06-02
JP2004165005 2004-06-02
JP2004251871 2004-08-31
JP2004251871 2004-08-31
JP2010195100A JP4910065B2 (ja) 2004-04-28 2010-08-31 復号システム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2007169798A Division JP4614991B2 (ja) 2004-04-28 2007-06-27 動画像ストリーム生成装置、動画像ストリーム生成方法、動画像復号化装置、動画像復号化方法および記録方法

Publications (2)

Publication Number Publication Date
JP2011019270A JP2011019270A (ja) 2011-01-27
JP4910065B2 true JP4910065B2 (ja) 2012-04-04

Family

ID=34971443

Family Applications (5)

Application Number Title Priority Date Filing Date
JP2006515497A Active JP4071811B2 (ja) 2004-04-28 2005-04-25 動画像ストリーム生成装置、動画像ストリーム生成方法、動画像復号化装置、動画像復号化方法、記録方法および動画像復号化システム
JP2007169798A Active JP4614991B2 (ja) 2004-04-28 2007-06-27 動画像ストリーム生成装置、動画像ストリーム生成方法、動画像復号化装置、動画像復号化方法および記録方法
JP2008150176A Active JP4185567B1 (ja) 2004-04-28 2008-06-09 動画像ストリーム生成装置、動画像ストリーム生成方法、動画像復号化装置、動画像復号化方法、記録媒体への記録方法および動画像復号化システム
JP2009251461A Expired - Fee Related JP4763824B2 (ja) 2004-04-28 2009-10-30 動画像復号化装置、動画像復号化方法、動画像ストリーム生成装置、動画像ストリーム生成方法、および記録方法
JP2010195100A Expired - Fee Related JP4910065B2 (ja) 2004-04-28 2010-08-31 復号システム

Family Applications Before (4)

Application Number Title Priority Date Filing Date
JP2006515497A Active JP4071811B2 (ja) 2004-04-28 2005-04-25 動画像ストリーム生成装置、動画像ストリーム生成方法、動画像復号化装置、動画像復号化方法、記録方法および動画像復号化システム
JP2007169798A Active JP4614991B2 (ja) 2004-04-28 2007-06-27 動画像ストリーム生成装置、動画像ストリーム生成方法、動画像復号化装置、動画像復号化方法および記録方法
JP2008150176A Active JP4185567B1 (ja) 2004-04-28 2008-06-09 動画像ストリーム生成装置、動画像ストリーム生成方法、動画像復号化装置、動画像復号化方法、記録媒体への記録方法および動画像復号化システム
JP2009251461A Expired - Fee Related JP4763824B2 (ja) 2004-04-28 2009-10-30 動画像復号化装置、動画像復号化方法、動画像ストリーム生成装置、動画像ストリーム生成方法、および記録方法

Country Status (13)

Country Link
US (5) US7843994B2 (ja)
EP (8) EP2182521A1 (ja)
JP (5) JP4071811B2 (ja)
KR (1) KR101148765B1 (ja)
CN (5) CN101778235B (ja)
AT (7) ATE555476T1 (ja)
CA (2) CA2542266C (ja)
DE (2) DE602005021926D1 (ja)
ES (7) ES2388397T3 (ja)
MY (2) MY145551A (ja)
PL (6) PL2207181T3 (ja)
TW (2) TWI324338B (ja)
WO (1) WO2005106875A1 (ja)

Families Citing this family (104)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4002878B2 (ja) * 2003-01-17 2007-11-07 松下電器産業株式会社 画像符号化方法
ES2400955T3 (es) * 2004-10-07 2013-04-15 Panasonic Corporation Aparato de codificación de imágenes y aparato de decodificación de imágenes
US9497483B2 (en) * 2005-01-10 2016-11-15 Panasonic Corporation Method for generating and decoding a coded picture signal, an apparatus for generating and decoding a coded picture signal, a program for generating and decoding a coding picture signal, and an integrated circuit for generating and decoding a coded picture signal
JP2006211274A (ja) * 2005-01-27 2006-08-10 Toshiba Corp 記録媒体、この記録媒体を再生する方法並びにその再生装置及び記録媒体に映像データを記録する記録装置並びにその記録方法
KR100770704B1 (ko) 2005-08-04 2007-10-29 삼성전자주식회사 픽쳐 스킵 방법 및 장치
NZ566935A (en) 2005-09-27 2010-02-26 Qualcomm Inc Methods and apparatus for service acquisition
US8229983B2 (en) 2005-09-27 2012-07-24 Qualcomm Incorporated Channel switch frame
EP1952627A1 (en) * 2005-11-03 2008-08-06 Thomson Licensing Digital video recording device and method
US7903737B2 (en) * 2005-11-30 2011-03-08 Mitsubishi Electric Research Laboratories, Inc. Method and system for randomly accessing multiview videos with known prediction dependency
US9516326B1 (en) * 2005-12-09 2016-12-06 Nvidia Corporation Method for rotating macro-blocks of a frame of a video stream
FR2894739A1 (fr) * 2005-12-12 2007-06-15 Thomson Licensing Sa Procede de codage, procede de decodage, dispositif de codage et dispositif de decodage de donnees video
JP4736918B2 (ja) * 2006-04-11 2011-07-27 パナソニック株式会社 デジタル再生装置または再生プログラム
US8699583B2 (en) * 2006-07-11 2014-04-15 Nokia Corporation Scalable video coding and decoding
US20080068993A1 (en) * 2006-09-08 2008-03-20 Edgeware Ab Method and an apparatus for data streaming
US20080062869A1 (en) * 2006-09-08 2008-03-13 Edgeware Ab Method and an apparatus for data streaming
US8826345B2 (en) * 2006-09-08 2014-09-02 Edgeware Ab Method and an apparatus for data streaming
JP4947349B2 (ja) * 2006-11-10 2012-06-06 ソニー株式会社 画像処理装置、画像処理方法、およびプログラム
US8155207B2 (en) 2008-01-09 2012-04-10 Cisco Technology, Inc. Processing and managing pictures at the concatenation of two video streams
US8875199B2 (en) 2006-11-13 2014-10-28 Cisco Technology, Inc. Indicating picture usefulness for playback optimization
US8416859B2 (en) * 2006-11-13 2013-04-09 Cisco Technology, Inc. Signalling and extraction in compressed video of pictures belonging to interdependency tiers
US8873932B2 (en) 2007-12-11 2014-10-28 Cisco Technology, Inc. Inferential processing to ascertain plural levels of picture interdependencies
US20080115175A1 (en) * 2006-11-13 2008-05-15 Rodriguez Arturo A System and method for signaling characteristics of pictures' interdependencies
KR101089072B1 (ko) * 2006-11-14 2011-12-09 퀄컴 인코포레이티드 채널 전환용 시스템 및 방법
WO2008061211A2 (en) 2006-11-15 2008-05-22 Qualcomm Incorporated Systems and methods for applications using channel switch frames
EP3182709B1 (en) 2007-01-18 2021-05-12 Nokia Technologies Oy Carriage of sei message in rtp payload format
KR101396364B1 (ko) * 2007-01-24 2014-05-19 삼성전자주식회사 컨텐츠를 저장한 정보저장매체, 재생 방법 및 장치
US7995640B2 (en) * 2007-04-30 2011-08-09 Texas Instruments Incorporated Dynamic interpolation location
JP2008294638A (ja) * 2007-05-23 2008-12-04 Sony Corp 伝送システム、記録装置、伝送方法、記録方法、およびプログラム
US8804845B2 (en) 2007-07-31 2014-08-12 Cisco Technology, Inc. Non-enhancing media redundancy coding for mitigating transmission impairments
US8958486B2 (en) 2007-07-31 2015-02-17 Cisco Technology, Inc. Simultaneous processing of media and redundancy streams for mitigating impairments
KR100951008B1 (ko) * 2007-12-17 2010-04-02 한국전자통신연구원 인터레이스 부호화에서의 실시간 비트율 제어 방법 및시스템
JP5170708B2 (ja) * 2008-01-24 2013-03-27 日本電気株式会社 動画像ストリーム加工方法及び装置、それを用いた動画像再生装置並びに動画像配信装置
US8416858B2 (en) 2008-02-29 2013-04-09 Cisco Technology, Inc. Signalling picture encoding schemes and associated picture properties
JP4577409B2 (ja) * 2008-06-10 2010-11-10 ソニー株式会社 再生装置、再生方法、プログラム、及び、データ構造
US8886022B2 (en) 2008-06-12 2014-11-11 Cisco Technology, Inc. Picture interdependencies signals in context of MMCO to assist stream manipulation
US8699578B2 (en) 2008-06-17 2014-04-15 Cisco Technology, Inc. Methods and systems for processing multi-latticed video streams
US8971402B2 (en) 2008-06-17 2015-03-03 Cisco Technology, Inc. Processing of impaired and incomplete multi-latticed video streams
US8705631B2 (en) 2008-06-17 2014-04-22 Cisco Technology, Inc. Time-shifted transport of multi-latticed video for resiliency from burst-error effects
EP2297964A4 (en) * 2008-06-25 2017-01-18 Cisco Technology, Inc. Support for blocking trick mode operations
EP2356812B1 (en) 2008-11-12 2015-06-10 Cisco Technology, Inc. Processing of a video program having plural processed representations of a single video signal for reconstruction and output
FR2940737A1 (fr) * 2008-12-31 2010-07-02 Thomson Licensing Generation de flux de paquets de donnees video contenant des informations d'acceleration pour le decodage
MY155999A (en) * 2009-01-19 2015-12-31 Panasonic Ip Corp America Coding method,decoding method,coding apparatus,decoding apparatus,program, and integrated circuit
US8326131B2 (en) 2009-02-20 2012-12-04 Cisco Technology, Inc. Signalling of decodable sub-sequences
US20100218232A1 (en) * 2009-02-25 2010-08-26 Cisco Technology, Inc. Signalling of auxiliary information that assists processing of video according to various formats
US8782261B1 (en) 2009-04-03 2014-07-15 Cisco Technology, Inc. System and method for authorization of segment boundary notifications
US8949883B2 (en) 2009-05-12 2015-02-03 Cisco Technology, Inc. Signalling buffer characteristics for splicing operations of video streams
US8279926B2 (en) 2009-06-18 2012-10-02 Cisco Technology, Inc. Dynamic streaming with latticed representations of video
US9300969B2 (en) 2009-09-09 2016-03-29 Apple Inc. Video storage
WO2011068807A1 (en) * 2009-12-01 2011-06-09 Divx, Llc System and method for determining bit stream compatibility
TWI410135B (zh) * 2009-12-08 2013-09-21 Alticast Corp 在數位廣播系統中傳送/接收傳輸流的裝置與方法
US20110176611A1 (en) * 2010-01-15 2011-07-21 Yu-Wen Huang Methods for decoder-side motion vector derivation
US8254453B2 (en) * 2010-01-20 2012-08-28 Himax Media Solutions, Inc. Multi-format video decoder and related decoding method
JP5387430B2 (ja) * 2010-01-28 2014-01-15 株式会社Jvcケンウッド 動画像再生装置、動画像再生方法、及び、プログラム
US20110222837A1 (en) * 2010-03-11 2011-09-15 Cisco Technology, Inc. Management of picture referencing in video streams for plural playback modes
US8259808B2 (en) * 2010-03-25 2012-09-04 Mediatek Inc. Low complexity video decoder
KR101556821B1 (ko) 2010-04-13 2015-10-01 지이 비디오 컴프레션, 엘엘씨 샘플 배열 멀티트리 세부분할에서 계승
PT2559246T (pt) 2010-04-13 2016-09-14 Ge Video Compression Llc Regiões de fusão de amostras
KR102080450B1 (ko) 2010-04-13 2020-02-21 지이 비디오 컴프레션, 엘엘씨 평면 간 예측
PT3703377T (pt) 2010-04-13 2022-01-28 Ge Video Compression Llc Codificação de vídeo utilizando subdivisões multi-árvore de imagens
JP5805991B2 (ja) * 2010-05-07 2015-11-10 トムソン ライセンシングThomson Licensing ピクチャ・シーケンスを符号化する方法、それに対応する再構築方法、および当該シーケンスを表す符号化データのストリーム
JP2011259110A (ja) * 2010-06-07 2011-12-22 Panasonic Corp 動画再生方法および動画再生装置
JP2012018727A (ja) * 2010-07-08 2012-01-26 Sony Corp 情報処理装置、および情報処理方法、並びにプログラム
JP5589654B2 (ja) * 2010-08-04 2014-09-17 三菱電機株式会社 映像音声再生装置、および映像音声再生方法
TWI523499B (zh) 2011-02-22 2016-02-21 Panasonic Ip Corp America An image coding method, an image decoding method, an image coding apparatus, an image decoding apparatus, and an image coding / decoding apparatus
MX2013000093A (es) 2011-02-22 2013-02-27 Panasonic Corp Metodo de filtro, dispositivo de codificacion de imagen dinamica, dispositivo de decodificacion de imagen dinamica y dispositivo de codificacion y decodificacion de imagen dinamica.
US9516379B2 (en) 2011-03-08 2016-12-06 Qualcomm Incorporated Buffer management in video codecs
KR101803970B1 (ko) * 2011-03-16 2017-12-28 삼성전자주식회사 컨텐트를 구성하는 장치 및 방법
JP5341952B2 (ja) 2011-05-30 2013-11-13 株式会社東芝 ビデオサーバ及びデータ収録再生方法
USRE47366E1 (en) 2011-06-23 2019-04-23 Sun Patent Trust Image decoding method and apparatus based on a signal type of the control parameter of the current block
MY165357A (en) 2011-06-23 2018-03-21 Sun Patent Trust Image decoding method and apparatus based on a signal type of the control parameter of the current block
EP3407610B1 (en) 2011-06-24 2019-09-04 Sun Patent Trust Coding method and coding apparatus
CA2830046C (en) * 2011-06-24 2018-09-04 Panasonic Corporation Image decoding method, image coding method, image decoding apparatus, image coding apparatus, and image coding and decoding apparatus
CN106878715B (zh) 2011-06-27 2019-05-28 太阳专利托管公司 编码方法及编码装置
RU2602671C2 (ru) 2011-06-28 2016-11-20 Сан Пэтент Траст Способ декодирования изображений, способ кодирования изображений, устройство декодирования изображений, устройство кодирования изображений и устройство кодирования и декодирования изображений
KR102006032B1 (ko) 2011-06-29 2019-07-31 선 페이턴트 트러스트 화상 복호 방법, 화상 부호화 방법, 화상 복호 장치, 화상 부호화 장치 및 화상 부호화 복호 장치
EP2728869B1 (en) 2011-06-30 2021-11-10 Sun Patent Trust Image decoding method
AU2012277219A1 (en) 2011-06-30 2013-09-19 Sun Patent Trust Image decoding method, image encoding method, image decoding device, image encoding device, and image encoding/decoding device
TWI604720B (zh) * 2011-07-02 2017-11-01 三星電子股份有限公司 視訊解碼裝置
US8767824B2 (en) * 2011-07-11 2014-07-01 Sharp Kabushiki Kaisha Video decoder parallelization for tiles
RU2714371C2 (ru) 2011-07-11 2020-02-14 Сан Пэтент Траст Способ декодирования изображений, способ кодирования изображений, устройство декодирования изображений, устройство кодирования изображений и устройство кодирования и декодирования изображений
PL3661201T3 (pl) 2011-07-19 2021-10-25 Tagivan Ii Llc Sposób filtrowania, sposób dekodowania filmu, sposób kodowania filmu, aparat do dekodowania filmu, aparat do kodowania filmu i aparat do kodowania/dekodowania filmu
CN103369314B (zh) * 2012-04-01 2018-02-16 中兴通讯股份有限公司 帧场信息的编码方法及解码方法、编码器和解码器
US20150063463A1 (en) * 2012-04-15 2015-03-05 Samsung Electronics Co., Ltd. Method and device for coding multi-layer video, and method and device for decoding multi-layer video
US9979958B2 (en) 2012-04-20 2018-05-22 Qualcomm Incorporated Decoded picture buffer processing for random access point pictures in video sequences
KR102444264B1 (ko) * 2012-09-13 2022-09-16 엘지전자 주식회사 영상 부호화/복호화 방법 및 장치
US8989508B2 (en) * 2012-09-28 2015-03-24 Sharp Kabushiki Kaisha Electronic device for signaling a sub-picture buffer parameter
US10187646B2 (en) * 2013-08-22 2019-01-22 Sony Corporation Encoding device, encoding method, transmission device, decoding device, decoding method, and reception device
JP6474815B2 (ja) * 2013-12-16 2019-02-27 エルジー エレクトロニクス インコーポレイティド トリックプレイサービス提供のための信号送受信装置及び信号送受信方法
JP6224522B2 (ja) * 2014-05-22 2017-11-01 日本電信電話株式会社 映像配信装置、映像配信方法及び映像配信プログラム
US9729887B2 (en) 2014-06-25 2017-08-08 Qualcomm Incorporated Multi-layer video coding
KR101528269B1 (ko) * 2014-09-04 2015-06-16 (주)브레인키즈 동영상 재생 방법
CN106105221B (zh) * 2015-01-09 2021-05-04 索尼公司 图像处理设备、图像处理方法以及记录介质
KR101868203B1 (ko) * 2015-01-28 2018-07-20 한국전자통신연구원 스트림 처리 방법 및 장치
WO2017047399A1 (ja) * 2015-09-15 2017-03-23 ソニー株式会社 受信装置および方法、送信装置および方法
CN106792078A (zh) * 2016-07-12 2017-05-31 乐视控股(北京)有限公司 视频处理方法及装置
US10412383B2 (en) * 2017-08-15 2019-09-10 Google Llc Compressing groups of video frames using reversed ordering
TWI659647B (zh) * 2017-11-21 2019-05-11 晶睿通訊股份有限公司 影像播放設備及其影像播放方法
TWI665663B (zh) * 2018-08-22 2019-07-11 張維中 影音倒轉播放裝置與系統及其方法
CN109618186B (zh) * 2018-11-15 2021-01-01 中国航空工业集团公司洛阳电光设备研究所 一种采用fpga实现的h264/avc视频辅助增强信息封装电路
KR20220100710A (ko) * 2019-12-23 2022-07-15 엘지전자 주식회사 Nal 유닛 타입 기반 영상 또는 비디오 코딩
US11792432B2 (en) * 2020-02-24 2023-10-17 Tencent America LLC Techniques for signaling and identifying access unit boundaries
KR20220156830A (ko) * 2020-03-20 2022-11-28 바이트댄스 아이엔씨 서브픽처 사이의 순서 관계
JP2023522224A (ja) 2020-04-20 2023-05-29 バイトダンス インコーポレイテッド 参照ピクチャリスト上の制約
WO2021252525A1 (en) * 2020-06-08 2021-12-16 Bytedance Inc. Constraints of slice count in a coded video picture

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1147854C (zh) 1994-02-28 2004-04-28 索尼公司 数据记录方法和设备、数据记录介质,以及数据再生方法和设备
JP3365109B2 (ja) * 1994-12-28 2003-01-08 ソニー株式会社 データ再生装置及びデータ再生方法
JP3604186B2 (ja) 1995-02-16 2004-12-22 三菱電機株式会社 記録媒体の記録方法及び再生方法
JP3329979B2 (ja) * 1995-02-24 2002-09-30 株式会社日立製作所 光ディスク及び光ディスク再生装置
JPH08280009A (ja) 1995-04-06 1996-10-22 Matsushita Electric Ind Co Ltd 画像符号化装置および画像復号化装置および光ディスク
JP3146937B2 (ja) * 1995-07-13 2001-03-19 日本ビクター株式会社 高能率符号化された動画像情報から早送り,早戻し画像を再生する再生方法
JP3484834B2 (ja) 1995-07-28 2004-01-06 ソニー株式会社 データ符号化/復号化方法および装置
US5757435A (en) * 1995-12-08 1998-05-26 C-Cube Microsystems, Inc. MPEG-2 inverse telecine circuit
JP4434326B2 (ja) 1997-03-19 2010-03-17 ソニー株式会社 映像再生方法及び映像再生装置
TW408310B (en) 1997-08-21 2000-10-11 Sony Corp Disk recording method and device, disk reproducing method and device and recording media
CA2289958C (en) * 1998-11-19 2003-01-21 Tomoyuki Okada Information recording medium, apparatus and method for recording or reproducing data thereof
JP2000354224A (ja) * 1999-01-01 2000-12-19 Hitachi Ltd 画像データ記録方法および光ディスク再生方法
JP3805985B2 (ja) * 1999-02-18 2006-08-09 株式会社東芝 ストリームデータの情報記憶媒体、その記録方法、再生方法、記録装置および再生装置
EP1148727A1 (en) * 2000-04-05 2001-10-24 THOMSON multimedia Method and device for decoding a digital video stream in a digital video system using dummy header insertion
JP2003511918A (ja) * 1999-10-07 2003-03-25 トムソン ライセンシング ソシエテ アノニム デジタル・ビデオ・システムにおけるトリックモード生成のための方法および装置
JP3820155B2 (ja) 2001-01-16 2006-09-13 松下電器産業株式会社 情報記録装置および方法、情報記録プログラム、および情報記録プログラムを記録した記録媒体
KR100878927B1 (ko) * 2001-01-16 2009-01-19 파나소닉 주식회사 정보기록장치, 정보기록방법 및 기록매체
JP2003009085A (ja) * 2001-06-20 2003-01-10 Mitsubishi Electric Corp デジタル信号記録装置および方法、デジタル信号再生装置および方法
US7218635B2 (en) * 2001-08-31 2007-05-15 Stmicroelectronics, Inc. Apparatus and method for indexing MPEG video data to perform special mode playback in a digital video recorder and indexed signal associated therewith
US20030044166A1 (en) * 2001-08-31 2003-03-06 Stmicroelectronics, Inc. System for multiplexing video data streams in a digital video recorder and method of operating the same
US6707984B2 (en) 2001-10-31 2004-03-16 Thomson Licensing S.A. Changing a playback speed for video presentation recorded in a modified film format
WO2003083868A1 (fr) * 2002-04-02 2003-10-09 Sony Corporation Dispositif et procede d'enregistrement de donnees, dispositif et procede de lecture de donnees, support d'enregistrement d'informations, support de programme et programme
US8406301B2 (en) * 2002-07-15 2013-03-26 Thomson Licensing Adaptive weighting of reference pictures in video encoding
US7376186B2 (en) 2002-07-15 2008-05-20 Thomson Licensing Motion estimation with weighting prediction
US7903742B2 (en) * 2002-07-15 2011-03-08 Thomson Licensing Adaptive weighting of reference pictures in video decoding
JP4477295B2 (ja) 2002-10-10 2010-06-09 古河電気工業株式会社 自動車ワイヤハーネス用アルミ電線
JP3975889B2 (ja) 2002-11-13 2007-09-12 松下電器産業株式会社 照光つまみ及びその製造方法
JP3718499B2 (ja) * 2002-11-29 2005-11-24 シャープ株式会社 動画像記録方法
JP4318478B2 (ja) 2002-12-27 2009-08-26 原子燃料工業株式会社 沸騰水型軽水炉用燃料集合体
WO2004066635A1 (ja) * 2003-01-17 2004-08-05 Matsushita Electric Industrial Co., Ltd. 動画像符号化方法および動画像復号化方法
JP2003303476A (ja) 2003-03-03 2003-10-24 Pioneer Electronic Corp 情報記録媒体、その記録装置及び記録方法並びにその再生装置及び再生方法
WO2005074295A1 (en) * 2004-01-16 2005-08-11 General Instrument Corporation Method, protocol, and apparatus for transporting advanced video coding content
US8391672B2 (en) * 2004-02-06 2013-03-05 Panasonic Corporation Recording medium, reproduction device, program, and reproduction method
TW200952462A (en) * 2004-06-02 2009-12-16 Panasonic Corp Seamless switching between random access units multiplexed in a multi angle view multimedia stream

Also Published As

Publication number Publication date
EP2207181B1 (en) 2012-04-25
ATE555473T1 (de) 2012-05-15
TWI395207B (zh) 2013-05-01
CN101697576B (zh) 2012-07-11
US8130843B2 (en) 2012-03-06
JP4763824B2 (ja) 2011-08-31
EP2207183B1 (en) 2012-04-25
ATE555476T1 (de) 2012-05-15
WO2005106875A1 (en) 2005-11-10
CN101697576A (zh) 2010-04-21
ES2383652T3 (es) 2012-06-25
EP1968063A1 (en) 2008-09-10
US8254446B2 (en) 2012-08-28
US20080219393A1 (en) 2008-09-11
PL2182520T3 (pl) 2012-09-28
PL1743338T3 (pl) 2010-04-30
JP4614991B2 (ja) 2011-01-19
US7809060B2 (en) 2010-10-05
CN101778235A (zh) 2010-07-14
EP2207183A1 (en) 2010-07-14
EP2182519B1 (en) 2012-04-25
ES2330864T3 (es) 2009-12-16
CN101697575A (zh) 2010-04-21
JP2011019270A (ja) 2011-01-27
DE602005016663D1 (de) 2009-10-29
PL2182519T3 (pl) 2012-09-28
EP1968063B1 (en) 2010-06-16
ES2388397T3 (es) 2012-10-15
KR101148765B1 (ko) 2012-05-25
ATE471562T1 (de) 2010-07-15
CA2811897A1 (en) 2005-11-10
ES2347385T3 (es) 2010-10-28
CN101778235B (zh) 2013-06-19
CA2542266C (en) 2012-07-17
ATE555477T1 (de) 2012-05-15
CN1950907B (zh) 2011-04-13
TWI324338B (en) 2010-05-01
EP1743338B1 (en) 2009-09-16
EP2182519A1 (en) 2010-05-05
EP2207182B1 (en) 2012-04-25
MY144441A (en) 2011-09-15
JP2008295055A (ja) 2008-12-04
ES2383656T3 (es) 2012-06-25
TW200949824A (en) 2009-12-01
EP1743338A1 (en) 2007-01-17
PL2207181T3 (pl) 2012-09-28
ATE555475T1 (de) 2012-05-15
US8254447B2 (en) 2012-08-28
JP4071811B2 (ja) 2008-04-02
CN1950907A (zh) 2007-04-18
US20080117988A1 (en) 2008-05-22
US20080131079A1 (en) 2008-06-05
CN101697575B (zh) 2012-05-30
TW200601281A (en) 2006-01-01
PL2207182T3 (pl) 2012-09-28
US7843994B2 (en) 2010-11-30
EP2182520A1 (en) 2010-05-05
EP2207183B8 (en) 2012-08-08
US20080118224A1 (en) 2008-05-22
PL2207183T3 (pl) 2012-09-28
DE602005021926D1 (de) 2010-07-29
ATE555474T1 (de) 2012-05-15
CA2542266A1 (en) 2005-11-10
JP2010028860A (ja) 2010-02-04
EP2182521A1 (en) 2010-05-05
ES2383654T3 (es) 2012-06-25
CA2811897C (en) 2014-06-03
ATE443327T1 (de) 2009-10-15
EP2207181A1 (en) 2010-07-14
JP2007325289A (ja) 2007-12-13
EP2182520B1 (en) 2012-04-25
KR20070007028A (ko) 2007-01-12
MY145551A (en) 2012-02-29
EP2207182A1 (en) 2010-07-14
JP2007535187A (ja) 2007-11-29
JP4185567B1 (ja) 2008-11-26
CN101707723A (zh) 2010-05-12
ES2383655T3 (es) 2012-06-25
US20080118218A1 (en) 2008-05-22

Similar Documents

Publication Publication Date Title
JP4910065B2 (ja) 復号システム
JP4211999B2 (ja) 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法、記録方法、および画像復号化システム
JP4554690B2 (ja) ストリーム生成装置、ストリーム生成方法、ストリーム再生装置、ストリーム再生システム、ストリーム再生方法および記録方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111004

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111205

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111227

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120116

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150120

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4910065

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees