JP2008263640A - 画像符号化装置、画像復号装置、画像符号化方法、および画像復号方法 - Google Patents

画像符号化装置、画像復号装置、画像符号化方法、および画像復号方法 Download PDF

Info

Publication number
JP2008263640A
JP2008263640A JP2008150944A JP2008150944A JP2008263640A JP 2008263640 A JP2008263640 A JP 2008263640A JP 2008150944 A JP2008150944 A JP 2008150944A JP 2008150944 A JP2008150944 A JP 2008150944A JP 2008263640 A JP2008263640 A JP 2008263640A
Authority
JP
Japan
Prior art keywords
picture
encoded
pixel data
storage unit
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008150944A
Other languages
English (en)
Other versions
JP4212000B2 (ja
Inventor
Tadamasa Toma
正真 遠間
Shinya Sumino
眞也 角野
Tomoyuki Okada
智之 岡田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2008150944A priority Critical patent/JP4212000B2/ja
Publication of JP2008263640A publication Critical patent/JP2008263640A/ja
Application granted granted Critical
Publication of JP4212000B2 publication Critical patent/JP4212000B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/238Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
    • H04N21/2387Stream processing in response to a playback request from an end-user, e.g. for trick-play
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/7605Television signal recording on discs or drums
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor

Abstract

【課題】特殊再生時においても、復号に必要なピクチャパラメータセットを適切に取得してピクチャを復号することができるようにストリームを生成する画像符号化装置を提供する。
【解決手段】画像符号化装置10は、ピクチャ符号化データを生成するスライス符号化部11と、PPSを生成するPPS作成部16と、所定の条件に基づき、PPSを、複数のAUのうち先頭のAU、または、PPSを参照するピクチャ符号化データが格納されているAUに格納するAU決定部17とを備え、AU決定部17は、先頭のAUに格納するPPSの数に制限を有し、先頭のピクチャを除くピクチャのSEIには、そのピクチャの符号化画素データが参照する符号化されたPPSを格納するか、または、そのピクチャの符号化画素データが参照する符号化されたPPSを格納しない。
【選択図】図1

Description

本発明は、動画像を符号化する画像符号化装置、及びその画像符号化装置で符号化された動画像を復号する画像復号装置に関し、特に、高速再生(可変速再生)などの特殊再生に対応した画像符号化装置及び画像復号装置に関する。
近年、音声、画像、その他の画素値を統合的に扱うマルチメディア時代を迎え、従来からの情報メディア、つまり新聞、雑誌、テレビ、ラジオ、電話等の情報を人に伝達する手段がマルチメディアの対象として取り上げられるようになってきた。一般に、マルチメディアとは、文字だけでなく、図形、音声、特に画像等を同時に関連づけて表すことをいうが、上記従来の情報メディアをマルチメディアの対象とするには、その情報をディジタル形式にして表すことが必須条件となる。
ところが、上記各情報メディアの持つ情報量をディジタル情報量として見積もってみると、文字の場合1文字当たりの情報量は1〜2バイトであるのに対し、音声の場合1秒当たり64Kbits(電話品質)、さらに動画については1秒当たり100Mbits(現行テレビ受信品質)以上の情報量が必要となり、上記情報メディアでその膨大な情報をディジタル形式でそのまま扱うことは現実的ではない。例えば、テレビ電話は、64Kbit/s〜1.5Mbits/sの伝送速度を持つサービス総合ディジタル網(ISDN:Integrated Services Digital Network)によって既に実用化されているが、テレビ・カメラの映像をそのままISDNで送ることは不可能である。
そこで、必要となってくるのが情報の圧縮技術であり、例えば、テレビ電話の場合、ITU−T(国際電気通信連合 電気通信標準化部門)で勧告されたH.261やH.263規格の動画圧縮技術が用いられている。また、MPEG−1規格の情報圧縮技術によると、通常の音楽用CD(コンパクト・ディスク)に音声情報とともに画像情報を入れることも可能となる。
ここで、MPEG(Moving Picture Experts Group)とは、ISO/IEC(国際標準化機構 国際電気標準会議)で標準化された動画像信号圧縮の国際規格であり、MPEG−1は、動画像信号を1.5Mbpsまで、つまりテレビ信号の情報を約100分の1にまで圧縮する規格である。また、MPEG−1規格では対象とする品質を伝送速度が主として約1.5Mbpsで実現できる程度の中程度の品質としたことから、さらなる高画質化の要求をみたすべく規格化されたMPEG−2では、動画像信号を2〜15MbpsでTV放送品質を実現する。さらに現状では、MPEG−1、MPEG−2と標準化を進めてきた作業グループ(ISO/IEC JTC1/SC29/WG11)によって、MPEG−1、MPEG−2を上回る圧縮率を達成し、さらに物体単位で符号化・復号化・操作を可能とし、マルチメディア時代に必要な新しい機能を実現するMPEG−4が規格化された。MPEG−4では、当初、低ビットレートの符号化方法の標準化を目指して進められたが、現在はインタレース画像も含む高ビットレートも含む、より汎用的な符号化に拡張されている。その後、ISO/IECとITU−Tが共同でより高圧縮率の次世代画像符号化方式として、MPEG−4 AVC(Advanced Video Coding)が標準化され、次世代の光ディスク関連機器、あるいは携帯端末向けの放送などで使用される見込みである。
一般に動画像の符号化では、時間方向および空間方向の冗長性を削減することによって情報量の圧縮を行う。そこで時間的な冗長性の削減を目的とする画面間予測符号化では、前方または後方のピクチャを参照してブロック単位で動きの検出および予測画像の作成を行い、得られた予測画像と符号化対象ピクチャとの差分値に対して符号化を行う。ここで、ピクチャとは1枚の画面を表す用語であり、プログレッシブ画像ではフレームを意味し、インタレース画像ではフレームもしくはフィールドを意味する。ここで、インタレース画像とは、1つのフレームが時刻の異なる2つのフィールドから構成される画像である。インタレース画像の符号化や復号化処理においては、1つのフレームをフレームのまま処理したり、2つのフィールドとして処理したり、フレーム内のブロック毎にフレーム構造またはフィールド構造として処理したりすることができる。
参照画像を持たず画面内予測符号化を行うものをIピクチャと呼ぶ。また、1枚のピクチャのみを参照し画面間予測符号化を行うものをPピクチャと呼ぶ。また、同時に2枚のピクチャを参照して画面間予測符号化を行うことのできるものをBピクチャと呼ぶ。Bピクチャは表示時間が前方もしくは後方から任意の組み合わせとして2枚のピクチャを参照することが可能である。参照画像(参照ピクチャ)は符号化および復号の基本単位であるブロック毎に指定することができるが、符号化を行ったビットストリーム中に先に記述される方の参照ピクチャを第1参照ピクチャ、後に記述される方を第2参照ピクチャとして区別する。ただし、これらのピクチャを符号化および復号化する場合の条件として、参照するピクチャが既に符号化および復号化されている必要がある。
図21は、従来のMPEG−2のストリームの構成図である。
図21に示すようにMPEG−2のストリームは以下のような階層構造を有している。ストリームは複数のGOP(Group Of Picture)から構成されており、これを符号化処理の基本単位とすることで動画像の編集やランダムアクセスが可能になっている。GOPは、複数のピクチャから構成され、各ピクチャには、Iピクチャ、PピクチャまたはBピクチャがある。ストリーム、GOPおよびピクチャはさらにそれぞれの単位の区切りを示す同期信号(sync)と当該単位に共通のデータであるヘッダ(header)から構成されている。
図22Aおよび図22Bは、MPEG−2で使用されているピクチャ間の予測構造例である。
同図で斜線をつけたピクチャは他のピクチャから参照されるピクチャである。図22Aに示すように、MPEG−2ではPピクチャ(P0、P6、P9、P12、P15)は表示時刻が直前1枚のIピクチャもしくはPピクチャのみ参照した予測符号化が可能である。また、Bピクチャ(B1、B2、B4、B5、B7、B8、B10、B11、B13、B14、B16、B17、B19、B20)は表示時刻が直前1枚と直後1枚のIピクチャもしくはPピクチャを参照した予測符号化が可能である。さらに、ストリームに配置される順序も決まっており、IピクチャおよびPピクチャは表示時刻の順序、Bピクチャは直後に表示されるIピクチャもしくはPピクチャの直後に配置される。GOP構造としては、例えば、図22Bに示すように、I3からB14までのピクチャをまとめて1つのGOPとすることができる。
図23は、MPEG−4 AVCのストリームの構成図である。MPEG−4 AVCでは、GOPに相当する概念は無いが他のピクチャに依存せずに復号化できる特別なピクチャ単位でデータを分割すればGOPに相当するランダムアクセス可能な単位が構成できるので、これをランダムアクセスユニットRAUと呼ぶことにする。
次に、ストリームを扱う際の基本単位であるアクセスユニット(以降、AU(Acce
ss Unit)と呼ぶ)について説明する。AUとは、1ピクチャ分の符号化データを格納する単位であり、パラメータセットPSや、スライスデータなどを含む。パラメータセットPSは各ピクチャのヘッダに相当するデータであるピクチャパラメータセット(以下、単にPPSという)とMPEG−2のGOP以上の単位のヘッダに相当するシーケンスパラメータセット(以下、単にSPSという)がある。なお、PPSとSPSは、それぞれ復号化の際の初期化を行うために必要とされる初期化情報である。
SPSには、ランダムアクセスユニットRAUの全ての符号化されたピクチャを復号するために共通に参照される情報として、プロファイル、最大参照可能ピクチャ数、画像サイズ等が含まれている。PPSには、ランダムアクセスユニットRAU内の符号化されたピクチャごとに、そのピクチャを復号するために参照される情報として、可変長符号化のタイプ、量子化ステップの初期値、参照ピクチャ数等が含まれている。さらに、SPS、PPSには量子化マトリックスを含めることもでき、SPSで設定された量子化マトリックスを必要に応じてPPSに上書きすることができる。各ピクチャには前記PPSおよびSPSのいずれを参照するかを示す識別子が付与される。また、スライスデータには、ピクチャを識別するための識別番号であるフレーム番号FNが含まれる。ここで、各ピクチャから参照されるPPSはピクチャ単位で更新できるが、SPSは、後述するIDRピクチャにおいてのみ更新可能である。
MPEG−4 AVCにおけるIピクチャには、IDR(Instantaneous
Decoder Refresh)ピクチャと、IDRピクチャではないIピクチャの2種類がある。IDRピクチャとは、復号順でIDRピクチャより後の全ピクチャを、復号順でIDRピクチャより前のピクチャを参照することなしに復号することのできるIピクチャであり、MPEG−2のclosed GOPの先頭Iピクチャに相当する。IDRではないIピクチャにおいては、復号順でIピクチャより後のピクチャが、復号順で当該Iピクチャより前のピクチャを参照してもよい。IDRピクチャでないIピクチャをランダムアクセス単位RAUの先頭に配置し、ランダムアクセス単位RAUにおけるピクチャの予測構造を制約することにより、MPEG−2のopen GOPのような構造を構成することもできる。
MPEG−4 AVCにおけるAUには、ピクチャの復号化に必須のデータに加えて、スライスデータの復号に必須でないSEI(Supplemental Enhancement Information)と呼ばれる補助情報や、AUの境界情報なども含めることができる。パラメータセットPS、スライスデータ、SEIなどのデータは、全てNAL(Network Adaptation Layer)ユニットNALUに格納される。NALユニットは、ヘッダとペイロードから構成され、ヘッダには、ペイロードに格納されるデータのタイプ(以降、NALユニットタイプと呼ぶ)を示すフィールドなどが含まれる。NALユニットタイプは、スライスやSEIなどデータの種類別に値が定義されており、NALユニットタイプを参照することにより、NALユニットに格納されるデータの種類を特定できる。
SEIのNALユニットには、1以上のSEIメッセージを格納することができる。SEIメッセージもヘッダとペイロードから構成され、ペイロードに格納される情報の種類は、ヘッダにおいて示されるSEIメッセージのタイプにより識別される。以降で、AUを復号化するとは、AUにおけるスライスデータを復号することを示し、AUを表示するとは、AUにおけるスライスデータの復号結果を表示することを示すものとする。
ランダムアクセスユニットRAUの先頭AUには、そのランダムアクセスユニットRAUにおける全てのAUから参照されるSPSのNALユニット、および先頭AUが参照するPPSのNALユニットが含まれる。さらに、ランダムアクセスユニットRAUにおけ
る各AUを復号する際に必要となるPPSのNALユニットは、当該AU、あるいはランダムアクセスユニットRAUにおいて復号順で当該AUよりも前のAUに含まれることが保証される。
ここで、NALユニットにはNALユニット境界を識別するための情報が存在しないため、AUとして格納する際には、各NALユニットの先頭に境界情報を付加できる。MPEG−2 TS(Transport Stream)やPS(Program Stream)においてMPEG−4 AVCのストリームを扱う際には、NALユニットの先頭に、0x000001の3バイトで示されるスタートコードプレフィックスが付加される。また、MPEG−2 TSおよびPSにおいては、AUの先頭にAccess Unit Delimiterと呼ばれる、AU境界を示すNALユニットを必ず挿入することが規定されている。
従来、このような動画像の符号化及び復号に関連した様々な技術が提案されている(例えば、特許文献1参照)。
図24は、従来の画像符号化方法を実現する画像符号化装置のブロック図である。
画像符号化装置191は、入力される動画像データVinを圧縮符号化して、MPEG−4 AVCの符号化ストリームであるAVCストリームstを出力する装置であり、スライス符号化部11、メモリ12、SPS作成部13、新規PPS判定部14、PPS作成部16、およびAU決定部17を備えている。
動画像データVinは、スライス符号化部11に入力される。スライス符号化部11は、1AU分のスライスデータを符号化して、符号化結果であるスライスデータSinをメモリ12に格納し、当該ピクチャの復号に必要なSPS情報SPSinをSPS作成部13に出力するとともに、当該AUの復号に必要なPPS情報PPSinを新規PPS判定部14に出力する。
SPS作成部13は、SPS情報SPSinに基づいてSPSを作成し、そのSPSを含むデータSPSnalをAU決定部17に出力する。
新規PPS判定部14は、ランダムアクセスユニットRAUの先頭AUから順に、各AUについてのPPS情報PPSinを保持しておき、入力されたPPS情報PPSinと保持されているPPS情報PPSinを比較して、入力されたPPS情報PPSinが新規である場合には、その旨を示す新規PPSフラグflgを1にセットするとともに、当該PPS情報PPSinをPPS情報PPSoutとしてPPS作成部16に出力する。一方、入力されたPPS情報PPSinが保持されているPPS情報PPSinに含まれる際には、新規PPS判定部14は、新規PPSフラグを0にセットする。
PPS作成部16は、新規PPSフラグが1であれば、入力されたPPS情報PPSoutに基づいてPPSを作成し、そのPPSを含むデータPPSnalをAU決定部17に出力する。
AU決定部17は、データSPSnal、データPPSnalに基づいてSPSとPPSのNALユニットを作成するとともに、メモリ12からスライスデータSnalを取得してスライスデータのNALユニットを作成する。そして、AU決定部17は、作成したNALユニットを予め定められた順序で配置してAUデータを決定することで、AVCストリームstを構成し、そのAVCストリームstを出力する。
図25は、画像符号化装置191の動作を示すフローチャートである。ステップS101において、画像符号化装置191は、1ピクチャ分のスライスデータを符号化し、ステップS102においてSPSを作成する。ここで、SPSの作成は、ランダムアクセスユニットRAUの先頭AUにおいてのみ行うことにしてもよい。続いて、画像符号化装置191は、ステップS103において当該AUのPPS情報(PPS)がランダムアクセスユニットRAUにおいて新規であるかどうか判定する。新規である場合には(ステップS111のはい)、画像符号化装置191は、AUにPPSを格納すると決定し、ステップS111においてステップS106に進み、そうでない場合には(ステップS111のいいえ)、ステップS107に進む。ステップS106では、画像符号化装置191は、PPSを作成する。ステップS107では、ステップS111において新規であると判断されてAUにPPSを格納すると決定された際には、画像符号化装置191は、ステップS106で作成されたPPSをAUに含め、1AU分のデータを作成して出力する。
図26は、従来の画像復号方法を実現する画像復号装置のブロック図である。
画像復号装置291は、入力されるAVCストリームstからAUを分離して復号することにより、復号された画像を示す復号後データDoutを出力する装置であり、AU境界検出部22、PPS取得部23、PPSメモリ24、復号情報取得部25、および復号部26を備えている。
AU境界検出部22は、AUの境界を検出してAUデータを分離し、AUデータ内にPPSのNALユニットが含まれる際には、そのPPSのNALユニットPPSnalをPPS取得部23に出力し、その他のNALユニットDnalを復号情報取得部25に出力する。
PPS取得部23は、NALユニットPPSnalを解析し、解析結果を解析結果信号PPSstとしてPPSメモリ24に保持させる。復号情報取得部25は、NALユニットDnalを解析してSPSおよびスライスデータなどを取得するとともに、PPSメモリ24から当該AUが参照するPPSを含むデータPPSrefを取得して、スライスデータと、スライスデータの復号に必要なSPSおよびPPSとを復号前データDinとして復号部26に出力する。
復号部26は、復号前データDinに基づいてスライスデータを復号し、復号後データDoutを出力する。
ところで、ランダムアクセスユニットRAUは、その先頭AUから復号が可能であることを示し、光ディスクやハードディスクを有する蓄積機器において、飛び込み再生、可変速再生、逆再生などの特殊再生、あるいはランダムアクセスユニット単位でのスキップ再生を実現するうえで必須のデータ構造である。
特開2003−18549号公報
しかしながら、従来のMPEG−4 AVCのストリームにおけるランダムアクセスユニットRAUでは、IピクチャやPピクチャのAUなど、特定のAUを選択して復号、表示することにより高速再生を行う場合に、AUの復号に必要なPPSを取得することができなかった。
図27Aおよび図27Bは、ランダムアクセスユニットRAUの構造例である。
図27Aに示すように、ランダムアクセスユニットRAUはAU1からAU15までの15個のAUから構成され、高速再生時にはAU1、AU4、AU7、AU10、AU1
3の5個のAUを復号、表示するものとする。ここで、AU1からAU8まではPPSとしてPPS#1を参照し、AU9からAU15まではPPS#2を参照し、PPS#1とPPS#2は、それぞれAU1とAU9に格納される。このとき、図27Bに示すように、高速再生時に復号されるAUにはAU9が含まれないため、高速再生時にはPPS#2を取得することができず、結果としてAU10とAU13を復号することができない。
このように、ランダムアクセスユニットRAUにおけるAUを選択的に復号して表示する際には、MPEG−2のように予め決められたAUのみを復号するのでは、必要なPPSを取得できず、ランダムアクセスユニットRAU内の全てのAUを解析してPPSを取得しなければならないという課題があった。
そこで本発明は、かかる問題に鑑みてなされたものであって、高速再生(可変速再生)のような特殊再生時においても、復号に必要なピクチャパラメータセットを適切に取得してピクチャを復号することができるようにストリームを生成する画像符号化装置、及びそのストリームを復号する画像復号装置を提供することを目的とする。
上記目的を達成するために、本発明の画像符号化装置は、少なくとも、画素データを格納するための画素データ格納単位と、前記画素データを格納する格納単位の前に位置し、補助情報を格納するための補助情報格納単位とから構成されるピクチャを符号化して、符号化された複数のピクチャを含んで構成されるランダムアクセスユニットを、ストリームの一部として生成する画像符号化装置であって、前記ピクチャの画素データをそれぞれ符号化することで、符号化画素データを生成する符号化手段と、前記符号化画素データごとに、当該符号化画素データを復号するために参照されるパラメータ群たるピクチャパラメータセット情報を生成し、符号化する情報生成手段と、前記画素データ格納単位に、前記符号化画素データを格納する第1の格納手段と、所定の条件に基づき、前記符号化されたピクチャパラメータセット情報を、前記複数のピクチャのうち先頭のピクチャの補助情報格納単位、または、当該ピクチャパラメータセット情報を参照する符号化画素データを含むピクチャの補助情報格納単位に格納する第2の格納手段とを備え、前記第2の格納手段は、前記先頭のピクチャの補助情報格納単位に複数の符号化されたピクチャパラメータセット情報を格納し、前記先頭のピクチャの補助情報格納単位に格納する符号化されたピクチャパラメータセット情報の数に制限を有し、前記複数のピクチャのうち、先頭のピクチャを除くピクチャの補助情報格納単位には、当該ピクチャの符号化画素データが参照する符号化されたピクチャパラメータセット情報を格納するか、または、当該ピクチャの符号化画素データが参照する符号化されたピクチャパラメータセット情報を格納しないことを特徴とする。
また、上記目的を達成するために、本発明の画像符号化装置は、複数のピクチャを符号化して、符号化された複数のピクチャを含んで構成されるランダムアクセスユニットを、ストリームの一部として生成する画像符号化装置であって、前記複数のピクチャをそれぞれ符号化することで複数のピクチャ符号化データを生成する符号化手段と、前記ピクチャ符号化データごとに、当該ピクチャ符号化データを復号するために参照されるパラメータ群たるピクチャパラメータセット情報を生成する情報生成手段と、前記ランダムアクセスユニットを構成する複数の格納単位のそれぞれに、前記複数のピクチャ符号化データを1つずつ格納する第1の格納手段と、所定の条件に基づき、前記ピクチャパラメータセット情報を、前記複数の格納単位のうち先頭の格納単位、または、当該ピクチャパラメータセット情報を参照するピクチャ符号化データが格納されている格納単位に格納する第2の格納手段とを備え、前記第2の格納手段は、前記先頭の格納単位に格納するピクチャパラメータセット情報の数に制限を有し、前記先頭の格納単位に格納する前記ピクチャパラメータセット情報の数が制限を越えない場合には、前記先頭の格納単位に前記ピクチャパラメータセット情報を格納し、前記先頭の格納単位に格納する前記ピクチャパラメータセット情報の数が制限を越える場合には、前記先頭の格納単位より後の格納単位であり、当該ピクチャパラメータセット情報を参照するピクチャ符号化データが格納されている格納単位に、前記ピクチャパラメータセット情報を1つ格納することを特徴とする。
また、上記目的を達成するために、本発明の画像符号化装置は、複数のピクチャを符号化して、符号化された複数のピクチャを含んで構成されるランダムアクセスユニットを、ストリームの一部として生成する画像符号化装置であって、前記複数のピクチャをそれぞれ符号化することで複数のピクチャ符号化データを生成する符号化手段と、前記全てのピクチャ符号化データを復号するために共通に参照されるパラメータ群たるシーケンスパラメータセット情報を生成する第1の情報生成手段と、前記ピクチャ符号化データごとに、当該ピクチャ符号化データを復号するために参照されるパラメータ群たるピクチャパラメータセット情報を生成する第2の情報生成手段と、前記ランダムアクセスユニットを構成する複数の格納単位のそれぞれに、前記複数のピクチャ符号化データを1つずつ格納する第1の格納手段と、前記複数の格納単位のうち先頭の格納単位に、前記シーケンスパラメータセット情報を格納する第2の格納手段と、前記ピクチャパラメータセット情報ごとに、当該ピクチャパラメータセット情報を、前記複数の格納単位のうち先頭の格納単位に格納する、または、当該ピクチャパラメータセット情報を参照するピクチャ符号化データが格納されている格納単位に格納する第3の格納手段とを備えることを特徴とする。例えば、前記第3の格納手段は、複数のピクチャパラメータセット情報を前記先頭の格納単位に
予め格納しておき、前記第2の情報生成手段で生成されたピクチャパラメータセット情報と同一のピクチャパラメータセット情報が、前記先頭の格納単位に格納されていない場合に、当該ピクチャパラメータセット情報を参照するピクチャ符号化データが格納されている格納単位に、当該ピクチャパラメータセット情報を格納する。
これにより、ストリームの一部として生成されたランダムアクセスユニットには、各ピクチャ符号化データの復号に必要なピクチャパラメータセット情報(PPS)が、ランダムアクセスユニットの先頭の格納単位(AU)か、そのピクチャ符号化データを格納している格納単位に格納されている。したがって、このようなランダムアクセスユニットに含まれる全てのピクチャ符号化データのうち、少なくとも先頭の格納単位に格納されているピクチャ符号化データを選択して再生するような特殊再生を行う場合であっても、選択されたピクチャ符号化データの復号に必要なピクチャパラメータセット情報を取り損ねることなく、適切に且つ迅速に取得することができる。その結果、特殊再生をスムーズに行うことができる。
また、本発明の画像復号装置は、上記の画像符号化装置により生成されたストリームから、符号化された複数のピクチャを復号する画像復号装置であって、前記符号化された複数のピクチャの中から、復号すべきピクチャを特定するピクチャ特定手段と、前記符号化された複数のピクチャのうち、先頭のピクチャの補助情報格納単位、または前記復号すべきピクチャの補助情報格納単位から、当該復号すべき符号化画素データを復号するために参照されるパラメータ群であり、符号化されたピクチャパラメータセット情報を取得する取得手段と、前記符号化されたピクチャパラメータセット情報を復号化する第1の復号手段と、復号化されたピクチャパラメータセット情報を参照することで前記復号すべき符号化画素データを復号する復号手段とを備える。
また、本発明の画像復号装置は、上記の画像符号化装置により生成されたストリームから、ランダムアクセスユニットを取得し、前記複数のピクチャ符号化データを復号する画像復号装置であって、少なくとも、前記ランダムアクセスユニットの先頭の格納単位に格納されているピクチャ符号化データが特定されるように、前記複数のピクチャ符号化データの中から、一部の復号すべきピクチャ符号化データを特定するピクチャ特定手段と、前記先頭の格納単位、または前記復号すべきピクチャ符号化データが格納されている格納単位から、当該復号すべきピクチャ符号化データを復号するために参照されるパラメータ群たるピクチャパラメータセット情報を取得する取得手段と、前記ピクチャパラメータセット情報を参照することで前記復号すべきピクチャ符号化データを復号する復号手段とを備えることを特徴とする。
また、本発明の画像復号装置は、符号化された複数のピクチャをそれぞれピクチャ符号化データとして格納単位ごとに格納して構成されるランダムアクセスユニットをストリームから取得し、前記複数のピクチャ符号化データを復号する画像復号装置であって、少なくとも、前記ランダムアクセスユニットの先頭の格納単位に格納されているピクチャ符号化データが特定されるように、前記複数のピクチャ符号化データの中から、一部の復号すべきピクチャ符号化データを特定するピクチャ特定手段と、前記先頭の格納単位から、前記全てのピクチャ符号化データを復号するために共通に参照されるパラメータ群たるシーケンスパラメータセット情報を取得する第1の取得手段と、前記先頭の格納単位、または前記復号すべきピクチャ符号化データが格納されている格納単位から、当該復号すべきピクチャ符号化データを復号するために参照されるパラメータ群たるピクチャパラメータセット情報を取得する第2の取得手段と、前記シーケンスパラメータセット情報及びピクチャパラメータセット情報を参照することで前記復号すべきピクチャ符号化データを復号する復号手段とを備えることを特徴とする。
例えば、各ピクチャ符号化データの復号に必要なピクチャパラメータセット情報は、ランダムアクセスユニットの先頭の格納単位か、そのピクチャパラメータセット情報を参照するピクチャ符号化データを格納している格納単位に格納されている。したがって、ランダムアクセスユニットに含まれる複数のピクチャ符号化データの中から一部のピクチャ符号化データを復号して再生するような特殊再生を行う場合であっても、少なくとも先頭の格納単位に格納されているピクチャ符号化データを復号すべきピクチャ符号化データとし、先頭の格納単位か、復号すべきピクチャ符号化データを格納している格納単位から、復号すべきピクチャ符号化データのピクチャパラメータセット情報を取得するため、ピクチャ符号化データの復号に必要なピクチャパラメータセット情報を取り損ねることなく、適切に且つ迅速に取得することができる。その結果、特殊再生をスムーズに行うことができる。
また、上記目的を達成するために、本発明の画像符号化方法は、動画像をピクチャ単位で符号化する画像符号化方法であって、1以上の前記ピクチャをまとめたランダムアクセス単位は、高速再生や逆再生などの特殊再生時に復号するピクチャと、全ピクチャを復号して表示する通常再生時にのみ復号するピクチャとから構成されるように、ピクチャの画素を符号化して画素の符号化データを生成する符号化ステップと、前記ピクチャを復号する際に参照する初期化情報のうち、前記ランダムアクセス単位を構成する全ピクチャに対して有効であるシーケンス初期化情報を生成するシーケンス初期化情報生成ステップと、前記ピクチャを復号する際に参照する初期化情報のうち、前記ランダムアクセス単位を構成する個々のピクチャに対して設定できるピクチャ初期化情報を生成するピクチャ初期化情報生成ステップと、前記生成された画素の符号化データ、シーケンス初期化情報、あるいはピクチャ初期化情報を、それぞれ異なるサブピクチャ単位に格納する格納ステップと、前記作成された符号化データのサブピクチャ単位を必ず含み、シーケンス初期化情報、あるいはピクチャ初期化情報のサブピクチャ単位を選択的に含むピクチャ格納単位を作成するピクチャ格納単位作成ステップとを含み、ピクチャ格納単位作成ステップは、前記特殊再生時に復号するピクチャのピクチャ初期化情報が、同一ピクチャ格納単位、あるいは、前記ランダムアクセス単位において復号順が前であり、かつ前記特殊再生時に復号するピクチャを格納するピクチャ格納単位から取得できるように、前記ピクチャ初期化情報のサブピクチャ単位を格納することを特徴とする。
また、前記特殊再生時に復号するピクチャは、面内予測、あるいは単予測により符号化されたピクチャであることを特徴としてもよい。
また、前記特殊再生時に復号するピクチャは、面内予測、単予測により符号化されたピクチャ、あるいは双予測により符号化されたピクチャのなかで他のピクチャから参照されないピクチャであることを特徴としてもよい。
また、前記ピクチャ格納単位作成ステップは、前記特殊再生時に復号する全てのピクチャについて、当該ピクチャを復号する際に参照するピクチャ初期化情報を含むサブピクチャ単位を、ピクチャ格納単位に格納することを特徴としてもよい。
また、前記ランダムアクセス単位における先頭のピクチャ格納単位は、前記ランダムアクセス単位内の全てのピクチャを復号する際に参照する前記シーケンス初期化情報を格納したサブピクチャ単位を含むことを特徴としてもよい。
また、上記目的を達成するために、本発明の画像復号方法は、上述の画像符号化方法により符号化された符号化データを復号する画像復号方法であって、復号するピクチャを決定する決定ステップと、前記決定されたピクチャのピクチャ格納単位から前記シーケンス初期化情報と前記ピクチャ初期化情報を取得する初期化情報取得ステップと、前記取得した前記シーケンス初期化情報と前記ピクチャ初期化情報を参照して、前記サブピクチャ格納単位に格納された前記符号化データを復号する復号ステップとを含み、前記決定ステップは、前記通常再生時には全てのピクチャを復号すると決定し、前記特殊再生時には、特殊再生を行う際に復号が必要なピクチャを選択することを特徴とする。
また、上記目的を達成するために、本発明の多重化方法は、動画像を符号化し、符号化ストリームと符号化ストリームの管理情報を多重化して記録する多重化方法であって、動画像を符号化して符号化ストリームを生成する符号化ステップと、前記符号化された符号化ストリームをパケット化するパケット化ステップと、前記パケット化された符号化ストリームからピクチャデータを分離する際に必要なアクセス情報を作成するアクセス情報作
成ステップと、前記アクセス情報を含む管理情報と、前記パケット化された符号化ストリームを多重化する多重化ステップと、前記多重化された多重化データを記録する記録ステップとを含み、前記符号化ステップは、上述の画像符号化方法により符号化ストリームを生成することを特徴とする。
また、上記目的を達成するために、本発明のプログラムは、コンピュータにより上述の画像符号化方法を行うためのプログラムであって、1以上の前記ピクチャをまとめたランダムアクセス単位は、高速再生や逆再生などの特殊再生時に復号するピクチャと、全ピクチャを復号して表示する通常再生時にのみ復号するピクチャとから構成されるように、ピクチャの画素を符号化して画素の符号化データを生成する符号化ステップと、前記ピクチャを復号する際に参照する初期化情報のうち、前記ランダムアクセス単位を構成する全ピクチャに対して有効であるシーケンス初期化情報を生成するシーケンス初期化情報生成ステップと、前記ピクチャを復号する際に参照する初期化情報のうち、前記ランダムアクセス単位を構成する個々のピクチャに対して設定できるピクチャ初期化情報を生成するピクチャ初期化情報生成ステップと、前記生成された画素の符号化データ、シーケンス初期化情報、あるいはピクチャ初期化情報を、それぞれ異なるサブピクチャ単位に格納する格納ステップと、前記作成された符号化データのサブピクチャ単位を必ず含み、シーケンス初期化情報、あるいはピクチャ初期化情報のサブピクチャ単位を選択的に含むピクチャ格納単位を作成するピクチャ格納単位作成ステップとを含み、ピクチャ格納単位作成ステップは、前記特殊再生時に復号するピクチャのピクチャ初期化情報が、同一ピクチャ格納単位、あるいは、前記ランダムアクセス単位において復号順が前であり、かつ前記特殊再生時に復号するピクチャを格納するピクチャ格納単位から取得できるように、前記ピクチャ初期化情報のサブピクチャ単位を格納することを特徴とする。
また、上記目的を達成するために、本発明のプログラムは、コンピュータにより上述の画像復号方法を行うためのプログラムであって、上記プログラムはコンピュータに、上述の画像符号化方法により符号化された符号化データを復号するプログラムであって、復号するピクチャを決定する決定ステップと、前記決定されたピクチャのピクチャ格納単位から前記シーケンス初期化情報と前記ピクチャ初期化情報を取得する初期化情報取得ステップと、前記取得した前記シーケンス初期化情報と前記ピクチャ初期化情報を参照して、前記サブピクチャ格納単位に格納された前記符号化データを復号する復号ステップとを含み、前記決定ステップは、前記通常再生時には全てのピクチャを復号すると決定し、前記特殊再生時には、特殊再生を行う際に復号が必要なピクチャを選択することを特徴とするプログラムである。
なお、本発明は、上記画像符号化装置及び画像復号装置やそれらのプログラムなどだけでなく、そのプログラムを格納する記憶媒体や、画像符号化装置で生成されたストリームとしても実現することができる。
以上のように、本発明によれば、ストリーム中のランダムアクセスユニットRAUにおいて、可変速再生時に復号されるAUのみを選択しても、当該AUの復号に必要なPPSを適切に取得してそのAUを復号することができる。したがって、可変速再生に対応した優れた画像符号化装置及び画像復号装置を容易に実現することができ、その実用的価値が高い。
以下、本発明の実施の形態について、図面を参照しながら説明する。
(実施の形態1)
図1は、本発明の画像符号化方法を実現する画像符号化装置のブロック図である。
同図において、図24の従来の画像符号化方法を実現する画像符号化装置の各構成要素と同じ動作をする構成要素には同じ番号を付し、詳細な説明を省略する。
従来の画像符号化装置との違いは、可変速再生や逆再生などの特殊再生時に復号されるAUを選択すれば、当該AUの復号に必要なPPSが取得できるように、PPSのNALユニットが配置されていることである。以降、特殊再生時に復号されるAUを、特再AUと呼ぶことにする。特殊再生時には、全ての特再AUの復号結果を表示してもよいし、1以上の特再AUを選択して表示してもよい。
特再AUとは、例えば、IピクチャおよびPピクチャのAUを示す。ここで、PピクチャのAUがBピクチャのAUを参照しないなどの制約を設ければ、特殊再生時に特再AUのみを復号することができる。また、他のAUから参照されるBピクチャと参照されないBピクチャを区別して、Iピクチャ、Pピクチャ、および他のAUから参照されるBピクチャのAUを特再AUとしてもよい。
画像符号化装置10は、従来の画像符号化装置における各構成要素に加えて、PPS配置決定部15を備える。PPS配置決定部15は、新規PPSフラグflgの値、PPS情報PPSout、および生成しているAUが特再AUであるかどうかを示す特再AU情報trkに基づいて、AUにPPSを格納するかどうか判定する。PPS配置決定部15は、格納すると判定された際には、PPS作成フラグmkを1にセットし、格納しないと判定された際には前記フラグを0にセットしてPPS作成部16に出力する。ここで、PPS作成フラグmkが1にセットされている際には、PPS配置決定部15は、PPSを作成するためのPPS情報PPSmkも合わせて、PPS作成部16に出力する。PPS作成部16は、PPS作成フラグmkが1にセットされている際には、PPS情報PPSmkに基づいてPPSのNALユニットを作成する。ここで、特再AU情報trkは図示しない手段、あるいは、スライス符号化部11から別途取得する。
図2は、本発明の画像符号化方法の処理を示すフローチャートである。
同図において、図25の従来の画像符号化方法の処理を示すフローチャートと同じ処理を行うステップには同じ符号を付し、説明を省略する。ステップS104では、ステップS103における判定結果、および、生成中のAUが特再AUであるかどうかを示す情報に基づいて、特再AUの復号に必要なPPSが特再AUから取得できるように、画像符号化装置10は、当該AUにPPSを格納するかどうかを判定し、ステップS105に進む。
PPSを格納すると判定された際には(ステップS105のはい)、ステップS106に進んでPPSを作成し、その後ステップS107に進んで1AU分のデータを作成する。
一方、PPSを格納しないと判定された際には(ステップS105のいいえ)、直接ステップS107に進む。
ステップS107では、ステップS105においてPPSを格納すると判定された場合には、ステップS106で作成されたPPSをAUに含め、1AU分のデータを生成して出力する。なお、特再AUではないAUにおいて既に格納されたPPSを、特再AUにおいて再び格納する際には、ステップS106において改めてPPSを作成せずに、保持しておいたPPSを、ステップS107において格納してもよい。
また、特再AUについては、例えばIピクチャとPピクチャを特再ピクチャとするなどピクチャの符号化タイプに応じて決定してもよいし、ピクチャ間の予測構造に応じて動的に決定してもよい。
図3は、ステップS104の処理を詳細に示すフローチャートである。
ここで、PPS作成フラグmkの初期値を0とする。ステップS201では、画像符号化装置10は、ステップS103においてセットされた新規PPSフラグflgが1であるかどうか(PPSが新規であるか否か)を判定する。新規PPSフラグflgが1である際には、画像符号化装置10は、ステップS204に進み、新規PPSフラグflgが0である際には、ステップS202に進む。ステップS202では、画像符号化装置10は、特再AU情報trkに基づいて、作成中のAUが特再AUであるかどうか判定し、特再AUである際にはステップS203に進み、特再AUでなければ図2のステップS105に進む。
ステップS203では、画像符号化装置10は、同一ランダムアクセスユニットRAUのなかで復号順が前の特再AUにおいて、当該PPSが格納されたかどうかを判定する。既に格納されていた場合には処理を終了し、格納されていなければステップS204に進む。ステップS204では、画像符号化装置10は、PPS作成フラグmkを1にセットして図2のステップS105に進む。
なお、PPSの更新方法には、PPSの識別子となるID番号が異なるPPSを新規に作成する、あるいは同一ID番号のPPSを上書きする、という2通りの方法があるが、同一ID番号のPPSを上書きした際には、上書き前のPPSは無効となる。従って、ステップ103およびステップ104における判定処理では、PPSのID番号だけでなく、PPSにより示される情報自体を比較する必要がある。ただし、運用規格等において、同一ID番号のPPSを上書きすることが禁止されている際には、ID番号により識別してもよい。
図4は、本発明の画像符号化方法により作成されたストリームにおけるランダムアクセスユニットRAUの構造例を示す。
図4の(a)に示すように、ランダムアクセスユニットRAUは復号順にAU1からAU15までの15個のAUから構成される。また、AU1、AU4、AU7、AU10、AU13の5個のAUは特再AUであるとする。ここで、AU1、AU4、AU7、AU10、AU13は、それぞれPPSとしてPPS#1、PPS#3、PPS#2、PPS#3、PPS#1を参照する。さらに、AU6は、PPS#2を参照し、かつ、ランダムアクセスユニットRAUにおいてPPS#2を格納する先頭AUであるとする。また、AU2とAU3はPPS#1を参照し、AU5はPPS#3を参照する。
図4の(b)は、各AUに格納されるPPSのNALユニットを示す。PPS#1はAU1において、PPS#3はAU4において、ランダムアクセスユニットRAUで最初に参照される。したがって、PPS#1及びPPS#3はそれぞれAU1とAU4に格納される。次に、PPS#2はAU6において格納されるが、AU7はPPS#2を参照する最初の特再AUであるため、AU7にもPPS#2が格納される。AU10とAU13は、それぞれPPS#3とPPS#1を参照するが、これらは共に、特再AUであるAU4とAU1において既に格納されているため、AU10とAU13においては格納されない。
なお、特再AUにおいては、当該AUが参照するPPSを必ずそのAU自身に格納することにしてもよい。
図4の(c)は、特再AUが参照するPPSが必ずその特再AU自身に格納するときのPPS格納例を示す。この図4の(c)に示すように、AU10とAU13がそれぞれ参照するPPS#3とPPS#1は、特再AUであるAU4とAU1において既に格納されているが、AU10とAU13において再度格納される。
なお、PPSのNALユニットは1AU内に複数格納できるため、ランダムアクセスユニットRAUの先頭AUに、ランダムアクセスユニットRAU内のAUの復号に必要なPPSを全て格納してもよいし、あるいは、特再AUの復号に必要なPPSを全て格納してもよい。
また、よく用いられる1以上のPPSについてはデフォルトのPPSとしてランダムアクセス単位RAUの先頭AUに格納し、先頭AUあるいは後続AUにおいてデフォルトのPPSとは異なるPPSを参照する際には、当該ピクチャにおいて逐次PPSを格納してもよい。デフォルトのPPSは、例えば、Iピクチャ、Pピクチャ、参照されるBピクチャ、あるいは参照されないBピクチャなど符号化のタイプに応じて用意しておける。
また、特再AUの復号に必要なPPSを、ランダムアクセスユニットRAUの先頭AUと、各特再AUの両方に格納してもよい。
なお、特再AU以外のAUについても、当該AUが参照するPPSを必ず格納することにしてもよい。
なお、特再AUにおいて、ランダムアクセスユニットRAU内で当該特再AUよりも復号順が後である、特再AU以外のAUの復号に必要なPPSを格納してもよい。例えば、ランダムアクセスユニットRAUの先頭AUに、特再AU以外の全てのAUを復号する際に必要なPPSを格納する。こうすることで、ランダムアクセスユニットRAUの途中のAUまではIピクチャとPピクチャのAUのみを復号、表示し、以降のAUについては全AUを復号、表示するなど、特殊再生から通常再生に復帰する際にも、スキップしたAUに格納されるPPSを取得することなしに、通常再生に復帰した後の全AUの復号に必要なPPSを取得できる。
次に、SPSが示す情報には、量子化マトリックスのように、PPSにより上書きできる情報が含まれる。例えば、あるAUがID番号1のSPS(SPS(1)とする)、および、ID番号2のPPS(PPS(2)とする)を参照し、SPS(1)における量子化マトリックスがPPS(2)により上書きされている際には、AUの復号時にはPPS(2)に示される量子化マトリックスを使用する。AUが参照するSPSは、IDRピクチャのAUにおいてのみ切替え可能であるため、ランダムアクセスユニットRAU内のAUが参照するSPSを切替える際には、通常ランダムアクセスユニットRAUの先頭AUをIDRピクチャのAUとする。しかしながら、IDRピクチャのAUを使うと、復号順で後のAUが、IDRピクチャより前のAUを参照できないため、符号化効率が低下することがある。ここで、SPSのうち、PPSにより更新可能なパラメータのみが更新される際には、SPSは更新せずに、PPSの更新により対応することができる。
図5は、ランダムアクセスユニットRAUの先頭AUに格納するSPSを、直前のランダムアクセスユニットRAUのAUが参照するSPSから更新するかどうかを決定する処理を示すフローチャートである。
まず、ステップS301において、画像符号化装置10は、先頭AUが参照するSPS情報と、直前のランダムアクセスユニットRAUのAUが参照するSPS情報とが異なる
かどうか判定する。画像符号化装置10は、両者が異なると判定された際には、ステップS303に進み、同一であると判定されれば、ステップS302に進む。ここで、SPS情報とは、SPSにおいてのみ設定できる情報と、PPSにおいて更新可能な情報を共に含むとする。
ステップS302では、画像符号化装置10は、SPSの更新は不要であり、PPSによりSPSの情報を更新する必要もないと決定する。
ステップS303では、画像符号化装置10は、両者の相違点がPPSにより更新可能なデータ(SPSvariとする)のみであるかどうかを判定する。画像符号化装置10は、違いがSPSvariのみであると判定された際には、ステップS305に進み、SPSvair以外にも相違点があると判定された際には、ステップS304に進む。ステップS304では、画像符号化装置10は、SPSを更新すると決定して処理を終了する。ステップS305では、画像符号化装置10は、SPSを更新せずに、SPSvariの更新情報を含むPPSをAUに格納すると決定して処理を終了する。
処理結果により、SPSを更新しないと決定された際には、ランダムアクセスユニットRAUの先頭AUをIDRピクチャのAUとせずに、IDRピクチャ以外のIピクチャのAUとすることができる。なお、シーンチェンジなど、ランダムアクセスユニットRAUの先頭AUをIDRピクチャのAUとしたい場合には、上記判定処理を行わなくてもよい。
図6Aおよび図6Bは、図5の方法により作成したランダムアクセスユニットRAUのデータ構造例を示す。
図6Aでは、連続する2つのランダムアクセスユニットRAUであるRAU#1とRAU#2において参照されるSPSデータの違いは、PPSにより更新可能なデータであるSPSvari#1のみである。このとき、RAU#2においては、SPSvari#1のデータを含むPPSを先頭AUに含めることにより、IピクチャのAUを先頭とすることができる。
図6Bでは、RAU#1内のAUにおいて、SPSvari#1がPPSにより更新されており、RAU#2においても更新後のSPS情報が使用される。このときも、RAU#2の先頭AUに格納するPPSはSPSvari#1を含む。
なお、特再AUのみを復号すれば特再AUの復号に必要なPPSが取得できることが保証されていることを示すフラグ情報をランダムアクセスユニットRAU内に示してもよい。例えば、SPSやPPSなどのNALユニットのヘッダにおけるnal_ref_idcフィールド、あるいは、別途タイプを定義したNALユニット、SEIメッセージなどにフラグ情報を格納することができる。ここで、nal_ref_idcフィールドとは、NALユニットのタイプ毎に0あるいは1以上の値をとることが定められた2ビットのフィールドであり、例えばSPSやPPSのNALユニットでは1以上の値をとる。このため、1以上のいずれかの値により上記フラグ情報を示すことができる。
また、ランダムアクセスユニットRAUの先頭AUに、ランダムアクセスユニットRAU内のAUを復号する際に必要な全てのPPSが格納されることを示すフラグ情報を示してもよい。
なお、上記ではPPSの格納方法について説明したが、アクセスユニット単位の初期化情報、あるいは、複数のアクセスユニットから共通に参照される初期化情報を更新するた
めの情報であれば、PPS以外の情報であってもよい。
(変形例)
上記実施の形態の画像符号化装置10は、対象とするAUが特再AUであるか否かを判断して、特再AUである場合には、その特再AUを復号するために参照されるPPSをその特再AUか、その特再AUよりも復号順で前の特再AUに格納した。
本変形例の画像符号化装置は、対象とするAUが特再AUであるか否かを判断することなく、対象とするAUを復号するために参照されるPPSを、ランダムアクセスユニットRAUの先頭のAUか、そのPPSを参照するAU自身に格納する。
ここで、ランダムアクセスユニットRAUの先頭のAUは特再AUであるため、PPSを上述のように先頭のAUか、PPSを参照するAU自身に格納しておけば、特殊再生時においても、適切に且つ迅速にPPSを取得して、AU(ピクチャ)を復号することができる。
図7は、本変形例に係る画像符号化方法の処理の一部を示すフローチャートである。
本変形例に係る画像符号化方法は、図2に示す画像符号化方法と比べて、ステップS103及びステップS104の処理が異なる。即ち、本変形例に係る画像符号化方法は、図2に示すステップS103及びステップS104の処理の代わりに、図7に示すステップS1001及びステップS1002の処理を行う。
具体的に、画像符号化装置は、対象とするAUのPPSがランダムアクセスユニットRAUの先頭のAUに既に格納されているPPSであるか否かを判別する(ステップS1001)。
ここで、画像符号化装置は、先頭のAUに既に格納されているPPSであると判別したときには(ステップS1001のはい)、PPS作成フラグmkが0にセットされた状態を維持したまま、図2のステップS105の処理を行う。
一方、画像符号化装置は、先頭のAUに既に格納されているPPSではないと判別したときには(ステップS1001のいいえ)、PPS作成フラグmkを1にセットして(ステップS1002)、図2のステップS105の処理を行う。
なお、このような画像符号化方法では、ランダムアクセスユニットRAUの先頭のAUに、複数のPPSを予め格納しておいても、格納しておかなくてもよい。
複数のPPSが予め格納されている場合には、対象とするAUに参照されるPPSは、上記先頭のAUに予め格納されている複数のPPSと比較される。そして、対象とするAUのPPSがその複数のPPSの何れとも異なる場合に、その対象とするAU自身にそのPPSが格納される。
一方、PPSが予め格納されていない場合には、先頭のAUには、その先頭のAUに参照されるPPSが格納される。そして、他の各AUについても同様に、AUには、そのAUに参照されるPPSが格納される。
また、ランダムアクセスユニットRAUの先頭のAUには、ランダムアクセスユニットRAUに含まれる各AUを復号するために参照される全てのPPSを格納してもよい。このような場合、例えば、画像符号化装置は、ランダムアクセスユニットRAUに含まれるべき全てのピクチャを符号化した後に、全てのPPSを先頭のAUに格納する。
なお、先頭AUには複数のPPSを格納できるが、同時に格納されるPPSの個数が増加するにつれて復号時の処理負荷も増大する。従って、先頭AUにおいて同時に格納できるPPSの個数に上限を設けてもよい。上限値は、ランダムアクセスユニットRAUを構成するピクチャの枚数の上限値に基づいて、あるいは処理負荷を考慮して決定できる。例えば、ランダムアクセスユニットRAUに格納できるフレーム数の上限値が15枚であれば、PPSの個数の上限値を15個としてもよい。このとき、上限値の制約から先頭AUに格納できないPPSについては、当該PPSを参照するAUにおいて格納される。
また、本方法によれば、ランダムアクセスユニットRAU内の先頭AU以降のAUにおいて格納されるPPSの個数は0又は1とすることができ、PPSを効率的に格納できる。
このように本変形例では、生成されたランダムアクセスユニットRAUには、各AUの復号に必要なPPSが、ランダムアクセスユニットRAUの先頭のAUか、そのAUに格納されている。したがって、このようなランダムアクセスユニットRAUに含まれる全てのAUのうち、少なくとも先頭のAUを選択して再生するような特殊再生を行う場合であっても、選択されたAUの復号に必要なPPSを取り損ねることなく、適切に且つ迅速に取得して、その選択されたAUを復号することができる。その結果、特殊再生をスムーズに行うことができる。
(実施の形態2)
図8は、本発明の画像復号方法を実現する画像復号装置のブロック図である。
同図において、図26の従来の画像復号方法を実現する画像復号化装置の各構成要素と同じ動作をする構成要素には同じ番号を付し、詳細な説明を省略する。従来の画像復号装置との違いは、可変速再生や逆再生などの特殊再生時に、特再AUのみを選択して復号することである。
本発明の画像復号装置20は、従来の画像復号装置における各構成要素に追加して、復号判定部21を備える。画像復号装置20には、実施の形態1に係る本発明の画像符号化装置により符号化されたMPEG−4 AVCのストリーム(AVCストリームst)が入力される。
AU境界検出部28は、各AUの境界を検出して各AUを分離し、分離した各AUを復号するかどうかを判定するために必要な判定情報lstを取得して復号判定部21に出力する。特殊再生時には、復号判定部21に特再命令trkplyが入力される。
復号判定部21は、特再命令trkplyが入力されると、判定情報lstに基づいてAUが特再AUであるかどうか判定し、特再AUである際には、復号命令swをAU境界検出部28に出力する。なお、全AUを復号して表示する通常再生時には、特再命令trkplyは入力されず、復号判定部21は全AUに対して復号命令swを出力する。
AU境界検出部28は、復号命令swが入力されると、各構成要素に対して復号に必要な情報を出力する。具体的には、AU内にPPSのNALユニットが含まれる際には、PPSのNALユニットPPSnalをPPS取得部23に出力し、その他のNALユニットDnalを復号情報取得部25に出力する。なお、復号判定部21に特再命令trkplyが入力された場合にのみ、復号判定部21に判定情報lstを入力することにしてもよい。
図9は、画像復号装置20において1AUのデータを復号する際の動作を示すフローチャートである。
まず、ステップS401において、画像復号装置20は、AUを復号するかどうか決定する。特殊再生時には、AUが特再AUであるかどうか判定し、特再AUである場合にのみ復号すると決定する。なお、画像復号装置20は、特殊再生時には必ず、ランダムアクセスユニットRAUの先頭のAUは特再AUであると判定する。通常再生時には、全AUを復号すると決定する。
ステップS402では、ステップS401においてAUを復号すると決定された際には、画像復号装置20は、ステップS403に進み、復号しないと決定された場合には処理を終了する。ステップS403では、画像復号装置20は、SPSのNALユニットをサーチして、SPSのNALユニットが検出されればステップS404においてSPSのデータを取得し、検出されなければステップS405に進む。ステップS405では、画像復号装置20は、PPSのNALユニットをサーチして、PPSのNALユニットが検出されればステップS406においてPPSのデータを取得し、検出されなければステップS407に進む。ステップS407では、画像復号装置20は、スライスデータのNALユニットを分離し、現在のAU、あるいはランダムアクセスユニットRAUにおいて復号順で前のAUから取得したSPSとPPSのデータに基づいてスライスデータを復号する。
ここで、判定情報lstを決定するときには、Access Unit Delimiterにおいてピクチャのタイプを示すprimary_pic_typeの値、スライスヘッダにおいてスライスのタイプを示すslice_typeの値、あるいは、SPS、PPS、スライスなどのNALユニットにおけるnal_ref_idcフィールドの値など、AVCストリーム内の各情報から判定情報lstを決定してもよいし、特再AUの一覧情報が提供される際には当該情報に従ってもよい。AVCストリームを光ディスクなどの記録媒体に記録する際の多重化フォーマットにおける管理情報により示される情報から判定情報lstを決定してもよい。
なお、特再AUの復号に必要なPPSが特再AUから取得できることが保証されないAVCストリームstの入力に対応するために、特殊再生時に、特再AU以外のAUについてもPPSをサーチして取得、保持しておいてもよい。これらのAUについては、スライスデータのNALユニット、あるいはスライスデータにおけるマクロブロックデータの解析は行わなくてもよい。
(実施の形態3)
図10は、本発明の画像符号化装置により出力されるAVCストリームstを多重化して光ディスクやハードディスクなどの記録媒体に記録する多重化装置のブロック図である。
多重化装置30は、画像符号化部10、メモリ32、ストリーム解析部31、管理情報作成部33、多重化部34、および記録部35を備える。ここで、画像符号化部10は、実施の形態1に係る本発明の画像符号化装置と同一である。
画像符号化部10は、入力された動画像データVinを圧縮符号化してAVCストリームstを生成し、メモリ32に記録する。
ストリーム解析部31は、メモリ32に記録されたAVCストリームデータout1を読み出し、AUの復号時刻、表示時刻、AUがランダムアクセスユニットRAUの先頭A
Uであるかどうかを示す情報、あるいは画像サイズやビデオフォーマットについての情報などを取得して解析し、解析結果STinfを管理情報作成部33に出力する。
管理情報作成部33は、解析結果STinfに基づいてAVCストリームstへのアクセス情報、ビデオフォーマットやアスペクト比などの属性情報、およびプレイリスト情報などを含む管理情報Dbを作成し、多重化部34に出力する。
多重化部34は、管理情報Dbと、メモリ32から読み出したAVCストリームデータout2とを多重化して、多重化データMuxを作成し、記録部35に出力する。多重化の方式は、BD(Blu−ray Disc)のRead Only FormatやRewritable Formatにより規格化された方式であるとするが、MPEGで規格化されたファイルフォーマットであるMP4に準拠した方式など、他の多重化方式であってもよい。なお、Read Only FormatやRewritable Formatにおいては、MPEG−4 AVCの符号化ストリームはMPEG−2 TSにパケット化されてから多重化される。
なお、特再AUのみを復号すれば特再AUの復号に必要なPPSが取得できることが保証されていることを示すフラグ情報を多重化データの管理情報に格納してもよい。あるいは、ランダムアクセスユニットRAUの先頭AUに、ランダムアクセスユニットRAU内の全てのPPSが格納されることを示すフラグ情報を多重化データの管理情報に格納してもよい。
(実施の形態4)
特殊再生機能は、パッケージメディアを再生する光ディスク機器においては特に重要である。ここで、次世代の光ディスクであるBD(Blu−ray Disc)において、実施の形態3に係る多重化装置の多重化データMuxを記録する例について説明する。
まず、BD−ROMの記録フォーマットについて説明する。
図11は、BD−ROMの構成、特にディスク媒体であるBDディスク104と、ディスクに記録されているデータ101、102および103の構成を示す図である。BDディスク104に記録されるデータは、AVデータ103と、AVデータに関する管理情報およびAV再生シーケンスなどのBD管理情報102と、インタラクティブを実現するBD再生プログラム101である。本実施の形態では、説明の都合上、映画のAVコンテンツを再生するためのAVアプリケーションを主眼においてのBDディスクの説明を行うが、他の用途として用いても勿論同様である。
図12は、上述したBDディスクに記録されている論理データのディレクトリ・ファイル構成を示した図である。BDディスクは、他の光ディスク、例えばDVDやCDなどと同様にその内周から外周に向けてらせん状に記録領域を持ち、内周のリード・インと外周のリード・アウトの間に論理データを記録できる論理アドレス空間を有している。また、リード・インの内側にはBCA(Burst Cutting Area)と呼ばれるドライブでしか読み出せない特別な領域がある。この領域はアプリケーションから読み出せないため、例えば著作権保護技術などに利用されることがある。
論理アドレス空間には、ファイルシステム情報(ボリューム)を先頭に映像データなどのアプリケーションデータが記録されている。ファイルシステムとは従来技術で説明した通り、UDFやISO9660などのことであり、通常のPCと同じように記録されている論理データをディレクトリ、ファイル構造を使って読み出しすることが可能になっている。
本実施例の場合、BDディスク上のディレクトリ、ファイル構造は、ルートディレクトリ(ROOT)直下にBDVIDEOディレクトリが置かれている。このディレクトリはBDで扱うAVコンテンツや管理情報などのデータ(図11で説明した101、102、103)が格納されているディレクトリである。
BDVIDEOディレクトリの下には、次の7種類のファイルが記録されている。
・BD.INFO(ファイル名固定)
「BD管理情報」の1つであり、BDディスク全体に関する情報を記録したファイルである。BDプレーヤは最初にこのファイルを読み出す。
・BD.PROG(ファイル名固定)
「BD再生プログラム」の1つであり、BDディスク全体に関わる再生制御情報を記録したファイルである。
・XXX.PL(「XXX」は可変、拡張子「PL」は固定)
「BD管理情報」の1つであり、シナリオ(再生シーケンス)であるプレイリスト情報を記録したファイルである。プレイリスト毎に1つのファイルを持っている。
・XXX.PROG(「XXX」は可変、拡張子「PROG」は固定)
「BD再生プログラム」の1つであり、前述したプレイリスト毎の再生制御情報を記録したファイルである。プレイリストとの対応はファイルボディ名(「XXX」が一致する)によって識別される。
・YYY.VOB(「YYY」は可変、拡張子「VOB」は固定)
「AVデータ」の1つであり、VOB(従来例で説明したVOBと同じ)を記録したファイルである。VOB毎に1つのファイルを持っている。
・YYY.VOBI(「YYY」は可変、拡張子「VOBI」は固定)
「BD管理情報」の1つであり、AVデータであるVOBに関わるストリーム管理情報を記録したファイルである。VOBとの対応はファイルボディ名(「YYY」が一致する)によって識別される。
・ZZZ.PNG(「ZZZ」は可変、拡張子「PNG」は固定)
「AVデータ」の1つであり、字幕およびメニューを構成するためのイメージデータPNG(W3Cによって標準化された画像フォーマットであり「ピング」と読む)を記録したファイルである。1つのPNGイメージ毎に1つのファイルを持つ。
図13から図18を用いて、BDのナビゲーションデータ(BD管理情報)構造について説明をする。
図13は、VOB管理情報ファイル(“YYY.VOBI”)の内部構造を示した図である。
VOB管理情報は、当該VOBのストリーム属性情報(Attribute)とタイムマップ(TMAP)を有している。ストリーム属性は、ビデオ属性(Video)、オーディオ属性(Audio#0〜Audio#m)個々に持つ構成となっている。特にオーディオストリームの場合は、VOBが複数本のオーディオストリームを同時に持つことができることから、オーディオストリーム数(Number)によって、データフィールドの有無を示している。
下記はビデオ属性(Video)の持つフィールドと夫々が持ち得る値である。
・圧縮方式(Coding):
MPEG−1
MPEG−2
MPEG−4
MPEG−4 AVC(Advanced Video Coding)
・解像度(Resolution):
1920x1080
1440x1080
1280x720
720x480
720x565
・アスペクト比(Aspect)
4:3
16:9
・フレームレート(Framerate)
60
59.94(60/1.001)
50
30
29.97(30/1.001)
25
24
23.976(24/1.001)
下記はオーディオ属性(Audio)の持つフィールドと夫々が持ち得る値である。
・圧縮方式(Coding):
AC3
MPEG−1
MPEG−2
LPCM
・チャンネル数(Ch):
1〜8
・言語属性(Language):
タイムマップ(TMAP)はVOBU毎の情報を持つテーブルであって、当該VOBが有するVOBU数(Number)と各VOBU情報(VOBU#1〜VOBU#n)を持つ。個々のVOBU情報は、VOBU先頭TSパケット(Iピクチャ開始)のアドレスI_startと、そのIピクチャの終了アドレスまでのオフセットアドレス(I_end)、およびそのIピクチャの再生開始時刻(PTS)から構成される。
図14はVOBU情報の詳細を説明する図である。
広く知られているように、MPEGビデオストリームは高画質記録するために可変ビットレート圧縮されることがあり、その再生時間とデータサイズ間に単純な相関はない。逆に、音声の圧縮規格であるAC3は固定ビットレートでの圧縮を行っているため、時間とアドレスとの関係は一次式によって求めることができる。しかしながらMPEGビデオデータの場合は、個々のフレームは固定の表示時間、例えばNTSCの場合は、1フレームは1/29.97秒の表示時間を持つが、個々のフレームの圧縮後のデータサイズは絵の特性や圧縮に使ったピクチャタイプ、いわゆるI/P/Bピクチャによってデータサイズは大きく変わってくる。従って、MPEGビデオの場合は、時間とアドレスの関係は一次式の形で表現することは不可能である。
当然のこととして、MPEGビデオデータを多重化しているMPEGシステムストリー
ム、即ちVOBも時間とデータサイズとを一次式の形で表現することは不可能である。このため、VOB内での時間とアドレスとの関係を結びつけるのがタイムマップ(TMAP)である。
このようにして、ある時刻情報が与えられた場合、先ずは当該時刻がどのVOBUに属するのかを検索(VOBU毎のPTSを追っていく)して、当該時刻の直前のPTSをTMAPに持つVOBUに飛び込み(I_startで指定されたアドレス)、VOBU先頭のIピクチャから復号を開始し、当該時刻のピクチャから表示を開始する。
次に図15を使って、プレイリスト情報(“XXX.PL”)の内部構造を説明する。
プレイリスト情報は、セルリスト(CellList)とイベントリスト(EventList)から構成されている。
セルリスト(CellList)は、プレイリスト内の再生セルシーケンスであり、本リストの記述順でセルが再生されることになる。セルリスト(CellList)の中身は、セルの数(Number)と各セル情報(Cell#1〜Cell#n)である。
セル情報(Cell#)は、VOBファイル名(VOBName)、当該VOB内での開始時刻(In)および終了時刻(Out)と、字幕テーブル(SubtitleTable)を持っている。開始時刻(In)および終了時刻(Out)は、夫々当該VOB内でのフレーム番号で表現され、前述したタイムマップ(TMAP)を使うことによって再生に必要なVOBデータのアドレスを得ることができる。
字幕テーブル(SubtitleTable)は、当該VOBと同期再生される字幕情報を持つテーブルである。字幕は音声同様に複数の言語を持つことができ、字幕テーブル(SubtitleTable)最初の情報も言語数(Number)とそれに続く個々の言語毎のテーブル(Language#1〜Language#k)から構成されている。
各言語のテーブル(Language#)は、言語情報(Lang)と、個々に表示される字幕の字幕情報数(Number)と、個々に表示される字幕の字幕情報(Speech#1〜Speech#j)から構成され、字幕情報(Speech#)は対応するイメージデータファイル名(Name)、字幕表示開始時刻(In)および字幕表示終了時刻(Out)と、字幕の表示位置(Position)から構成されている。
イベントリスト(EventList)は、当該プレイリスト内で発生するイベントを定義したテーブルである。イベントリストは、イベント数(Number)に続いて個々のイベント(Event#1〜Event#m)から構成され、個々のイベント(Event#)は、イベントの種類(Type)、イベントのID(ID)、イベント発生時刻(Time)と有効期間(Duration)から構成されている。
図16は、個々のプレイリスト毎のイベントハンドラ(時間イベントと、メニュー選択用のユーザイベント)を持つイベントハンドラテーブル(“XXX.PROG”)である。
イベントハンドラテーブルは、定義されているイベントハンドラ/プログラム数(Number)と個々のイベントハンドラ/プログラム(Program#1〜Program#n)を有している。各イベントハンドラ/プログラム(Program#)内の記述は、イベントハンドラ開始の定義(<event_handler>タグ)と前述したイベントのIDと対になるイベントハンドラのID(ID)を持ち、その後に当該プログラ
ムもFunctionに続く括弧“{”と“}”の間に記述する。前述の“XXX.PL”のイベントリスト(EventList)に格納されたイベント(Event#1〜Event#m)は“XXX.PROG”のイベントハンドラのID(ID)を用いて特定される。
次に図17を用いてBDディスク全体に関する情報(“BD.INFO”)の内部構造を説明する。
BDディスク全体情報は、タイトルリスト(TitleList)とグローバルイベント用のイベントテーブル(EventList)から構成されている。
タイトルリスト(TitleList)は、ディスク内のタイトル数(Number)と、これに続く各タイトル情報(Title#1〜Title#n)から構成されている。個々のタイトル情報(Title#)は、タイトルに含まれるプレイリストのテーブル(PLTable)とタイトル内のチャプタリスト(ChapterList)を含んでいる。プレイリストのテーブル(PLTable)はタイトル内のプレイリストの数(Number)と、プレイリスト名(Name)即ちプレイリストのファイル名を有している。
チャプタリスト(ChapterList)は、当該タイトルに含まれるチャプタ数(Number)と個々のチャプタ情報(Chapter#1〜Chapter#n)から構成され、個々のチャプタ情報(Chapter#)は当該チャプタが含むセルのテーブル(CellTable)を持ち、セルのテーブル(CellTable)はセル数(Number)と個々のセルのエントリ情報(CellEntry#1〜CellEntry#k)から構成されている。セルのエントリ情報(CellEntry#)は当該セルを含むプレイリスト名と、プレイリスト内でのセル番号によって記述されている。
イベントリスト(EventList)は、グローバルイベントの数(Number)と個々のグローバルイベントの情報を持っている。ここで注意すべきは、最初に定義されるグローバルイベントは、ファーストイベント(FirstEvent)と呼ばれ、BDディスクがプレーヤに挿入された時、最初に呼ばれるイベントである。グローバルイベント用イベント情報はイベントタイプ(Type)とイベントのID(ID)だけを持っている。
図18は、グローバルイベントハンドラのプログラムのテーブル(“BD.PROG”)である。本テーブルは、図16で説明したイベントハンドラテーブルと同一内容である。
以上のようなBD−ROMフォーマットにおいて、画像符号化部10から出力されるAVCストリームstを格納する際には、VOBUが1以上のランダムアクセスユニットRAUから構成されるものとする。
なお、BD−ROMに多重化されたMPEG−4 AVCのストリームにおいて、特再AUのみを復号すれば特再AUの復号に必要なPPSが取得できることが保証されていることを示すフラグ情報、あるいは、ランダムアクセスユニットRAUの先頭AUにランダムアクセスユニットRAU内の全てのPPSが格納されることを示すフラグ情報をBD管理情報内に格納してもよい。
なお、EPマップなどのアクセス情報は、バイナリデータとしてテーブルに格納してもよいし、XML(Extensible Markup Language)などのテキ
スト形式であってもよい。
(実施の形態5)
図19は、実施の形態4に係るBDディスクを再生するプレーヤの大まかな機能構成を示すブロック図である。
BDディスク201上のデータは、光ピックアップ202を通して読み出される。読み出されたデータは夫々のデータの種類に応じて専用のメモリに転送される。BD再生プログラム(「BD.PROG」または「XXX.PROG」ファイルの中身)はプログラム記録メモリ203に、BD管理情報(「BD.INFO」、「XXX.PL」または「YYY.VOBI」)は管理情報記録メモリ204に、AVデータ(「YYY.VOB」または「ZZZ.PNG」)はAV記録メモリ205に夫々転送される。
プログラム記録メモリ203に記録されたBD再生プログラムは、プログラム処理部206によって、管理情報記録メモリ204に記録されたBD管理情報は、管理情報処理部207によって、また、AV記録メモリ205に記録されたAVデータは、プレゼンテーション処理部208によって夫々処理される。
プログラム処理部206は、管理情報処理部207より再生するプレイリストの情報やプログラムの実行タイミングなどのイベント情報を受け取りプログラムの処理を行う。また、プログラムでは再生するプレイリストを動的に変えることが可能であり、この場合は管理情報処理部207に対してプレイリストの再生命令を送ることで実現する。プログラム処理部206は、ユーザからのイベント、即ちリモコンキーからのリクエストを受け、ユーザイベントに対応するプログラムがある場合は、それを実行する。
管理情報処理部207は、プログラム処理部206の指示を受け、対応するプレイリストおよびプレイリストに対応したVOBの管理情報を解析し、プレゼンテーション処理部208に対象となるAVデータの再生を指示する。また、管理情報処理部207は、プレゼンテーション処理部208より基準時刻情報を受け取り、時刻情報に基づいてプレゼンテーション処理部208にAVデータ再生の停止指示を行い、また、プログラム処理部206に対してプログラム実行タイミングを示すイベントを生成する。
プレゼンテーション処理部208は、映像、音声、字幕/イメージ(静止画)の夫々に対応するデコーダを持ち、管理情報処理部207からの指示に従い、AVデータのデコードおよび出力を行う。映像データ、字幕/イメージの場合は、デコード後に夫々の専用プレーン、ビデオプレーン210およびイメージプレーン209に描画され、合成処理部211によって映像の合成処理が行われTVなどの表示デバイスへ出力される。
可変速再生や逆再生などの特殊再生時には、ユーザから要求された可変速再生あるいは逆再生動作をプレゼンテーション処理部208が解釈し、再生方法を示す情報を管理情報処理部207に通知する。管理情報処理部207は、再生方法をプレゼンテーション処理部208に通知し、プレゼンテーション処理部208は、VOBU内に格納された特再AUを特定するための情報に基づいて特再AUを検出し、ユーザが指定した特殊再生動作を満足するように、復号、および表示するAUを決定する。例えば、Iピクチャ、およびPピクチャのAUのみを復号、表示する際には、Access Unit Delimiter、スライスヘッダ、NALユニットのヘッダなどに含まれる識別情報に基づいて、Iピクチャ、およびPピクチャのAUを検出する。以下に、特再AUの決定方法の例を示す。
まず、Access Unit Delimiterを参照して決定する方法について
説明する。Access Unit Delimiterでは、AUを構成するスライスデータのタイプ(primary_pic_typeフィールド)を示すことができる。従って、Iピクチャ、Pピクチャ、あるいはBピクチャのAUについて、それぞれ異なるタイプを指定することにより、特再時に復号するAUが決定できる。
次に、スライスヘッダにおいては、スライスデータのタイプ(slice_typeフィールド)を示すことができる。ここで、slice_typeには、AU内のスライスデータが全て同一のタイプであることを示す値が設定できる。例えば、AUを構成する任意の1つのスライスデータにおいてslice_typeが7であれば、当該スライス、およびAU内の他のスライスは全てIスライスであることが示される。同様にして、slice_typeが5であればAU内の全スライスがPスライス、slice_typeが6であればAU内の全スライスがBスライスであることを示す値も定義されている。符号化時に、slice_typeが5、6、7のいずれかのスライスのみを使用することにすれば、AUの先頭スライスのslice_typeを解析することにより、特再時に復号するAUを決定する。なお、slice_typeが5、6、7以外であっても、AU内の全てのスライスについてslice_typeを解析することにより特再時に復号するAUが決定できる。
次に、NALユニットのヘッダから決定する場合は、スライスなどのNALユニットにおけるnal_ref_idcフィールドの値を、Iピクチャ、Pピクチャ、およびBピクチャなどに対してそれぞれ別々のフィールド値を設定することにより、特再時に復号するAUが決定できる。
さらに、特殊再生用の情報を示すNALユニットやSEIメッセージがランダムアクセス単位RAUに含まれる際には、それらの情報に基づいて特再時に復号するAUを決定してもよい。
なお、特再AUを特定するための情報が管理情報に含まれる際には、管理情報処理部207において、復号および表示するAUを決定してもよい。
さらに、特再AUのみを復号すれば特再AUの復号に必要なPPSが取得できることが保証されていることを示すフラグ情報が管理情報、あるいはVOBU内に格納される際には、フラグ情報に基づいてPPSの取得方法を切替えてもよい。このとき、フラグがセットされている際には、特再AUのみからPPSを取得し、フラグがセットされていなければ特再AU以外のAUに格納されるPPSについても取得する。
なお、上記各実施の形態において、符号化方式はMPEG−4 AVCに限定されるものではなく、同様の処理を適用できる符号化方式であれば、他の方式であってもよい。
また、EPマップなどのアクセス情報は、バイナリデータとしてテーブルに格納してもよいし、XML(Extensible Markup Language)などのテキスト形式であってもよい。
(実施の形態6)
さらに、上記各実施の形態で示した画像符号化方法および画像復号方法を実現するためのプログラムを、フレキシブルディスク等の記録媒体に記録するようにすることにより、上記各実施の形態で示した処理を、独立したコンピュータシステムにおいて簡単に実施することが可能となる。
図20A、図20Bおよび図20Cは、上記各実施の形態の画像符号化方法および画像
復号方法を、フレキシブルディスク等の記録媒体に記録されたプログラムを用いて、コンピュータシステムにより実施する場合の説明図である。
図20Bは、フレキシブルディスクの正面からみた外観、断面構造、およびフレキシブルディスクを示し、図20Aは、記録媒体本体であるフレキシブルディスクの物理フォーマットの例を示している。フレキシブルディスクFDはケースF内に内蔵され、該ディスクの表面には、同心円状に外周からは内周に向かって複数のトラックTrが形成され、各トラックは角度方向に16のセクタSeに分割されている。従って、上記プログラムを格納したフレキシブルディスクでは、上記フレキシブルディスクFD上に割り当てられた領域に、上記プログラムが記録されている。また、図20Cは、フレキシブルディスクFDに上記プログラムの記録再生を行うための構成を示す。画像符号化方法および画像復号方法を実現する上記プログラムをフレキシブルディスクFDに記録する場合は、コンピュータシステムCsから上記プログラムをフレキシブルディスクドライブを介して書き込む。また、フレキシブルディスク内のプログラムにより画像符号化方法および画像復号方法を実現する上記画像符号化方法および画像復号方法をコンピュータシステム中に構築する場合は、フレキシブルディスクドライブによりプログラムをフレキシブルディスクから読み出し、コンピュータシステムに転送する。
なお、上記説明では、記録媒体としてフレキシブルディスクを用いて説明を行ったが、光ディスクを用いても同様に行うことができる。また、記録媒体はこれに限らず、ICカード、ROMカセット等、プログラムを記録できるものであれば同様に実施することができる。
以上、本発明に係る画像符号化装置、画像復号装置、多重化装置およびBDディスクプレーヤなどについて、上記各実施の形態に基づいて説明したが、本発明は、これら実施の形態に限定されるものではない。本発明の主旨を逸脱しない範囲内で、当業者が思いつく変形を本実施の形態に施したものも、本発明に含まれる。
例えば、本実施の形態における画像符号化装置および多重化装置のいずれかを備える光ディスク記録装置、動画像送信装置、デジタルテレビ放送送出装置、Webサーバ、通信装置、携帯情報端末等や、本実施の形態における画像復号装置を備える動画像受信装置、デジタルテレビ放送受信装置、通信装置、携帯情報端末等も、本発明に含まれるのは言うまでもない。
なお、ブロック図(図1及び図8など)の各機能ブロックは典型的には集積回路であるLSI(Large Scale Integration)として実現される。これらは個別に1チップ化され
ても良いし、一部又は全てを含むように1チップ化されても良い。(例えばメモリ以外の機能ブロックが1チップ化されていても良い。)
ここでは、LSIとしたが、集積度の違いにより、IC(Integrated Circuit)、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギ
ュラブル・プロセッサーを利用しても良い。
さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適応等が可能性としてありえる。
また、各機能ブロックのうち、符号化または復号の対象となるデータを格納する手段だけ1チップ化せずに別構成としても良い。
本発明に係る画像符号化方法は、高速再生のような特殊再生時においても、復号に必要なピクチャパラメータセットを適切に取得してピクチャを復号することができるという効果を奏し、MPEG−4 AVCのストリームを用いた可変速再生や逆再生などの特殊再生機能を備える機器全般に適用することができる。また、特殊再生機能が重視される光ディスク関連機器において特に有効である。
図1は、本発明の実施の形態1に係る画像符号化装置のブロック図である。 図2は、本発明の実施の形態1に係る画像符号化装置の動作を示すフローチャートである。 図3は、本発明の実施の形態1に係る画像符号化装置においてPPSの配置を決定する動作を示す第1のフローチャートである。 図4は、本発明の実施の形態1に係る画像符号化装置の出力ストリームの第1の構造例である。 図5は、本発明の実施の形態1に係る画像符号化装置においてPPSの配置を決定する動作を示す第2のフローチャートである。 図6Aは、本発明の実施の形態1に係る画像符号化装置の出力ストリームの第1の構造例である。 図6Bは、本発明の実施の形態1に係る画像符号化装置の出力ストリームの第1の構造例である。 図7は、本発明の実施の形態1の変形例に係る画像符号化装置の動作を示すフローチャートである。 図8は、本発明の実施の形態2に係る画像復号装置のブロック図である。 図9は、本発明の実施の形態2に係る画像復号装置の動作を示すフローチャートである。 図10は、本発明の実施の形態3に係る多重化装置のブロック図である。 図11は、HD−DVDのデータ階層図である。 図12は、HD−DVD上の論理空間の構成図である。 図13は、VOB情報ファイル構成図である。 図14は、タイムマップの説明図である。 図15は、プレイリストファイルの構成図である。 図16は、プレイリストに対応するプログラムファイルの構成図である。 図17は、BDディスク全体管理情報ファイルの構成図である。 図18は、グローバルイベントハンドラを記録するファイルの構成図である。 図19は、HD−DVDプレーヤの概要ブロック図である。 図20Aは、本発明の画像符号化方法および画像復号方法を実現するためのプログラムを記録した記録媒体である。 図20Bは、本発明の画像符号化方法および画像復号方法を実現するためのプログラムを記録した記録媒体である。 図20Cは、本発明の画像符号化方法および画像復号方法を実現するためのプログラムを記録した記録媒体である。 図21は、MPEG−2のストリーム構造である。 図22Aは、MPEG−2のGOP構造である。 図22Bは、MPEG−2のGOP構造である。 図23は、MPEG−4 AVCのストリーム構造である。 図24は、従来の画像符号化装置の構成を示すブロック図である。 図25は、従来の画像符号化装置の動作を示すフローチャートである。 図26は、従来の画像復号装置の構成を示すブロック図である。 図27Aは、従来の画像符号化装置における課題についての説明図である。 図27Bは、従来の画像符号化装置における課題についての説明図である。
符号の説明
10 画像符号化装置
11 スライス符号化部
12 メモリ
13 SPS作成部
14 新規PPS判定部
15 PPS配置決定部
16 PPS作成部
17 AU決定部
上記目的を達成するために、本発明の画像符号化装置は、少なくとも、画素データを格納するための画素データ格納単位と、前記画素データを格納する格納単位の前に位置し、補助情報を格納するための補助情報格納単位とから構成されるピクチャを符号化して、符号化された複数のピクチャを含んで構成されるランダムアクセスユニットを、ストリームの一部として生成する画像符号化装置であって、前記ピクチャの画素データをそれぞれ符号化することで、符号化画素データを生成する符号化手段と、前記ランダムアクセスユニットに含まれる複数の符号化画素データを復号するために共通に参照されるパラメータ群たるシーケンスパラメータセット情報を生成する第1の情報生成手段と、前記符号化画素データごとに、当該符号化画素データを復号するために参照されるパラメータ群たるピクチャパラメータセット情報を生成し、符号化する第2の情報生成手段と、前記画素データ格納単位に、前記符号化画素データを格納する第1の格納手段と、前記複数の格納単位のうち先頭ピクチャの補助情報格納単位に、前記シーケンスパラメータセット情報を1つ格納する第2の格納手段と、所定の条件に基づき、前記符号化されたピクチャパラメータセット情報を、前記複数のピクチャのうち先頭のピクチャの補助情報格納単位、または、当該ピクチャパラメータセット情報を参照する符号化画素データを含むピクチャの補助情報格納単位に格納する第3の格納手段とを備え、前記第3の格納手段は、前記先頭のピクチャの補助情報格納単位に複数の符号化されたピクチャパラメータセット情報を格納し、前記先頭のピクチャの補助情報格納単位に格納する符号化されたピクチャパラメータセット情報の数に制限を有し、前記複数のピクチャのうち、先頭のピクチャを除くピクチャの補助情報格納単位には、前記ピクチャが参照する符号化されたピクチャパラメータセット情報を1つ格納するか、または、符号化されたピクチャパラメータセット情報を格納しないことを特徴とする。
また、本発明の画像符号化装置は、少なくとも、画素データを格納するための画素データ格納単位と、前記画素データを格納する格納単位の前に位置し、補助情報を格納するための補助情報格納単位とから構成されるピクチャを符号化して、符号化された複数のピクチャを含んで構成されるランダムアクセスユニットを、ストリームの一部として生成する画像符号化装置であって、前記ピクチャの画素データをそれぞれ符号化することで、符号化画素データを生成する符号化手段と、前記符号化画素データごとに、当該符号化画素データを復号するために参照されるパラメータ群たるピクチャパラメータセット情報を生成し、符号化する情報生成手段と、前記画素データ格納単位に、前記符号化画素データを格納する第1の格納手段と、所定の条件に基づき、前記符号化されたピクチャパラメータセット情報を、前記複数のピクチャのうち先頭のピクチャの補助情報格納単位、または、当該ピクチャパラメータセット情報を参照する符号化画素データを含むピクチャの補助情報格納単位に格納する第2の格納手段とを備え、前記第2の格納手段は、前記先頭のピクチャの補助情報格納単位に複数の符号化されたピクチャパラメータセット情報を格納し、前記先頭のピクチャの補助情報格納単位に格納する符号化されたピクチャパラメータセット情報の数に制限を有し、前記複数のピクチャのうち、先頭のピクチャを除くピクチャの補助情報格納単位には、当該ピクチャの符号化画素データが参照する符号化されたピクチャパラメータセット情報を格納するか、または、当該ピクチャの符号化画素データが参照する符号化されたピクチャパラメータセット情報を格納しないことを特徴とする。

Claims (5)

  1. 少なくとも、画素データを格納するための画素データ格納単位と、前記画素データを格納する格納単位の前に位置し、補助情報を格納するための補助情報格納単位とから構成されるピクチャを符号化して、符号化された複数のピクチャを含んで構成されるランダムアクセスユニットを、ストリームの一部として生成する画像符号化装置であって、
    前記ピクチャの画素データをそれぞれ符号化することで、符号化画素データを生成する符号化手段と、
    前記符号化画素データごとに、当該符号化画素データを復号するために参照されるパラメータ群たるピクチャパラメータセット情報を生成し、符号化する情報生成手段と、
    前記画素データ格納単位に、前記符号化画素データを格納する第1の格納手段と、
    所定の条件に基づき、
    前記符号化されたピクチャパラメータセット情報を、前記複数のピクチャのうち先頭のピクチャの補助情報格納単位、または、当該ピクチャパラメータセット情報を参照する符号化画素データを含むピクチャの補助情報格納単位に格納する第2の格納手段とを備え、
    前記第2の格納手段は、前記先頭のピクチャの補助情報格納単位に複数の符号化されたピクチャパラメータセット情報を格納し、前記先頭のピクチャの補助情報格納単位に格納する符号化されたピクチャパラメータセット情報の数に制限を有し、
    前記複数のピクチャのうち、先頭のピクチャを除くピクチャの補助情報格納単位には、当該ピクチャの符号化画素データが参照する符号化されたピクチャパラメータセット情報を格納するか、または、当該ピクチャの符号化画素データが参照する符号化されたピクチャパラメータセット情報を格納しない
    ことを特徴とする画像符号化装置。
  2. 少なくとも、画素データを格納するための画素データ格納単位と、前記画素データを格納する格納単位の前に位置し、補助情報を格納するための補助情報格納単位とから構成されるピクチャを符号化して、符号化された複数のピクチャを含んで構成されるランダムアクセスユニットを、ストリームの一部として生成する画像符号化方法であって、
    前記ピクチャの画素データをそれぞれ符号化することで、符号化画素データを生成する符号化ステップと、
    前記符号化画素データごとに、当該符号化画素データを復号するために参照されるパラメータ群たるピクチャパラメータセット情報を生成し、符号化する情報生成ステップと、
    前記画素データ格納単位に、前記符号化画素データを格納する第1の格納ステップと、
    所定の条件に基づき、
    前記符号化されたピクチャパラメータセット情報を、前記複数のピクチャのうち先頭のピクチャの補助情報格納単位、または、当該ピクチャパラメータセット情報を参照する符号化画素データを含むピクチャの補助情報格納単位に格納する第2の格納ステップとを備え、
    前記第2の格納ステップは、前記先頭のピクチャの補助情報格納単位に複数の符号化されたピクチャパラメータセット情報を格納し、前記先頭のピクチャの補助情報格納単位に格納する符号化されたピクチャパラメータセット情報の数に制限を有し、
    前記複数のピクチャのうち、先頭のピクチャを除くピクチャの補助情報格納単位には、当該ピクチャの符号化画素データが参照する符号化されたピクチャパラメータセット情報を格納するか、または、当該ピクチャの符号化画素データが参照する符号化されたピクチャパラメータセット情報を格納しない
    ことを特徴とする画像符号化方法。
  3. 請求項1記載の画像符号化装置により生成されたストリームから、符号化された複数のピクチャを復号する画像復号装置であって、
    前記符号化された複数のピクチャの中から、復号すべきピクチャを特定するピクチャ特定手段と、
    前記符号化された複数のピクチャのうち、先頭のピクチャの補助情報格納単位、または前記復号すべきピクチャの補助情報格納単位から、当該復号すべき符号化画素データを復号するために参照されるパラメータ群であり、符号化されたピクチャパラメータセット情報を取得する取得手段と、
    前記符号化されたピクチャパラメータセット情報を復号化する第1の復号手段と、
    復号化されたピクチャパラメータセット情報を参照することで前記復号すべき符号化画素データを復号する復号手段と
    を備えることを特徴とする画像復号装置。
  4. 請求項2記載の画像符号化方法により生成されたストリームから、符号化された複数のピクチャを復号する画像復号方法であって、
    前記符号化された複数のピクチャの中から、復号すべきピクチャを特定するピクチャ特定ステップと、
    前記符号化された複数のピクチャのうち、先頭のピクチャの補助情報格納単位、または前記復号すべきピクチャの補助情報格納単位から、当該復号すべき符号化画素データを復号するために参照されるパラメータ群であり、符号化されたピクチャパラメータセット情報を取得する取得ステップと、
    前記符号化されたピクチャパラメータセット情報を復号化する第1の復号ステップと、
    復号化されたピクチャパラメータセット情報を参照することで前記復号すべき符号化画素データを復号する復号ステップと
    を備えることを特徴とする画像復号方法。
  5. 少なくとも、画素データを格納するための画素データ格納単位と、前記画素データを格納する格納単位の前に位置し、補助情報を格納するための補助情報格納単位とから構成されるピクチャを符号化して、符号化された複数のピクチャを含んで構成されるランダムアクセスユニットを一部に有するストリームを記録媒体に記録する記録方法であって、
    前記ピクチャの画素データをそれぞれ符号化することで、符号化画素データを生成する符号化ステップと、
    前記符号化画素データごとに、当該符号化画素データを復号するために参照されるパラメータ群たるピクチャパラメータセット情報を生成し、符号化する情報生成ステップと、
    前記画素データ格納単位に、前記符号化画素データを格納する第1の格納ステップと、
    所定の条件に基づき、
    前記符号化されたピクチャパラメータセット情報を、前記複数のピクチャのうち先頭のピクチャの補助情報格納単位、または、当該ピクチャパラメータセット情報を参照する符号化画素データを含むピクチャの補助情報格納単位に格納する第2の格納ステップと、
    前記第1および第2の格納ステップにより生成されたストリームを記録媒体に記録する記録ステップと、を備え、
    前記第2の格納ステップは、前記先頭のピクチャの補助情報格納単位に複数の符号化されたピクチャパラメータセット情報を格納し、前記先頭のピクチャの補助情報格納単位に格納する符号化されたピクチャパラメータセット情報の数に制限を有し、
    前記複数のピクチャのうち、先頭のピクチャを除くピクチャの補助情報格納単位には、当該ピクチャの符号化画素データが参照する符号化されたピクチャパラメータセット情報を格納するか、または、当該ピクチャの符号化画素データが参照する符号化されたピクチャパラメータセット情報を格納しない
    ことを特徴とする記録方法。
JP2008150944A 2004-06-02 2008-06-09 画像符号化装置、画像復号装置、画像符号化方法、および画像復号方法 Active JP4212000B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008150944A JP4212000B2 (ja) 2004-06-02 2008-06-09 画像符号化装置、画像復号装置、画像符号化方法、および画像復号方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2004165006 2004-06-02
JP2004165006 2004-06-02
JP2008150944A JP4212000B2 (ja) 2004-06-02 2008-06-09 画像符号化装置、画像復号装置、画像符号化方法、および画像復号方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2007341451A Division JP4211999B2 (ja) 2004-06-02 2007-12-28 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法、記録方法、および画像復号化システム

Publications (2)

Publication Number Publication Date
JP2008263640A true JP2008263640A (ja) 2008-10-30
JP4212000B2 JP4212000B2 (ja) 2009-01-21

Family

ID=34971428

Family Applications (5)

Application Number Title Priority Date Filing Date
JP2006519671A Active JP4138840B2 (ja) 2004-06-02 2005-06-01 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法、および記録方法
JP2007341451A Active JP4211999B2 (ja) 2004-06-02 2007-12-28 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法、記録方法、および画像復号化システム
JP2008150944A Active JP4212000B2 (ja) 2004-06-02 2008-06-09 画像符号化装置、画像復号装置、画像符号化方法、および画像復号方法
JP2008227632A Active JP4668308B2 (ja) 2004-06-02 2008-09-04 画像符号化装置、画像符号化方法および記録方法
JP2009251497A Active JP4668344B2 (ja) 2004-06-02 2009-10-30 画像符号化装置、画像符号化方法および記録方法

Family Applications Before (2)

Application Number Title Priority Date Filing Date
JP2006519671A Active JP4138840B2 (ja) 2004-06-02 2005-06-01 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法、および記録方法
JP2007341451A Active JP4211999B2 (ja) 2004-06-02 2007-12-28 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法、記録方法、および画像復号化システム

Family Applications After (2)

Application Number Title Priority Date Filing Date
JP2008227632A Active JP4668308B2 (ja) 2004-06-02 2008-09-04 画像符号化装置、画像符号化方法および記録方法
JP2009251497A Active JP4668344B2 (ja) 2004-06-02 2009-10-30 画像符号化装置、画像符号化方法および記録方法

Country Status (11)

Country Link
US (3) US7706662B2 (ja)
EP (4) EP1993284B1 (ja)
JP (5) JP4138840B2 (ja)
KR (4) KR101132062B1 (ja)
CN (5) CN101695116B (ja)
AT (1) ATE498279T1 (ja)
DE (1) DE602005026277D1 (ja)
DK (1) DK2190192T3 (ja)
ES (3) ES2495391T3 (ja)
PL (3) PL2200295T3 (ja)
WO (1) WO2005120060A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010219983A (ja) * 2009-03-18 2010-09-30 Sony Corp 画像処理装置および方法

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10026003A1 (de) * 2000-05-25 2001-12-06 Bosch Gmbh Robert Stator
JP4002878B2 (ja) * 2003-01-17 2007-11-07 松下電器産業株式会社 画像符号化方法
JP2006050391A (ja) * 2004-08-06 2006-02-16 Matsushita Electric Ind Co Ltd 動画データ再生装置、動画データの再生方法、動画データ記録装置、動画データの記録方法、および動画データが記録された記録媒体
KR100770704B1 (ko) 2005-08-04 2007-10-29 삼성전자주식회사 픽쳐 스킵 방법 및 장치
US8670437B2 (en) * 2005-09-27 2014-03-11 Qualcomm Incorporated Methods and apparatus for service acquisition
US8229983B2 (en) 2005-09-27 2012-07-24 Qualcomm Incorporated Channel switch frame
US20070189732A1 (en) * 2006-02-10 2007-08-16 Sai Pothana System and method for reconstructing MPEG-2 start codes from AVC data
AU2006338425B2 (en) * 2006-02-13 2010-12-09 Kabushiki Kaisha Toshiba Moving image encoding/decoding method and device and program
CA2783599C (en) * 2006-11-14 2013-06-25 Qualcomm Incorporated Systems and methods for channel switching
WO2008061211A2 (en) * 2006-11-15 2008-05-22 Qualcomm Incorporated Systems and methods for applications using channel switch frames
JP5157140B2 (ja) 2006-11-29 2013-03-06 ソニー株式会社 記録装置、記録方法、情報処理装置、情報処理方法、撮像装置およびビデオシステム
JP5057820B2 (ja) 2007-03-29 2012-10-24 株式会社東芝 デジタルストリームの記録方法、再生方法、記録装置、および再生装置
US8526489B2 (en) 2007-09-14 2013-09-03 General Instrument Corporation Personal video recorder
JP5170708B2 (ja) * 2008-01-24 2013-03-27 日本電気株式会社 動画像ストリーム加工方法及び装置、それを用いた動画像再生装置並びに動画像配信装置
CN101547346B (zh) * 2008-03-24 2014-04-23 展讯通信(上海)有限公司 富媒体电视中场景描述的收发方法及设备
TW201121332A (en) * 2009-12-11 2011-06-16 Acer Inc Device for decoding audio and video data
US9131033B2 (en) * 2010-07-20 2015-09-08 Qualcomm Incoporated Providing sequence data sets for streaming video data
KR101803970B1 (ko) * 2011-03-16 2017-12-28 삼성전자주식회사 컨텐트를 구성하는 장치 및 방법
JP5341952B2 (ja) * 2011-05-30 2013-11-13 株式会社東芝 ビデオサーバ及びデータ収録再生方法
US9386125B2 (en) 2011-06-13 2016-07-05 Electronic And Telecommunications Research Institute Method for transmitting packet-based media data having header in which overhead is minimized
WO2012173391A2 (ko) * 2011-06-13 2012-12-20 한국전자통신연구원 오버헤드를 최소화한 헤더를 가지는 패킷 기반의 미디어 데이터 전송 방법
KR20120138604A (ko) * 2011-06-14 2012-12-26 삼성전자주식회사 멀티미디어 시스템에서 복합 미디어 컨텐츠를 송수신하는 방법 및 장치
JPWO2013001794A1 (ja) * 2011-06-27 2015-02-23 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 画像符号化方法、及び画像符号化装置
CN102868881B (zh) * 2011-07-05 2015-04-15 富士通株式会社 视频编码系统和方法
JP6008334B2 (ja) 2011-08-25 2016-10-19 サン パテント トラスト 復号装置及び復号方法
ES2625097T3 (es) 2011-09-07 2017-07-18 Sun Patent Trust Método de codificación de imágenes y aparato de codificación de imágenes
EP2760205B1 (en) 2011-09-19 2020-11-04 Sun Patent Trust Image decoding method, image decoding device
US9319721B2 (en) 2011-10-13 2016-04-19 Electronics And Telecommunications Research Institute Method of configuring and transmitting an MMT transport packet
JP5995111B2 (ja) 2011-10-19 2016-09-21 サン パテント トラスト 画像符号化方法及び画像符号化装置
US9143802B2 (en) * 2011-10-31 2015-09-22 Qualcomm Incorporated Fragmented parameter set for video coding
US20150063463A1 (en) * 2012-04-15 2015-03-05 Samsung Electronics Co., Ltd. Method and device for coding multi-layer video, and method and device for decoding multi-layer video
KR20130116782A (ko) 2012-04-16 2013-10-24 한국전자통신연구원 계층적 비디오 부호화에서의 계층정보 표현방식
RU2584501C1 (ru) * 2012-04-16 2016-05-20 Нокиа Текнолоджиз Ой Способ и устройство для видеокодирования
US9979959B2 (en) * 2012-04-20 2018-05-22 Qualcomm Incorporated Video coding with enhanced support for stream adaptation and splicing
KR20140002447A (ko) * 2012-06-29 2014-01-08 삼성전자주식회사 멀티미디어 시스템에서 적응적 미디어 구조 송수신 방법 및 장치
US9479776B2 (en) 2012-07-02 2016-10-25 Qualcomm Incorporated Signaling of long-term reference pictures for video coding
WO2014014305A1 (ko) * 2012-07-19 2014-01-23 한국전자통신연구원 동일 포트에 멀티플렉싱 된 다중 패킷 스트림의 패킷오류 구분을 선택적으로 수행하는 방법 및 그 장치
KR102284107B1 (ko) * 2013-01-07 2021-07-30 삼성전자주식회사 영상을 부호화/복호화하기 위한 파라미터 세트 생성 방법 및 장치
KR20150029121A (ko) * 2013-09-09 2015-03-18 삼성전자주식회사 디스플레이장치 및 그 이미지 처리방법
US9648348B2 (en) * 2013-10-23 2017-05-09 Qualcomm Incorporated Multi-layer video file format designs
US9911460B2 (en) 2014-03-24 2018-03-06 Microsoft Technology Licensing, Llc Fast and smart video trimming at frame accuracy on generic platform
US9516147B2 (en) 2014-10-30 2016-12-06 Microsoft Technology Licensing, Llc Single pass/single copy network abstraction layer unit parser
US10560742B2 (en) * 2016-01-28 2020-02-11 Oath Inc. Pointer activity as an indicator of interestingness in video
WO2017154563A1 (ja) * 2016-03-07 2017-09-14 ソニー株式会社 符号化装置および符号化方法
JP6722505B2 (ja) * 2016-05-11 2020-07-15 富士通株式会社 画像制御方法、装置、及びプログラム
CN115118971A (zh) 2016-05-13 2022-09-27 Vid拓展公司 用于视频编码的通用式多假设预测的系统及方法
JPWO2020255771A1 (ja) * 2019-06-20 2020-12-24
US11582463B2 (en) * 2019-12-30 2023-02-14 Tencent America LLC Method for alignment across layers in coded video stream

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3084811B2 (ja) 1991-07-24 2000-09-04 ソニー株式会社 記録媒体サーチ方法および装置
US6002834A (en) * 1995-02-24 1999-12-14 Hitachi, Ltd. Optical disk having table relating sector address and time and optical disk reproducing apparatus
JP3263807B2 (ja) * 1996-09-09 2002-03-11 ソニー株式会社 画像符号化装置および画像符号化方法
CA2289958C (en) * 1998-11-19 2003-01-21 Tomoyuki Okada Information recording medium, apparatus and method for recording or reproducing data thereof
JP4292654B2 (ja) * 1999-03-19 2009-07-08 ソニー株式会社 記録装置および方法、再生装置および方法、並びに記録媒体
JP2002010213A (ja) 2000-06-27 2002-01-11 Mitsubishi Electric Corp 符号化データの再生方法および符号化データの再生装置
JP2002176622A (ja) 2000-12-07 2002-06-21 Victor Co Of Japan Ltd 映像信号の記録方法、及び映像信号記録装置
JP3820155B2 (ja) 2001-01-16 2006-09-13 松下電器産業株式会社 情報記録装置および方法、情報記録プログラム、および情報記録プログラムを記録した記録媒体
CZ20031749A3 (cs) * 2001-01-16 2004-01-14 Matsushita Electric Industrial Co., Ltd. Médium pro záznam dat, zařízení pro záznam dat a způsob záznamu dat
US20030077071A1 (en) * 2001-10-23 2003-04-24 Shu Lin Fast forward trick mode and reverse trick mode using an information file
US7136417B2 (en) * 2002-07-15 2006-11-14 Scientific-Atlanta, Inc. Chroma conversion optimization
JP2004165006A (ja) 2002-11-13 2004-06-10 Matsushita Electric Ind Co Ltd 放電灯点灯方法及び装置
US7227901B2 (en) * 2002-11-21 2007-06-05 Ub Video Inc. Low-complexity deblocking filter
CN1692654A (zh) * 2003-01-17 2005-11-02 松下电器产业株式会社 动态图像编码方法和动态图像解码方法
JP2004242286A (ja) 2003-01-17 2004-08-26 Matsushita Electric Ind Co Ltd 動画像符号化方法および動画像復号化方法
US7415069B2 (en) * 2003-12-09 2008-08-19 Lsi Corporation Method for activation and deactivation of infrequently changing sequence and picture parameter sets
US7586924B2 (en) * 2004-02-27 2009-09-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding an information signal into a data stream, converting the data stream and decoding the data stream
KR20050113501A (ko) * 2004-05-29 2005-12-02 삼성전자주식회사 에이치 264 비디오 디코더를 위한 구문 분석기

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010219983A (ja) * 2009-03-18 2010-09-30 Sony Corp 画像処理装置および方法
US8699581B2 (en) 2009-03-18 2014-04-15 Sony Corporation Image processing device, image processing method, information processing device, and information processing method

Also Published As

Publication number Publication date
KR101132062B1 (ko) 2012-04-02
KR101084462B1 (ko) 2011-11-21
PL1751978T3 (pl) 2011-07-29
KR20100033447A (ko) 2010-03-29
EP2200295A1 (en) 2010-06-23
JP4212000B2 (ja) 2009-01-21
DE602005026277D1 (de) 2011-03-24
KR20100033445A (ko) 2010-03-29
US7706662B2 (en) 2010-04-27
EP1751978A1 (en) 2007-02-14
JP2010028864A (ja) 2010-02-04
US7792415B2 (en) 2010-09-07
JP4138840B2 (ja) 2008-08-27
PL2200295T3 (pl) 2013-08-30
KR101133342B1 (ko) 2012-04-06
CN101695116B (zh) 2013-01-02
ES2405131T3 (es) 2013-05-30
JP2008154255A (ja) 2008-07-03
US20070110390A1 (en) 2007-05-17
EP2190192A1 (en) 2010-05-26
KR101134220B1 (ko) 2012-04-09
PL1993284T3 (pl) 2013-11-29
KR20070033322A (ko) 2007-03-26
ES2356745T3 (es) 2011-04-12
JP4668344B2 (ja) 2011-04-13
JP2008502171A (ja) 2008-01-24
JP4668308B2 (ja) 2011-04-13
JP4211999B2 (ja) 2009-01-21
EP1993284A2 (en) 2008-11-19
EP1751978B1 (en) 2011-02-09
KR20100033446A (ko) 2010-03-29
US20100021143A1 (en) 2010-01-28
CN1965574A (zh) 2007-05-16
CN101695114A (zh) 2010-04-14
CN101695115B (zh) 2013-01-02
CN101695117B (zh) 2013-01-09
EP2190192B1 (en) 2014-08-06
US20100046609A1 (en) 2010-02-25
CN100596180C (zh) 2010-03-24
DK2190192T3 (da) 2014-09-15
EP2200295B1 (en) 2013-02-20
ES2495391T3 (es) 2014-09-17
EP1993284B1 (en) 2013-07-03
CN101695116A (zh) 2010-04-14
ATE498279T1 (de) 2011-02-15
CN101695115A (zh) 2010-04-14
EP1993284A3 (en) 2008-12-10
JP2009027738A (ja) 2009-02-05
CN101695117A (zh) 2010-04-14
WO2005120060A1 (en) 2005-12-15

Similar Documents

Publication Publication Date Title
JP4212000B2 (ja) 画像符号化装置、画像復号装置、画像符号化方法、および画像復号方法
US8442382B2 (en) Stream generation apparatus, stream generation method, coding apparatus, coding method, recording medium and program thereof
JP4071812B2 (ja) 多重化装置および逆多重化装置
JP2011019270A (ja) 復号システムおよび記録媒体

Legal Events

Date Code Title Description
A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20080716

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080722

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A132

Effective date: 20080729

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080904

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080930

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081023

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111107

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4212000

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121107

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121107

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131107

Year of fee payment: 5