JP2000013790A - 画像符号化装置および画像符号化方法、画像復号装置および画像復号方法、並びに提供媒体 - Google Patents

画像符号化装置および画像符号化方法、画像復号装置および画像復号方法、並びに提供媒体

Info

Publication number
JP2000013790A
JP2000013790A JP17349998A JP17349998A JP2000013790A JP 2000013790 A JP2000013790 A JP 2000013790A JP 17349998 A JP17349998 A JP 17349998A JP 17349998 A JP17349998 A JP 17349998A JP 2000013790 A JP2000013790 A JP 2000013790A
Authority
JP
Japan
Prior art keywords
image
display time
layer
objects
hierarchy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP17349998A
Other languages
English (en)
Inventor
Takefumi Nagumo
武文 名雲
Teruhiko Suzuki
輝彦 鈴木
Yoichi Yagasaki
陽一 矢ヶ崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP17349998A priority Critical patent/JP2000013790A/ja
Priority to US09/334,853 priority patent/US6400768B1/en
Priority to EP19990304770 priority patent/EP0966161A3/en
Priority to KR19990022908A priority patent/KR100629092B1/ko
Priority to EP20100010849 priority patent/EP2265028A3/en
Publication of JP2000013790A publication Critical patent/JP2000013790A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/31Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • H04N19/29Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding involving scalability at the object level, e.g. video object layer [VOL]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding

Abstract

(57)【要約】 【課題】 効率的かつ迅速なランダムアクセスをする。 【解決手段】 画像を構成するオブジェクトのシーケン
スが上位レイヤと下位レイヤとに階層化され、下位レイ
ヤのVOP(Video Object Plane)のシーケンスが、G
OV(Group Of VOP)に分けて符号化されるとともに、
下位レイヤのGOVの最初に表示されるVOPの表示時
刻と同時刻またはその直後に表示される上位レイヤのV
OPが、GOVの最初に表示されるVOPとなるよう
に、上位レイヤのVOPのシーケンスが、GOVに分け
て符号化される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、画像符号化装置お
よび画像符号化方法、画像復号装置および画像復号方
法、並びに提供媒体に関する。特に、例えば、動画像デ
ータを、光磁気ディスクや磁気テープなどの記録媒体に
記録し、これを再生してディスプレイなどに表示した
り、テレビ会議システム、テレビ電話システム、放送用
機器、マルチメディアデータベース検索システムなどの
ように、動画像データを伝送路を介して送信側から受信
側に伝送し、受信側において、受信された動画像データ
を表示する場合や、編集して記録する場合などに用いて
好適な画像符号化装置および画像符号化方法、画像復号
装置および画像復号方法、並びに提供媒体に関する。
【0002】
【従来の技術】例えば、テレビ会議システム、テレビ電
話システムなどのように、動画像データを遠隔地に伝送
するシステムにおいては、伝送路を効率良く利用するた
め、画像データを、そのライン相関やフレーム間相関を
利用して圧縮符号化するようになされている。
【0003】動画像の高能率符号化方式として代表的な
ものとしては、MPEG(Moving Picture Experts Group)
(蓄積用動画像符号化)方式がある。これはISO−I
EC/JTC1/SC2/WG11において議論され、
標準案として提案されたものであり、動き補償予測符号
化とDCT(Discrete Cosine Transform)符号化を組
み合わせたハイブリッド方式が採用されている。
【0004】MPEGでは、様々なアプリケーションや
機能に対応するために、いくつかのプロファイルおよび
レベルが定義されている。最も基本となるのが、メイン
プロファイルメインレベル(MP@ML(Main Profile
at Main Level))である。
【0005】図53は、MPEG方式におけるMP@M
Lのエンコーダの一例の構成を示している。
【0006】符号化すべき画像データは、フレームメモ
リ31に入力され、一時記憶される。そして、動きベク
トル検出器32は、フレームメモリ31に記憶された画
像データを、例えば、16画素×16画素などで構成さ
れるマクロブロック単位で読み出し、その動きベクトル
を検出する。
【0007】ここで、動きベクトル検出器32において
は、各フレームの画像データを、Iピクチャ(フレーム
内符号化)、Pピクチャ(前方予測符号化)、またはB
ピクチャ(両方向予測符号化)のうちのいずれかとして
処理する。なお、シーケンシャルに入力される各フレー
ムの画像を、I,P,Bピクチャのいずれのピクチャと
して処理するかは、例えば、予め定められている(例え
ば、I,B,P,B,P,・・・B,Pとして処理され
る)。
【0008】即ち、動きベクトル検出器32は、フレー
ムメモリ31に記憶された画像データの中の、予め定め
られた所定の参照フレームを参照し、その参照フレーム
と、現在符号化の対象となっているフレームの16画素
×16ラインの小ブロック(マクロブロック)とをパタ
ーンマッチング(ブロックマッチング)することによ
り、そのマクロブロックの動きベクトルを検出する。
【0009】ここで、MPEGにおいては、画像の予測
モードには、イントラ符号化(フレーム内符号化)、前
方予測符号化、後方予測符号化、両方向予測符号化の4
種類があり、Iピクチャはイントラ符号化され、Pピク
チャはイントラ符号化または前方予測符号化のいずれか
で符号化され、Bピクチャはイントラ符号化、前方予測
符号化、後方予測符号化、または両方法予測符号化のい
ずれかで符号化される。
【0010】即ち、動きベクトル検出器32は、Iピク
チャについては、予測モードとしてイントラ符号化モー
ドを設定する。この場合、動きベクトル検出器32は、
動きベクトルの検出は行わず、予測モード(イントラ予
測モード)を、VLC(可変長符号化)器36および動
き補償器42に出力する。
【0011】また、動きベクトル検出器32は、Pピク
チャについては、前方予測を行い、その動きベクトルを
検出する。さらに、動きベクトル検出器32は、前方予
測を行うことにより生じる予測誤差と、符号化対象のマ
クロブロック(Pピクチャのマクロブロック)の、例え
ば分散とを比較する。その比較の結果、マクロブロック
の分散の方が予測誤差より小さい場合、動きベクトル検
出器32は、予測モードとしてイントラ符号化モードを
設定し、VLC器36および動き補償器42に出力す
る。また、動きベクトル検出器32は、前方予測を行う
ことにより生じる予測誤差の方が小さければ、予測モー
ドとして前方予測符号化モードを設定し、検出した動き
ベクトルとともに、VLC器36および動き補償器42
に出力する。
【0012】さらに、動きベクトル検出器32は、Bピ
クチャについては、前方予測、後方予測、および両方向
予測を行い、それぞれの動きベクトルを検出する。そし
て、動きベクトル検出器32は、前方予測、後方予測、
および両方向予測についての予測誤差の中の最小のもの
(以下、適宜、最小予測誤差という)を検出し、その最
小予測誤差と、符号化対象のマクロブロック(Bピクチ
ャのマクロブロック)の、例えば分散とを比較する。そ
の比較の結果、マクロブロックの分散の方が最小予測誤
差より小さい場合、動きベクトル検出器32は、予測モ
ードとしてイントラ符号化モードを設定し、VLC器3
6および動き補償器42に出力する。また、動きベクト
ル検出器32は、最小予測誤差の方が小さければ、予測
モードとして、その最小予測誤差が得られた予測モード
を設定し、対応する動きベクトルとともに、VLC器3
6および動き補償器42に出力する。
【0013】動き補償器42は、動きベクトル検出器3
2から予測モードと動きベクトルの両方を受信すると、
その予測モードおよび動きベクトルにしたがって、フレ
ームメモリ41に記憶されている、符号化され、かつ既
に局所復号された画像データを読み出し、この読み出さ
れた画像データを、予測画像データとして、演算器33
および40に供給する。
【0014】演算器33は、動きベクトル検出器32が
フレームメモリ31から読み出した画像データと同一の
マクロブロックをフレームメモリ31から読み出し、そ
のマクロブロックと、動き補償器42からの予測画像と
の差分を演算する。この差分値は、DCT器34に供給
される。
【0015】一方、動き補償器42は、動きベクトル検
出器32から予測モードのみを受信した場合、即ち、予
測モードがイントラ符号化モードである場合には、予測
画像を出力しない。この場合、演算器33(演算器40
も同様)は、特に処理を行わず、フレームメモリ31か
ら読み出したマクロブロックを、そのままDCT器34
に出力する。
【0016】DCT器34では、演算器33の出力デー
タに対して、DCT処理が施され、その結果得られるD
CT係数が、量子化器35に供給される。量子化器35
では、バッファ37のデータ蓄積量(バッファ37に記
憶されているデータの量)(バッファフィードバック)
に対応して量子化ステップ(量子化スケール)が設定さ
れ、その量子化ステップで、DCT器34からのDCT
係数が量子化される。この量子化されたDCT係数(以
下、適宜、量子化係数という)は、設定された量子化ス
テップとともに、VLC器36に供給される。
【0017】VLC器36では、量子化器35より供給
される量子化係数が、例えばハフマン符号などの可変長
符号に変換され、バッファ37に出力される。さらに、
VLC器36は、量子化器35からの量子化ステップ、
動きベクトル検出器32からの予測モード(イントラ符
号化(画像内予測符号化)、前方予測符号化、後方予測
符号化、または両方向予測符号化のうちのいずれが設定
されたかを示すモード)および動きベクトルも可変長符
号化し、その結果得られる符号化ビットストリームを、
バッフ37に出力する。
【0018】バッファ37は、VLC器36からの符号
化ビットストリームを一時蓄積することにより、そのデ
ータ量を平滑化し、例えば、伝送路に出力し、または記
録媒体に記録する。
【0019】また、バッファ37は、そのデータ蓄積量
を量子化器35に出力しており、量子化器35は、この
バッファ37からのデータ蓄積量にしたがって量子化ス
テップを設定する。即ち、量子化器35は、バッファ3
7がオーバーフローしそうなとき、量子化ステップを大
きくし、これにより、量子化係数のデータ量を低下させ
る。また、量子化器35は、バッファ37がアンダーフ
ローしそうなとき、量子化ステップを小さくし、これに
より、量子化係数のデータ量を増大させる。このように
して、バッファ37のオーバフローとアンダフローを防
止するようになっている。
【0020】量子化器35が出力する量子化係数と量子
化ステップは、VLC器36だけでなく、逆量子化器3
8にも供給されるようになされている。逆量子化器38
では、量子化器35からの量子化係数が、同じく量子化
器35からの量子化ステップにしたがって逆量子化さ
れ、これによりDCT係数に変換される。このDCT係
数は、IDCT器(逆DCT器)39に供給される。I
DCT器39では、DCT係数が逆DCT処理され、そ
の処理の結果得られるデータが、演算器40に供給され
る。
【0021】演算器40には、IDCT器39の出力デ
ータの他、上述したように、動き補償器42から、演算
器33に供給されている予測画像と同一のデータが供給
されている。演算器40は、IDCT器39の出力デー
タ(予測残差(差分データ))と、動き補償器42から
の予測画像データとを加算することで、元の画像データ
を局所復号し、この局所復号された画像データ(局所復
号画像データ)が出力される(但し、予測モードがイン
トラ符号化である場合には、IDCT器39の出力デー
タは、演算器40をスルーして、そのまま、局所復号画
像データとして、フレームメモリ41に供給される)。
なお、この復号画像データは、受信側において得られる
復号画像データと同一のものである。
【0022】演算器40において得られた復号画像デー
タ(局所復号画像データ)は、フレームメモリ41に供
給されて記憶され、その後、インター符号化(前方予測
符号化、後方予測符号化、量方向予測符号化)される画
像に対する参照画像データ(参照フレーム)として用い
られる。
【0023】次に、図54は、図53のエンコーダから
出力される符号化ビットストリームを復号する、MPE
GにおけるMP@MLのデコーダの一例の構成を示して
いる。
【0024】伝送路を介して伝送されてきた符号化ビッ
トストリームが図示せぬ受信装置で受信され、または記
録媒体に記録された符号化ビットストリームが図示せぬ
再生装置で再生され、バッファ101に供給されて記憶
される。
【0025】IVLC器(逆VLC器(可変長復号
器))102は、バッファ101に記憶された符号化ビ
ットストリームを読み出し、可変長復号することによ
り、その符号化ビットストリームを、マクロブロック単
位で、動きベクトル、予測モード、量子化ステップ、お
よび量子化係数に分離する。これらのデータのうち、動
きベクトルおよび予測モードは動き補償器107に供給
され、量子化ステップおよびマクロブロックの量子化係
数は逆量子化器103に供給される。
【0026】逆量子化器103は、IVLC器102よ
り供給されたマクロブロックの量子化係数を、同じくI
VLC器102より供給された量子化ステップにしたが
って逆量子化し、その結果得られるDCT係数を、ID
CT器104に出力する。IDCT器104は、逆量子
化器103からのマクロブロックのDCT係数を逆DC
Tし、演算器105に供給する。
【0027】演算器105には、IDCT器104の出
力データの他、動き補償器107の出力データも供給さ
れている。即ち、動き補償器107は、フレームメモリ
106に記憶されている、既に復号された画像データ
を、図53の動き補償器42における場合と同様に、I
VLC器102からの動きベクトルおよび予測モードに
したがって読み出し、予測画像データとして、演算器1
05に供給する。演算器105は、IDCT器104の
出力データ(予測残差(差分値))と、動き補償器10
7からの予測画像データとを加算することで、元の画像
データを復号する。この復号画像データは、フレームメ
モリ106に供給されて記憶される。なお、IDCT器
104の出力データが、イントラ符号化されたものであ
る場合には、その出力データは、演算器105をスルー
して、復号画像データとして、そのままフレームメモリ
106に供給されて記憶される。
【0028】フレームメモリ106に記憶された復号画
像データは、その後に復号される画像データの参照画像
データとして用いられる。さらに、復号画像データは、
出力再生画像として、例えば、図示せぬディスプレイな
どに供給されて表示される。
【0029】なお、MPEG1および2では、Bピクチ
ャは、参照画像データとして用いられないため、エンコ
ーダまたはデコーダのそれぞれにおいて、フレームメモ
リ41(図53)または106(図54)には記憶され
ない。
【0030】
【発明が解決しようとする課題】以上の図53、図54
に示したエンコーダ、デコーダは、MPEG1/2の規
格に準拠したものであるが、現在、画像を構成する物体
などのオブジェクトのシーケンスであるVO(Video Ob
ject)単位で符号化を行う方式につき、ISO−IEC
/JTC1/SC29/WG11において、MPEG
(Moving Picture Experts Group)4として標準化作業
が進められている。
【0031】ところで、MPEG4については、主とし
て、通信の分野で利用されるものとして、標準化作業が
進められていたため、MPEG1/2において規定され
ているGOP(Group Of Picture)は、当初、MPEG
4では規定されておらず、従って、MPEG4が蓄積メ
ディアに利用された場合には、効率的なランダムアクセ
スが困難になることが予想される。
【0032】このため、本件出願人は、効率的なランダ
ムアクセスを可能とするために、MPEG1/2で規定
されているGOPに相当するGOV(Group Of VOP)の
導入を、特願平10−80758号において先に提案し
ており、また、MPEG4において、このGOVが導入
された。
【0033】一方、MPEG4では、画像データを2以
上の階層に階層化し、各階層の画像を利用した、柔軟な
スケーラブル符号化/復号が可能となっている。
【0034】ところで、MPEG4では、現在、各階層
の画像データのGOVどうしの対応関係を規定しておら
ず、このため、各階層ごとに、独立に、GOVを挿入す
ることが可能である。しかしながら、各階層の画像デー
タは、独立したものではないから、各階層ごとに、独立
に、GOVを挿入した場合には、効率的なランダムアク
セスが困難となる場合が生じることが予想される。
【0035】本発明は、このような状況に鑑みてなされ
たものであり、効率的なランダムアクセスをすることが
できるようにするものである。
【0036】
【課題を解決するための手段】請求項1に記載の画像符
号化装置は、画像を構成するオブジェクトのシーケンス
を2以上の階層に階層化する階層化手段と、階層化手段
が出力する、オブジェクトのシーケンスの第1の階層
を、複数のグループに分けて符号化する第1の符号化手
段と、第1の階層のグループの最初に表示されるオブジ
ェクトの表示時刻と同時刻またはその直後に表示される
第2の階層のオブジェクトが、グループの最初に表示さ
れるオブジェクトとなるように、階層化手段が出力す
る、オブジェクトのシーケンスの第2の階層を、複数の
グループに分けて符号化する第2の符号化手段とを備え
ることを特徴とする。
【0037】請求項7に記載の画像符号化方法は、画像
を構成するオブジェクトのシーケンスを2以上の階層に
階層化し、オブジェクトのシーケンスの第1の階層を、
複数のグループに分けて符号化するとともに、第1の階
層のグループの最初に表示されるオブジェクトの表示時
刻と同時刻またはその直後に表示される第2の階層のオ
ブジェクトが、グループの最初に表示されるオブジェク
トとなるように、オブジェクトのシーケンスの第2の階
層を、複数のグループに分けて符号化することを特徴と
する。
【0038】請求項8に記載の画像復号装置は、画像を
構成するオブジェクトのシーケンスを2以上の階層に階
層化し、オブジェクトのシーケンスの第1の階層を、複
数のグループに分けて符号化するとともに、第1の階層
のグループの最初に表示されるオブジェクトの表示時刻
と同時刻またはその直後に表示される第2の階層のオブ
ジェクトが、グループの最初に表示されるオブジェクト
となるように、オブジェクトのシーケンスの第2の階層
を、複数のグループに分けて符号化することにより得ら
れる符号化ビットストリームを復号する復号手段を備え
ることを特徴とする。
【0039】請求項14に記載の画像復号方法は、画像
を構成するオブジェクトのシーケンスを2以上の階層に
階層化し、オブジェクトのシーケンスの第1の階層を、
複数のグループに分けて符号化するとともに、第1の階
層のグループの最初に表示されるオブジェクトの表示時
刻と同時刻またはその直後に表示される第2の階層のオ
ブジェクトが、グループの最初に表示されるオブジェク
トとなるように、オブジェクトのシーケンスの第2の階
層を、複数のグループに分けて符号化することにより得
られる符号化ビットストリームを復号することを特徴と
する。
【0040】請求項15に記載の提供媒体は、画像を構
成するオブジェクトのシーケンスを2以上の階層に階層
化し、オブジェクトのシーケンスの第1の階層を、複数
のグループに分けて符号化するとともに、第1の階層の
グループの最初に表示されるオブジェクトの表示時刻と
同時刻またはその直後に表示される第2の階層のオブジ
ェクトが、グループの最初に表示されるオブジェクトと
なるように、オブジェクトのシーケンスの第2の階層
を、複数のグループに分けて符号化することをにより得
られる符号化ビットストリームを提供することを特徴と
する。
【0041】請求項21に記載の画像符号化装置は、画
像を構成するオブジェクトのシーケンスを2以上の階層
に階層化する階層化手段と、階層化手段が出力する、オ
ブジェクトのシーケンスの第1または第2の階層を、1
以上のグループに分けてそれぞれ符号化し、第1または
第2の階層のグループに、その最初に表示されるオブジ
ェクトの表示時刻を秒精度で表す秒精度先頭表示時刻を
それぞれ含める符号化手段と、第1または第2の階層の
オブジェクトそれぞれに、秒精度先頭表示時刻を基準と
する、そのオブジェクトの表示時刻の秒精度を表す秒精
度相対時刻情報を付加する付加手段と、第2の階層の、
表示順で隣接するオブジェクトどうしの表示時刻の差に
基づいて、第2の階層のオブジェクトについての秒精度
相対時刻情報をリセットするリセット手段とを備えるこ
とを特徴とする。
【0042】請求項22に記載の画像符号化方法は、画
像を構成するオブジェクトのシーケンスを2以上の階層
に階層化し、オブジェクトのシーケンスの第1または第
2の階層を、1以上のグループに分けてそれぞれ符号化
し、第1または第2の階層のグループに、その最初に表
示されるオブジェクトの表示時刻を秒精度で表す秒精度
先頭表示時刻をそれぞれ含め、第1または第2の階層の
オブジェクトそれぞれに、秒精度先頭表示時刻を基準と
する、そのオブジェクトの表示時刻の秒精度を表す秒精
度相対時刻情報を付加する画像符号化方法において、第
2の階層の、表示順で隣接するオブジェクトどうしの表
示時刻の差に基づいて、第2の階層のオブジェクトにつ
いての秒精度相対時刻情報をリセットすることを特徴と
する。
【0043】請求項23に記載の画像復号装置は、画像
を構成するオブジェクトのシーケンスを2以上の階層に
階層化し、オブジェクトのシーケンスの第1または第2
の階層を、1以上のグループに分けてそれぞれ符号化
し、第1または第2の階層のグループに、その最初に表
示されるオブジェクトの表示時刻を秒精度で表す秒精度
先頭表示時刻をそれぞれ含め、第1または第2の階層の
オブジェクトそれぞれに、秒精度先頭表示時刻を基準と
する、そのオブジェクトの表示時刻の秒精度を表す秒精
度相対時刻情報を付加することにより得られる符号化ビ
ットストリームであって、第2の階層の、表示順で隣接
するオブジェクトどうしの表示時刻の差に基づいて、第
2の階層のオブジェクトについての秒精度相対時刻情報
がリセットされているものを復号する復号手段を備える
ことを特徴とする。
【0044】請求項24に記載の画像復号方法は、画像
を構成するオブジェクトのシーケンスを2以上の階層に
階層化し、オブジェクトのシーケンスの第1または第2
の階層を、1以上のグループに分けてそれぞれ符号化
し、第1または第2の階層のグループに、その最初に表
示されるオブジェクトの表示時刻を秒精度で表す秒精度
先頭表示時刻をそれぞれ含め、第1または第2の階層の
オブジェクトそれぞれに、秒精度先頭表示時刻を基準と
する、そのオブジェクトの表示時刻の秒精度を表す秒精
度相対時刻情報を付加することにより得られる符号化ビ
ットストリームであって、第2の階層の、表示順で隣接
するオブジェクトどうしの表示時刻の差に基づいて、第
2の階層のオブジェクトについての秒精度相対時刻情報
がリセットされているものを復号することを特徴とす
る。
【0045】請求項25に記載の提供媒体は、画像を構
成するオブジェクトのシーケンスを2以上の階層に階層
化し、オブジェクトのシーケンスの第1または第2の階
層を、1以上のグループに分けてそれぞれ符号化し、第
1または第2の階層のグループに、その最初に表示され
るオブジェクトの表示時刻を秒精度で表す秒精度先頭表
示時刻をそれぞれ含め、第1または第2の階層のオブジ
ェクトそれぞれに、秒精度先頭表示時刻を基準とする、
そのオブジェクトの表示時刻の秒精度を表す秒精度相対
時刻情報を付加することにより得られる符号化ビットス
トリームであって、第2の階層の、表示順で隣接するオ
ブジェクトどうしの表示時刻の差に基づいて、第2の階
層のオブジェクトについての秒精度相対時刻情報がリセ
ットされているものを提供することを特徴とする。
【0046】請求項26に記載の画像符号化装置は、画
像を構成するオブジェクトのシーケンスを、空間スケー
ラビリティを実現するための上位階層と下位階層とを含
む2以上の階層に階層化する階層化手段と、階層化手段
が出力する、下位階層のオブジェクトのシーケンスを符
号化する第1の符号化手段と、階層化手段が出力する、
上位階層のオブジェクトのシーケンスを、その表示順序
と同一の順序で符号化する第2の符号化手段とを備える
ことを特徴とする。
【0047】請求項27に記載の画像符号化方法は、画
像を構成するオブジェクトのシーケンスを、空間スケー
ラビリティを実現するための上位階層と下位階層とを含
む2以上の階層に階層化し、下位階層のオブジェクトの
シーケンスを符号化するとともに、上位階層のオブジェ
クトのシーケンスを、その表示順序と同一の順序で符号
化することを特徴とする。
【0048】請求項28に記載の画像復号装置は、画像
を構成するオブジェクトのシーケンスを、空間スケーラ
ビリティを実現するための上位階層と下位階層とを含む
2以上の階層に階層化し、下位階層のオブジェクトのシ
ーケンスを符号化するとともに、上位階層のオブジェク
トのシーケンスを、その表示順序と同一の順序で符号化
することにより得られる符号化ビットストリームを復号
する復号手段を備えることを特徴とする。
【0049】請求項29に記載の画像復号方法は、画像
を構成するオブジェクトのシーケンスを、空間スケーラ
ビリティを実現するための上位階層と下位階層とを含む
2以上の階層に階層化し、下位階層のオブジェクトのシ
ーケンスを符号化するとともに、上位階層のオブジェク
トのシーケンスを、その表示順序と同一の順序で符号化
することにより得られる符号化ビットストリームを復号
することを特徴とする。
【0050】請求項30に記載の提供媒体は、画像を構
成するオブジェクトのシーケンスを、空間スケーラビリ
ティを実現するための上位階層と下位階層とを含む2以
上の階層に階層化し、下位階層のオブジェクトのシーケ
ンスを符号化するとともに、上位階層のオブジェクトの
シーケンスを、その表示順序と同一の順序で符号化する
ことにより得られる符号化ビットストリームを提供する
ことを特徴とする。
【0051】請求項1に記載の画像符号化装置において
は、階層化手段は、画像を構成するオブジェクトのシー
ケンスを2以上の階層に階層化し、第1の符号化手段
は、階層化手段が出力する、オブジェクトのシーケンス
の第1の階層を、複数のグループに分けて符号化するよ
うになされている。第2の符号化手段は、第1の階層の
グループの最初に表示されるオブジェクトの表示時刻と
同時刻またはその直後に表示される第2の階層のオブジ
ェクトが、グループの最初に表示されるオブジェクトと
なるように、階層化手段が出力する、オブジェクトのシ
ーケンスの第2の階層を、複数のグループに分けて符号
化するようになされている。
【0052】請求項7に記載の画像符号化方法において
は、画像を構成するオブジェクトのシーケンスを2以上
の階層に階層化し、オブジェクトのシーケンスの第1の
階層を、複数のグループに分けて符号化するとともに、
第1の階層のグループの最初に表示されるオブジェクト
の表示時刻と同時刻またはその直後に表示される第2の
階層のオブジェクトが、グループの最初に表示されるオ
ブジェクトとなるように、オブジェクトのシーケンスの
第2の階層を、複数のグループに分けて符号化するよう
になされている。
【0053】請求項8に記載の画像復号装置において
は、復号手段が、画像を構成するオブジェクトのシーケ
ンスを2以上の階層に階層化し、オブジェクトのシーケ
ンスの第1の階層を、複数のグループに分けて符号化す
るとともに、第1の階層のグループの最初に表示される
オブジェクトの表示時刻と同時刻またはその直後に表示
される第2の階層のオブジェクトが、グループの最初に
表示されるオブジェクトとなるように、オブジェクトの
シーケンスの第2の階層を、複数のグループに分けて符
号化することにより得られる符号化ビットストリームを
復号するようになされている。
【0054】請求項14に記載の画像復号方法において
は、画像を構成するオブジェクトのシーケンスを2以上
の階層に階層化し、オブジェクトのシーケンスの第1の
階層を、複数のグループに分けて符号化するとともに、
第1の階層のグループの最初に表示されるオブジェクト
の表示時刻と同時刻またはその直後に表示される第2の
階層のオブジェクトが、グループの最初に表示されるオ
ブジェクトとなるように、オブジェクトのシーケンスの
第2の階層を、複数のグループに分けて符号化すること
により得られる符号化ビットストリームを復号するよう
になされている。
【0055】請求項15に記載の提供媒体においては、
画像を構成するオブジェクトのシーケンスを2以上の階
層に階層化し、オブジェクトのシーケンスの第1の階層
を、複数のグループに分けて符号化するとともに、第1
の階層のグループの最初に表示されるオブジェクトの表
示時刻と同時刻またはその直後に表示される第2の階層
のオブジェクトが、グループの最初に表示されるオブジ
ェクトとなるように、オブジェクトのシーケンスの第2
の階層を、複数のグループに分けて符号化することをに
より得られる符号化ビットストリームを提供するように
なされている。
【0056】請求項21に記載の画像符号化装置におい
ては、階層化手段は、画像を構成するオブジェクトのシ
ーケンスを2以上の階層に階層化し、符号化手段は、階
層化手段が出力する、オブジェクトのシーケンスの第1
または第2の階層を、1以上のグループに分けてそれぞ
れ符号化し、第1または第2の階層のグループに、その
最初に表示されるオブジェクトの表示時刻を秒精度で表
す秒精度先頭表示時刻をそれぞれ含めるようになされて
いる。付加手段は、第1または第2の階層のオブジェク
トそれぞれに、秒精度先頭表示時刻を基準とする、その
オブジェクトの表示時刻の秒精度を表す秒精度相対時刻
情報を付加し、リセット手段は、第2の階層の、表示順
で隣接するオブジェクトどうしの表示時刻の差に基づい
て、第2の階層のオブジェクトについての秒精度相対時
刻情報をリセットするようになされている。
【0057】請求項22に記載の画像符号化方法におい
ては、画像を構成するオブジェクトのシーケンスを2以
上の階層に階層化し、オブジェクトのシーケンスの第1
または第2の階層を、1以上のグループに分けてそれぞ
れ符号化し、第1または第2の階層のグループに、その
最初に表示されるオブジェクトの表示時刻を秒精度で表
す秒精度先頭表示時刻をそれぞれ含め、第1または第2
の階層のオブジェクトそれぞれに、秒精度先頭表示時刻
を基準とする、そのオブジェクトの表示時刻の秒精度を
表す秒精度相対時刻情報を付加するようになされてい
る。この場合に、第2の階層の、表示順で隣接するオブ
ジェクトどうしの表示時刻の差に基づいて、第2の階層
のオブジェクトについての秒精度相対時刻情報をリセッ
トするようになされている。
【0058】請求項23に記載の画像復号装置において
は、復号手段が、画像を構成するオブジェクトのシーケ
ンスを2以上の階層に階層化し、オブジェクトのシーケ
ンスの第1または第2の階層を、1以上のグループに分
けてそれぞれ符号化し、第1または第2の階層のグルー
プに、その最初に表示されるオブジェクトの表示時刻を
秒精度で表す秒精度先頭表示時刻をそれぞれ含め、第1
または第2の階層のオブジェクトそれぞれに、秒精度先
頭表示時刻を基準とする、そのオブジェクトの表示時刻
の秒精度を表す秒精度相対時刻情報を付加することによ
り得られる符号化ビットストリームであって、第2の階
層の、表示順で隣接するオブジェクトどうしの表示時刻
の差に基づいて、第2の階層のオブジェクトについての
秒精度相対時刻情報がリセットされているものを復号す
るようになされている。
【0059】請求項24に記載の画像復号方法において
は、画像を構成するオブジェクトのシーケンスを2以上
の階層に階層化し、オブジェクトのシーケンスの第1ま
たは第2の階層を、1以上のグループに分けてそれぞれ
符号化し、第1または第2の階層のグループに、その最
初に表示されるオブジェクトの表示時刻を秒精度で表す
秒精度先頭表示時刻をそれぞれ含め、第1または第2の
階層のオブジェクトそれぞれに、秒精度先頭表示時刻を
基準とする、そのオブジェクトの表示時刻の秒精度を表
す秒精度相対時刻情報を付加することにより得られる符
号化ビットストリームであって、第2の階層の、表示順
で隣接するオブジェクトどうしの表示時刻の差に基づい
て、第2の階層のオブジェクトについての秒精度相対時
刻情報がリセットされているものを復号するようになさ
れている。
【0060】請求項25に記載の提供媒体においては、
画像を構成するオブジェクトのシーケンスを2以上の階
層に階層化し、オブジェクトのシーケンスの第1または
第2の階層を、1以上のグループに分けてそれぞれ符号
化し、第1または第2の階層のグループに、その最初に
表示されるオブジェクトの表示時刻を秒精度で表す秒精
度先頭表示時刻をそれぞれ含め、第1または第2の階層
のオブジェクトそれぞれに、秒精度先頭表示時刻を基準
とする、そのオブジェクトの表示時刻の秒精度を表す秒
精度相対時刻情報を付加することにより得られる符号化
ビットストリームであって、第2の階層の、表示順で隣
接するオブジェクトどうしの表示時刻の差に基づいて、
第2の階層のオブジェクトについての秒精度相対時刻情
報がリセットされているものを提供するようになされて
いる。
【0061】請求項26に記載の画像符号化装置におい
ては、階層化手段は、画像を構成するオブジェクトのシ
ーケンスを、空間スケーラビリティを実現するための上
位階層と下位階層とを含む2以上の階層に階層化し、第
1の符号化手段は、階層化手段が出力する、下位階層の
オブジェクトのシーケンスを符号化するようになされて
いる。第2の符号化手段は、階層化手段が出力する、上
位階層のオブジェクトのシーケンスを、その表示順序と
同一の順序で符号化するようになされている。
【0062】請求項27に記載の画像符号化方法におい
ては、画像を構成するオブジェクトのシーケンスを、空
間スケーラビリティを実現するための上位階層と下位階
層とを含む2以上の階層に階層化し、下位階層のオブジ
ェクトのシーケンスを符号化するとともに、上位階層の
オブジェクトのシーケンスを、その表示順序と同一の順
序で符号化するようになされている。
【0063】請求項28に記載の画像復号装置において
は、復号手段が、画像を構成するオブジェクトのシーケ
ンスを、空間スケーラビリティを実現するための上位階
層と下位階層とを含む2以上の階層に階層化し、下位階
層のオブジェクトのシーケンスを符号化するとともに、
上位階層のオブジェクトのシーケンスを、その表示順序
と同一の順序で符号化することにより得られる符号化ビ
ットストリームを復号するようになされている。
【0064】請求項29に記載の画像復号方法において
は、画像を構成するオブジェクトのシーケンスを、空間
スケーラビリティを実現するための上位階層と下位階層
とを含む2以上の階層に階層化し、下位階層のオブジェ
クトのシーケンスを符号化するとともに、上位階層のオ
ブジェクトのシーケンスを、その表示順序と同一の順序
で符号化することにより得られる符号化ビットストリー
ムを復号するようになされている。
【0065】請求項30に記載の提供媒体においては、
画像を構成するオブジェクトのシーケンスを、空間スケ
ーラビリティを実現するための上位階層と下位階層とを
含む2以上の階層に階層化し、下位階層のオブジェクト
のシーケンスを符号化するとともに、上位階層のオブジ
ェクトのシーケンスを、その表示順序と同一の順序で符
号化することにより得られる符号化ビットストリームを
提供するようになされている。
【0066】
【発明の実施の形態】以下に、本発明の実施の形態を説
明するが、その前に、特許請求の範囲に記載の発明の各
手段と以下の実施の形態との対応関係を明らかにするた
めに、各手段の後の括弧内に、対応する実施の形態(但
し、一例)を付加して、本発明の特徴を記述すると、次
のようになる。
【0067】即ち、請求項1に記載の画像符号化装置
は、画像を符号化し、その結果得られる符号化ビットス
トリームを出力する画像符号化装置であって、画像を構
成するオブジェクトのシーケンスを2以上の階層に階層
化する階層化手段(例えば、図3に示す画像階層化部2
1など)と、階層化手段が出力する、オブジェクトのシ
ーケンスの第1の階層を、複数のグループに分けて符号
化する第1の符号化手段(例えば、図3に示す下位レイ
ヤ符号化部25など)と、第1の階層のグループの最初
に表示されるオブジェクトの表示時刻と同時刻またはそ
の直後に表示される第2の階層のオブジェクトが、グル
ープの最初に表示されるオブジェクトとなるように、階
層化手段が出力する、オブジェクトのシーケンスの第2
の階層を、複数のグループに分けて符号化する第2の符
号化手段(例えば、図3に示す上位レイヤ符号化部23
など)とを備えることを特徴とする。
【0068】請求項8に記載の画像復号装置は、画像を
復号する画像復号装置であって、画像を構成するオブジ
ェクトのシーケンスを2以上の階層に階層化し、オブジ
ェクトのシーケンスの第1の階層を、複数のグループに
分けて符号化するとともに、第1の階層のグループの最
初に表示されるオブジェクトの表示時刻と同時刻または
その直後に表示される第2の階層のオブジェクトが、グ
ループの最初に表示されるオブジェクトとなるように、
オブジェクトのシーケンスの第2の階層を、複数のグル
ープに分けて符号化することにより得られる符号化ビッ
トストリームを受信する受信手段(例えば、図14に示
す逆多重化部91など)と、符号化ビットストリームを
復号する復号手段(例えば、図14に示す上位レイヤ復
号部93および下位レイヤ復号部95など)とを備える
ことを特徴とする。
【0069】請求項21に記載の画像符号化装置は、画
像を符号化し、その結果得られる符号化ビットストリー
ムを出力する画像符号化装置であって、画像を構成する
オブジェクトのシーケンスを2以上の階層に階層化する
階層化手段(例えば、図3に示す画像階層化部21な
ど)と、階層化手段が出力する、オブジェクトのシーケ
ンスの第1または第2の階層を、1以上のグループに分
けてそれぞれ符号化し、第1または第2の階層のグルー
プに、その最初に表示されるオブジェクトの表示時刻を
秒精度で表す秒精度先頭表示時刻をそれぞれ含める符号
化手段(例えば、図3に示す上位レイヤ符号化部23お
よび下位レイヤ符号化部25など)と、第1または第2
の階層のオブジェクトそれぞれに、秒精度先頭表示時刻
を基準とする、そのオブジェクトの表示時刻の秒精度を
表す秒精度相対時刻情報を付加する付加手段(例えば、
図3に示す上位レイヤ符号化部23および下位レイヤ符
号化部25など)と、第2の階層の、表示順で隣接する
オブジェクトどうしの表示時刻の差に基づいて、第2の
階層のオブジェクトについての秒精度相対時刻情報をリ
セットするリセット手段(例えば、図48に示すプログ
ラムの処理ステップS23など)とを備えることを特徴
とする。
【0070】請求項23に記載の画像復号装置は、画像
を復号する画像復号装置であって、画像を構成するオブ
ジェクトのシーケンスを2以上の階層に階層化し、オブ
ジェクトのシーケンスの第1または第2の階層を、1以
上のグループに分けてそれぞれ符号化し、第1または第
2の階層のグループに、その最初に表示されるオブジェ
クトの表示時刻を秒精度で表す秒精度先頭表示時刻をそ
れぞれ含め、第1または第2の階層のオブジェクトそれ
ぞれに、秒精度先頭表示時刻を基準とする、そのオブジ
ェクトの表示時刻の秒精度を表す秒精度相対時刻情報を
付加することにより得られる符号化ビットストリームで
あって、第2の階層の、表示順で隣接するオブジェクト
どうしの表示時刻の差に基づいて、第2の階層のオブジ
ェクトについての秒精度相対時刻情報がリセットされて
いるものを受信する受信手段(例えば、図14に示す逆
多重化部91など)と、符号化ビットストリームを復号
する復号手段(例えば、図14に示す上位レイヤ復号部
93および下位レイヤ復号部95など)とを備えること
を特徴とする。
【0071】請求項26に記載の画像符号化装置は、画
像を符号化し、その結果得られる符号化ビットストリー
ムを出力する画像符号化装置であって、画像を構成する
オブジェクトのシーケンスを、空間スケーラビリティを
実現するための上位階層と下位階層とを含む2以上の階
層に階層化する階層化手段(例えば、図3に示す画像階
層化部21など)と、階層化手段が出力する、下位階層
のオブジェクトのシーケンスを符号化する第1の符号化
手段(例えば、図3に示す下位レイヤ符号化部25な
ど)と、階層化手段が出力する、上位階層のオブジェク
トのシーケンスを、その表示順序と同一の順序で符号化
する第2の符号化手段(例えば、図3に示す上位レイヤ
符号化部23など)とを備えることを特徴とする。
【0072】請求項28に記載の画像復号装置は、画像
を復号する画像復号装置であって、画像を構成するオブ
ジェクトのシーケンスを、空間スケーラビリティを実現
するための上位階層と下位階層とを含む2以上の階層に
階層化し、下位階層のオブジェクトのシーケンスを符号
化するとともに、上位階層のオブジェクトのシーケンス
を、その表示順序と同一の順序で符号化することにより
得られる符号化ビットストリームを受信する受信手段
(例えば、図14に示す逆多重化部91など)と、符号
化ビットストリームを復号する復号手段(例えば、図1
4に示す上位レイヤ復号部93および下位レイヤ復号部
95など)とを備えることを特徴とする。
【0073】なお、勿論この記載は、各手段を上記した
ものに限定することを意味するものではない。
【0074】図1は、本発明を適用したエンコーダの一
実施の形態の構成例を示している。なお、このエンコー
ダは、基本的には、MPEG4の規格に即した処理を行
うようになされている。
【0075】符号化すべき画像(動画像)データは、V
O(Video Object)構成部1に入力され、VO構成部1
では、そこに入力される画像を構成するオブジェクトご
とに、そのシーケンスであるVOが構成され、VOP構
成部21乃至2Nに出力される。即ち、VO構成部1にお
いてN個のVO#1乃至VO#Nが構成された場合、そ
のN個のVO#1乃至VO#Nは、VOP構成部21
至2Nにそれぞれ出力される。
【0076】具体的には、例えば、符号化すべき画像デ
ータが、独立した背景F1のシーケンスと前景F2のシ
ーケンスとから構成される場合、VO構成部1は、例え
ば、前景F2のシーケンスを、VO#1として、VOP
構成部21に出力するとともに、背景F1のシーケンス
を、VO#2として、VOP構成部22に出力する。
【0077】なお、VO構成部1は、符号化すべき画像
データが、例えば、背景F1と前景F2とを、既に合成
したものである場合、所定のアルゴリズムにしたがっ
て、画像を領域分割することにより、背景F1と前景F
2とを取り出し、それぞれのシーケンスとしてのVO
を、対応するVOP構成部2n(但し、n=1,2,・
・・,N)に出力する。
【0078】VOP構成部2nは、VO構成部1の出力
から、VOP(VO Plane)を構成する。即ち、例えば、
各フレームから物体を抽出し、その物体を囲む、例え
ば、最小の長方形(以下、適宜、最小長方形という)を
VOPとする。なお、このとき、VOP構成部2nは、
その横および縦の画素数が、例えば、16の倍数となる
ようにVOPを構成する。VO構成部2nは、VOPを
構成すると、そのVOPを、VOP符号化部3nに出力
する。
【0079】さらに、VOP構成部2nは、VOPの大
きさ(例えば、横および縦の長さ)を表すサイズデータ
(VOP size)と、フレームにおける、そのVOPの位置
(例えば、フレームの最も左上を原点とするときの座
標)を表すオフセットデータ(VOP offset)とを検出
し、これらのデータも、VOP符号化部3nに供給す
る。
【0080】VOP符号化部3nは、VOP構成部2n
出力を、例えば、MPEGや、H.263などの規格に
準拠した方式で符号化し、その結果得られるビットスト
リームを、多重化部4に出力する。多重化部4は、VO
P符号化部31乃至3Nからのビットストリームを多重化
し、その結果得られる多重化データを、例えば、地上波
や、衛星回線、CATV網その他の伝送路5を介して伝
送し、または、例えば、磁気ディスク、光磁気ディス
ク、光ディスク、磁気テープその他の記録媒体6に記録
する。
【0081】ここで、VOおよびVOPについて説明す
る。
【0082】VOは、ある合成画像のシーケンスが存在
する場合の、その合成画像を構成する各オブジェクト
(物体)のシーケンスであり、VOPは、ある時刻にお
けるVOを意味する。即ち、例えば、いま、画像F1お
よびF2を合成して構成される合成画像F3がある場
合、画像F1またはF2が時系列に並んだものが、それ
ぞれVOであり、ある時刻における画像F1またはF2
が、それぞれVOPである。従って、VOは、異なる時
刻の、同一オブジェクトのVOPの集合ということがで
きる。
【0083】なお、例えば、画像F1を背景とするとと
もに、画像F2を前景とすると、合成画像F3は、画像
F2を抜くためのキー信号を用いて、画像F1およびF
2を合成することによって得られるが、この場合におけ
る画像F2のVOPには、その画像F2を構成する画像
データ(輝度信号および色差信号)の他、適宜、そのキ
ー信号も含まれるものとする。
【0084】画像フレーム(画枠)のシーケンスは、そ
の大きさおよび位置のいずれも変化しないが、VOは、
大きさや位置が変化する場合がある。即ち、同一のVO
を構成するVOPであっても、時刻によって、その大き
さや位置が異なる場合がある。
【0085】具体的には、図2は、背景である画像F1
と、前景である画像F2とからなる合成画像を示してい
る。
【0086】画像F1は、例えば、ある自然の風景を撮
影したものであり、その画像全体のシーケンスが1つの
VO(VO#0とする)とされている。また、画像F2
は、例えば、人が歩いている様子を撮影したものであ
り、その人を囲む最小の長方形のシーケンスが1つのV
O(VO#1とする)とされている。
【0087】この場合、VO#0は風景の画像であるか
ら、基本的に、通常の画像のフレームと同様に、その位
置および大きさの両方とも変化しない。これに対して、
VO#1は人の画像であるから、人物が左右に移動した
り、また、図面において手前側または奥側に移動するこ
とにより、その大きさや位置が変化する。従って、図2
は、同一時刻におけるVO#0およびVO#1を表して
いるが、VOの位置や大きさは、時間の経過にともなっ
て変化することがある。
【0088】そこで、図1のVOP符号化部3nは、そ
の出力するビットストリームに、VOPを符号化したデ
ータの他、所定の絶対座標系におけるVOPの位置(座
標)および大きさに関する情報も含めるようになされて
いる。なお、図2においては、VO#0を構成する、あ
る時刻のVOP(画像F1)の位置を示すベクトルをO
ST0と、その時刻と同一時刻における、VO#1のV
OP(画像F2)の位置を表すベクトルをOST1と、
それぞれ表してある。
【0089】次に、図3は、スケーラビリティを実現す
る、図1のVOP符号化部3nの構成例を示している。
即ち、MPEG4では、異なる画像サイズやフレームレ
ートに対応するスケーラビリティを実現するスケーラブ
ル符号化方式が導入されており、図3に示したVOP符
号化部3nでは、そのようなスケーラビリティを実現す
ることができるようになされている。
【0090】VOP構成部2nからのVOP(画像デー
タ)、並びにそのサイズデータ(VOPsize)、およびオ
フセットデータ(VOP offset)は、いずれも画像階層化
部21に供給される。
【0091】画像階層化部21は、VOPから、1以上
の階層の画像データを生成する(VOPの1以上の階層
化を行う)。即ち、例えば、空間スケーラビリティの符
号化を行う場合においては、画像階層化部21は、そこ
に入力される画像データを、そのまま上位レイヤ(上位
階層)の画像データとして出力するとともに、それらの
画像データを構成する画素数を間引くことなどにより縮
小し(解像度を低下させ)、これを下位レイヤ(下位階
層)の画像データとして出力する。
【0092】なお、入力されたVOPを下位レイヤのデ
ータとするとともに、そのVOPの解像度を、何らかの
手法で高くし(画素数を多くし)、これを、上位レイヤ
のデータとすることなども可能である。
【0093】また、階層数は、1とすることが可能であ
るが、この場合、スケーラビリティは実現されない。な
お、この場合、VOP符号化部3nは、例えば、下位レ
イヤ符号化部25だけで構成されることになる。
【0094】さらに、階層数は、3以上とすることも可
能であるが、ここでは、簡単のために、2階層の場合に
ついて説明を行う。
【0095】画像階層化部21は、例えば、時間スケー
ラビリティ(テンポラルスケーラビリティ)の符号化を
行う場合、時刻に応じて、画像データを、下位レイヤま
たは上位レイヤのデータとして、例えば、交互に出力す
る。即ち、例えば、画像階層化部21は、そこに、ある
VOを構成するVOPが、VOP0,VOP1,VOP
2,VOP3,・・・の順で入力されたとした場合、V
OP0,VOP2,VOP4,VOP6,・・・を、下
位レイヤのデータとして、また、VOP1,VOP3,
VOP5,VOP7,・・・を、上位レイヤデータとし
て出力する。なお、時間スケーラビリティの場合は、こ
のようにVOPが間引かれたものが、下位レイヤおよび
上位レイヤのデータとされるだけで、画像データの拡大
または縮小(解像度の変換)は行われない(但し、行う
ようにすることも可能である)。
【0096】また、画像階層化部21は、例えば、SN
R(Signal to Noise Ratio)スケーラビリティの符号
化を行う場合、入力された画像データを、そのまま上位
レイヤまたは下位レイヤのデータそれぞれとして出力す
る。即ち、この場合、下位レイヤ並びに上位レイヤの画
像データは、同一のデータとなる。
【0097】ここで、VOPごとに符号化を行う場合の
空間スケーラビリティについては、例えば、次のような
3種類が考えられる。
【0098】即ち、例えば、いま、VOPとして、図2
に示したような画像F1およびF2でなる合成画像が入
力されたとすると、第1の空間スケーラビリティは、図
4に示すように、入力されたVOP全体(図4(A))
を上位レイヤ(EnhancementLayer)とするとともに、そ
のVOP全体を縮小したもの(図4(B))を下位レイ
ヤ(Base Layer)とするものである。
【0099】また、第2の空間スケーラビリティは、図
5に示すように、入力されたVOPを構成する一部の物
体(図5(A)(ここでは、画像F2に相当する部
分)))を抜き出して(なお、このような抜き出しは、
例えば、VOP構成部2nにおける場合と同様にして行
われ、従って、これにより抜き出された物体も、1つの
VOPと考えることができる)、上位レイヤとするとと
もに、そのVOP全体を縮小したもの(図5(B))を
下位レイヤとするものである。
【0100】さらに、第3の空間スケーラビリティは、
図6および図7に示すように、入力されたVOPを構成
する物体(VOP)を抜き出して、その物体ごとに、上
位レイヤおよび下位レイヤを生成するものである。な
お、図6は、図2のVOPを構成する背景(画像F1)
から上位レイヤおよび下位レイヤを生成した場合を示し
ており、また、図7は、図2のVOPを構成する前景
(画像F2)から上位レイヤおよび下位レイヤを生成し
た場合を示している。
【0101】以上のようなスケーラビリティのうちのい
ずれを用いるかは予め決められており、画像階層化部2
1は、その予め決められたスケーラビリティによる符号
化を行うことができるように、VOPの階層化を行う。
【0102】さらに、画像階層化部21は、そこに入力
されるVOPのサイズデータおよびオフセットデータ
(それぞれを、以下、適宜、初期サイズデータ、初期オ
フセットデータという)から、生成した下位レイヤおよ
び上位レイヤのVOPの所定の絶対座標系における位置
を表すオフセットデータと、その大きさを示すサイズデ
ータとを計算(決定)する。
【0103】ここで、下位レイヤ並びに上位レイヤのV
OPのオフセットデータ(位置情報)およびサイズデー
タの決定方法について、例えば、上述の第2のスケーラ
ビリティ(図5)を行う場合を例に説明する。
【0104】この場合、下位レイヤのオフセットデータ
FPOS_Bは、例えば、図8(A)に示すように、下
位レイヤの画像データを、その解像度および上位レイヤ
の解像度の違いに基づいて拡大(アップサンプリング)
したときに、即ち、下位レイヤの画像を、上位レイヤの
画像の大きさと一致するような拡大率(上位レイヤの画
像を縮小して下位レイヤの画像を生成したときの、その
縮小率の逆数)(以下、適宜、倍率FRという)で拡大
したときに、その拡大画像の絶対座標系におけるオフセ
ットデータが、初期オフセットデータと一致するように
決定される。また、下位レイヤのサイズデータFSZ_
Bも同様に、下位レイヤの画像を倍率FRで拡大したと
きに得られる拡大画像のサイズデータが初期サイズデー
タと一致するように決定される。即ち、オフセットデー
タFPOS_BまたはサイズデータFSZ_Bは、それ
ぞれのFR倍か、初期オフセットデータまたは初期サイ
ズデータと一致するように決定される。
【0105】一方、上位レイヤのオフセットデータFP
OS_Eは、例えば、図8(B)に示すように、入力さ
れたVOPから抜き出した物体を囲む最小長方形(VO
P)の、例えば、左上の頂点の座標が、初期オフセット
データに基づいて求められ、この値に決定される。ま
た、上位レイヤのサイズデータFPOS_Eは、入力さ
れたVOPから抜き出した物体を囲む最小長方形の、例
えば横および縦の長さに決定される。
【0106】従って、この場合、下位レイヤのオフセッ
トデータFPOS_BおよびサイズデータFPOS_B
を、倍率FRにしたがって変換し(変換後のオフセット
データFPOS_BまたはサイズデータFPOS_B
を、それぞれ、変換オフセットデータFPOS_Bまた
は変換サイズデータFPOS_Bという)、絶対座標系
において、変換オフセットデータFPOS_Bに対応す
る位置に、変換サイズデータFSZ_Bに対応する大き
さの画枠を考え、そこに、下位レイヤの画像データをF
R倍だけした拡大画像を配置するとともに(図8
(A))、その絶対座標系において、上位レイヤのオフ
セットデータFPOS_EおよびサイズデータFPOS
_Eにしたがって、上位レイヤの画像を同様に配置する
と(図8(B))、拡大画像を構成する各画素と、上位
レイヤの画像を構成する各画素とは、対応するものどう
しが同一の位置に配置されることになる。即ち、この場
合、例えば、図8において、上位レイヤの画像(図8
(B))である人の部分と、拡大画像(図8(A))の
中の人の部分とは、同一の位置に配置されることにな
る。
【0107】第1および第3のスケーラビリティにおけ
る場合も、同様にして、下位レイヤの拡大画像および上
位レイヤの画像を構成する、対応する画素どうしが、絶
対座標系において同一の位置に配置されるように、オフ
セットデータFPOS_BおよびFPOS_E、並びに
サイズデータFSZ_BおよびFSZ_Eが決定され
る。
【0108】図3に戻り、画像階層化部21において生
成された上位レイヤの画像データ、オフセットデータF
POS_E、およびサイズデータFSZ_Eは、遅延回
路22で、後述する下位レイヤ符号化部25における処
理時間だけ遅延され、上位レイヤ符号化部23に供給さ
れる。また、下位レイヤの画像データ、オフセットデー
タFPOS_B、およびサイズデータFSZ_Bは、下
位レイヤ符号化部25に供給される。また、倍率FR
は、遅延回路22を介して、上位レイヤ符号化部23お
よび解像度変換部24に供給される。
【0109】下位レイヤ符号化部25では、下位レイヤ
の画像データが符号化され、その結果得られる符号化ビ
ットストリームに、オフセットデータFPOS_Bおよ
びサイズデータFSZ_Bが含められ、多重化部26に
供給される。
【0110】また、下位レイヤ符号化部25は、符号化
ビットストリームを局所復号し、その結果局所復号結果
である下位レイヤの画像データを、解像度変換部24に
出力する。解像度変換部24は、下位レイヤ符号化部2
5からの下位レイヤの画像データを、倍率FRにしたが
って拡大(または縮小)することにより、元の大きさに
戻し、これにより得られる拡大画像を、上位レイヤ符号
化部23に出力する。
【0111】一方、上位レイヤ符号化部23では、上位
レイヤの画像データが符号化され、その結果得られる符
号化ビットストリームに、オフセットデータFPOS_
EおよびサイズデータFSZ_Eが含められ、多重化部
26に供給される。なお、上位レイヤ符号化部23にお
いては、上位レイヤ画像データの符号化は、後述するよ
うに、解像度変換部24から供給される拡大画像をも参
照画像として用いて行われる。
【0112】多重化部26では、上位レイヤ符号化部2
3および下位レイヤ符号化部25の出力が多重化されて
出力される。
【0113】なお、下位レイヤ符号化部25から上位レ
イヤ符号化部23に対しては、下位レイヤのサイズデー
タFSZ_B、オフセットデータFPOS_B、動きベ
クトルMV、フラグCODなどが供給されており、上位
レイヤ符号化部23では、これらのデータを必要に応じ
て参照しながら、処理を行うようになされているが、こ
の詳細については、後述する。
【0114】次に、図9は、図3の下位レイヤ符号化部
25の詳細構成例を示している。なお、図中、図53に
おける場合と対応する部分については、同一の符号を付
してある。即ち、下位レイヤ符号化部25は、基本的に
は、図53のエンコーダと同様に構成されている。
【0115】画像階層化部21(図3)からの画像デー
タ、即ち、下位レイヤのVOPは、図53における場合
と同様に、フレームメモリ31に供給されて記憶され、
動きベクトル検出器32において、マクロブロック単位
で動きベクトルの検出が行われる。
【0116】但し、下位レイヤ符号化部25の動きベク
トル検出器32には、下位レイヤのVOPのサイズデー
タFSZ_BおよびオフセットデータFPOS_Bが供
給されるようになされており、そこでは、このサイズデ
ータFSZ_BおよびオフセットデータFPOS_Bに
基づいて、マクロブロックの動きベクトルが検出され
る。
【0117】即ち、上述したように、VOPは、時刻
(フレーム)によって、大きさや位置が変化するため、
その動きベクトルの検出にあたっては、その検出のため
の基準となる座標系を設定し、その座標系における動き
を検出する必要がある。そこで、ここでは、動きベクト
ル検出器32は、上述の絶対座標系を基準となる座標系
とし、その絶対座標系に、サイズデータFSZ_Bおよ
びオフセットデータFPOS_Bにしたがって、符号化
対象のVOPおよび参照画像とするVOPを配置して、
動きベクトルを検出するようになされている。
【0118】なお、検出された動きベクトル(MV)
は、予測モードとともに、VLC器36および動き補償
器42に供給される他、上位レイヤ符号化部23(図
3)にも供給される。
【0119】また、動き補償を行う場合においても、や
はり、上述したように、基準となる座標系における動き
を検出する必要があるため、動き補償器42には、サイ
ズデータFSZ_BおよびオフセットデータFPOS_
Bが供給されるようになされている。
【0120】動きベクトルの検出されたVOP(のマク
ロブロック)は、図53における場合と同様に量子化係
数とされてVLC器36に供給される。VLC器36に
は、やはり図53における場合と同様に、量子化係数、
量子化ステップ、動きベクトル、および予測モードが供
給される他、画像階層化部21からのサイズデータFS
Z_BおよびオフセットデータFPOS_Bも供給され
ており、そこでは、これらのデータすべてが可変長符号
化される。
【0121】動きベクトルの検出されたVOP(のマク
ロブロック)は、上述したように符号化される他、やは
り図53における場合と同様に局所復号され、フレーム
メモリ41に記憶される。この復号画像は、前述したよ
うに参照画像として用いられる他、解像度変換部24
(図3)に出力される。
【0122】なお、MPEG4においては、MPEG1
および2と異なり、Bピクチャ(B−VOP)も参照画
像として用いられるため、Bピクチャも、局所復号さ
れ、フレームメモリ41に記憶されるようになされてい
る(但し、現時点においては、Bピクチャが参照画像と
して用いられるのは上位レイヤについてだけである)。
【0123】一方、VLC器36は、I,P,Bピクチ
ャ(I−VOP,P−VOP,B−VOP)のマクロブ
ロックについて、スキップマクロブロックとするかどう
かを決定し、その決定結果を示すフラグCOD,MOD
Bを設定する。このフラグCOD,MODBは、やはり
可変長符号化されて伝送される。さらに、フラグCOD
は、上位レイヤ符号化部23にも供給される。
【0124】次に、図10は、図3の上位レイヤ符号化
部23の構成例を示している。なお、図中、図9または
図53における場合と対応する部分については、同一の
符号を付してある。即ち、上位レイヤ符号化部23は、
フレームメモリ52が新たに設けられていることを除け
ば、基本的には、図9の下位レイヤ符号化部25または
図53のエンコーダと同様に構成されている。
【0125】画像階層化部21(図3)からの画像デー
タ、即ち、上位レイヤのVOPは、図53における場合
と同様に、フレームメモリ31に供給されて記憶され、
動きベクトル検出器32において、マクロブロック単位
で動きベクトルの検出が行われる。なお、この場合も、
動きベクトル検出器32には、図9における場合と同様
に、上位レイヤのVOPの他、そのサイズデータFSZ
_EおよびオフセットデータFPOS_Eが供給される
ようになされており、動きベクトル検出器32では、上
述の場合と同様に、このサイズデータFSZ_Eおよび
オフセットデータFPOS_Eに基づいて、絶対座標系
における上位レイヤのVOPの配置位置が認識され、マ
クロブロックの動きベクトルが検出される。
【0126】ここで、上位レイヤ符号化部23および下
位レイヤ符号化部25における動きベクトル検出器32
では、図53で説明した場合と同様に、予め設定されて
いる所定のシーケンスにしたがって、VOPが処理され
ていくが、そのシーケンスは、ここでは、例えば、次の
ように設定されている。
【0127】即ち、空間スケーラビリティの場合におい
ては、図11(A)または図11(B)に示すように、
上位レイヤまたは下位レイヤのVOPは、例えば、P,
B,B,B,・・・またはI,P,P,P,・・・ピク
チャ(VOP)としてそれぞれ処理されていく。
【0128】そして、この場合、上位レイヤの(表示順
で)最初のVOPであるPピクチャ(P−VOP)は、
例えば、同時刻における下位レイヤのVOP(ここで
は、Iピクチャ(I−VOP))を参照画像として用い
て符号化される。また、上位レイヤの2番目以降のVO
PであるBピクチャ(B−VOP)は、例えば、その直
前の上位レイヤのVOPおよびそれと同時刻の下位レイ
ヤのVOPを参照画像として用いて符号化される。即
ち、ここでは、上位レイヤのBピクチャは、下位レイヤ
のPピクチャと同様に他のVOPを符号化する場合の参
照画像として用いられる。
【0129】なお、下位レイヤについては、例えば、M
PEG1や2、あるいはH.263における場合と同様
に符号化が行われていく。
【0130】SNRスケーラビリティは、空間スケーラ
ビリティにおける倍率FRが1のときと考えられるか
ら、上述の空間スケーラビリティの場合と同様に処理さ
れる。
【0131】テンポラルスケーラビリティの場合、即
ち、例えば、上述したように、VOが、VOP0,VO
P1,VOP2,VOP3,・・・で構成され、VOP
1,VOP3,VOP5,VOP7,・・・が上位レイ
ヤとされ(図12(A))、VOP0,VOP2,VO
P4,VOP6,・・・が下位レイヤとされた場合にお
いては(図12(B))、図12に示すように、上位レ
イヤまたは下位レイヤのVOPは、例えば、B,B,
B,・・・またはI,P,P,P,・・・ピクチャ(V
OP)としてそれぞれ処理されていく。
【0132】そして、この場合、上位レイヤの(表示順
で)最初のVOP1(Bピクチャ)は、例えば、下位レ
イヤのVOP0(Iピクチャ)およびVOP2(Pピク
チャ)を参照画像として用いて符号化される。また、上
位レイヤの2番目のVOP3(Bピクチャ)は、例え
ば、その直前にBピクチャとして符号化された上位レイ
ヤのVOP1、およびVOP3の次の時刻(フレーム)
における画像である下位レイヤのVOP4(Pピクチ
ャ)を参照画像として用いて符号化される。上位レイヤ
の3番目のVOP5(Bピクチャ)も、VOP3と同様
に、例えば、その直前にBピクチャとして符号化された
上位レイヤのVOP3、およびVOP5の次の時刻(フ
レーム)における画像である下位レイヤのVOP6(P
ピクチャ)を参照画像として用いて符号化される。
【0133】以上のように、あるレイヤのVOP(ここ
では、上位レイヤ)については、PおよびBピクチャを
符号化するための参照画像として、他のレイヤ(スケー
ラブルレイヤ)(ここでは、下位レイヤ)のVOPを用
いることができる。このように、あるレイヤのVOPを
符号化するのに、他のレイヤのVOPを参照画像として
用いる場合、即ち、ここでは、上位レイヤのVOPを予
測符号化するのに、下位レイヤのVOPを参照画像とし
て用いる場合、上位レイヤ符号化部23(図10)の動
きベクトル検出器32は、その旨を示すフラグref_
layer_id(階層数が3以上存在する場合、フラ
グref_layer_idは、参照画像として用いる
VOPが属するレイヤを表す)を設定して出力するよう
になされている。
【0134】さらに、上位レイヤ符号化部23の動きベ
クトル検出器32は、VOPについてのフラグref_
layer_idにしたがい、前方予測符号化または後
方予測符号化を、それぞれ、どのレイヤのVOPを参照
画像として行うかを示すフラグref_select_
code(参照画像情報)を設定して出力するようにも
なされている。
【0135】即ち、例えば、上位レイヤ(Enhancement
Layer)のPピクチャが、その直前に復号(局所復号)
される、それと同一のレイヤに属するVOPを参照画像
として用いて符号化される場合、フラグref_sel
ect_codeは「00」とされる。また、Pピクチ
ャが、その直前に表示される、それと異なるレイヤ(こ
こでは、下位レイヤ)(Reference Layer)に属するV
OPを参照画像として用いて符号化される場合、フラグ
ref_select_codeは「01」とされる。
さらに、Pピクチャが、その直後に表示される、それと
異なるレイヤに属するVOPを参照画像として用いて符
号化される場合、フラグref_select_cod
eは「10」とされる。また、Pピクチャが、それと同
時刻における、異なるレイヤのVOPを参照画像として
用いて符号化される場合、フラグref_select
_codeは「11」とされる。
【0136】一方、例えば、上位レイヤのBピクチャ
が、それと同時刻における、異なるレイヤのVOPを前
方予測のための参照画像として用い、かつ、その直前に
復号される、それと同一のレイヤに属するVOPを後方
予測のための参照画像として用いて符号化される場合、
フラグref_select_codeは「00」とさ
れる。また、上位レイヤのBピクチャが、それと同一の
レイヤに属するVOPを前方予測のための参照画像とし
て用い、かつ、その直前に表示される、それと異なるレ
イヤに属するVOPを後方予測のための参照画像として
用いて符号化される場合、フラグref_select
_codeは「01」とされる。さらに、上位レイヤの
Bピクチャが、その直前に復号される、それと同一のレ
イヤに属するVOPを前方予測のための参照画像として
用い、かつその直後に表示される、それと異なるレイヤ
に属するVOPを後方予測のための参照画像として用い
て符号化される場合、フラグref_select_c
odeは「10」とされる。また、上位レイヤのBピク
チャが、その直前に表示される、それと異なるレイヤに
属するVOPを前方予測のための参照画像として用い、
かつその直後に表示される、それと異なるレイヤに属す
るVOPを後方予測のための参照画像として用いて符号
化される場合、フラグref_select_code
は「11」とされる。
【0137】ここで、図11および図12で説明した予
測符号化の方法は、1つの例であり、前方予測符号化、
後方予測符号化、または両方向予測符号化のための参照
画像として、どのレイヤの、どのVOPを用いるかは、
例えば、上述した範囲で、自由に設定することが可能で
ある。
【0138】なお、上述の場合においては、便宜的に、
「空間スケーラビリティ」、「時間スケーラビリテ
ィ」、「SNRスケーラビリティ」という語を用いた
が、フラグref_select_codeによって、
予測符号化に用いる参照画像を設定する場合、空間スケ
ーラビリティや、テンポラルスケーラビリティ、SNR
スケーラビリティを明確に区別することは困難となる。
即ち、逆にいえば、フラグref_select_co
deを用いることによって、上述のようなスケーラビリ
ティの区別をせずに済むようになる。
【0139】ここで、上述のスケーラビリティとフラグ
ref_select_codeとを対応付けるとすれ
ば、例えば、次のようになる。即ち、Pピクチャについ
ては、フラグref_select_codeが「1
1」の場合が、フラグref_layer_idが示す
レイヤの同時刻におけるVOPを参照画像(前方予測の
ための参照画像)として用いる場合であるから、これ
は、空間スケーラビリティまたはSNRスケーラビリテ
ィに対応する。そして、フラグref_select_
codeが「11」の場合以外は、テンポラルスケーラ
ビリティに対応する。
【0140】また、Bピクチャについては、フラグre
f_select_codeが「00」の場合が、やは
り、フラグref_layer_idが示すレイヤの同
時刻におけるVOPを前方予測のための参照画像として
用いる場合であるから、これが、空間スケーラビリティ
またはSNRスケーラビリティに対応する。そして、フ
ラグref_select_codeが「00」の場合
以外は、テンポラルスケーラビリティに対応する。
【0141】なお、上位レイヤのVOPの予測符号化の
ために、それと異なるレイヤ(ここでは、下位レイヤ)
の、同時刻におけるVOPを参照画像として用いる場
合、両者の間に動きはないので、動きベクトルは、常に
0((0,0))とされる。
【0142】図10に戻り、上位レイヤ符号化部23の
動きベクトル検出器32では、以上のようなフラグre
f_layer_idおよびref_select_c
odeが設定され、動き補償器42およびVLC器36
に供給される。
【0143】また、動きベクトル検出器32では、フラ
グref_layer_idおよびref_selec
t_codeにしたがって、フレームメモリ31を参照
するだけでなく、必要に応じて、フレームメモリ52を
も参照して、動きベクトルが検出される。
【0144】ここで、フレームメモリ52には、解像度
変換部24(図3)から、局所復号された下位レイヤの
拡大画像が供給されるようになされている。即ち、解像
度変換部24では、局所復号された下位レイヤのVOP
が、例えば、いわゆる補間フィルタなどによって拡大
(補間)され、これにより、そのVOPを、FR倍だけ
した拡大画像、つまり、その下位レイヤのVOPに対応
する上位レイヤのVOPと同一の大きさとした拡大画像
が生成され、上位レイヤ符号化部23に供給される。フ
レームメモリ52では、このようにして解像度変換部2
4から供給される拡大画像が記憶される。
【0145】従って、倍率FRが1の場合は、解像度変
換部24は、下位レイヤ符号化部25からの局所復号さ
れたVOPに対して、特に処理を施すことなく、そのま
ま、上位レイヤ符号化部23に供給する。
【0146】動きベクトル検出器32には、下位レイヤ
符号化部25からサイズデータFSZ_Bおよびオフセ
ットデータFPOS_Bが供給されるとともに、遅延回
路22(図3)からの倍率FRが供給されるようになさ
れており、動きベクトル検出器32は、フレームメモリ
52に記憶された拡大画像を参照画像として用いる場
合、即ち、上位レイヤのVOPの予測符号化に、そのV
OPと同時刻における下位レイヤのVOPを参照画像と
して用いる場合(この場合、フラグref_selec
t_codeは、Pピクチャについては「11」に、B
ピクチャについては「00」にされる)、その拡大画像
に対応するサイズデータFSZ_Bおよびオフセットデ
ータFPOS_Bに、倍率FRを乗算する。そして、そ
の乗算結果に基づいて、絶対座標系における拡大画像の
位置を認識し、動きベクトルの検出を行う。
【0147】なお、動きベクトル検出器32には、下位
レイヤの動きベクトルと予測モードが供給されるように
なされており、これは、次のような場合に使用される。
即ち、動きベクトル検出部32は、例えば、上位レイヤ
のBピクチャについてのフラグref_select_
codeが「00」である場合において、倍率FRが1
であるとき、即ち、SNRスケーラビリティのとき(但
し、この場合、上位レイヤの予測符号化に、上位レイヤ
のVOPが用いられるので、この点で、ここでいうSN
Rスケーラビリティは、MPEG2に規定されているも
のと異なる)、上位レイヤと下位レイヤは同一の画像で
あるから、上位レイヤのBピクチャの予測符号化には、
下位レイヤの同時刻における画像の動きベクトルと予測
モードをそのまま用いることができる。そこで、この場
合、動きベクトル検出部32は、上位レイヤのBピクチ
ャについては、特に処理を行わず、下位レイヤの動きベ
クトルと予測モードをそのまま採用する。
【0148】なお、この場合、上位レイヤ符号化部23
では、動きベクトル検出器32からVLC器36には、
動きベクトルおよび予測モードは出力されない(従っ
て、伝送されない)。これは、受信側において、上位レ
イヤの動きベクトルおよび予測モードを、下位レイヤの
復号結果から認識することができるからである。
【0149】以上のように、動きベクトル検出器32
は、上位レイヤのVOPの他、拡大画像をも参照画像と
して用いて、動きベクトルを検出し、さらに、図53で
説明したように、予測誤差(あるいは分散)を最小にす
る予測モードを設定する。また、動きベクトル検出器3
2は、例えば、フラグref_select_code
やref_layer_idその他の必要な情報を設定
して出力する。
【0150】なお、図10では、下位レイヤ符号化部2
5から、下位レイヤにおけるIまたはPピクチャを構成
するマクロブロックがスキップマクロブロックであるか
どうかを示すフラグCODが、動きベクトル検出器3
2、VLC器36、および動き補償器42に供給される
ようになされている。
【0151】動きベクトルの検出されたマクロブロック
は、上述した場合と同様に符号化され、これにより、V
LC器36からは、その符号化結果としての可変長符号
が出力される。
【0152】なお、上位レイヤ符号化部23のVLC器
36は、下位レイヤ符号化部25における場合と同様
に、フラグCOD,MODBを設定して出力するように
なされている。ここで、フラグCODは、上述したよう
に、IまたはPピクチャのマクロブロックがスキップマ
クロブロックであるかどうかを示すものであるが、フラ
グMODBは、Bピクチャのマクロブロックがスキップ
マクロブロックであるかどうかを示すものである。
【0153】また、VLC器36には、量子化係数、量
子化ステップ、動きベクトル、および予測モードの他、
倍率FR、フラグref_serect_code,r
ef_layer_id、サイズデータFSZ_E、オ
フセットデータFPOS_E、も供給されるようになさ
れており、VLC器36では、これらのデータがすべて
可変長符号化されて出力される。
【0154】一方、動きベクトルの検出されたマクロブ
ロックは符号化された後、やはり上述したように局所復
号され、フレームメモリ41に記憶される。そして、動
き補償器42において、動きベクトル検出器32におけ
る場合と同様にして、フレームメモリ41に記憶され
た、局所復号された上位レイヤのVOPだけでなく、フ
レームメモリ52に記憶された、局所復号されて拡大さ
れた下位レイヤのVOPをも参照画像として用いて動き
補償が行われ、予測画像が生成される。
【0155】即ち、動き補償器42には、動きベクトル
および予測モードの他、フラグref_serect_
code,ref_layer_id、倍率FR、サイ
ズデータFSZ_B,FSZ_E、オフセットデータF
POS_B,FPOS_Eが供給されるようになされて
おり、動き補償器42は、フラグref_serect
_code,ref_layer_idに基づいて、動
き補償すべき参照画像を認識し、さらに、参照画像とし
て、局所復号された上位レイヤのVOP、または拡大画
像を用いる場合には、その絶対座標系における位置と大
きさを、サイズデータFSZ_Eおよびオフセットデー
タFPOS_E、またはサイズデータFSZ_Bおよび
オフセットデータFPOS_Bに基づいて認識し、必要
に応じて、倍率FRを用いて予測画像を生成する。
【0156】次に、図13は、図1のエンコーダから出
力されるビットストリームを復号するデコーダの一実施
の形態の構成例を示している。
【0157】このデコーダには、図1のエンコーダから
伝送路5または記録媒体6を介して提供される符号化ビ
ットストリームが供給される。即ち、図1のエンコーダ
から出力され、伝送路5を介して伝送されてくるビット
ストリームは、図示せぬ受信装置で受信され、あるい
は、記録媒体6に記録されたビットストリームは、図示
せぬ再生装置で再生され、逆多重化部71に供給され
る。
【0158】逆多重化部71では、そこに入力された符
号化ビットストリーム(後述するVS(Visual Object
Seguence))が受信される。さらに、逆多重化部71で
は、入力されたビットストリームが、VOごとのビット
ストリームVO#1,VO#2,・・・に分離され、そ
れぞれ、対応するVOP復号部72nに供給される。V
OP復号部72nでは、逆多重化部71からのビットス
トリームから、VOを構成するVOP(画像データ)、
サイズデータ(VOP size)、およびオフセットデータ
(VOP offset)が復号され、画像再構成部73に供給さ
れる。
【0159】画像再構成部73では、VOP復号部72
1乃至72Nそれぞれからの出力に基づいて、元の画像が
再構成される。この再構成された画像は、例えば、モニ
タ74に供給されて表示される。
【0160】次に、図14は、スケーラビリティを実現
する、図13のVOP復号部72nの構成例を示してい
る。
【0161】逆多重化部71(図13)から供給される
ビットストリームは、逆多重化部91に入力され、そこ
で、上位レイヤのVOPのビットストリームと、下位レ
イヤのVOPのビットストリームとに分離される。上位
レイヤのVOPのビットストリームは、遅延回路92に
おいて、下位レイヤ復号部95における処理の時間だけ
遅延された後、上位レイヤ復号部93に供給され、ま
た、下位レイヤのVOPのビットストリームは、下位レ
イヤ復号部95に供給される。
【0162】下位レイヤ復号部95では、下位レイヤの
ビットストリームが復号され、その結果得られる下位レ
イヤの復号画像が解像度変換部94に供給される。ま
た、下位レイヤ復号部95は、下位レイヤのビットスト
リームを復号することにより得られるサイズデータFS
Z_B、オフセットデータFPOS_B、動きベクトル
(MV)、予測モード、フラグCODなどの、上位レイ
ヤのVOPを復号するのに必要な情報を、上位レイヤ復
号部93に供給する。
【0163】上位レイヤ復号部93では、遅延回路92
を介して供給される上位レイヤのビットストリームが、
下位レイヤ復号部95および解像度変換部94の出力を
必要に応じて参照することにより復号され、その結果得
られる上位レイヤの復号画像、サイズデータFSZ_
E、およびオフセットデータFPOS_Eが出力され
る。さらに、上位レイヤ復号部93は、上位レイヤのビ
ットストリームを復号することにより得られる倍率FR
を、解像度変換部94に出力する。解像度変換部94で
は、上位レイヤ復号部93からの倍率FRを用いて、図
3における解像度変換部24における場合と同様にし
て、下位レイヤの復号画像が変換される。この変換によ
り得られる拡大画像は、上位レイヤ復号部93に供給さ
れ、上述したように、上位レイヤのビットストリームの
復号に用いられる。
【0164】次に、図15は、図14の下位レイヤ復号
部95の構成例を示している。なお、図中、図54のデ
コーダにおける場合と対応する部分については、同一の
符号を付してある。即ち、下位レイヤ復号部95は、基
本的に、図54のデコーダと同様に構成されている。
【0165】逆多重化部91からの下位レイヤのビット
ストリームは、バッファ101に供給され、そこで受信
されて一時記憶される。IVLC器102は、その後段
のブロックの処理状態に対応して、バッファ101から
ビットストリームを適宜読み出し、そのビットストリー
ムを可変長復号することで、量子化係数、動きベクト
ル、予測モード、量子化ステップ、サイズデータFSZ
_B、オフセットデータFPOS_B、およびフラグC
ODなどを分離する。量子化係数および量子化ステップ
は、逆量子化器103に供給され、動きベクトルおよび
予測モードは、動き補償器107と上位レイヤ復号部9
3(図14)に供給される。また、サイズデータFSZ
_BおよびオフセットデータFPOS_Bは、動き補償
器107、画像再構成部73(図13)、および上位レ
イヤ復号部93に供給され、フラグCODは、上位レイ
ヤ復号部93に供給される。
【0166】逆量子化器103、IDCT器104、演
算器105、フレームメモリ106、または動き補償器
107では、図9の下位レイヤ符号化部25の逆量子化
器38、IDCT器39、演算器40、フレームメモリ
41、または動き補償器42における場合とそれぞれ同
様の処理が行われることで、下位レイヤのVOPが復号
され、画像再構成部73、上位レイヤ復号部93、およ
び解像度変換部94(図14)に供給される。
【0167】次に、図16は、図14の上位レイヤ復号
部93の構成例を示している。なお、図中、図54にお
ける場合と対応する部分については、同一の符号を付し
てある。即ち、上位レイヤ復号部93は、フレームメモ
リ112が新たに設けられていることを除けば、基本的
に、図54のデコーダと同様に構成されている。
【0168】逆多重化部91からの上位レイヤのビット
ストリームは、バッファ101を介してIVLC器10
2に供給される。IVLC器102は、上位レイヤのビ
ットストリームを可変長復号することで、量子化係数、
動きベクトル、予測モード、量子化ステップ、サイズデ
ータFSZ_E、オフセットデータFPOS_E、倍率
FR、フラグref_layer_id,ref_se
lect_code,COD,MODBなどを分離す
る。量子化係数および量子化ステップは、図15におけ
る場合と同様に、逆量子化器103に供給され、動きベ
クトルおよび予測モードは、動き補償器107に供給さ
れる。また、サイズデータFSZ_Eおよびオフセット
データFPOS_Eは、動き補償器107および画像再
構成部73(図13)に供給され、フラグCOD,MO
DB,ref_layer_id、およびref_se
lect_codeは、動き補償器107に供給され
る。さらに、倍率FRは、動き補償器107および解像
度変換部94(図14)に供給される。
【0169】なお、動き補償器107には、上述したデ
ータの他、下位レイヤ復号部95(図14)から、下位
レイヤの動きベクトル、フラグCOD、サイズデータF
SZ_B、およびオフセットデータFPOS_Bが供給
されるようになされている。また、フレームメモリ11
2には、解像度変換部94から拡大画像が供給される。
【0170】逆量子化器103、IDCT器104、演
算器105、フレームメモリ106、動き補償器10
7、またはフレームメモリ112では、図10の上位レ
イヤ符号化部23の逆量子化器38、IDCT器39、
演算器40、フレームメモリ41、動き補償器42、ま
たはフレームメモリ52における場合とそれぞれ同様の
処理が行われることで、上位レイヤのVOPが復号さ
れ、画像再構成部73に供給される。
【0171】ここで、以上のように構成される上位レイ
ヤ復号部93および下位レイヤ復号部95を有するVO
P復号部72nにおいては、上位レイヤについての復号
画像、サイズデータFSZ_E、およびオフセットデー
タFPOS_E(以下、適宜、これらをすべて含めて、
上位レイヤデータという)と、下位レイヤについての上
位レイヤについての復号画像、サイズデータFSZ_
B、およびオフセットデータFPOS_B(以下、適
宜、これらをすべて含めて、下位レイヤデータという)
が得られるが、画像再構成部73では、この上位レイヤ
データまたは下位レイヤデータから、例えば、次のよう
にして画像が再構成されるようになされている。
【0172】即ち、例えば、第1の空間スケーラビリテ
ィ(図4)が行われた場合(入力されたVOP全体が上
位レイヤとされるとともに、そのVOP全体を縮小した
ものが下位レイヤされた場合)において、下位レイヤデ
ータおよび上位レイヤデータの両方のデータが復号され
たときには、画像再構成部73は、上位レイヤデータの
みに基づき、サイズデータFSZ_Eに対応する大きさ
の上位レイヤの復号画像(VOP)を、オフセットデー
タFPOS_Eによって示される位置に配置する。ま
た、例えば、上位レイヤのビットストリームにエラーが
生じたり、また、モニタ74が、低解像度の画像にしか
対応していないため、下位レイヤデータのみの復号が行
われたときには、画像再構成部73は、その下位レイヤ
データのみに基づき、サイズデータFSZ_Bに対応す
る大きさの上位レイヤの復号画像(VOP)を、オフセ
ットデータFPOS_Bによって示される位置に配置す
る。
【0173】また、例えば、第2の空間スケーラビリテ
ィ(図5)が行われた場合(入力されたVOPの一部が
上位レイヤとされるとともに、そのVOP全体を縮小し
たものが下位レイヤとされた場合)において、下位レイ
ヤデータおよび上位レイヤデータの両方のデータが復号
されたときには、画像再構成部73は、サイズデータF
SZ_Bに対応する大きさの下位レイヤの復号画像を、
倍率FRにしたがって拡大し、その拡大画像を生成す
る。さらに、画像再構成部73は、オフセットデータF
POS_BをFR倍し、その結果得られる値に対応する
位置に、拡大画像を配置する。そして、画像再構成部7
3は、サイズデータFSZ_Eに対応する大きさの上位
レイヤの復号画像を、オフセットデータFPOS_Eに
よって示される位置に配置する。
【0174】この場合、上位レイヤの復号画像の部分
が、それ以外の部分に比較して高い解像度で表示される
ことになる。
【0175】なお、上位レイヤの復号画像を配置する場
合においては、その復号画像と、拡大画像とは合成され
る。
【0176】また、図14(図13)には図示しなかっ
たが、上位レイヤ復号部93(VOP復号部72n)か
ら画像再構成部73に対しては、上述したデータの他、
倍率FRも供給されるようになされており、画像再構成
部73は、これを用いて、拡大画像を生成するようにな
されている。
【0177】一方、第2の空間スケーラビリティが行わ
れた場合において、下位レイヤデータのみが復号された
ときには、上述の第1の空間スケーラビリティが行われ
た場合と同様にして、画像が再構成される。
【0178】さらに、第3の空間スケーラビリティ(図
6、図7)が行われた場合(入力されたVOPを構成す
る物体ごとに、その物体(オブジェクト)全体を上位レ
イヤとするとともに、その物体全体を間引いたものを下
位レイヤとした場合)においては、上述の第2の空間ス
ケーラビリティが行われた場合と同様にして、画像が再
構成される。
【0179】上述したように、オフセットデータFPO
S_BおよびFPOS_Eは、下位レイヤの拡大画像お
よび上位レイヤの画像を構成する、対応する画素どうし
が、絶対座標系において同一の位置に配置されるように
なっているため、以上のように画像を再構成すること
で、正確な(位置ずれのない)画像を得ることができ
る。
【0180】次に、図1のエンコーダが出力する符号化
ビットストリームのシンタクスについて、例えば、MPEG
4規格のVideo Verification Model(Version10.0)(以
下、適宜、VM10.0と記述する)を例に説明する。
【0181】図17は、VM10.0における符号化ビットス
トリームの構成を示している。
【0182】符号化ビットストリームは、VS(Visual
Object Sequence)を単位として構成される。ここで、
VSは、画像シーケンスであり、例えば、一本の番組や
映画などに相当する。
【0183】各VSは、1以上のVISO(Visual Obj
ect)から構成される。ここで、VISOには、幾つか
の種類がある。即ち、VISOには、例えば、静止画で
あるスチルテクスチャオブジェクト(Still Texture Ob
ject)や、顔画像から構成されるフェイスオブジェクト
(Face Object)、動画像のオブジェクトであるVO(V
ideo Object)などがある。従って、符号化ビットスト
リームが動画像のものである場合、VISOは、VOか
ら構成される。
【0184】VOは、1以上のVOL(Video Object L
ayer)から構成される(画像を階層化しないときは1の
VOLで構成され、画像を階層化する場合には、その階
層数だけのVOLで構成される)。
【0185】VOLは、必要な数のGOV(Group of V
OP)で構成され、GOVは、1以上のVOP(Video Ob
ject Plane)のシーケンスで構成される。なお、GOV
はなくても良く、この場合、VOLは、1以上のVOP
で構成されることになる。
【0186】図18または図19は、VSまたはVOの
シンタクスをそれぞれ示している。VOは、画像全体ま
たは画像の一部(物体)のシーケンスに対応するビット
ストリームであり、従って、VSは、そのようなシーケ
ンスの集合で構成される(よって、VSは、例えば、一
本の番組などに相当する)。
【0187】図20乃至図25は、VOLのシンタクス
を示している。
【0188】VOLは、上述したようなスケーラビリテ
ィのためのクラスであり、video_object_layer_idで示
される番号によって識別される。即ち、例えば、下位レ
イヤのVOLについてのvideo_object_layer_idは0と
され、また、例えば、上位レイヤのVOLについてのvi
deo_object_layer_idは1とされる。なお、上述したよ
うに、スケーラブルのレイヤの数は2に限られることな
く、1や3以上を含む任意の数とすることができる。
【0189】また、各VOLについて、それが画像全体
であるのか、画像の一部であるのかは、video_object_l
ayer_shapeで識別される。このvideo_object_layer_sha
peは、VOLの形状を示すフラグで、例えば、以下のよ
うに設定される。
【0190】即ち、VOLの形状が長方形状であると
き、video_object_layer_shapeは、例えば「00」とさ
れる。また、VOLが、ハードキー(0または1のうち
のいずれか一方の値をとる2値(Binary)の信号)によ
って抜き出される領域の形状をしているとき、video_ob
ject_layer_shapeは、例えば「01」とされる。さら
に、VOLが、ソフトキー(0乃至1の範囲の連続した
値(Gray-Scale)をとることが可能な信号(MPEG4
では、8ビットで表現される))によって抜き出される
領域の形状をしているとき(ソフトキーを用いて合成さ
れるものであるとき)、video_object_layer_shapeは、
例えば「10」とされる。
【0191】ここで、video_object_layer_shapeが「0
0」とされるのは、VOLの形状が長方形状であり、か
つ、そのVOLの絶対座標形における位置および大きさ
が、時間とともに変化しない、即ち、一定の場合であ
る。なお、この場合、その大きさ(横の長さと縦の長
さ)は、video_object_layer_widthとvideo_object_lay
er_heightによって示される。video_object_layer_widt
hおよびvideo_object_layer_heightは、いずれも10ビ
ットの固定長のフラグで、video_object_layer_shapeが
「00」の場合には、最初に、一度だけ伝送される(こ
れは、video_object_layer_shapeが「00」の場合、上
述したように、VOLの絶対座標系における大きさが一
定であるからである)。
【0192】また、VOLが、下位レイヤまたは上位レ
イヤのうちのいずれであるかは、1ビットのフラグであ
るscalabilityによって示される。VOLが下位レイヤ
の場合、scalabilityは、例えば1とされ、それ以外の
場合、scalabilityは、例えば0とされる。
【0193】さらに、VOLが、自身以外のVOLにお
ける画像を参照画像として用いる場合、その参照画像が
属するVOLは、上述したように、ref_layer_idで表さ
れる。なお、ref_layer_idは、上位レイヤについてのみ
伝送される。
【0194】また、VOLにおいて、hor_sampling_fac
tor_nとhor_sampling_factor_mは、下位レイヤのVOP
の水平方向の長さに対応する値と、上位レイヤのVOP
の水平方向の長さに対応する値をそれぞれ示す。従っ
て、下位レイヤに対する上位レイヤの水平方向の長さ
(水平方向の解像度の倍率)は、式hor_sampling_facto
r_n/hor_sampling_factor_mで与えられる。
【0195】さらに、VOLにおいて、ver_sampling_f
actor_nとver_sampling_factor_mは、下位レイヤのVO
Pの垂直方向の長さに対応する値と、上位レイヤのVO
Pの垂直方向の長さに対応する値をそれぞれ示す。従っ
て、下位レイヤに対する上位レイヤの垂直方向の長さ
(垂直方向の解像度の倍率)は、式ver_sampling_facto
r_n/ver_sampling_factor_mで与えられる。
【0196】図26および図27は、GOVのシンタク
ス(Syntax)を示している。
【0197】GOV層は、符号化ビットストリームの先頭
だけでなく、符号化ビットストリームの任意の位置に挿
入することができるように、VOL層とVOP層との間に規定
されている(図17)。これにより、あるVOL#0が、VOP
#0,VOP#1,・・・,VOP#n,VOP#(n+1),・・・,VOP#m
といったVOPのシーケンスで構成される場合において、G
OV層は、その先頭のVOP#0の直前だけでなく、VOP#(n+1)
の直前(VOP#nとVOP#(n+1)との間)にも挿入することが
できる。従って、エンコーダにおいて、GOV層は、例え
ば、符号化ストリームの中の、ランダムアクセスさせた
い位置に挿入することができ、このGOV層を挿入するこ
とで、あるVOLを構成するVOPの一連のシーケンスは、複
数のグループ(GOV)に分けられて符号化されることに
なる。
【0198】GOV層は、図26に示すように、グループ
スタートコード(group_start_code)、VOPタイムイン
クリメントレゾリューション(VOP_time_increment_reso
lusion),タイムコード(time_code)、クローズドGOP
(closed_gop)、ブロークンリンク(broken_link)、
GOVを構成するVOP(Group_of_VideoObjectPlan
e())、ネクストスタートコード(next_start_code())
が順次配置されて構成される。
【0199】次に、GOV層のセマンティクス(Semantic
s)について説明するが、GOV層のセマンティクスは、基
本的には、MPEG2のGOP層と同様であり、従って、特に記
述しない部分については、MPEG2Video規格(ISO/IEC1381
8-2)を参照されたい。
【0200】まず、group_start_codeは、000001B8
(16進数)で、GOVの開始位置を示す。VOP_time_incr
ement_resolusionは、後述するVOP_time_incrementによ
って示される同期点どうしの間隔である1秒間を、何分
割するかの分割数(分解能)を表す。
【0201】time_codeは、図27に示すように、時刻
の時間の単位を表すtime_code_hours、時刻の分の単位
を表すtime_code_minutes、marker_bit、および時刻の
秒の単位を表すtime_code_secondsで構成される。そし
て、このtime_codeのうちの、time_code_hours,time_c
ode_minutes,time_code_secondsによって、GOVの先頭の
時刻が表される。その結果、GOV層のtime_code(秒精度
先頭表示時刻)は、秒精度で、その先頭の時刻、即ち、
そのGOV層の符号化が開始された、VOPのシーケンス上の
絶対時刻を表現することとなる。具体的には、time_cod
eには、GOVの中で最初に表示されるVOPの絶対的な表示
時刻を秒精度で表したものが設定される。
【0202】なお、VM10.0において、time_codeは、「T
he parameters correspond to those defined in the I
EC standard publication 461 for "time and control
codes for video tape recorders". The timecode refe
rs to the first plane ( in display order) after th
e GOV header」と記載されている。
【0203】time_codeのmarker_bitは、符号化ビット
ストリームにおいて、0が23個以上連続しないように
1とされる。
【0204】next_start_code()は、次のGOVの先頭の位
置を与える。
【0205】以上のようなGOVによれば、そのタイム
コードtime_codeにより、GOVのヘッダに続く、表示順
で、最初に表示されるVOPの絶対的な表示時刻を秒精度
で認識することが可能となる。なお、上述のように、GO
V層のtime_codeは秒精度であるため、VOPの表示時刻
の、さらに細かい精度の部分は、VOP毎に設定される
が、この点については、後述する。
【0206】なお、GOV層は、前述したように、本件
出願人による提案後に、MPEG4において導入された
ものである。
【0207】次に、図28乃至図36は、VOP(Vide
o Object Plane Class)のシンタクスを示している。
【0208】VOPの大きさ(横と縦の長さ)は、例え
ば、10ビット固定長のVOP_widthとVOP_heightで表さ
れる。また、VOPの絶対座標系における位置は、例え
ば、10ビット固定長のVOP_horizontal_spatial_mc_re
fとVOP_vertical_mc_refで表される。なお、VOP_width
またはVOP_heightは、VOPの水平方向または垂直方向
の長さをそれぞれ表し、これらは、上述のサイズデータ
FSZ_BやFSZ_Eに相当する。また、VOP_horizo
ntal_spatial_mc_refまたはVOP_vertical_mc_refは、V
OPの水平方向または垂直方向の座標(xまたはy座
標)をそれぞれ表し、これらは、上述のオフセットデー
タFPOS_BやFPOS_Eに相当する。
【0209】VOP_width,VOP_height,VOP_horizontal_
spatial_mc_ref、およびVOP_vertical_mc_refは、video
_object_layer_shapeが「00」以外の場合にのみ伝送
される。即ち、video_object_layer_shapeが「00」の
場合、上述したように、VOPの大きさおよび位置はい
ずれも一定であるから、VOP_width,VOP_height,VOP_h
orizontal_spatial_mc_ref、およびVOP_vertical_mc_re
fは伝送する必要がない。この場合、受信側では、VO
Pは、その左上の頂点が、例えば、絶対座標系の原点に
一致するように配置され、また、その大きさは、図20
乃至図25に示したVOLのvideo_object_layer_width
およびvideo_object_layer_heightから認識される。
【0210】なお、VOPにおいて、ref_select_code
は、上述したように、参照画像として用いる画像を表
す。
【0211】ところで、VM10.0では、各VOP(Video Obje
ct Plane:従来のFrameに相当する)の表示時刻は、その
VOPで規定されているmodulo_time_baseおよびVOP_ti
me_increment(図28)、並びにそのVOPから構成さ
れるGOVで規定されているtime_code(図27)によ
って、次のように定められる。
【0212】即ち、modulo_time_baseは、エンコーダの
ローカルな時間軸上における時刻を、1秒(1000ms(ミ
リ秒))の精度で表す。modulo_time_baseは、VOPヘッ
ダの中で伝送されるマーカ(marker)で表現され、必要
な数の「1」と、1つの「0」とで構成される。modulo_t
ime_baseを構成する「1」の数が、最後に(現在から遡
って、最も最近に)(直前に)表示されたI−VOP,
P−VOPで符号化/復号化されたmodulo_time_base、
またはGOVヘッダのtime_codeによって示された同期
点(1秒精度の時刻)からの累積時間を表す。
【0213】具体的には、VOPのmodulo_time_base
が、例えば、「0」の場合は、直前に表示されたI−V
OP,P−VOPのmodulo_time_base、またはGOVヘ
ッダのtime_codeによって示された同期点からの累積時
間が0秒であることを表す。また、modulo_time_base
が、例えば、「10」の場合は、直前に表示されたI−
VOP,P−VOPのmodulo_time_base、またはGOV
ヘッダのtime_codeによって示された同期点からの累積
時間が1秒であることを表す。さらに、modulo_time_ba
seが、例えば、「110」の場合は、直前に表示された
I−VOP,P−VOPのmodulo_time_base、またはG
OVヘッダのtime_codeによって示された同期点の累積
時間が2秒であることを表す。以上のように、VOPの
modulo_time_baseの「1」の数は、その直前に表示され
たI−VOP,P−VOPのmodulo_time_base、または
GOVヘッダのtime_codeによって示された同期点から
の秒数になっている。
【0214】なお、VM10.0では、modulo_time_baseにつ
いて、「This value represents the local time base
at the one second resolutionunit (1000 millisecond
s). It is represented as a marker transmitted int
he VOP header. The number of consecutive "1" follo
wed by a "0" indicates the number of seconds has e
lapsed since the synchronization point marked by t
he modulo_time_base of the last displayed I/P-VOPs
belonging tothe same VOL. There are two exception
s, one for the first I/P-VOP afterthe GOV header,
and the other is for B-VOPs (in display order) to
the first I-VOP after the GOV header.For the first
I/P-VOP after the GOV header, the modulo_time_bas
e indicates the time relative to the time_code in
the GOV header.For the B-VOPs prior (in display or
der) to the first I-VOP after the GOV header, the
modulo_time_base indicates the time relative to th
e time_code in the GOV header」と記載されている。
【0215】即ち、ある注目VOPのmodulo_time_base
は、直前に表示されたI−VOP,P−VOPのmodulo
_time_baseによって示される同期点、即ち、直前に表示
されたI−VOP,P−VOPの表示時刻の秒精度の時
刻からの相対時間によって、注目VOPの秒精度の表示
時刻を表す。但し、GOVヘッダに続いて最初に符号化
/復号されるI−VOPまたはP−VOPのmodulo_tim
e_baseは、GOVヘッダのtime_codeからの相対時間に
よって、そのI−VOPまたはP−VOPの秒精度の表
示時刻を表し、また、GOVヘッダに続いて最初に符号
化/復号されるI−VOPより前に表示されるB−VO
Pのmodulo_time_baseも、GOVヘッダのtime_codeか
らの相対時間によって、そのB−VOPの秒精度の表示
時刻を表す。
【0216】なお、GOVヘッダに続いて最初に符号化
/復号されるI−VOPまたはP−VOP、およびその
ようなI−VOPより前に表示されるB−VOPに関し
て、GOVヘッダのtime_codeによって示される同期点
を、直前に表示されたI−VOP,P−VOPのmodulo
_time_baseによって示された同期点(直前に表示された
I−VOP,P−VOPの表示時刻の秒精度の時刻)と
考えれば、VOPのmodulo_time_baseは、どのようなV
OPについても、直前に表示されたI−VOP,P−V
OPのmodulo_time_baseによって示された同期点からの
時間によって、そのVOPの表示時刻を、秒精度で表す
ということができる。
【0217】VOP_time_incrementは、1秒以下の精度でV
OPの表示時刻を表すのに使用される。すなわち time_co
de及びmodulo_time_baseは、1秒の精度で時刻を表す
が、それ以下の精度は、VOP_time_incrementを用いて表
現される。VM10.0の場合、VOP_time_incrementの精度
は、上述したGOVレイヤのtime_increment_resolution
(図26)で示され、VOP_time_increment_resolution
=1000とすると、VOP_time_incrementは、VOPの表
示時刻を、1ms(=1000ミリ秒/VOP_time_incremen
t_resolution)単位で表すものとなる。
【0218】図37および図38は、以上の定義に基づ
いて、time_code,modulo_time_baseとVOP_time_increme
ntとの関係を示した図である。
【0219】図37において、VOは、GOVヘッダ、
1(B−VOP),I2(I−VOP)、B3,B4,P5(P
−VOP)....というVOPのシーケンスで構成されて
いる。いま、GOVヘッダのtime_codeが時刻t0 = 0h:
12m:43Sec(0時間12分43秒)を示していたとする
と、modulo_time_baseは、time_codeを基準とする時刻
を、1秒精度で表し、従って、t0+1秒、t0+2秒,
・・・という時刻を、同期点として表す。なお、図37
において、表示順は、B1,I2,B3,B4,P5,・・
・であるが、符号化/復号順は、GOVヘッダ、I2
1,P5,B3,B4,・・・である。
【0220】図37では、(後述する図38、図46、
図47においても同様)、各VOPについてのVOP_time
_incrementを、四角形で囲んだ数字で、modulo_time_ba
seを、四角形とダブルクオーテーション(”)で囲んだ
ビット列で、それぞれ示してあり、さらに、VOP_time_i
ncrement_resolutionを1000としてある。従って、
図37では、B1,I2,B3,B4,P5についてのVOP_time_i
ncrementがそれぞれ350,750,150,550,
350とされており、また、VOP_time_increment_resol
utionが1000であるから、各VOPの表示時刻の1秒以下の
値は、それぞれ350ms(350/1000秒),75
0ms(750/1000秒),150ms(150/10
00秒),550ms(550/1000秒),350ms
(350/1000秒)となる。
【0221】いま、図37において、B1は、GOVヘ
ッダが符号化/復号された後、最初に符号化/復号され
るI−VOPであるI2より前に表示されるB−VOP
であるから、その表示時刻の基準は、GOVヘッダのti
me_codeで示される同期点である時刻t0となる。いま、
1のtime_modulo_baseは、”0”であり、従って、B1
の表示時刻は、GOVヘッダのtime_codeで示された時刻t
0の、0+350/1000秒後の時刻、すなわち0h:12
m:34s+0s:350ms=0h:12m:34s:350msとなる。
【0222】次に、I2は、GOVヘッダが符号化/復
号された後、最初に符号化/復号されるI−VOPであ
るから、その表示時刻の基準は、GOVヘッダのtime_c
odeで示される同期点である時刻t0となる。いま、I2
のtime_modulo_baseは、”0”であり、従って、I2
表示時刻は、GOVヘッダのtime_codeで示された時刻t0
の、0+750/1000秒の時刻 すなわち0h:12m:34s+0s:750
ms=0h:12m:34s:750msとなる。
【0223】次に、B3は、I2の直後に表示されるた
め、その表示時刻の基準は、I2のmodulo_time_baseによ
って示された同期点となる。即ち、I2の表示時刻は、上
述したように、0h:12m:34s:750msであり、modulo_time_
baseは、時刻t0=0h:12m:34Secから0秒後の時刻である
0h:12m:34sを、同期点として示している。そして、B3
のmodulo_time_baseは、"10"であることから、B3の表
示時刻は、I2のmodulo_time_baseによって示される同
期点の、1+150/1000秒後の時刻、すなわち0
h:12m:34s+1s:150ms=0h:12m:35s:150msとなる。B4の表
示時刻も、B3の表示時刻と同様にして求めることがで
き、I2のmodulo_time_baseによって示される同期点の、
1+550/1000秒後の時刻、すなわち0h:12m:34s
+1s:550ms=0h:12m:35s:550msとなる。
【0224】次に、P5については、その前に表示される
3,B4は共にB−VOPであるため、これらのmodulo
_time_baseによって示される同期点は、P5の表示時刻
の計算には用いられず、P5の直前に表示されるI/P
−VOPであるI2のmodulo_time_baseによって示され
る同期点(0h:12m:34Sec)が用いられる。また、図37
では、P5のtime_modulo_baseが、"110"であり、time_i
ncrementは、上述したように350であることから、そ
の表示時刻は、I2のmodulo_time_baseによって示され
る同期点の、2+350/1000秒後の時刻、すなわ
ち0h:12m:34s+2s:350ms=0h:12m:36s:350msとなる。
【0225】次に、図38では、VOが、GOVヘッ
ダ、B1,B2,I3,B4,P5,・・・というVOPの
シーケンスで構成されている。また、GOVヘッダのti
me_codeは、図37における場合と同様に、時刻t0 = 0
h:12m:43Sec(0時間12分43秒)を示している。
【0226】図38において、B1については、modulo_
time_base が”0”と、VOP_time_incrementが350と
なっている。そして、B1は、GOVヘッダが符号化/
復号された後、最初に符号化/復号されるI−VOPで
あるI3より前に表示されるB−VOPであるから、そ
の表示時刻は、GOVヘッダのtime_codeで示される同
期点である時刻t0を基準に計算される。従って、B1
表示時刻は、図37のB1と同様に、0h:12m:34s+0s:350
ms=0h:12m:34s:350msとなる。
【0227】次に、B2は、B1と同様に、GOVヘッダ
が符号化/復号された後、最初に符号化/復号されるI
−VOPであるI3より前に表示されるB−VOPであ
るから、その表示時刻は、やはり、GOVヘッダのtime
_codeで示される同期点である時刻t0を基準に計算され
る。いま、B2のtime_modulo_baseが”0”で、VOP_tim
e_incrementが750となっているから、B2の表示時刻
は、GOVヘッダのtime_codeで示された時刻t0の、0+
750/1000秒後の時刻、すなわち0h:12m:34s+0s:
750ms=0h:12m:34s:750msとなる。
【0228】次に、I3は、GOVの符号化/復号後、
最初に表示されるI−VOPであり、そのmodulo_time_
baseが”01”で、VOP_time_incrementが150であるた
め、その表示時刻は、time_codeによって示された同期
点より1+150/1000秒遅れとなる。従って、I3
の表示時刻は、時刻t0の、0+750/1000秒後
の時刻、すなわち0h:12m:34s+1s:150ms=0h:12m:35s:150
msとなる。
【0229】次に、B4については、その直前に表示さ
れるI/P−VOPであるI3のmodulo_time_baseによ
って示される同期点(I3の表示時刻の秒精度)、即
ち、0h:12m:35sを基準に、その表示時刻が計算される。
いま、B4のmodulo_time_baseは”0”で、VOP_time_in
crementが550であるため、その表示時刻は、0h:12m:35s
+0s:550ms=0h:12m:35s:550msとなる。
【0230】次に、P5については、その直前に表示さ
れるI/P−VOPであるI3のmodulo_time_baseによ
って示される同期点、即ち、B4と同様に、0h:12m:35s
を基準に、その表示時刻が計算される。いま、P5のmod
ulo_time_baseは”10”で、VOP_time_incrementが350
であるため、その表示時刻は、0h:12m:35s+1s:350ms=0
h:12m:36s:350msとなる。
【0231】ここで、以上のように、VM10.0では、表示
時刻の計算に、I/P-VOPのmodulo_time_baseによって示
される同期点(これは、その表示時刻の秒精度に等し
い)は用いられるが、B-VOPのmodulo_time_baseによっ
て示される同期点は用いられない。これは、主として次
のような理由による。即ち、B-VOPは、表示順では、I/P
VOPに挟まれているが、符号化/復号化順では、B-VOPを
挟んでいるI/PVOPが符号化/復号された後に符号化/復
号される。このため、仮に、表示時刻の計算に、B-VOP
のmodulo_time_baseによって示される同期点を用いるこ
ととすると、即ち、B−VOPの表示時刻の秒精度を用
いることとすると、表示順においてB−VOPの直後に
位置するI/P-VOPは、すでに符号化/復号されているの
にもかかわらず、そのB-VOPの符号化/復号が終了する
までは、I/P-VOPの表示時刻を求めることができず、処
理が煩雑になるためである。
【0232】次に、VM10.0では、上述したとおり、GOV
レイヤを採用しており、これにより、効率的なランダム
アクセスを可能としている。即ち、GOVレイヤのtime_co
deにより、GOVの絶対的な開始時刻(但し、秒精度)が
定まり、この開始時刻とtime_modulo_base,VOP_time_in
crementにより、上述したように、そのGOVに含まれ
る各VOPの絶対的な表示時刻が容易に求められる。そし
て、この表示時刻を参照することにより、符号化ビット
ストリームの途中にあるVOPにアクセスすること、すな
わちランダムアクセスすることが可能となる。
【0233】ところで、VM10.0では、「The GOV layer
is an optional layer, so the bitstream can have an
y (include non) number of the GOV header, and the
frequency of the GOV headeris an encoder issue.Sin
ce the GOV header shall be followed by the I-VO
P.」と定義されていることから、GOVレイヤの挿入につ
いては、符号化ビットストリームの中で、GOVヘッダ
の後にI-VOPを配置しなければならないという制限があ
る点を除き、エンコーダ側で、その数と頻度を、自由に
設定することができる。
【0234】即ち、VM10.0では、スケーラビリティを実
現するための階層化を行った場合に、各階層におけるG
OVの挿入位置は、特に規定されていない。従って、例
えば、上位レイヤと下位レイヤとの2階層に階層化した
場合には、上位レイヤまたは下位レイヤそれぞれについ
て、独立に、I-VOPを、ヘッダの後に配置(但し、符号
化ビットストリームの中で)した形のGOVを構成する
ことができる。
【0235】一方、MPEG4では、上位レイヤは、必
ずしもI-VOPを使用しなくてもエンコード/デコードが
可能である。これは、上位レイヤについては、基本的
に、下位レイヤのVOPが参照画像として用いられるか
らであり、MPEG4では、このように、下位レイヤの
VOPを参照画像として用いることで、符号化効率を向
上させている。
【0236】しかしながら、上述したように、GOVを用
いるためには、符号化/復号化順でGOVヘッダの後にI-V
OPを配置しなければならない。そして、I-VOPのデータ
量は、一般に、P-VOPやB-VOPのデータ量より大きいか
ら、I-VOPを使用しなくても問題のない上位レイヤにI-V
OPを使用しなくてはならないことは、符号化効率を低下
させることになる。
【0237】そこで、符号化効率の低下を防止するため
に、VM10.0で規定されている上述の定義は、「The GOV
layer is an optional layer, so the bitstream can h
ave any (include non) number of the GOV header, an
d the frequency of the GOV headeris an encoder iss
ue.Since thr GOV header shall be followed by the I
-VOPin base layer.」と変更し、下位レイヤについての
み、GOVヘッダの後にI-VOPを配置しなければならな
いという制限をつけるべきであり、上位レイヤについて
は、そのような制限をつけるべきではない。
【0238】図1のエンコーダまたは図13のデコーダ
は、上述の変更後の定義にしたがって、それぞれ符号化
または復号が行われるようになされている。
【0239】次に、VM10.0では、下位レイヤと上位レイ
ヤのGOVの時間的な位置関係については、特に制限がな
い。従って、下位レイヤのGOVの最初のVOPまたは最
後のVOPそれぞれと、上位レイヤの最初のVOPまた
は最後のVOPそれぞれとの時間的な位置は、必ずしも
一致しなくてもよいこととなる。
【0240】しかしながら、下位レイヤと上位レイヤと
で、GOVの挿入位置が異なる場合に、その符号化ビット
ストリームにランダムアクセスするときには、上位レイ
ヤのVOPが参照する下位レイヤの復号画像を得るため
に、本来表示されない下位レイヤのVOPを復号しなけ
ればならないケースが生じ、この場合、迅速で、効率的
なランダムアクセスが困難となる。
【0241】即ち、いま、下位レイヤの、表示順で#i
番目のI−VOPまたはP−VOPを、それぞれ、Ibi
またはPbiとそれぞれ表すとともに、上位レイヤの、表
示順で#i番目のP−VOPを、Peiと表し、例えば、
図39に示すように、Ib1,Pb2,Pb3,Pb4,Pb5
b6,Pb7,Pb8,Pb9,Pb10,Ib11,Pb12
b13,・・・で構成される下位レイヤと、Pe1
e2,Pe3,Pe4,Pe5,Pe6,Pe7,Pe8,Pe9,P
e10,Pe11,Pe12,Pe13,・・・で構成される上位レ
イヤとからなる符号化ビットストリームを考える。
【0242】図39において、下位レイヤのIb1
b2,Pb3,Pb4,Pb5,Ib6,Pb7,Pb8,Pb9,P
b10,Ib11,Pb12,Pb13,・・・それぞれと、上位レ
イヤのPe1,Pe2,Pe3,Pe4,Pe5,Pe6,Pe7,P
e8,Pe9,Pe10,Pe11,Pe12,Pe13,・・・それぞ
れとは、同一時刻に表示されるVOPであり、さらに、
上位レイヤのPe1乃至Pe13それぞれは、下位レイヤの
b1乃至Pb13それぞれを参照画像として符号化されて
いる。即ち、空間スケーラビリティが実現されている。
そして、図39では、下位レイヤのIb1乃至Pb5がGO
b1を、Ib6乃至Pb10がGOVb2を、それぞれ構成し
ており、上位レイヤのPe1乃至Pe4がGOVe1を、Pe5
乃至Pe8がGOVe2を、Pe9乃至Pe12がGOVe3を、
それぞれ構成している。即ち、下位レイヤでは、5つの
VOPごとにGOVが構成され、上位レイヤでは、4つ
のVOPごとにGOVが構成されている。
【0243】この場合において、例えば、上位レイヤの
GOVe2の先頭にランダムアクセスするとしたとき、そ
の先頭のPe5は、下位レイヤのGOVb1のPb5の復号画像
を参照画像として用いて復号されるから、Pb5を復号す
る必要がある。しかしながら、Pb5は、下位レイヤのG
OVb1を構成するVOP(最後に表示されるVOP)で
あり、従って、Pb5を復号するには、GOVb1を構成す
るVOPを順次復号する必要がある。そして、P65が復
号されるまでの間は、そのP65を参照画像として用いる
上位レイヤのPe5を復号することができないから、迅速
なランダムアクセスが困難となる。
【0244】このようなことは、時間スケーラビリティ
の場合も、同様に生ずる。
【0245】即ち、いま、図40に示すように、b1
2,b3,b4,b5,・・・で表されるVOPで構成さ
れる下位レイヤと、e1,e2,e3,e4,e5,e6,e
7,e8,・・・で表されるVOPで構成される上位レイ
ヤとからなる符号化ビットストリームを考える。なお、
1,b1,e2,b2,e3,e4,b3,e5,e6,b4
7,e8,b5,・・・が、一連の画像シーケンスを構
成しており、図40では、そのような画像シーケンスか
ら、b1,b2,b3,b4,b5,・・・が抽出されて下
位レイヤが構成され、 e1,e2,e3,e4,e5
6,e7,e8,・・・が抽出されて上位レイヤが構成
されている。
【0246】そして、図40では、下位レイヤのb1
至b3がGOVb1を、b4乃至b6がGOVb2を、それぞ
れ構成しており、上位レイヤのe1乃至e3がGOV
e1を、e4乃至e6がGOVe2を、e7乃至e9がGOVe3
を、それぞれ構成している。即ち、下位レイヤおよび上
位レイヤの両方とも、3つのVOPごとにGOVが構成
されている。なお、e1はb1を、e2およびe3はb
2を,e4およびe5はb3を,e6およびe7はb4を,e8
はb5を、それぞれ参照画像として用いている。
【0247】この場合において、例えば、上位レイヤの
GOVe2の先頭にランダムアクセスするとしたとき、そ
の先頭のe4は、下位レイヤのGOVb1のb3の復号画像
を参照画像として用いて復号されるから、まずは、b3
を復号する必要がある。しかしながら、b3は、下位レ
イヤのGOVb1を構成するVOP(最後に表示されるV
OP)であり、従って、e4を復号するには、GOVb1
を構成するVOPを順次復号する必要がある。そして、
3を復号するまでの間は、ランダムアクセスする目的
である上位レイヤのe4を復号することができないか
ら、やはり、迅速なランダムアクセスが困難となる。
【0248】そこで、下位レイヤのGOVの最初に表示
されるVOPの表示時刻と同時刻またはその直後に表示
される上位レイヤのVOPが、上位レイヤのGOVの最
初に表示されるものとなるように、上位レイヤを、GO
Pに分けるようにする。このようにすることで、上位レ
イヤと下位レイヤとのGOVが1対1に対応することにな
り、迅速なランダムアクセスが妨げられることを防止す
ることができる。
【0249】即ち、例えば、図39に示した場合と同様
に、上位レイヤおよび下位レイヤが構成される場合にお
いて、下位レイヤのPb5が、最初に表示されるVOPと
なるように、下位レイヤのGOVを構成したときには、
図41に示すように、そのPb5の表示時刻と同時刻に表
示される上位レイヤのPe5が最初に表示されるVOPと
なるように、上位レイヤのGOVを構成する。また、例
えば、下位レイヤのPb10が、最初に表示されるVOP
となるように、下位レイヤのGOVを構成したときに
も、図41に示すように、そのPb10の表示時刻と同時
刻に表示される上位レイヤのPe10が最初に表示される
ものとなるように、上位レイヤのGOVを構成する。
【0250】さらに、例えば、図40に示した場合と同
様に、上位レイヤおよび下位レイヤが構成される場合に
おいて、下位レイヤのb2が、最初に表示されるVOP
となるように、下位レイヤのGOVを構成したときに
は、図42に示すように、そのb2の表示時刻の直後に
表示される上位レイヤのe3が最初に表示されるVOP
となるように、上位レイヤのGOVを構成する。また、
例えば、下位レイヤのbが、最初に表示されるVOP
となるように、下位レイヤのGOVを構成したときに
は、図42に示すように、そのbの表示時刻の直後に
表示される上位レイヤのe7が最初に表示されるVOP
となるように、上位レイヤのGOVを構成する。
【0251】なお、GOVについては、GOVヘッダが各GOV
毎に符号化されるが、そのエンコード結果は、GOVの中
で最初に符号化/復号されるVOPの直前に配置される。
そして、GOVヘッダのtime_codeとしては、GOVの中で最
初に表示されるVOPの表示時刻が秒精度でエンコードさ
れる。
【0252】従って、図41において、例えば、Pb5
最初に表示される下位レイヤのGOVのGOVヘッダに配
置されるtime_codeは、そのPb5の表示時刻の秒精度と
なり、Pe5が最初に表示される上位レイヤのGOVのGO
Vヘッダに配置されるtime_codeは、Pe5の表示時刻の秒
精度となる。そして、図41では、Pb5とPe5の表示時
刻は同一であり、よって、Pb5が最初に表示される下位
レイヤのGOVのGOVヘッダに配置されるtime_codeと、
e5が最初に表示される上位レイヤのGOVのGOVヘッ
ダに配置されるtime_codeも同一の値となる。
【0253】また、図42において、例えば、b2が最
初に表示される下位レイヤのGOVのGOVヘッダに配置
されるtime_codeは、b2の表示時刻の秒精度となり、e
3が最初に表示される上位レイヤのGOVのGOVヘッダに
配置されるtime_codeは、e3の表示時刻の秒精度とな
る。
【0254】次に、下位レイヤのGOVを構成する処理
(GOVヘッダの挿入処理)は、図9に示した下位レイ
ヤ符号化部25のVLC器36(以下、適宜、下位VL
C器36という)において、また、下位レイヤのGOV
の最初に表示されるVOPの表示時刻と同時刻またはそ
の直後に表示される上位レイヤのVOPが、上位レイヤ
のGOVの最初に表示されるものとなるように、上位レ
イヤのGOPを構成する処理は、図10に示した上位レ
イヤ符号化部23のVLC器36(以下、適宜、上位V
LC器36という)において、それぞれ行われるように
なされている。
【0255】そこで、図43または図44のフローチャ
ートを参照して、下位VLC器36または上位VLC器
36が行うGOVの構成処理について説明する。
【0256】まず、図43のフローチャートを参照し
て、下位VLC器36によるGOVの構成処理について
説明する。
【0257】下位VLC器36では、まず最初に、ステ
ップS1において、いま処理の対象となっている下位レ
イヤのVOPのデータが、GOVの中で最初にエンコー
ドされたものであるかどうかが判定され、最初にエンコ
ードされたものでないと判定された場合、次の下位レイ
ヤのVOPのデータが供給されるのを待って、ステップ
S1に戻る。また、ステップS1において、処理の対象
となっている下位レイヤのVOPのデータが、GOVの
中で最初にエンコードされたものであると判定された場
合、ステップS2に進み、その最初にエンコードされた
VOPのデータの前に、GOVヘッダが挿入され、ステ
ップS3に進む。ステップS3では、下位レイヤにGO
Vヘッダを挿入した旨のGOVヘッダ挿入信号が、その
下位レイヤのGOVの中で最初に表示されるVOPの表
示時刻とともに、上位VLC器36に出力され、次の下
位レイヤのVOPのデータが供給されるのを待って、ス
テップS1に戻る。
【0258】次に、図44のフローチャートを参照し
て、上位VLC器によるGOVの構成処理について説明
する。
【0259】上位VLC器36では、まず最初に、ステ
ップS11において、下位VLC器36から、GOVヘ
ッダ挿入信号が送信されてきたかどうかが判定され、送
信されてきていないと判定された場合、ステップS11
に戻る。また、ステップS11において、GOVヘッダ
挿入信号が送信されてきたと判定された場合、ステップ
S12に進み、そのGOVヘッダ挿入信号とともに送信
されてくる、下位レイヤのGOVの中で最初に表示され
るVOPの表示時刻が認識される。さらに、ステップS
12において、その表示時刻と同時刻またはその直後に
表示される上位レイヤのVOPが、上位レイヤのGOP
の最初に表示されるものとなるように、GOVヘッダ
が、符号化ビットストリームに挿入され、ステップS1
1に戻る。
【0260】なお、図13のデコーダでは、ランダムア
クセスが指令された場合、符号化ビットストリームの中
のGOVヘッダに配置されたtime_code、並びにVOP
ヘッダに配置されたmodulo_time_baseおよびVOP_time_i
ncrementを用いて、上述したように、ランダムアクセス
すべきVOPの表示時刻が求められ、その表示時刻に基
づき、ランダムアクセスが行われる。
【0261】次に、MPEG4では、下位レイヤおよび
上位レイヤを構成するVOPのピクチャタイプのシーケ
ンス(ピクチャストラクチャ)については、特に規定さ
れていない。
【0262】そこで、図1のエンコーダでは、例えば、
符号化対象の画像を構成するオブジェクトのシーケンス
を、空間スケーラビリティを実現するための、例えば、
下位レイヤと上位レイヤなどの2以上の階層に階層化し
た場合には、上位レイヤのVOPを、その表示順序と同
一の順序で符号化するようになされている。
【0263】即ち、図45は、空間スケーラブル符号化
における上位レイヤと下位レイヤのピクチャストラクチ
ャを示している。なお、図45においては、下位レイヤ
の、表示順で#i番目のI−VOP,P−VOP、また
はB−VOPを、それぞれ、Ibi,Pbi、またはBbi
それぞれ表し、上位レイヤの、表示順で#i番目のP−
VOPまたはB−VOPを、それぞれ、PeiまたはBei
とそれぞれ表してある。
【0264】図45では、I−VOPである下位レイヤ
のIb3が、最初に符号化/復号される。その後、この下
位レイヤのIb3を参照画像として用い、下位レイヤの最
初に表示されるBb1が符号化/復号される。空間スケー
ラブル符号化の上位レイヤのVOPは、基本的に、同時
刻に表示される下位レイヤのVOPが参照画像として用
いられるため、下位レイヤのBb1の符号化/復号後は、
それを参照画像として用いる上位レイヤのBe1が符号化
/復号される。続いて、下位レイヤの2番目に表示され
るBb2が、既に符号化/復号されている下位レイヤのI
b3を参照画像として符号化/復号され、その同時刻に表
示される上位レイヤであるBe2が、下位レイヤのBb2と、
上位レイヤのBe1を参照画像として符号化/復号され
る。
【0265】そして、上位レイヤのPe3が、下位レイヤ
のIb3を参照画像として用いて符号化/復号される。そ
の後、下位レイヤBb4の符号化/復号のための参照画像
となる下位レイヤのPb6が符号化/復号され、その下位
レイヤのPb6と、同じく下位レイヤのIb3を参照画像と
して用いて、下位レイヤのBb4が符号化/復号される。
そして、その下位レイヤのBb4と、上位レイヤのPe3
参照画像として用いて、上位レイヤのBe4が符号化/復
号される。
【0266】その後、下位レイヤのBb5が、下位レイヤ
のIb3およびPb6を参照画像として符号化/復号され、
その下位レイヤのBb5と、上位レイヤのBe4を参照画像
として、上位レイヤのBe5が符号化/復号される。そし
て、下位レイヤのPb6は、既に符号化/復号されている
ので、その下位レイヤのPb6と、上位レイヤのBe5を参
照画像として、上位レイヤのBe6が符号化/復号され
る。
【0267】その後、下位レイヤのBb7の参照画像とし
て用いられる下位レイヤのPb9が符号化/復号され、そ
の下位レイヤのPb9と、同じく下位レイヤのPb6を参照
画像として、下位レイヤのBb7が符号化/復号される。
続いて、その下位レイヤのBb7と、上位レイヤのBe6
参照画像として、上位レイヤのBe7が符号化/復号さ
れ、既に符号化/復号されている下位レイヤのPb6およ
びPb9を参照画像として、下位レイヤのBb8が符号化/
復号される。そして、その下位レイヤのBb8と、上位レ
イヤのBe7を参照画像として、上位レイヤのBe8が符号
化/復号され、その上位レイヤのBe8と、下位レイヤの
b9を参照画像として、上位レイヤのBe9が符号化/
復号される。
【0268】従って、下位レイヤに注目すれば、
b1,Bb2,Ib3,Bb4,Bb5,Pb6,Bb7,Bb8
b9の順で表示されるVOPが、Ib3,Bb1,Bb2,P
b6,Bb4,Bb5,Pb9,Bb7,Bb8の順で符号化/復号
されていく。
【0269】一方、上位レイヤに注目した場合には、B
e1,Be2,Pe3,Be4,Be5,Be6,Be7,Be8,Be9
の順で表示されるVOPが、やはり、Be1,Be2
e3,Be4,Be5,Be6,Be7,Be8,Be9の順で符号
化/復号されていく。即ち、上位レイヤのVOPは、そ
の表示順序と同一の順序で符号化/復号される。
【0270】このように、上位レイヤのVOPを、その
表示順序と同一の順序で符号化/復号するようにした場
合には、表示順序と異なる順序で符号化/復号を行う場
合に比較して、処理の容易化を図ることができる。
【0271】ここで、空間スケーラブル符号化を行う場
合でも、図1のエンコーダ/図13のデコーダには、図
45に示したピクチャストラクチャと異なるピクチャス
トラクチャを対象に、符号化/復号を行わせることが可
能である。即ち、図1のエンコーダ/図13のデコーダ
に符号化/復号を行わせるピクチャストラクチャは、図
45に示したものに限定されるものではない。同様に、
参照関係や符号化/復号順序も、図45に示したものに
限定されるものではない。
【0272】なお、図45に示した参照関係は、MPE
G4のref_select_codeで規定される参照関係を満たす
ものである。また、空間スケーラブル符号化を行う場合
に、上位レイヤのVOPを、その表示順序と同一の順序
で符号化/復号する手法は、GOVの有無にかかわらず
適用可能である。
【0273】ところで、図45に示したピクチャストラ
クチャにおいては、上位レイヤの3番目に表示されるP
e3の後に表示されるVOPは、すべてB−VOPになっ
ている。
【0274】一方、VOPの表示時刻は、VOPヘッダのmodu
lo_time_base,VOP_time_incrementに基づき、GOVヘッ
ダのtime_code、または直前に表示されるI/P-VOPのmodu
lo_time_baseによって示される同期点を基準として求め
られる(但し、直前に表示されたI/P-VOPのmodulo_time
_baseによって示される同期点、即ち、直前に表示され
たI/P-VOPの秒精度の表示時刻も、元をたどれば、GOVヘ
ッダのtime_codeによって示される同期点を基準として
求められるから、すべてのVOPの表示時刻は、結局は、G
OVヘッダのtime_codeによって示される同期点を基準と
して求められるということができる)。
【0275】従って、図45の下位レイヤについては、
Bb1,Bb2,Ib3の表示時刻は、GOVヘッダのtime_code
を、Bb4,Bb5,Pb6の表示時刻は、その直前に表示され
るIb3の秒精度の表示時刻を、Bb7,Bb8,Pb9の表示時刻
は、その直前に表示されるPb6の秒精度の表示時刻を、
それぞれ用いて計算される。
【0276】一方、図45の上位レイヤについては、B
e1,Be2,Pe3の表示時刻は、GOVヘッダのtime_codeを用い
て計算される。そして、Pe3の後に表示されるVOPは、
上述したように、すべてB−VOPであるから、そのB
−VOPの表示時刻は、直前に表示されるPe3の秒精度
の表示時刻を用いて計算される。その結果、Pe3の後に
表示されるB-VOPのmodulo_time_baseのビット数が増大
し、符号化効率が劣化することになる。
【0277】即ち、注目している注目VOPのmodulo_time
_baseは、最下位ビットに0を配置し、その上位ビット
に、直前に表示されるI/P-VOPの表示時刻の秒精度と、
注目VOPの表示時刻の秒精度との差分と同一の数の1を
配置して構成される。従って、modulo_time_baseは、I/
P-VOPがあると、その後に、いわば”0”にリセットさ
れ、これにより、そのビット数の増大の防止が図られて
いる。
【0278】しかしながら、図45に示した上位レイヤ
については、Pe3の後に表示されるVOPは、すべてB−
VOPであるから、modulo_time_baseのリセットが行わ
れず、そのビット数が増大することになる。
【0279】具体的には、図46に示すように、下位レ
イヤについては、Ib3,Pb6,Pb6それぞれの後におい
て、modulo_time_baseは、”0”にリセットされる。そ
して、Ib3の後のBb4、Pb6の後のBb7、またはPb6
後のBb10については、Ib3,Pb6,Pb6から、Bb4
b7,Bb10までのそれぞれの表示間隔の秒精度に対応
した数の”1”が、”0”にリセットされたmodulo_tim
e_baseの上位ビットに付される(図46では、Ib3,P
b6,Pb6から、Bb4,Bb7,Bb10までのそれぞれの表
示間隔は、いずれも1秒未満であるため、それぞれのmo
dulo_time_baseは、”0”の上位ビットとして0個の”
1”が付された”0”となっている)。
【0280】これに対して、上位レイヤについては、P
e3の後において、modulo_time_baseが”0”にリセット
された後は、Pe3の秒精度の表示時刻を基準とした秒精
度の表示時刻が、1秒増加するごとに、VOPに付されるm
odulo_time_baseも、1ビットずつ増加していく。その
結果、図46に示すように、Pe3の後においてmodulo_t
ime_baseが”0”にリセットされた後、その後に表示さ
れるBe4,Be5,Be6,Be7,Be8,Be9,Be10のmod
ulo_time_baseは、それぞれ"0","10","10","110","11
0","1110","1110"となり、そのビット数が増大してい
く。
【0281】そこで、例えば、図45に示したように、
空間スケーラブル符号化において、上位レイヤの符号化
/復号が表示順序と同一順序で行われる場合には、上位
レイヤのB-VOPの後においても、modulo_time_baseを”
0”にリセットし、そのB-VOPと、次に表示されるVOPと
の秒精度の表示時刻の差分と同一の数の”1”を、”
0”の上位ビットとして付加して、次に表示されるVOP
のmodulo_time_baseを構成するようにする。この場合、
上位レイヤのVOPの表示時刻は、そのVOPの直前に表示さ
れるVOP(I,P,BのいずれのVOPであっても良い)の
秒精度の表示時刻を基準にして計算されることになる。
なお、注目VOPの前に表示されるVOPが存在しない場合、
即ち、注目VOPが、GOVにおいて、最初に表示されるV
OPである場合には、その直線に表示されるVOPは存在し
ないため、この最初に表示されるVOPについては、例え
ば、time_codeを基準として、modulo_time_baseの構
成、および表示時刻の計算を行うこととする。
【0282】図47は、modulo_time_baseの構成方法お
よびVOPの表示時刻の計算方法を、上述のように変更し
た場合における、図45に示したピクチャストラクチャ
のmodulo_time_baseを示している。
【0283】この場合、上位レイヤの最初に表示される
Be1については、その表示時刻の秒精度(図47では、0
h:12m:34s)と、time_code(図47では、0h:12m:34s)
との差分が0となるから、そのmodulo_time_baseは、”
0”に、0個の”1”を付加した”0”となる。Be2
ついても、その表示時刻の秒精度(図47では、0h:12
m:34s)と、その直前に表示されるBe1の表示時刻の秒
精度(図47では、0h:12m:34s)との差分が0となるか
ら、そのmodulo_time_baseは、”0”に、0個の”1”
を付加した”0”となる。Pe3については、その表示時
刻の秒精度(図47では、0h:12m:35s)と、その直前に
表示されるBe2の表示時刻の秒精度(図47では、0h:1
2m:34s)との差分が1となるから、そのmodulo_time_ba
seは、”0”に、1個の”1”を付加した”10”とな
る。Be4については、その表示時刻の秒精度(図47で
は、0h:12m:35s)と、その直前に表示されるPe3の表示
時刻の秒精度(図47では、0h:12m:35s)との差分が0
となるから、そのmodulo_time_baseは、”0”に、0個
の”1”を付加した”0”となる。即ち、Be4の表示時
刻の秒精度と、その直前に表示されるPe3の表示時刻の
秒精度との差分が1秒に満たないため、いわば、Be4
おいて、modulo_time_baseはリセットされる。
【0284】Be5については、その表示時刻の秒精度
(図47では、0h:12m:36s)と、その直前に表示される
e4の表示時刻の秒精度(図47では、0h:12m:35s)と
の差分が1となるから、そのmodulo_time_baseは、”
0”に、1個の”1”を付加した”0”となる。Be6
ついては、その表示時刻の秒精度(図47では、0h:12
m:36s)と、その直前に表示されるBe5の表示時刻の秒
精度(図47では、0h:12m:36s)との差分が0となるか
ら、そのmodulo_time_baseは、Be4における場合と同様
に、”0”にリセットされる。
【0285】以下、同様にして、Be7,Be8,Be9,Be10のmo
dulo_time_baseは、図47に示すように、それぞれ、"1
0","0","10","0"となる。
【0286】次に、modulo_time_baseを設定する処理
(modulo_time_base設定処理)は、下位レイヤまたは上
位レイヤそれぞれについて、図9に示した下位レイヤ符
号化部25のVLC器36(下位VLC器36)、また
は図10に示した上位レイヤ符号化部23のVLC器3
6(上位VLC器36)において、それぞれ行われるよ
うになされている。
【0287】そこで、図48のフローチャートを参照し
て、上位VLC器36が行うmodulo_time_base設定処理
について説明する。
【0288】上位VLC器36では、いま処理の対象と
なっているVOPを注目VOPとして、ステップS21におい
て、その注目VOPと、直前に表示されるVOPとの秒精度の
表示時刻の差分Dが求められ、ステップS22に進み、
Dが0に等しいかどうかが判定される。ステップS22
において、Dが0に等しいと判定された場合、ステップ
S23に進み、modulo_time_baseが”0”にリセットさ
れ、ステップS28に進む。ステップS28では、”
0”にリセットされたmodulo_time_baseが、注目VOPに
設定され、次の処理対象となるVOPが供給されるのを待
って、ステップS21に戻る。
【0289】一方、ステップS22において、Dが0に
等しくないと判定された場合、ステップS24に進み、
modulo_time_baseが”0”にリセットされる。そして、
ステップS25において、modulo_time_baseの最上位ビ
ットとして、”1”が追加され、ステップS26に進
む。ステップS26では、Dが1だけデクリメントさ
れ、ステップS27に進み、Dが0に等しいかどうかが
判定される。ステップS27において、Dが0に等しく
ないと判定された場合、ステップS25に戻り、以下、
ステップS27でDが0に等しいと判定されるまで、ス
テップS25乃至S27の処理が繰り返される。
【0290】そして、ステップS27において、Dが0
に等しいと判定された場合、即ち、注目VOPと、直前に
表示されるVOPとの秒精度の表示時刻の差分と同一の数
の”1”が、”0”に付加されたmodulo_time_baseが構
成された場合、ステップS28に進み、そのmodulo_tim
e_baseが、注目VOPに設定され、次の処理対象となるVOP
が供給されるのを待って、ステップS21に戻る。
【0291】なお、下位VLC器36では、図48のス
テップS21において、注目VOPと、直前に表示されるV
OP(I/P/B-VOP)との秒精度の表示時刻の差分ではな
く、注目VOPと、直前に表示されるI/P-VOPとの秒精度の
表示時刻の差分Dが求められることを除けば、上位VL
C器36と同様のmodulo_time_base設定処理が行われ
る。
【0292】また、図13のデコーダでは、下位レイヤ
のVOPの表示時刻は、その直前に表示されるI/P-VOPの秒
精度の表示時刻(またはtime_code)を基準として求め
られるが、上位レイヤのVOPの表示時刻は、その直前に
表示されるVOP(I,P,Bを問わない)の秒精度の表
示時刻(またはtime_code)を基準として求められる。
【0293】ところで、図45に示した場合において
は、上位レイヤのBe1の符号化/復号は、同時刻に表示
される下位レイヤのBb1のみを参照画像として行われ
る。
【0294】上位レイヤのBe1は、B-VOPであるが、B-V
OPは、通常、I/P-VOPよりも発生ビット量が少なくなる
ように符号化されるため、Be1の復号画像の画質は劣化
する可能性が高い。さらに、Be1の復号画像の画質が劣
化する場合には、そのBe1を参照画像として用いるBe2
復号画像の画質も劣化する可能性が高い。即ち、図45
に示した場合では、上位レイヤにおいて、P-VOPである
e3が表示される前に表示されるB-VOPの画質は劣化す
る可能性が高い。
【0295】そこで、そのような画質の劣化を防止(低
減)するために、例えば、図45に示した、空間スケー
ラビリティを実現するピクチャストラクチャについて
は、その符号化/復号順序と参照関係を、例えば、図4
9に示すようにすることができる。
【0296】即ち、図49では、下位レイヤのI-VOPを
符号化/復号した場合には、上位レイヤにおいて、下位
レイヤのI-VOPの表示時刻と同時刻に表示されるP-VOP
が、下位レイヤのI-VOPの直後に符号化/復号される。
【0297】従って、図49に示した場合においては、
まず最初に、下位レイヤの最初に表示されるI-VOPであ
るIb3が符号化/復号される。そして、下位レイヤのIb3
と同時刻に表示される上位レイヤのP-VOPであるPe3が、
直前に符号化/復号されたIb3を参照画像として用いて
符号化/復号される。
【0298】その後、さらに、下位レイヤのIb3を参照
画像として用いて、下位レイヤのBb1が符号化/復号さ
れる。次に、上位レイヤのBe1が符号化/復号される
が、この上位レイヤのBe1の符号化/復号には、下位レ
イヤのBb1だけでなく、上位レイヤのPe1も、参照画像と
して用いられる。これは、MPEG4では、空間スケーラブ
ル符号化におけるB-VOPについては、前方予測(forward
prediction)につき、「most recent decoded enhance
ment VOP of the same layer」を参照画像として用いる
ことが定められているためであり、図49における場
合、「most recent decoded enhancement VOP of the s
ame layer」は、Pe3であるからである。
【0299】上位レイヤのBe1の符号化/復号後は、下
位レイヤのBb2が、同じく下位レイヤのIb3を参照画像
として符号化/復号され、その後、上位レイヤのBe1
よび下位レイヤのBb2を参照画像として用いて、上位レ
イヤのBe2が符号化/復号される。続いて、下位レイヤ
のPb6が符号化/復号化され、以下、図45における場
合と同様にして、下位レイヤのBb4、上位レイヤのBe4
下位レイヤのBb5、上位レイヤのBe5、下位レイヤの
Pb9、下位レイヤのBb7、上位レイヤのBe7、下位レイヤ
のBb8、上位レイヤのBe8,Be9の順で符号化/復号され
る。
【0300】以上のように、下位レイヤのI-VOPを符号
化/復号した場合には、上位レイヤにおいて、下位レイ
ヤのI-VOPの表示時刻と同時刻に表示されるP-VOPを、下
位レイヤのI-VOPの直後に符号化/復号するようにする
ことで、上位レイヤにおいては、そのP-VOPを参照画像
として、最初に表示されるB-VOPが符号化/復号される
ことになるので(図49では、Pe3を参照画像として、
e1が符号化/復号されることになるので)、上位レイ
ヤにおいて、P-VOPの前に表示されるB-VOPの画質の劣化
を防止することが可能となる。
【0301】ここで、図1のエンコーダ/図13のデコ
ーダには、図49に示した参照関係や符号化/復号順序
以外の参照関係や符号化/復号順序に基づいて、符号化
/復号を行わせることが可能である。即ち、参照関係や
符号化/復号順序は、図49に示したものに限定される
ものではない。
【0302】なお、図49に示した参照関係は、MPE
G4のref_select_codeで規定される参照関係を満たす
ものである。また、空間スケーラブル符号化を行う場合
に、図49に示した順序で符号化/復号を行う手法は、
GOVの有無にかかわらず適用可能である。
【0303】さらに、図49に示した参照関係にしたが
って符号化/復号を行う場合には、その符号化/復号順
序は、上述した場合と異なる順序とすることが可能であ
る。即ち、例えば、下位レイヤのすべてのVOPを符号化
/復号した後に、上位レイヤのVOPの符号化/復号を行
うようにすることなどが可能である。但し、図49で
は、上位レイヤのVOPの符号化/復号のための参照画像
として、下位レイヤのVOPを用いているため、この場
合、上位レイヤのVOPの符号化/復号のための参照画像
として用いる下位レイヤのVOPを、その上位レイヤのVOP
の符号化/復号が終了するまで、長時間、保持すること
が必要となることがある。そのような長時間の保持を避
けるためには、図49で説明したような符号化/復号順
序を採用するのが望ましい。なお、このことは、図45
に示した場合についても、同様である。
【0304】次に、本実施の形態では、迅速で、効率的
なランダムアクセスが妨げられることを防止するため
に、図39乃至図42で説明したように、下位レイヤの
GOVの最初に表示されるVOPの表示時刻と同時刻ま
たはその直後に表示される上位レイヤのVOPが、上位
レイヤのGOVの最初に表示されるものとなるように、
上位レイヤを、GOVに分けるようにした。
【0305】しかしながら、GOVヘッダのtime_codeに
は、GOVの中で最初に表示されるVOPの表示時刻を秒精度
で設定するようにしたため、下位レイヤのGOVの最初
に表示されるVOPの表示時刻の直後に表示される上位
レイヤのVOPが、上位レイヤのGOVの最初に表示さ
れるものとなるように、上位レイヤのGOVを構成した
場合には、下位レイヤのGOVのtime_codeに設定され
る値(秒精度先頭表示時刻)と、その下位レイヤのGO
Vに対応する上位レイヤのGOVのtime_codeに設定さ
れる値とが一致しないことがある。
【0306】即ち、図50は、時間的スケーラブル符号
化を行う場合の、下位レイヤおよび上位レイヤの構成例
を示している。
【0307】いま、図50において、下位レイヤのBb2
を、最初に表示されるVOPとして、GOVを構成した場
合、上位レイヤについては、下位レイヤのGOVの最初
に表示されるBb2の表示時刻の直後に表示される上位レ
イヤのVOPであるBe3が最初に表示されるVOPとなる
ように、上位レイヤのGOPが構成される。この場合、
下位レイヤで構成されるGOVのGOVヘッダのtime_code
には、そのGOVの中で最初に表示されるBb2の表示時刻が
秒精度で設定される。同様に、上位レイヤで構成される
GOVのGOVヘッダのtime_codeには、そのGOVの中で最
初に表示されるBe3の表示時刻が秒精度で設定される。
【0308】即ち、図50では、Bb2の表示時刻は、01
h:12m:33sから01h:12m:34sの間の時刻であり、Be3の表
示時刻は、01h:12m:34sから01h:12m:35sの間の時刻であ
るから、下位レイヤで構成されるGOVのGOVヘッダのt
ime_codeには、01h:12m:33sが設定され、上位レイヤで
構成されるGOVのGOVヘッダのtime_codeには、01h:12
m:34sが設定される。従って、下位レイヤのGOVのtim
e_codeに設定される値と、その下位レイヤのGOVに対
応する上位レイヤのGOVのtime_codeに設定される値
とは一致しない。
【0309】そして、このように、下位レイヤのGOV
のtime_codeに設定される値と、その下位レイヤのGO
Vに対応する上位レイヤのGOVのtime_codeに設定さ
れる値とが一致しない場合には、符号化ビットストリー
ムにランダムアクセスする際に、下位レイヤと上位レイ
ヤとにおいて、異なる秒精度の時刻(time_codeによっ
て示される同期点)を基準に、VOPの表示時刻を計算し
なければならないことになる。
【0310】そこで、上位レイヤのGOVのtime_code
には、その上位レイヤに対応する下位レイヤのGOVの
time_codeに設定される値と同一の値を設定するように
することができる。
【0311】即ち、図51は、図50における場合と同
様の時間的スケーラブル符号化を行う場合の、下位レイ
ヤおよび上位レイヤの構成例を示している。
【0312】いま、図51において、図50における場
合と同様に、下位レイヤのBb2を、最初に表示されるVO
Pとして、GOVを構成した場合、上位レイヤについて
は、下位レイヤのGOVの最初に表示されるBb2の表示
時刻の直後に表示される上位レイヤのVOPであるBe3
が最初に表示されるVOPとなるように、上位レイヤのG
OPが構成される。
【0313】そして、この場合、下位レイヤで構成され
るGOVのGOVヘッダのtime_codeには、図50における
場合と同様に、そのGOVの中で最初に表示されるBb2の表
示時刻を秒精度で設定する。従って、下位レイヤで構成
されるGOVのGOVヘッダのtime_codeには、01h:12m:33
sが設定される。
【0314】一方、上位レイヤで構成されるGOVのGO
Vヘッダのtime_codeには、その上位レイヤのGOVに対
応する下位レイヤのGOVのtime_codeに設定される値
と同一の値を設定する。従って、下位レイヤで構成され
るGOVのGOVヘッダのtime_codeにも、01h:12m:33sが
設定される。
【0315】この場合、符号化ビットストリームにラン
ダムアクセスする際に、下位レイヤと上位レイヤとにお
いて、異なる秒精度の時刻(time_codeによって示され
る同期点)を基準に、VOPの表示時刻を計算しなければ
ならなくなることを防止することができる。即ち、下位
レイヤと上位レイヤとにおいて、常に、同一の秒精度の
時刻(time_codeによって示される同期点)を基準に、V
OPの表示時刻を計算することが可能となる。
【0316】なお、上位レイヤで構成されるGOVのGO
Vヘッダのtime_codeに、その上位レイヤのGOVに対応
する下位レイヤのGOVのtime_codeに設定される値と
同一の値を設定する場合も、上位レイヤで構成されるG
OVのGOVヘッダのtime_codeに、そのGOVの中で最初に
表示されるVOPの表示時刻を秒精度で設定する場合と同
様にして、図1のエンコーダでは、modulo_time_baseお
よびVOP_time_incrementを求めることができ、また、図
13のデコーダでは、そのmodulo_time_baseおよびVOP_
time_increment、並びにtime_codeを用いて、VOPの表示
時刻を求めることができる。
【0317】次に、以上説明したエンコーダおよびデコ
ーダは、それ専用のハードウェアによって実現すること
もできるし、コンピュータに、上述したような処理を行
わせるためのプログラムを実行させることによっても実
現することができる。
【0318】即ち、図52は、図1のエンコーダまたは
図13のデコーダとして機能するコンピュータの一実施
の形態の構成例を示している。
【0319】ROM(Read Only Memory)201は、例
えば、ブートプログラムなどを記憶している。CPU
(Central Processing Unit)202は、例えば、HD
(HardDisk)206に記憶されたプログラムを、RAM
(Read Only Memory)203上に展開して実行すること
で、各種の処理を行うようになされている。RAM20
3は、CPU202が実行するプログラムや、CPU2
02の処理上必要なデータを一時記憶するようになされ
ている。入力部204は、例えば、キーボードやマウス
などでなり、必要なコマンドやデータを入力するときな
どに操作される。出力部205は、例えば、ディスプレ
イなどでなり、CPU202の制御にしたがったデータ
を表示する。HD206は、CPU202が実行すべき
プログラム、さらには、エンコード対象の画像データ
や、エンコード後のデータ(符号化ビットストリー
ム)、デコード後の画像データなどを記憶するようにな
されている。通信I/F(Interface)207は、外部
との通信を制御することにより、例えば、エンコード対
象の画像データを、外部から受信したり、また、エンコ
ード後の符号化ビットストリームを外部に送信したりす
るようになされている。また、通信I/F207は、外
部でエンコードされた符号化ビットストリームを受信し
たり、また、デコード後の画像データを、外部に送信す
るようにもなされている。
【0320】以上のように構成されるコンピュータのC
PU202に、上述したような処理を行うためのプログ
ラムを実行させることにより、このコンピュータは、図
1に示したエンコーダや、図13に示したデコーダとし
て機能することになる。
【0321】なお、本発明の適用範囲は、MPEG4に
準拠した範囲に限られるものではない。
【0322】
【発明の効果】請求項1に記載の画像符号化装置および
請求項7に記載の画像符号化方法によれば、画像を構成
するオブジェクトのシーケンスが2以上の階層に階層化
され、オブジェクトのシーケンスの第1の階層が、複数
のグループに分けて符号化されるとともに、第1の階層
のグループの最初に表示されるオブジェクトの表示時刻
と同時刻またはその直後に表示される第2の階層のオブ
ジェクトが、グループの最初に表示されるオブジェクト
となるように、オブジェクトのシーケンスの第2の階層
が、複数のグループに分けて符号化される。従って、効
率的かつ迅速なランダムアクセスが可能となる。
【0323】請求項8に記載の画像復号装置および請求
項14に記載の画像復号方法によれば、画像を構成する
オブジェクトのシーケンスを2以上の階層に階層化し、
オブジェクトのシーケンスの第1の階層を、複数のグル
ープに分けて符号化するとともに、第1の階層のグルー
プの最初に表示されるオブジェクトの表示時刻と同時刻
またはその直後に表示される第2の階層のオブジェクト
が、グループの最初に表示されるオブジェクトとなるよ
うに、オブジェクトのシーケンスの第2の階層を、複数
のグループに分けて符号化することにより得られる符号
化ビットストリームが復号される。従って、効率的かつ
迅速なランダムアクセスが可能となる。
【0324】請求項15に記載の提供媒体によれば、画
像を構成するオブジェクトのシーケンスを2以上の階層
に階層化し、オブジェクトのシーケンスの第1の階層
を、複数のグループに分けて符号化するとともに、第1
の階層のグループの最初に表示されるオブジェクトの表
示時刻と同時刻またはその直後に表示される第2の階層
のオブジェクトが、グループの最初に表示されるオブジ
ェクトとなるように、オブジェクトのシーケンスの第2
の階層を、複数のグループに分けて符号化することをに
より得られる符号化ビットストリームが提供される。従
って、その符号化ビットストリームに対しては、効率的
かつ迅速にランダムアクセスすることができる。
【0325】請求項21に記載の画像符号化装置および
請求項22に記載の画像符号化方法によれば、画像を構
成するオブジェクトのシーケンスが2以上の階層に階層
化され、オブジェクトのシーケンスの第1または第2の
階層が、1以上のグループに分けてそれぞれ符号化され
る。さらに、第1または第2の階層のグループに、その
最初に表示されるオブジェクトの表示時刻を秒精度で表
す秒精度先頭表示時刻がそれぞれ含められ、第1または
第2の階層のオブジェクトそれぞれに、秒精度先頭表示
時刻を基準とする、そのオブジェクトの表示時刻の秒精
度を表す秒精度相対時刻情報が付加される。そして、こ
の場合に、第2の階層の、表示順で隣接するオブジェク
トどうしの表示時刻の差に基づいて、第2の階層のオブ
ジェクトについての秒精度相対時刻情報がリセットされ
る。従って、符号化効率の劣化を防止することが可能と
なる。
【0326】請求項23に記載の画像復号装置および請
求項24に記載の画像復号方法によれば、画像を構成す
るオブジェクトのシーケンスを2以上の階層に階層化
し、オブジェクトのシーケンスの第1または第2の階層
を、1以上のグループに分けてそれぞれ符号化し、第1
または第2の階層のグループに、その最初に表示される
オブジェクトの表示時刻を秒精度で表す秒精度先頭表示
時刻をそれぞれ含め、第1または第2の階層のオブジェ
クトそれぞれに、秒精度先頭表示時刻を基準とする、そ
のオブジェクトの表示時刻の秒精度を表す秒精度相対時
刻情報を付加することにより得られる符号化ビットスト
リームであって、第2の階層の、表示順で隣接するオブ
ジェクトどうしの表示時刻の差に基づいて、第2の階層
のオブジェクトについての秒精度相対時刻情報がリセッ
トされているものが復号される。従って、符号化効率の
劣化を防止された符号化ビットストリームを復号するこ
とができる。
【0327】請求項25に記載の提供媒体によれば、画
像を構成するオブジェクトのシーケンスを2以上の階層
に階層化し、オブジェクトのシーケンスの第1または第
2の階層を、1以上のグループに分けてそれぞれ符号化
し、第1または第2の階層のグループに、その最初に表
示されるオブジェクトの表示時刻を秒精度で表す秒精度
先頭表示時刻をそれぞれ含め、第1または第2の階層の
オブジェクトそれぞれに、秒精度先頭表示時刻を基準と
する、そのオブジェクトの表示時刻の秒精度を表す秒精
度相対時刻情報を付加することにより得られる符号化ビ
ットストリームであって、第2の階層の、表示順で隣接
するオブジェクトどうしの表示時刻の差に基づいて、第
2の階層のオブジェクトについての秒精度相対時刻情報
がリセットされているものが提供される。従って、符号
化効率の劣化の防止された符号化ビットストリームを提
供することができる。
【0328】請求項26に記載の画像符号化装置および
請求項27に記載の画像符号化方法によれば、画像を構
成するオブジェクトのシーケンスが、空間スケーラビリ
ティを実現するための上位階層と下位階層とを含む2以
上の階層に階層化され、下位階層のオブジェクトのシー
ケンスが符号化されるとともに、上位階層のオブジェク
トのシーケンスが、その表示順序と同一の順序で符号化
される。従って、符号化処理の容易化を図ることが可能
となる。
【0329】請求項28に記載の画像復号装置および請
求項29に記載の画像復号方法によれば、画像を構成す
るオブジェクトのシーケンスを、空間スケーラビリティ
を実現するための上位階層と下位階層とを含む2以上の
階層に階層化し、下位階層のオブジェクトのシーケンス
を符号化するとともに、上位階層のオブジェクトのシー
ケンスを、その表示順序と同一の順序で符号化すること
により得られる符号化ビットストリームが復号される。
従って、復号処理の容易化を係ることが可能となる。
【0330】請求項30に記載の提供媒体によれば、画
像を構成するオブジェクトのシーケンスを、空間スケー
ラビリティを実現するための上位階層と下位階層とを含
む2以上の階層に階層化し、下位階層のオブジェクトの
シーケンスを符号化するとともに、上位階層のオブジェ
クトのシーケンスを、その表示順序と同一の順序で符号
化することにより得られる符号化ビットストリームが提
供される。従って、比較的容易に復号可能な符号化ビッ
トストリームを提供することができる。
【図面の簡単な説明】
【図1】本発明を適用したエンコーダの一実施の形態の
構成例を示すブロック図である。
【図2】時刻によって、VOの位置、大きさが変化する
ことを説明するための図である。
【図3】図1のVOP符号化部31乃至3Nの構成例を示
すブロック図である。
【図4】空間スケーラビリティを説明するための図であ
る。
【図5】空間スケーラビリティを説明するための図であ
る。
【図6】空間スケーラビリティを説明するための図であ
る。
【図7】空間スケーラビリティを説明するための図であ
る。
【図8】VOPのサイズデータおよびオフセットデータ
の決定方法を説明するための図である。
【図9】図3の下位レイヤ符号化部25の構成例を示す
ブロック図である。
【図10】図3の上位レイヤ符号化部23の構成例を示
すブロック図である。
【図11】空間スケーラビリティを説明するための図で
ある。
【図12】時間スケーラビリティを説明するための図で
ある。
【図13】本発明を適用したデコーダの一実施の形態の
構成例を示すブロック図である。
【図14】図13のVOP復号部721乃至72Nの他の
構成例を示すブロック図である。
【図15】図14の下位レイヤ復号部95の構成例を示
すブロック図である。
【図16】図14の上位レイヤ復号部93の構成例を示
すブロック図である。
【図17】MPEG4規格のVideo Verification Model(Vers
ion10.0)における符号化ビットストリームの構成を示す
図である。
【図18】VSのシンタックスを示す図である。
【図19】VOのシンタクスを示す図である。
【図20】VOLのシンタクスを示す図である。
【図21】VOLのシンタクスを示す図である。
【図22】VOLのシンタクスを示す図である。
【図23】VOLのシンタクスを示す図である。
【図24】VOLのシンタクスを示す図である。
【図25】VOLのシンタクスを示す図である。
【図26】GOVのシンタクスを示す図である。
【図27】GOVのシンタクスを示す図である。
【図28】VOPのシンタクスを示す図である。
【図29】VOPのシンタクスを示す図である。
【図30】VOPのシンタクスを示す図である。
【図31】VOPのシンタクスを示す図である。
【図32】VOPのシンタクスを示す図である。
【図33】VOPのシンタクスを示す図である。
【図34】VOPのシンタクスを示す図である。
【図35】VOPのシンタクスを示す図である。
【図36】VOPのシンタクスを示す図である。
【図37】time_code,modulo_time_base,VOP_time_in
crementの関係を示す図である。
【図38】time_code,modulo_time_base,VOP_time_in
crementの関係を示す図である。
【図39】下位レイヤと上位レイヤとで独立にGOVを
構成した状態を示す図である。
【図40】下位レイヤと上位レイヤとで独立にGOVを
構成した状態を示す図である。
【図41】上位レイヤのGOVを、下位レイヤのGOV
と対応付けて構成した状態を示す図である。
【図42】上位レイヤのGOVを、下位レイヤのGOV
と対応付けて構成した状態を示す図である。
【図43】上位レイヤのGOVを、下位レイヤのGOV
と対応付けて構成する場合の、図9のVLC器36の処
理を説明するためのフローチャートである。
【図44】上位レイヤのGOVを、下位レイヤのGOV
と対応付けて構成する場合の、図10のVLC器36の
処理を説明するためのフローチャートである。
【図45】空間スケーラブル符号化における上位レイヤ
と下位レイヤのピクチャストラクチャの例を示す図であ
る。
【図46】modulo_time_baseのビット数が増大する場合
を説明するための図である。
【図47】modulo_time_baseのビット数の増大を防止す
る方法を説明するための図である。
【図48】modulo_time_baseのビット数の増大を防止す
る処理を説明するための図である。
【図49】画質の劣化を防止するための符号化/復号順
序と参照関係を説明するための図である。
【図50】下位レイヤと上位レイヤとのtime_codeが一
致しない状態を示す図である。
【図51】下位レイヤと上位レイヤとのtime_codeを一
致させる方法を説明するための図である。
【図52】本発明を適用したエンコーダおよびデコーダ
の他の実施の形態の構成例を示すブロック図である。
【図53】従来のエンコーダの一例の構成を示すブロッ
ク図である。
【図54】従来のデコーダの一例の構成を示すブロック
図である。
【符号の説明】
1 VO構成部, 21乃至2N VOP構成部, 31
乃至3N VOP符号化部, 4 多重化部, 21
画像階層化部, 23 上位レイヤ符号化部,24 解
像度変換部, 25 下位レイヤ符号化部, 26 多
重化部, 31フレームメモリ, 32 動きベクトル
検出器, 33 演算器, 34 DCT器, 35
量子化器, 36 VLC器, 38 逆量子化器,
39IDCT器, 40 演算器, 41 フレームメ
モリ, 42 動き補償器,53 フレームメモリ,
71 逆多重化部, 721乃至72N VOP復号部,
73 画像再構成部, 91 逆多重化部, 93
上位レイヤ復号部,94 解像度変換部, 95 下位
レイヤ復号部, 102 IVLC器,103 逆量子
化器, 104 IDCT器, 105 演算器, 1
06 フレームメモリ, 107 動き補償器, 11
2 フレームメモリ, 201ROM, 202 CP
U, 203 RAM, 204 入力部, 205出
力部, 206 HD, 207 通信I/F
───────────────────────────────────────────────────── フロントページの続き (72)発明者 矢ヶ崎 陽一 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 Fターム(参考) 5C059 KK00 MA00 MA23 MA31 MB12 MB22 NN01 PP04 PP05 PP06 PP07 RB01 RB18 RC04 RC19 SS07 TA11 TB03 TC36 TD05 UA02 UA03 UA05 UA06 5C078 BA57 BA64 DA00 DA01 DA02 EA07

Claims (30)

    【特許請求の範囲】
  1. 【請求項1】 画像を符号化し、その結果得られる符号
    化ビットストリームを出力する画像符号化装置であっ
    て、 前記画像を構成するオブジェクトのシーケンスを2以上
    の階層に階層化する階層化手段と、 前記階層化手段が出力する、前記オブジェクトのシーケ
    ンスの第1の階層を、複数のグループに分けて符号化す
    る第1の符号化手段と、 前記第1の階層のグループの最初に表示されるオブジェ
    クトの表示時刻と同時刻またはその直後に表示される第
    2の階層のオブジェクトが、グループの最初に表示され
    るオブジェクトとなるように、前記階層化手段が出力す
    る、前記オブジェクトのシーケンスの第2の階層を、複
    数のグループに分けて符号化する第2の符号化手段とを
    備えることを特徴とする画像符号化装置。
  2. 【請求項2】 前記第1または第2の符号化手段は、前
    記第1または第2の階層のグループそれぞれに、その最
    初に表示されるオブジェクトの表示時刻を秒精度で表す
    秒精度先頭表示時刻を含めることを特徴とする請求項1
    に記載の画像符号化装置。
  3. 【請求項3】 前記第2の符号化手段は、前記第1の階
    層のグループの最初に表示されるオブジェクトの表示時
    刻の秒精度と、前記第2の階層のグループの最初に表示
    されるオブジェクトの表示時刻の秒精度とが一致しない
    とき、前記第2の階層のグループに、前記第1の階層の
    グループの最初に表示されるオブジェクトの表示時刻の
    秒精度を、前記秒精度先頭表示時刻として含めることを
    特徴とする請求項2に記載の画像符号化装置。
  4. 【請求項4】 前記第1または第2の符号化手段それぞ
    れは、前記第1または第2の階層のオブジェクトそれぞ
    れに、前記秒精度先頭表示時刻を基準とする、そのオブ
    ジェクトの表示時刻の秒精度を表す秒精度相対時刻情報
    を付加することを特徴とする請求項2に記載の画像符号
    化装置。
  5. 【請求項5】 前記第2の符号化手段は、前記第2の階
    層の、表示順で隣接するオブジェクトどうしの表示時刻
    の差に基づいて、前記第2の階層のオブジェクトについ
    ての前記秒精度相対時刻情報をリセットすることを特徴
    とする請求項4に記載の画像符号化装置。
  6. 【請求項6】 前記階層化手段は、前記画像を構成する
    オブジェクトのシーケンスを、空間スケーラビリティを
    実現するための前記第1と第2の階層を含む2以上の階
    層に階層化し、 前記第2の符号化手段は、前記第2の階層のオブジェク
    トのシーケンスを、その表示順序と同一の順序で符号化
    することを特徴とする請求項1に記載の画像符号化装
    置。
  7. 【請求項7】 画像を符号化し、その結果得られる符号
    化ビットストリームを出力する画像符号化方法であっ
    て、 前記画像を構成するオブジェクトのシーケンスを2以上
    の階層に階層化し、 前記オブジェクトのシーケンスの第1の階層を、複数の
    グループに分けて符号化するとともに、前記第1の階層
    のグループの最初に表示されるオブジェクトの表示時刻
    と同時刻またはその直後に表示される第2の階層のオブ
    ジェクトが、グループの最初に表示されるオブジェクト
    となるように、前記オブジェクトのシーケンスの第2の
    階層を、複数のグループに分けて符号化することを特徴
    とする画像符号化方法。
  8. 【請求項8】 画像を復号する画像復号装置であって、 前記画像を構成するオブジェクトのシーケンスを2以上
    の階層に階層化し、 前記オブジェクトのシーケンスの第1の階層を、複数の
    グループに分けて符号化するとともに、前記第1の階層
    のグループの最初に表示されるオブジェクトの表示時刻
    と同時刻またはその直後に表示される第2の階層のオブ
    ジェクトが、グループの最初に表示されるオブジェクト
    となるように、前記オブジェクトのシーケンスの第2の
    階層を、複数のグループに分けて符号化することにより
    得られる符号化ビットストリームを受信する受信手段
    と、 前記符号化ビットストリームを復号する復号手段とを備
    えることを特徴とする画像復号装置。
  9. 【請求項9】 前記第1または第2の階層のグループそ
    れぞれには、その最初に表示されるオブジェクトの表示
    時刻を秒精度で表す秒精度先頭表示時刻が含められてい
    ることを特徴とする請求項8に記載の画像復号装置。
  10. 【請求項10】 前記第1の階層のグループの最初に表
    示されるオブジェクトの表示時刻の秒精度と、前記第2
    の階層のグループの最初に表示されるオブジェクトの表
    示時刻の秒精度とが一致しないとき、 前記第2の階層のグループには、前記第1の階層のグル
    ープの最初に表示されるオブジェクトの表示時刻の秒精
    度が、前記秒精度先頭表示時刻として含められているこ
    とを特徴とする請求項9に記載の画像復号装置。
  11. 【請求項11】 前記第1または第2の階層のオブジェ
    クトそれぞれには、前記秒精度先頭表示時刻を基準とす
    る、そのオブジェクトの表示時刻の秒精度を表す秒精度
    相対時刻情報が付加されていることを特徴とする請求項
    9に記載の画像復号装置。
  12. 【請求項12】 前記第2の階層の、表示順で隣接する
    オブジェクトどうしの表示時刻の差に基づいて、前記第
    2の階層のオブジェクトについての前記秒精度相対時刻
    情報がリセットされていることを特徴とする請求項11
    に記載の画像復号装置。
  13. 【請求項13】 前記画像を構成するオブジェクトのシ
    ーケンスが、空間スケーラビリティを実現するための前
    記第1と第2の階層を含む2以上の階層に階層化されて
    おり、 前記第2の階層のオブジェクトのシーケンスが、その表
    示順序と同一の順序で符号化されていることを特徴とす
    る請求項8に記載の画像復号装置。
  14. 【請求項14】 画像を復号する画像復号方法であっ
    て、 前記画像を構成するオブジェクトのシーケンスを2以上
    の階層に階層化し、前記オブジェクトのシーケンスの第
    1の階層を、複数のグループに分けて符号化するととも
    に、前記第1の階層のグループの最初に表示されるオブ
    ジェクトの表示時刻と同時刻またはその直後に表示され
    る第2の階層のオブジェクトが、グループの最初に表示
    されるオブジェクトとなるように、前記オブジェクトの
    シーケンスの第2の階層を、複数のグループに分けて符
    号化することにより得られる符号化ビットストリームを
    受信し、 前記符号化ビットストリームを復号することを特徴とす
    る画像復号方法。
  15. 【請求項15】 画像を符号化して得られる符号化ビッ
    トストリームを提供する提供媒体であって、 前記画像を構成するオブジェクトのシーケンスを2以上
    の階層に階層化し、 前記オブジェクトのシーケンスの第1の階層を、複数の
    グループに分けて符号化するとともに、前記第1の階層
    のグループの最初に表示されるオブジェクトの表示時刻
    と同時刻またはその直後に表示される第2の階層のオブ
    ジェクトが、グループの最初に表示されるオブジェクト
    となるように、前記オブジェクトのシーケンスの第2の
    階層を、複数のグループに分けて符号化することをによ
    り得られる前記符号化ビットストリームを提供すること
    を特徴とする提供媒体。
  16. 【請求項16】 前記第1または第2の階層のグループ
    それぞれには、その最初に表示されるオブジェクトの表
    示時刻を秒精度で表す秒精度先頭表示時刻が含められて
    いることを特徴とする請求項15に記載の提供媒体。
  17. 【請求項17】 前記第1の階層のグループの最初に表
    示されるオブジェクトの表示時刻の秒精度と、前記第2
    の階層のグループの最初に表示されるオブジェクトの表
    示時刻の秒精度とが一致しないとき、 前記第2の階層のグループには、前記第1の階層のグル
    ープの最初に表示されるオブジェクトの表示時刻の秒精
    度が、前記秒精度先頭表示時刻として含められているこ
    とを特徴とする請求項16に記載の提供媒体。
  18. 【請求項18】 前記第1または第2の階層のオブジェ
    クトそれぞれには、前記秒精度先頭表示時刻を基準とす
    る、そのオブジェクトの表示時刻の秒精度を表す秒精度
    相対時刻情報が付加されていることを特徴とする請求項
    16に記載の提供媒体。
  19. 【請求項19】 前記第2の階層の、表示順で隣接する
    オブジェクトどうしの表示時刻の差に基づいて、前記第
    2の階層のオブジェクトについての前記秒精度相対時刻
    情報がリセットされていることを特徴とする請求項18
    に記載の提供媒体。
  20. 【請求項20】 前記画像を構成するオブジェクトのシ
    ーケンスが、空間スケーラビリティを実現するための前
    記第1と第2の階層を含む2以上の階層に階層化されて
    おり、 前記第2の階層のオブジェクトのシーケンスが、その表
    示順序と同一の順序で符号化されていることを特徴とす
    る請求項15に記載の提供媒体。
  21. 【請求項21】 画像を符号化し、その結果得られる符
    号化ビットストリームを出力する画像符号化装置であっ
    て、 前記画像を構成するオブジェクトのシーケンスを2以上
    の階層に階層化する階層化手段と、 前記階層化手段が出力する、前記オブジェクトのシーケ
    ンスの第1または第2の階層を、1以上のグループに分
    けてそれぞれ符号化し、前記第1または第2の階層のグ
    ループに、その最初に表示されるオブジェクトの表示時
    刻を秒精度で表す秒精度先頭表示時刻をそれぞれ含める
    符号化手段と、 前記第1または第2の階層のオブジェクトそれぞれに、
    前記秒精度先頭表示時刻を基準とする、そのオブジェク
    トの表示時刻の秒精度を表す秒精度相対時刻情報を付加
    する付加手段と、 前記第2の階層の、表示順で隣接するオブジェクトどう
    しの表示時刻の差に基づいて、前記第2の階層のオブジ
    ェクトについての前記秒精度相対時刻情報をリセットす
    るリセット手段とを備えることを特徴とする画像符号化
    装置。
  22. 【請求項22】 画像を符号化し、その結果得られる符
    号化ビットストリームを出力する画像符号化方法であっ
    て、 前記画像を構成するオブジェクトのシーケンスを2以上
    の階層に階層化し、 前記オブジェクトのシーケンスの第1または第2の階層
    を、1以上のグループに分けてそれぞれ符号化し、前記
    第1または第2の階層のグループに、その最初に表示さ
    れるオブジェクトの表示時刻を秒精度で表す秒精度先頭
    表示時刻をそれぞれ含め、 前記第1または第2の階層のオブジェクトそれぞれに、
    前記秒精度先頭表示時刻を基準とする、そのオブジェク
    トの表示時刻の秒精度を表す秒精度相対時刻情報を付加
    する画像符号化方法において、 前記第2の階層の、表示順で隣接するオブジェクトどう
    しの表示時刻の差に基づいて、前記第2の階層のオブジ
    ェクトについての前記秒精度相対時刻情報をリセットす
    ることを特徴とする画像符号化方法。
  23. 【請求項23】 画像を復号する画像復号装置であっ
    て、 前記画像を構成するオブジェクトのシーケンスを2以上
    の階層に階層化し、 前記オブジェクトのシーケンスの第1または第2の階層
    を、1以上のグループに分けてそれぞれ符号化し、前記
    第1または第2の階層のグループに、その最初に表示さ
    れるオブジェクトの表示時刻を秒精度で表す秒精度先頭
    表示時刻をそれぞれ含め、 前記第1または第2の階層のオブジェクトそれぞれに、
    前記秒精度先頭表示時刻を基準とする、そのオブジェク
    トの表示時刻の秒精度を表す秒精度相対時刻情報を付加
    することにより得られる符号化ビットストリームであっ
    て、前記第2の階層の、表示順で隣接するオブジェクト
    どうしの表示時刻の差に基づいて、前記第2の階層のオ
    ブジェクトについての前記秒精度相対時刻情報がリセッ
    トされているものを受信する受信手段と、 前記符号化ビットストリームを復号する復号手段とを備
    えることを特徴とする画像復号装置。
  24. 【請求項24】 画像を復号する画像復号方法であっ
    て、 前記画像を構成するオブジェクトのシーケンスを2以上
    の階層に階層化し、 前記オブジェクトのシーケンスの第1または第2の階層
    を、1以上のグループに分けてそれぞれ符号化し、前記
    第1または第2の階層のグループに、その最初に表示さ
    れるオブジェクトの表示時刻を秒精度で表す秒精度先頭
    表示時刻をそれぞれ含め、 前記第1または第2の階層のオブジェクトそれぞれに、
    前記秒精度先頭表示時刻を基準とする、そのオブジェク
    トの表示時刻の秒精度を表す秒精度相対時刻情報を付加
    することにより得られる符号化ビットストリームであっ
    て、前記第2の階層の、表示順で隣接するオブジェクト
    どうしの表示時刻の差に基づいて、前記第2の階層のオ
    ブジェクトについての前記秒精度相対時刻情報がリセッ
    トされているものを受信し、 前記符号化ビットストリームを復号することを特徴とす
    る画像復号方法。
  25. 【請求項25】 画像を符号化して得られる符号化ビッ
    トストリームを提供する提供媒体であって、 前記画像を構成するオブジェクトのシーケンスを2以上
    の階層に階層化し、 前記オブジェクトのシーケンスの第1または第2の階層
    を、1以上のグループに分けてそれぞれ符号化し、前記
    第1または第2の階層のグループに、その最初に表示さ
    れるオブジェクトの表示時刻を秒精度で表す秒精度先頭
    表示時刻をそれぞれ含め、 前記第1または第2の階層のオブジェクトそれぞれに、
    前記秒精度先頭表示時刻を基準とする、そのオブジェク
    トの表示時刻の秒精度を表す秒精度相対時刻情報を付加
    することにより得られる符号化ビットストリームであっ
    て、前記第2の階層の、表示順で隣接するオブジェクト
    どうしの表示時刻の差に基づいて、前記第2の階層のオ
    ブジェクトについての前記秒精度相対時刻情報がリセッ
    トされているものを提供することを特徴とする提供媒
    体。
  26. 【請求項26】 画像を符号化し、その結果得られる符
    号化ビットストリームを出力する画像符号化装置であっ
    て、 前記画像を構成するオブジェクトのシーケンスを、空間
    スケーラビリティを実現するための上位階層と下位階層
    とを含む2以上の階層に階層化する階層化手段と、 前記階層化手段が出力する、前記下位階層のオブジェク
    トのシーケンスを符号化する第1の符号化手段と、 前記階層化手段が出力する、前記上位階層のオブジェク
    トのシーケンスを、その表示順序と同一の順序で符号化
    する第2の符号化手段とを備えることを特徴とする画像
    符号化装置。
  27. 【請求項27】 画像を符号化し、その結果得られる符
    号化ビットストリームを出力する画像符号化方法であっ
    て、 前記画像を受信し、 前記画像を構成するオブジェクトのシーケンスを、空間
    スケーラビリティを実現するための上位階層と下位階層
    とを含む2以上の階層に階層化し、 前記下位階層のオブジェクトのシーケンスを符号化する
    とともに、前記上位階層のオブジェクトのシーケンス
    を、その表示順序と同一の順序で符号化することを特徴
    とする画像符号化方法。
  28. 【請求項28】 画像を復号する画像復号装置であっ
    て、 前記画像を構成するオブジェクトのシーケンスを、空間
    スケーラビリティを実現するための上位階層と下位階層
    とを含む2以上の階層に階層化し、 前記下位階層のオブジェクトのシーケンスを符号化する
    とともに、前記上位階層のオブジェクトのシーケンス
    を、その表示順序と同一の順序で符号化することにより
    得られる符号化ビットストリームを受信する受信手段
    と、 前記符号化ビットストリームを復号する復号手段とを備
    えることを特徴とする画像復号装置。
  29. 【請求項29】 画像を復号する画像復号方法であっ
    て、 前記画像を構成するオブジェクトのシーケンスを、空間
    スケーラビリティを実現するための上位階層と下位階層
    とを含む2以上の階層に階層化し、 前記下位階層のオブジェクトのシーケンスを符号化する
    とともに、前記上位階層のオブジェクトのシーケンス
    を、その表示順序と同一の順序で符号化することにより
    得られる符号化ビットストリームを受信し、 前記符号化ビットストリームを復号することを特徴とす
    る画像復号方法。
  30. 【請求項30】 画像を符号化して得られる符号化ビッ
    トストリームを提供する提供媒体であって、 前記画像を構成するオブジェクトのシーケンスを、空間
    スケーラビリティを実現するための上位階層と下位階層
    とを含む2以上の階層に階層化し、 前記下位階層のオブジェクトのシーケンスを符号化する
    とともに、前記上位階層のオブジェクトのシーケンス
    を、その表示順序と同一の順序で符号化することにより
    得られる符号化ビットストリームを提供することを特徴
    とする提供媒体。
JP17349998A 1998-06-19 1998-06-19 画像符号化装置および画像符号化方法、画像復号装置および画像復号方法、並びに提供媒体 Pending JP2000013790A (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP17349998A JP2000013790A (ja) 1998-06-19 1998-06-19 画像符号化装置および画像符号化方法、画像復号装置および画像復号方法、並びに提供媒体
US09/334,853 US6400768B1 (en) 1998-06-19 1999-06-17 Picture encoding apparatus, picture encoding method, picture decoding apparatus, picture decoding method and presentation medium
EP19990304770 EP0966161A3 (en) 1998-06-19 1999-06-18 Apparatus and method for video encoding and decoding
KR19990022908A KR100629092B1 (ko) 1998-06-19 1999-06-18 화상 인코딩 장치와 방법, 화상 디코딩 장치와 방법, 및 제공 매체
EP20100010849 EP2265028A3 (en) 1998-06-19 1999-06-18 Picture encoding apparatus, picture encoding method, picture decoding apparatus, picture decoding method and presentation medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP17349998A JP2000013790A (ja) 1998-06-19 1998-06-19 画像符号化装置および画像符号化方法、画像復号装置および画像復号方法、並びに提供媒体

Related Child Applications (2)

Application Number Title Priority Date Filing Date
JP2000194006A Division JP2001054120A (ja) 2000-01-01 2000-06-28 画像符号化装置および画像符号化方法、画像復号装置および画像復号方法、並びに記録媒体
JP2000194005A Division JP3345887B2 (ja) 1998-06-19 2000-06-28 画像符号化装置および画像符号化方法、画像復号装置および画像復号方法、並びに記録媒体

Publications (1)

Publication Number Publication Date
JP2000013790A true JP2000013790A (ja) 2000-01-14

Family

ID=15961660

Family Applications (1)

Application Number Title Priority Date Filing Date
JP17349998A Pending JP2000013790A (ja) 1998-06-19 1998-06-19 画像符号化装置および画像符号化方法、画像復号装置および画像復号方法、並びに提供媒体

Country Status (4)

Country Link
US (1) US6400768B1 (ja)
EP (2) EP2265028A3 (ja)
JP (1) JP2000013790A (ja)
KR (1) KR100629092B1 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000054512A1 (en) * 1999-03-05 2000-09-14 Kabushiki Kaisha Toshiba Method and apparatus for coding moving picture image
WO2006030694A1 (ja) * 2004-09-13 2006-03-23 Sharp Kabushiki Kaisha 画像符号化装置、画像復号装置、画像符号化プログラム、及び画像復号プログラム
JP2009049979A (ja) * 2007-07-20 2009-03-05 Fujifilm Corp 画像処理装置、画像処理方法、画像処理システム、及びプログラム
JP2009089356A (ja) * 2007-09-10 2009-04-23 Fujifilm Corp 画像処理装置、画像処理方法、およびプログラム
JP2009522890A (ja) * 2006-01-05 2009-06-11 トムソン ライセンシング インターレイヤ動き予測方法
US8345762B2 (en) 2005-02-18 2013-01-01 Thomson Licensing Method for deriving coding information for high resolution pictures from low resolution pictures and coding and decoding devices implementing said method
WO2014203516A1 (ja) * 2013-06-18 2014-12-24 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 送信方法および受信方法
US9167266B2 (en) 2006-07-12 2015-10-20 Thomson Licensing Method for deriving motion for high resolution pictures from motion data of low resolution pictures and coding and decoding devices implementing said method

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ID24586A (id) * 1998-12-21 2000-07-27 Matsushita Electric Ind Co Ltd Perangkat dan metode penyelarasan waktu dengan menggunakan modul basis waktu dan resolusi peningkatan waktu
US6823129B1 (en) * 2000-02-04 2004-11-23 Quvis, Inc. Scaleable resolution motion image recording and storage system
US6625322B1 (en) * 1999-06-08 2003-09-23 Matsushita Electric Industrial Co., Ltd. Image coding apparatus
GB2364841B (en) * 2000-07-11 2002-09-11 Motorola Inc Method and apparatus for video encoding
JP3636061B2 (ja) * 2000-11-08 2005-04-06 日本電気株式会社 データ挿入装置及びその方法
WO2003005699A2 (en) * 2001-07-05 2003-01-16 Board Of Trustees Operating Michigan State University Transcaling: a video coding and multicasting framework for wireless ip multimedia services
US7058649B2 (en) * 2001-09-28 2006-06-06 Intel Corporation Automated presentation layer content management system
WO2003055225A1 (en) * 2001-12-20 2003-07-03 Koninklijke Philips Electronics N.V. Video coding and decoding method
WO2003079692A1 (en) * 2002-03-19 2003-09-25 Fujitsu Limited Hierarchical encoder and decoder
US7088776B2 (en) 2002-07-15 2006-08-08 Apple Computer, Inc. Method and apparatus for variable accuracy inter-picture timing specification for digital video encoding
AU2013204743B2 (en) * 2002-07-15 2016-05-19 Apple Inc Method and apparatus for variable accuracy inter-picture timing specification for digital video encoding
US6728315B2 (en) * 2002-07-24 2004-04-27 Apple Computer, Inc. Method and apparatus for variable accuracy inter-picture timing specification for digital video encoding with reduced requirements for division operations
US8254461B2 (en) * 2002-07-24 2012-08-28 Apple Inc. Method and apparatus for variable accuracy inter-picture timing specification for digital video encoding with reduced requirements for division operations
KR100925627B1 (ko) * 2002-09-28 2009-11-06 주식회사 케이티 영상 분할에 기반한 신축적인 동영상 부호화/복호화 장치
US7426306B1 (en) * 2002-10-24 2008-09-16 Altera Corporation Efficient use of keyframes in video compression
US20050013496A1 (en) * 2003-07-16 2005-01-20 Bruls Wilhelmus Hendrikus Alfonsus Video decoder locally uses motion-compensated interpolation to reconstruct macro-block skipped by encoder
JP2006033793A (ja) * 2004-06-14 2006-02-02 Victor Co Of Japan Ltd 追尾映像再生装置
US8139646B2 (en) 2004-10-29 2012-03-20 Nxp B.V. Splicing MPEG streams comparing offset and reference time value
US20060153295A1 (en) * 2005-01-12 2006-07-13 Nokia Corporation Method and system for inter-layer prediction mode coding in scalable video coding
JP2006203661A (ja) * 2005-01-21 2006-08-03 Toshiba Corp 動画像符号化装置、動画像復号装置及び符号化ストリーム生成方法
US20060227871A1 (en) * 2005-03-31 2006-10-12 Madhukar Budagavi Video thumbnail method
US7483578B2 (en) * 2005-09-15 2009-01-27 Kabushiki Kaisha Toshiba Image data decoding apparatus and method
US7765458B1 (en) * 2005-09-29 2010-07-27 Marvell International Ltd. Error pattern generation for trellis-based detection and/or decoding
US8040953B2 (en) * 2005-09-29 2011-10-18 Marvell World Trade Ltd. Reliability metric generation for trellis-based detection and/or decoding
JP2009512306A (ja) * 2005-10-11 2009-03-19 ノキア コーポレイション スケーラブルビデオコーディングのためのデコードされたピクチャーの効率的なバッファマネージメント
JP4702943B2 (ja) * 2005-10-19 2011-06-15 キヤノン株式会社 画像処理装置及びその方法
FR2894422A1 (fr) * 2005-12-01 2007-06-08 Thomson Licensing Sas Procede de prediction de donnees mouvement et de texture
FR2894424A1 (fr) * 2005-12-05 2007-06-08 Thomson Licensing Sas Procede de prediction de donnees mouvement et de texture
FR2894423A1 (fr) * 2005-12-05 2007-06-08 Thomson Licensing Sas Procede de prediction de donnees mouvement et de texture
KR100904442B1 (ko) * 2006-01-09 2009-06-24 엘지전자 주식회사 영상 신호의 레이어 간 예측 방법
KR101557504B1 (ko) * 2009-04-13 2015-10-07 삼성전자주식회사 채널 적응형 비디오 전송 방법, 이를 이용한 장치 및 이를 제공하는 시스템
US8345749B2 (en) * 2009-08-31 2013-01-01 IAD Gesellschaft für Informatik, Automatisierung und Datenverarbeitung mbH Method and system for transcoding regions of interests in video surveillance
WO2012117744A1 (en) 2011-03-03 2012-09-07 Panasonic Corporation Method of encoding an image into a coded image, method of decoding a coded image, and apparatuses thereof
US8745158B2 (en) * 2011-09-30 2014-06-03 Avid Technology, Inc. Application-guided bandwidth-managed caching
JP5950541B2 (ja) * 2011-11-07 2016-07-13 キヤノン株式会社 動きベクトル符号化装置、動きベクトル符号化方法及びプログラム、動きベクトル復号装置、動きベクトル復号方法及びプログラム
FR2985139B1 (fr) * 2011-12-23 2014-01-03 Thales Sa Procede de compression selective bas debit de flux video et codeur mettant en eouvre le procede
US8867852B2 (en) 2012-01-19 2014-10-21 Sharp Kabushiki Kaisha Decoding a picture based on a reference picture set on an electronic device
US8693793B2 (en) * 2012-01-19 2014-04-08 Sharp Laboratories Of America, Inc. Reducing reference picture set signal overhead on an electronic device
US20150208092A1 (en) * 2012-06-29 2015-07-23 Samsung Electronics Co., Ltd. Method and apparatus for encoding scalable video, and method and apparatus for decoding scalable video
US20140086328A1 (en) * 2012-09-25 2014-03-27 Qualcomm Incorporated Scalable video coding in hevc
CN105025303B (zh) * 2012-09-28 2018-05-29 瑞典爱立信有限公司 视频序列图像的解码和编码
EP3078195A4 (en) 2013-12-02 2017-08-09 Nokia Technologies OY Video encoding and decoding

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08758A (ja) 1994-06-17 1996-01-09 Toshiba Corp 有害塩素化合物の光分解装置
US5784494A (en) * 1995-04-18 1998-07-21 Advanced Micro Devices, Inc. Method and apparatus for prestoring dequantization information for DCT VLC decoding
JP3210862B2 (ja) 1996-06-27 2001-09-25 シャープ株式会社 画像符号化装置及び画像復号装置
CA2208950A1 (en) * 1996-07-03 1998-01-03 Xuemin Chen Rate control for stereoscopic digital video encoding
DE69707929T2 (de) 1996-07-05 2002-06-20 Matsushita Electric Ind Co Ltd Verfahren zum Anzeigezeitstempeln und zur Synchronisation mehrerer Videoobjektebenen
CA2255923C (en) 1997-04-01 2005-06-07 Sony Corporation Picture coding device, picture coding method, picture decoding device, picture decoding method, and providing medium

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000054512A1 (en) * 1999-03-05 2000-09-14 Kabushiki Kaisha Toshiba Method and apparatus for coding moving picture image
US7027517B1 (en) 1999-03-05 2006-04-11 Kabushiki Kaisha Toshiba Method and apparatus for coding moving picture image
WO2006030694A1 (ja) * 2004-09-13 2006-03-23 Sharp Kabushiki Kaisha 画像符号化装置、画像復号装置、画像符号化プログラム、及び画像復号プログラム
US8345762B2 (en) 2005-02-18 2013-01-01 Thomson Licensing Method for deriving coding information for high resolution pictures from low resolution pictures and coding and decoding devices implementing said method
JP2009522890A (ja) * 2006-01-05 2009-06-11 トムソン ライセンシング インターレイヤ動き予測方法
US8446956B2 (en) 2006-01-05 2013-05-21 Thomson Licensing Inter-layer motion prediction method using resampling
US9167266B2 (en) 2006-07-12 2015-10-20 Thomson Licensing Method for deriving motion for high resolution pictures from motion data of low resolution pictures and coding and decoding devices implementing said method
JP2009049979A (ja) * 2007-07-20 2009-03-05 Fujifilm Corp 画像処理装置、画像処理方法、画像処理システム、及びプログラム
JP2009089356A (ja) * 2007-09-10 2009-04-23 Fujifilm Corp 画像処理装置、画像処理方法、およびプログラム
US8498483B2 (en) 2007-09-10 2013-07-30 Fujifilm Corporation Image processing apparatus, image processing method, and computer readable medium
WO2014203516A1 (ja) * 2013-06-18 2014-12-24 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 送信方法および受信方法

Also Published As

Publication number Publication date
EP2265028A3 (en) 2012-08-29
US6400768B1 (en) 2002-06-04
KR20000006286A (ko) 2000-01-25
EP2265028A2 (en) 2010-12-22
EP0966161A2 (en) 1999-12-22
EP0966161A3 (en) 2001-11-07
KR100629092B1 (ko) 2006-09-28

Similar Documents

Publication Publication Date Title
JP2000013790A (ja) 画像符号化装置および画像符号化方法、画像復号装置および画像復号方法、並びに提供媒体
KR100418141B1 (ko) 화상부호화장치,화상부호화방법,화상복호화장치및화상복호화방법
US6427027B1 (en) Picture encoding and/or decoding apparatus and method for providing scalability of a video object whose position changes with time and a recording medium having the same recorded thereon
US6031575A (en) Method and apparatus for encoding an image signal, method and apparatus for decoding an image signal, and recording medium
JP3413721B2 (ja) 画像符号化方法及び装置、並びに画像復号方法及び装置
JP2000023193A (ja) 画像符号化方法及び装置、画像復号方法及び装置、並びに提供媒体
US6847683B2 (en) Video coding method and corresponding encoder
JP3345887B2 (ja) 画像符号化装置および画像符号化方法、画像復号装置および画像復号方法、並びに記録媒体
JP3380980B2 (ja) 画像符号化方法、並びに画像復号方法および画像復号装置
JP3380981B2 (ja) 画像符号化装置および画像符号化方法、画像復号装置および画像復号方法、並びに記録媒体
JP2001054120A (ja) 画像符号化装置および画像符号化方法、画像復号装置および画像復号方法、並びに記録媒体
CA2421090C (en) Picture coding device, picture coding method, picture decoding device, picture decoding method, and providing medium
JP3263812B2 (ja) 画像符号化装置および画像符号化方法、並びに画像復号化装置および画像復号化方法
JP2001061145A (ja) 画像符号化装置および画像符号化方法、並びに画像復号装置および画像復号方法

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20020805