JP6074743B2 - 画像復号方法及び画像復号装置 - Google Patents

画像復号方法及び画像復号装置 Download PDF

Info

Publication number
JP6074743B2
JP6074743B2 JP2013117301A JP2013117301A JP6074743B2 JP 6074743 B2 JP6074743 B2 JP 6074743B2 JP 2013117301 A JP2013117301 A JP 2013117301A JP 2013117301 A JP2013117301 A JP 2013117301A JP 6074743 B2 JP6074743 B2 JP 6074743B2
Authority
JP
Japan
Prior art keywords
unit
decoding
tiles
tile
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013117301A
Other languages
English (en)
Other versions
JP2013219806A (ja
Inventor
大作 小宮
大作 小宮
西 孝啓
孝啓 西
陽司 柴原
陽司 柴原
寿郎 笹井
寿郎 笹井
敏康 杉尾
敏康 杉尾
京子 谷川
京子 谷川
徹 松延
徹 松延
Original Assignee
サン パテント トラスト
サン パテント トラスト
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by サン パテント トラスト, サン パテント トラスト filed Critical サン パテント トラスト
Publication of JP2013219806A publication Critical patent/JP2013219806A/ja
Application granted granted Critical
Publication of JP6074743B2 publication Critical patent/JP6074743B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/005Statistical coding, e.g. Huffman, run length coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/007Transform coding, e.g. discrete cosine transform
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/008Vector quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/436Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Description

本発明は、画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、及び、画像符号化復号装置に関する。
既に標準化されている画像符号化方式として、H.264が知られている。このような画像符号化方式では、ピクチャを分割して符号化する技術として、スライスを用いる。スライスを用いることで、画像復号装置は、ピクチャに含まれる各スライスを独立して復号することができる。
また、近年、ピクチャを分割して符号化する新しい技術として、タイルと呼ばれる符号化技術が提案されている(例えば、非特許文献1参照)。
「Tiles」(JCTVC−F335)Joint Collaborative Team on Video Coding(JCT−VC) of ITU−T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 6th Meeting:Torino,IT,14−22July,2011 「New results for parallel decoding for Tiles」(JCTVC−F594)Joint Collaborative Team on Video Coding(JCT−VC) of ITU−T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 6th Meeting:Torino,IT,14−22July,2011
このような画像符号化方法及び画像復号方法では、処理負荷の低減、及び符号化効率の向上が求められている。
そこで、本発明は、処理負荷を低減、又は符号化効率を向上できる画像符号化方法又は画像復号方法を提供することを目的とする。
本発明の一態様に係る画像復号方法は、ビットストリームに含まれる、ピクチャが分割された複数のタイルの各々が符号化されることにより生成された複数の符号化データを取得する取得ステップと、前記複数の符号化データの各々を復号することで、前記複数のタイルの画像データを生成する復号ステップとを含み、前記取得ステップでは、前記ビットストリームから前記複数のタイルのタイル間の境界が第1境界であるか第2境界であるかを示すタイル境界独立情報をさらに取得し、前記復号ステップは、前記複数の符号化データの一つである第1符号化データに含まれる第1符号列を復号する際に、前記タイル境界独立情報が前記第1境界であることを示す場合は他の復号済みタイルの復号情報を参照して復号し、前記第2境界であることを示す場合は、他の復号済みタイルの復号情報を参照せずに復号することで、前記複数のタイルの一つである第1タイルの画像データを生成する第1画像データ生成ステップと、前記第1符号化データに含まれ、前記第1符号列の後に位置する、予め定められたビット列をスキップするスキップステップとを含む。
なお、これらの包括的または具体的な態様は、システム、方法、集積回路、コンピュータプログラムまたはコンピュータ読み取り可能なCD−ROMなどの記録媒体で実現されてもよく、システム、方法、集積回路、コンピュータプログラムおよび記録媒体の任意な組み合わせで実現されてもよい。
本発明は、処理負荷を低減、又は符号化効率を向上できる画像符号化方法又は画像復号方法を提供できる。
図1は、本発明の実施の形態1に係る画像符号化装置のブロック図である。 図2は、本発明の実施の形態1に係るピクチャ分割処理のフローチャートである。 図3Aは、本発明の実施の形態1に係るタイル分割パターンの一例を示す図である。 図3Bは、本発明の実施の形態1に係るタイル分割パターンの一例を示す図である。 図3Cは、本発明の実施の形態1に係るタイル分割パターンの一例を示す図である。 図4Aは、本発明の実施の形態1に係るタイル境界独立情報の一例を示す図である。 図4Bは、本発明の実施の形態1に係るタイル境界独立情報の一例を示す図である。 図5は、本発明の実施の形態1に係る画像復号装置のブロック図である。 図6は、本発明の実施の形態2に係る画像符号化装置のブロック図である。 図7Aは、本発明の実施の形態2に係るタイルのスキャン順の一例を示す図である。 図7Bは、本発明の実施の形態2に係るタイルのスキャン順の一例を示す図である。 図7Cは、本発明の実施の形態2に係るタイルのスキャン順の一例を示す図である。 図7Dは、本発明の実施の形態2に係るタイルのスキャン順の一例を示す図である。 図8は、本発明の実施の形態2に係る画像復号装置のブロック図である。 図9は、本発明の実施の形態3に係る画像符号化装置のブロック図である。 図10は、本発明の実施の形態3に係るマーカー挿入処理のフローチャートである。 図11は、本発明の実施の形態3に係る画像復号装置のブロック図である。 図12は、本発明の実施の形態4に係る画像符号化装置のブロック図である。 図13Aは、本発明の実施の形態4に係る画像符号化方法のフローチャートである。 図13Bは、本発明の実施の形態4に係る符号化処理のフローチャートである。 図14は、本発明の実施の形態4に係るバイトアライメント処理を示す図である。 図15は、本発明の実施の形態4に係る画像復号装置のブロック図である。 図16Aは、本発明の実施の形態4に係る画像復号方法のフローチャートである。 図16Bは、本発明の実施の形態4に係る復号処理のフローチャートである。 図17Aは、タイル分割パターンの一例を示す図である。 図17Bは、タイルに含まれるブロックの処理順を示す図である。 図18は、コンテンツ配信サービスを実現するコンテンツ供給システムの全体構成図である。 図19は、デジタル放送用システムの全体構成図である。 図20は、テレビの構成例を示すブロック図である。 図21は、光ディスクである記録メディアに情報の読み書きを行う情報再生/記録部の構成例を示すブロック図である。 図22は、光ディスクである記録メディアの構造例を示す図である。 図23Aは、携帯電話の一例を示す図である。 図23Bは、携帯電話の構成例を示すブロック図である。 図24は、多重化データの構成を示す図である。 図25は、各ストリームが多重化データにおいてどのように多重化されているかを模式的に示す図である。 図26は、PESパケット列に、ビデオストリームがどのように格納されるかを更に詳しく示した図である。 図27は、多重化データにおけるTSパケットとソースパケットの構造を示す図である。 図28は、PMTのデータ構成を示す図である。 図29は、多重化データ情報の内部構成を示す図である。 図30は、ストリーム属性情報の内部構成を示す図である。 図31は、映像データを識別するステップを示す図である。 図32は、各実施の形態の動画像符号化方法および動画像復号化方法を実現する集積回路の構成例を示すブロック図である。 図33は、駆動周波数を切り替える構成を示す図である。 図34は、映像データを識別し、駆動周波数を切り替えるステップを示す図である。 図35は、映像データの規格と駆動周波数を対応づけたルックアップテーブルの一例を示す図である。 図36Aは、信号処理部のモジュールを共有化する構成の一例を示す図である。 図36Bは、信号処理部のモジュールを共有化する構成の他の一例を示す図である。
(本発明の基礎となった知見)
まず、図17A及び図17Bを用いてタイルについて説明する。
ピクチャは、任意の数のコラム(Column)とロウ(Row)とに分割される。そして境界線で囲まれた各領域がタイルと呼ばれる。
図17Aは、ピクチャが3つのコラムと3つのロウに分割された例を示す。分割の結果、ピクチャ内にはT1からT9の9つのタイルが存在する。コラムの幅は、LCU(Largest Coding Unit)を単位として、コラム毎に異なる値に設定できる。また、全てのコラムの幅が同一になるように設定することもできる。同様に、ロウの高さ(タイルの垂直方向の幅)は、LCUを単位として、ロウ毎に異なる値に設定できる。また、全てのロウの高さが同一になるように設定することもできる。
ピクチャを符号化する際、タイルはピクチャ内においてラスタスキャン順で処理される。すなわち、左上のタイルT1からT2、T3と処理され、右下のT9まで順番に処理される。
図17Bは、各タイルに含まれるLCUの例を示す。各々のタイルは一つ以上のLCUを含む。例えば、タイルT1は、1番から15番の16個のLCUを含んでいる。ピクチャを符号化する際、LCUはタイル内においてラスタスキャン順で処理される。上述したように、タイルはピクチャ内においてラスタスキャン順で処理されるため、複数のLCUは、図17Bに示す1番から53番のような順序で処理されることになる。
このように、ピクチャを複数のタイルに分割した場合には、ピクチャを分割しない場合に対して、LCUの処理順序が変わる場合がある。一方で、ピクチャを複数のスライスに分割した場合は、ピクチャを分割しない場合に対して、LCUの処理順序は変わらない。このように、タイルを用いることで、任意の分割が可能となるとともに処理順序を最適に設定できるので、スライスを用いる場合に比べて符号化効率を改善できる。
また、処理対象のLCUを符号化する際、通常、処理対象のLCUその周辺に位置するLCUの符号化情報が利用される。例えば、イントラ予測又は動きベクトル予測においては、処理対象のLCUの周辺に位置するLCUの情報が参照され、当該情報が処理対象のLCUの符号化に用いられる。つまり、処理対象のLCUは周辺のLCUに依存していることになる。一般に、参照に用いることができるLCUが多ければ多いほど、予測の精度が高まる。これにより、符号化効率が向上する。しかしながら、他のLCUに依存しているLCUは、被依存LCUと切り離して復号することはできない。
また、タイル境界での符号化の依存関係を示すフラグ(タイル境界独立フラグ:tile_boundary_independence_idc)が設けられている。このタイル境界独立フラグには、1ビットが割り当てられている。そして、このタイル境界独立フラグは、シーケンスパラメータセット(SPS)又はピクチャパラメータセット(PPS)に含まれた状態で画像復号装置に送られる。
タイル境界独立フラグがオンのときは、各タイルは独立する。すなわち、タイル内のあるLCUを符号化する際、タイル境界を越えるLCUの符号化情報は参照できず、タイル内のLCUの符号化情報のみが予測に利用されることになる。反対に、タイル境界独立フラグがオフのときは、各タイルは依存関係を有する。つまり、処理対象のLCUが含まれるタイル、及び他のタイルに含まれる、利用できる関係にある全てのLCUの情報を符号化に利用することができる。
なお、タイルは1つ以上のスライスを含んでも良く、スライスは1つ以上のタイルを含んでも良い。ただし、スライスが1つ以上のタイルを含む場合には、同一のスライスに属するLCUが複数のタイルに跨って存在することになる。その結果、タイル間での符号化の独立性を保つことはできず、タイル境界独立フラグはオフに設定しなければならない。
このような画像符号化方法及び画像復号方法では、処理負荷の低減、及び符号化効率の向上が求められている。
そこで、本実施の形態では、処理負荷を低減、又は符号化効率を向上できる画像符号化方法、画像復号方法、画像符号化装置及び画像復号装置について説明する。
このような課題を解決するために、本発明の一態様に係る画像符号化方法は、ピクチャを複数のタイルに分割する分割ステップと、前記複数のタイルの各々を符号化することで、各々が前記複数のタイルの各々に対応する複数の符号化データを生成する符号化ステップと、前記複数の符号化データを含むビットストリームを生成するビットストリーム生成ステップとを含み、前記符号化ステップは、前記複数のタイルの一つである第1タイルを、他のタイルの符号化に用いられた符号化情報を参照せずに符号化することで第1符号列を生成する符号列生成ステップと、前記第1符号列の後にビット列を追加することで、前記複数の符号化データの一つである第1符号化データのビット長を予め定められたN(Nは2以上の整数)ビットの倍数にするアライメントステップとを含む。
これにより、各タイルの符号化データは予め定められたビット数の倍数となる。よって、画像復号装置における符号化データの扱いが容易になる。また、画像復号装置は、容易にタイルの符号化データの先頭位置を特定できる。このように、当該画像符号化方法は、画像復号装置の処理負荷を低減できる。
例えば、前記符号列生成ステップは、算術符号化により前記第1符号列を生成する算術符号化ステップを含み、前記算術符号化ステップでは、前記第1符号列を完結させるターミネート処理を行ってもよい。
これにより、画像復号装置は、各タイルの符号化データを独立して扱うことができる。
例えば、前記分割ステップでは、さらに、前記複数のタイルのタイル間の境界の各々を、第1境界と第2境界とに分類し、前記符号化ステップでは、前記複数のタイルの各々に対して、当該タイルに隣接する符号化済みのタイルのうち、前記第1境界を跨ぐタイルの符号化情報を参照し、かつ、前記第2境界を跨ぐタイルの符号化情報を参照せずに当該タイルを符号化し、前記ビットストリーム生成ステップでは、前記複数のタイルのタイル間の境界の各々が第1境界であるか第2境界であるかを示すタイル境界独立情報を含む前記ビットストリームを生成してもよい。
これにより、タイル境界ごとにタイル間の依存関係が設定される。よって、例えばピクチャ単位でタイル間の依存関係が設定される場合に比べて、符号化効率が改善される。
例えば、前記タイル境界独立情報は、前記ビットストリームに含まれるピクチャパラメータセット又はシーケンスパラメータセットに含まれてもよい。
例えば、前記分割ステップでは、さらに、前記複数のタイルの符号化順を決定し、前記符号化ステップでは、前記複数のタイルを、決定された符号化順で符号化し、前記ビットストリーム生成ステップでは、前記符号化順を示すタイル処理順序情報を含む前記ビットストリームを生成してもよい。
これにより、画像復号装置におけるタイルの復号処理順を任意に設定できる。よって、例えば、ピクチャに含まれる複数の領域の画像のうち、優先度の高い領域の画像を、画像復号装置において先に復号することができる。
例えば、前記タイル処理順序情報は、前記ビットストリームに含まれるピクチャパラメータセット又はシーケンスパラメータセットに含まれてもよい。
例えば、前記ビットストリーム生成ステップでは、前記複数の符号化データのデータ境界のうち、当該データ境界を挟む2つの符号化データに対応する2つのタイル間の境界が第2境界であるデータ境界にのみ、当該データ境界を特定するためのマーカーを挿入してもよい。
これにより、当該画像符号化方法は、全てのタイル境界にマーカーを挿入する場合に比べて、符号化効率を改善できる。
また、本発明の一態様に係る画像復号方法は、ビットストリームに含まれる、ピクチャが分割された複数のタイルの各々が符号化されることにより生成された複数の符号化データを取得する取得ステップと、前記複数の符号化データの各々を復号することで、前記複数のタイルの画像データを生成する復号ステップとを含み、前記復号ステップは、前記複数の符号化データの一つである第1符号化データに含まれる第1符号列を、他のタイルの復号に用いられた復号情報を参照せずに復号することで、前記複数のタイルの一つである第1タイルの画像データを生成する第1画像データ生成ステップと、前記第1符号化データに含まれ、前記第1符号列の後に位置する、予め定められたビット列をスキップするスキップステップとを含む。
これにより、当該画像復号方法は、容易にタイルの符号化データの先頭位置を特定できる。このように、当該画像復号方法は、画像復号装置の処理負荷を低減できる。
例えば、前記第1画像データ生成ステップは、前記第1符号列を算術復号する算術復号ステップを含み、前記算術復号ステップは、前記スキップステップの前に、前記第1符号列に対する算術復号処理を完結するターミネート処理を行うターミネート処理ステップを含んでもよい。
これにより、画像復号装置は、各タイルの符号化データを独立して扱うことができる。
例えば、前記復号ステップは、さらに、前記複数の符号化データに含まれ、前記第1符号化データの後に位置する第2符号化データに含まれる第2符号列を復号することで、前記複数のタイルの一つである第2タイル画像データを生成する第2画像データ生成ステップを含んでもよい。
また、本発明の一態様に係る画像符号化装置は、ピクチャを複数のタイルに分割する分割部と、前記複数のタイルの各々を符号化することで、各々が前記複数のタイルの各々に対応する複数の符号化データを生成する符号化部と、前記複数の符号化データを含むビットストリームを生成するビットストリーム生成部とを備え、前記符号化部は、前記複数のタイルの一つである第1タイルを、他のタイルの符号化に用いられた符号化情報を参照せずに符号化することで第1符号列を生成し、前記第1符号列の後にビット列を追加することで、前記複数の符号化データの一つである第1符号化データのビット長を予め定められたN(Nは2以上の整数)ビットの倍数にする。
これにより、各タイルの符号化データは予め定められたビット数の倍数となる。よって、画像復号装置における符号化データの扱いが容易になる。また、画像復号装置は、容易にタイルの符号化データの先頭位置を特定できる。このように、当該画像符号化装置は、画像復号装置の処理負荷を低減できる。
また、本発明の一態様に係る画像復号装置は、ビットストリームに含まれる、ピクチャが分割された複数のタイルの各々が符号化されることにより生成された複数の符号化データを取得する解析部と、前記複数の符号化データの各々を復号することで、前記複数のタイルの画像データを生成する復号部とを備え、前記復号部は、前記複数の符号化データの一つである第1符号化データに含まれる第1符号列を、他のタイルの復号に用いられた復号情報を参照せずに復号することで、前記複数のタイルの一つである第1タイルの画像データを生成し、前記第1符号化データに含まれ、前記第1符号列の後に位置する、予め定められたビット列をスキップする。
これにより、当該画像復号装置は、容易にタイルの符号化データの先頭位置を特定できる。このように、当該画像復号装置は処理負荷を低減できる。
また、本発明の一態様に係る画像符号化復号装置は、前記画像符号化装置と、前記画像復号装置とを備える。
なお、これらの包括的または具体的な態様は、システム、方法、集積回路、コンピュータプログラムまたはコンピュータ読み取り可能なCD−ROMなどの記録媒体記録媒体で実現されてもよく、システム、方法、集積回路、コンピュータプログラムまたは記録媒体の任意な組み合わせで実現されてもよい。
以下、本発明の実施の形態について、図面を参照しながら説明する。
なお、以下で説明する実施の形態は、いずれも包括的または具体的な例を示すものである。以下の実施の形態で示される数値、形状、材料、構成要素、構成要素の配置位置及び接続形態、ステップ、ステップの順序などは、一例であり、本発明を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、最上位概念を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。
(実施の形態1)
上述したように、ピクチャ単位で、タイル間の依存関係を設定する場合、当該設定に応じて、ピクチャ内の全てのタイル間の依存関係が絶たれる。これにより、符号化効率が低下するという課題があることを本発明者は見出した。
これに対して本実施の形態に係る画像符号化装置は、タイル間の依存関係をタイル境界単位で設定する。これにより、当該画像符号化装置は、タイル間の依存関係をピクチャ単位で設定する場合に比べて、符号化効率を向上できる。
図1は、本実施の形態に係る画像符号化方法を用いた画像符号化装置100の構成を示すブロック図である。
図1に示す画像符号化装置100は、入力画像信号120を符号化することによりビットストリーム134を生成する。この画像符号化装置100は、符号化部115と、ピクチャ分割制御部112と、多重化部114とを備える。また、符号化部115は、減算器101と、直交変換部102と、量子化部103と、逆量子化部104と、逆直交変換部105と、加算器106と、ブロックメモリ107と、フレームメモリ108と、イントラ予測部109と、インター予測部110と、ピクチャタイプ決定部111と、可変長符号化部113とを備える。
ピクチャ分割制御部112は、分割部の一例であり、ピクチャを1つ以上のタイルに分割するとともに、各タイル境界におけるタイル間の依存関係を決定する。そして、ピクチャ分割制御部112は、当該タイルの分割に関する情報であるピクチャ分割情報135を多重化部114に送信する。具体的には、ピクチャ分割情報135は、ピクチャの分割パターン及びタイル間の依存関係を示す。
また、ピクチャ分割制御部112は、このピクチャ分割情報135を、シーケンスパラメータセット(SPS:Sequence Parameter Set)又はピクチャパラメータセット(PPS:Picture Parameter Set)の一部として、多重化部114に送信する。ピクチャパラメータセットは、ピクチャのヘッダに相当するパラメータセットである。シーケンスパラメータセットは、1枚以上のピクチャに共通に使用することが可能なヘッダに相当するパラメータセットである。ピクチャパラメータセットは、可変長符号化のタイプ、量子化ステップの初期値、及び参照ピクチャ数などを含む。シーケンスパラメータセットには、参照可能な最大のピクチャ数、画像サイズ、及びビデオ表示情報(VUI:Video Usability Information)などを含む。
また、ピクチャ分割制御部112は、ピクチャの分割パターン及びタイル間の依存関係に基づいて、イントラ予測部109、インター予測部110及び可変長符号化部113を制御するための分割制御信号132を生成する。
符号化部115は、入力画像信号120を符号化することで符号化データ133を生成する。
減算器101は、後述する処理部で生成された予測画像データ131と、入力画像信号120との差分を算出することで予測誤差データ121を生成する。直交変換部102は、予測誤差データ121を画像領域から周波数領域へ変換することで変換係数122を生成する。量子化部103は、変換係数122を量子化することで量子化係数123を生成する。
逆量子化部104は、量子化係数123を逆量子化することで変換係数124を生成する。逆直交変換部105は、変換係数124を周波数領域から画像領域へ変換することで予測誤差データ125を生成する。加算器106は、予測画像データ131と予測誤差データ125とを加算することで復号画像データ126を生成する。ブロックメモリ107は、復号画像データ126をブロック単位で復号画像データ127として保存する。フレームメモリ108は、復号画像データ126をフレーム単位で復号画像データ128として保存する。
イントラ予測部109は、ブロックメモリ107に保存されているブロック単位の復号画像データ127を用いてイントラ予測を行うことで、符号化対象ブロックの予測画像データ129を生成する。また、イントラ予測部109は、ピクチャ分割制御部112から送られた分割制御信号132に基づき、タイル間の依存関係を検出する。そして、イントラ予測部109は、処理対象のタイルと依存関係が絶たれているタイルに含まれるブロックの画素情報を用いないでイントラ予測を行う。
インター予測部110は、フレームメモリ108に保存されているフレーム単位の復号画像データ128を用いてインター予測を行うことで、符号化対象ブロックの予測画像データ130を生成する。また、インター予測部110は、ピクチャ分割制御部112から送られた分割制御信号132に基づき、タイル間の依存関係を検出する。そして、インター予測部110は、処理対象のタイルと依存関係が絶たれているタイルに含まれるブロックの動きベクトル情報を用いないで動きベクトル予測を行う。
可変長符号化部113は、量子化係数123を可変長符号化することで符号化データ133を生成する。また、可変長符号化部113は、ピクチャ分割制御部112から送られた分割制御信号132に基づき、タイル間の依存関係を検出する。そして、可変長符号化部113は、依存関係が絶たれているタイル境界でエントロピー符号化処理をリセットする。
多重化部114は、ビットストリーム生成部の一例であり、ピクチャ分割情報135が含まれているピクチャパラメータセット又はシーケンスパラメータセットを取得し、符号化データ133にこれらのパラメータを多重化することでビットストリーム134を生成する。
以下、ピクチャ分割制御部112によるピクチャを複数のタイルに分割する処理について説明する。図2は、本実施の形態に係るピクチャ分割制御部112によるピクチャ分割処理のフローチャートである。
まず、ピクチャ分割制御部112は、複数のタイルのコラムの数であるコラム数を決定する(S101)。次に、ピクチャ分割制御部112は、複数のタイルのロウの数であるロウ数を決定する(S102)。次に、ピクチャ分割制御部112は、決定したコラム数とロウ数とが両方とも1であるか否かを判定する(S103)。つまり、ピクチャ分割制御部112は、ピクチャが複数のタイルに分割されるか否かを判定する。コラム数及びロウ数が共に1である場合(S103でYes)、すなわちピクチャが複数のタイルに分割されない場合、ピクチャ分割制御部112は処理を終了する。
一方、コラム数及びロウ数の少なくとも一方が2以上である場合(S103でNo)、つまり、ピクチャが複数のタイルに分割される場合、ピクチャ分割制御部112は、タイル境界における符号化の依存関係を決定し、決定した依存関係を示すタイル境界独立情報を生成する(S104)。
次に、ピクチャ分割制御部112は、LCU(Largest Coding Unit:最大符号化単位)を単位として用いて、各コラムの幅(タイルの水平方向の幅)を決定する。具体的には、まず、ピクチャ分割制御部112は、ピクチャに含まれる全てのコラムの幅を同じにするか否かを決定する(S105)。全てのコラムの幅が同じである場合(S105でYes)、ピクチャ分割制御部112は、コラム幅均等フラグを「1」に設定する(S106)。一方、複数のコラムの幅がピクチャ内で異なる場合(S105でNo)、ピクチャ分割制御部112は、コラム幅均等フラグを「0」に設定し(S107)、各コラムの幅を決定する(S108)。
次に、ピクチャ分割制御部112は、LCUを単位として、ロウの高さを決定する。具体的には、まず、ピクチャ分割制御部112は、ピクチャに含まれる全てのロウの高さを同じにするか否かを決定する(S109)。全てのロウの高さ同じである場合(S109でYes)、ピクチャ分割制御部112は、ロウ高さ均等フラグを「1」に設定する(S110)。一方、複数のロウの高さがピクチャ内で異なる場合(S109でNo)、ピクチャ分割制御部112は、ロウ高さ均等フラグを「0」に設定し(S111)、各ロウの高さを決定する(S112)。
以上のように、ピクチャ分割制御部112はピクチャを複数のタイルに分割する。そして、ピクチャ分割制御部112は、ピクチャの分割パターンを示す情報と、タイル境界独立情報とを含むピクチャ分割情報135を生成し、生成したピクチャ分割情報135をシーケンスパラメータセット(SPS)又はピクチャパラメータセット(PPS)の一部として、多重化部114に送信する。ここで、ピクチャの分割パターンを示す情報は、例えば、コラム数、ロウ数、コラム幅均等フラグ、及びロウ高さ均等フラグを含む。また、当該情報は、必要に応じて、コラムの幅、及びロウの高さを含む。
図3A〜図3Cは、ピクチャをタイルへの分割するパターンの一例を示す図である。図3A〜図3Cに示す破線はその境界の両端のタイルが依存関係にあることを示し、実線はその境界の両端のタイルが互いに独立していること、すなわち依存関係が絶たれていることを示す。具体的には、2つのタイルが依存関係にある場合には、画像符号化装置100は、一方のタイルを他方のタイルの符号化情報を参照して符号化する。また、2つのタイルが互いに独立している場合には、画像符号化装置100は、一方のタイルを他方のタイルの符号化情報を参照せずに符号化する。ここで、符号化情報とは、符号化に用いられる情報であり、具体的には、イントラ予測における画素情報(画素値)、及びインター予測における動きベクトル情報である。なお、以降の説明では、2つのタイルが依存関係にある場合を2つのタイル(タイル間)は依存していると呼び、2つのタイルの依存関係が絶たれている場合を2つのタイル(タイル間)は独立であると呼ぶ。また、その境界の両端のタイルが依存している場合、当該境界は依存していると呼び、その境界の両端のタイルが独立している場合、当該境界は独立していると呼ぶ。
図3Aでは、垂直方向のタイル間(例えばT1とT4との間)ではタイルは依存しており、水平方向のタイル間(例えばT1とT2との間)ではタイルは独立である。また、2ビットが割り当てられたタイル境界独立情報によりタイル境界でのタイルの依存関係が示される。例えば、1ビット目が水平方向のタイル間の依存関係を示し、2ビット目が垂直方向のタイル間の依存関係を示す。タイルが独立である場合には、ビットが「1」に設定され、タイルが依存している場合にビットが「0」に設定される。この場合、図3Aにおけるタイル境界独立情報は「0b10」である。
図3Bでは、水平方向のタイル間ではタイルは依存しており、垂直方向のタイル間ではタイルは独立である。したがって、タイル境界独立情報は「0b01」である。なお、全てのタイル間が独立である場合には、タイル境界独立情報は「0x11」であり、全てのタイル間が依存している場合には、タイル境界独立情報は「0b00」である。
図3Cでは、タイル間の依存関係がタイル境界毎に異なる。垂直方向のタイル間であっても、タイルT1とタイルT4とは独立であり、タイルT2とタイルT5とは依存している。なお、図3Cは一例であって、隣接するタイルの境界毎に、符号化又は復号処理におけるタイル間の依存関係は任意に設定されてよい。
図4A及び図4Bは、タイル境界毎にタイル間の依存関係を設定する場合のタイル境界独立情報を示す図である。図4Aに示すタイル境界独立情報140は、全体のタイル間の依存関係を示す1ビットの全体依存情報141と、水平方向のタイル間の依存関係を示す複数ビット((コラム数−1)×ロウ数)の水平依存情報142と、垂直方向のタイル間の依存関係を示す複数ビット(コラム数×(ロウ数−1))の垂直依存情報143とを含む。また、図4A及び図4Bは、図3Cに示す依存関係の場合のタイル境界独立情報の例である。
水平依存情報142に含まれる各ビットは、先頭から順に、T1とT2との間の依存関係、T2とT3との間の依存関係、T4とT5との間の依存関係、T5とT6との間の依存関係、T7とT8との間の依存関係、T8とT9との間の依存関係を示す。また、垂直依存情報143に含まれる各ビットは、先頭から順に、T1とT4との間の依存関係、T2とT5との間の依存関係、T3とT6との間の依存関係、T4とT7との間の依存関係、T5とT8との間の依存関係、T6とT9との間の依存関係を示す。
図3Cに示す例では、T2とT5と、及びT5とT8とが依存しているために、図4Aに示すタイル境界独立情報140では、垂直依存情報143の先頭から2ビット目及び5ビット目が「0」に設定されている。なお、全てのタイル間が独立である場合には、先頭の1ビットの全体依存情報141が「1」に設定され、水平依存情報142及び垂直依存情報143は省略される。
図4Bは、タイル境界独立情報の別の例を示す図である。図4Bに示すタイル境界独立情報145は、タイル間の依存関係を示す2ビットの全体依存情報146と、水平方向のタイル間の依存関係を示す複数ビット((コラム数−1)×ロウ数)の水平依存情報142(図4Bでは省略されている)と、垂直方向のタイル間の依存関係を示す複数ビット(コラム数×(ロウ数−1))の垂直依存情報143とを含む。ここで、先頭の2ビットの全体依存情報146は、図3A及び図3Bで用いられたタイル境界独立情報そのものである。すなわち、全体依存情報146の1ビット目が水平方向のタイル間の依存関係を示し、2ビット目が垂直方向のタイル間の依存関係を示す。なお、水平依存情報142及び垂直依存情報143は、図4Aで説明したものと同一である。図3Cの例では、水平方向のタイル間ではタイルは独立である。したがって、全体依存情報146は、「0b10」である。また、水平方向のタイル間ではタイルは独立であるため、水平依存情報142は省略されている。つまり、図4Bに示すタイル境界独立情報145では水平方向の全てのタイル間の依存関係が独立である場合には、水平依存情報142が省略される。また、垂直方向の全てのタイル間の依存関係が独立である場合には、垂直依存情報143が省略される。これにより、タイル境界独立情報145のビット数を削減できる。
ここで、ピクチャを分割するメリットの一つは、並列処理を可能にできることである。例えば、図3A〜図3Cでは、ピクチャは9個のタイルに分割されており、全てのタイルが独立であれば、画像符号化装置及び画像復号装置は、9個のタイルを並列して符号化又は復号することができる。ハイビジョンの解像度を越えるスーパーハイビジョン(Super Hi−Vision)及びUHDTV(Ultra High Definition Television)と呼ばれる高解像度の画像の符号化及び復号処理は、演算負荷が高く実時間処理が難しい。そこで、高解像度の画像を符号化及び復号する際には、特に並列処理の必要性が高い。一方で、符号化の際、タイル間の依存関係が絶たれれば絶たれるだけ予測精度が低下する。これにより、符号化効率が低下する。したがって、必要以上にタイル間の依存関係を絶つことは符号化効率の点から望ましくない。
例えば、画像符号化装置及び画像復号装置が3プロセッサまで利用可能であり、3並列の処理を行うことができると仮定する。この状況では、図3A〜図3Cに示すようにタイルを9分割した場合でも、独立したタイル群(1つ以上のタイル含むグループをタイル群と呼ぶ)は、並列処理が可能なプロセッサの数に相当する3であれば十分である。独立したタイル群が3つより多くなるようにピクチャを分割することは、符号化効率を必要以上に低下させることにつながる。つまり、タイル間の依存関係(タイル間を依存させるか、独立させるか)がピクチャ毎に設定される場合、画像符号化装置又は画像復号装置が3並列の処理しかできない場合であっても、ピクチャ内の全てのタイル間で依存関係が絶たれる。これにより、符号化効率の低下を招いてしまう。
一方で、本実施の形態によれば、タイル間の依存間系を境界毎に設定できる。これにより、例えば、画像符号化装置又は画像復号装置が並列処理可能な並列数にあわせて、独立したタイル群を生成できる。よって、本実施の形態に係る画像符号化装置100は、符号化効率の低下を抑制するとともに、任意の並列数の並列処理を行うことができる。このように、本実施の形態に係る画像符号化装置100は、符号化効率を向上できる。
以上のように、本実施の形態に係る画像符号化装置100では、ピクチャ分割制御部112は、ピクチャを複数のタイルに分割する。符号化部115は、複数のタイルの各々を符号化することで、各々が複数のタイルの各々に対応する複数の符号化データ133を生成する。多重化部114は、複数の符号化データ133を含むビットストリームを生成する。
さらに、ピクチャ分割制御部112は、複数のタイルのタイル間の境界の各々を、第1境界(依存)と第2境界(独立)とに分類する。符号化部115は、複数のタイルの各々に対して、当該タイルに隣接する符号化済みのタイルのうち、第1境界を跨ぐタイルの符号化情報を参照し、かつ、第2境界を跨ぐタイルの符号化情報を参照せずに当該タイルを符号化する。また、多重化部114は、複数のタイルのタイル間の境界の各々が第1境界であるか第2境界であるかを示すタイル境界独立情報を含むビットストリーム134を生成する。
これにより、タイル間の境界ごとにタイルの依存関係が設定される。よって、例えばピクチャ単位でタイルの依存関係が設定される場合に比べて、符号化効率が改善される。
以下、本実施の形態に係る画像復号装置について説明する。
図5は、本実施の形態に係る画像復号方法を用いた画像復号装置200のブロック図である。
図5に示す画像復号装置200は、ビットストリーム234を復号することにより復号画像データ226を生成する。この画像復号装置200は、復号部215と、解析部201と、ピクチャ分割制御部212とを備える。また、復号部215は、逆量子化部204と、逆直交変換部205と、加算器206と、ブロックメモリ207と、フレームメモリ208と、イントラ予測部209と、インター予測部210と、ピクチャタイプ決定部211と、可変長復号部213とを備える。
ここで、ビットストリーム234は、上記画像符号化装置100により生成されたビットストリーム134に対応する。
解析部201は、ビットストリーム234を解析することにより、符号化データ233と、ビットストリーム234のシーケンスパラメータセット又はピクチャパラメータセットに含まれるピクチャ分割情報235とを取得する。ピクチャ分割情報235は、上記ピクチャ分割情報135に対応し、ピクチャの分割パターン及びタイルの依存関係を示す。
ピクチャ分割制御部212は、ピクチャ分割情報235で示されるピクチャの分割パターン及びタイル間の依存関係に基づいて、イントラ予測部209、インター予測部210及び可変長復号部213を制御するための分割制御信号232を生成する。
復号部215は、符号化データ233を復号することで復号画像データ226を生成する。
可変長復号部213は、符号化データ233を可変長復号することで量子化係数223を生成する。
逆量子化部204は、量子化係数223を逆量子化することで変換係数224を生成する。逆直交変換部205は、変換係数224を周波数領域から画像領域へ変換することで予測誤差データ225を生成する。加算器206は、予測画像データ231と予測誤差データ225とを加算することで復号画像データ226を生成する。ブロックメモリ207は、復号画像データ226をブロック単位で復号画像データ227として保存する。フレームメモリ208は、復号画像データ226をフレーム単位で復号画像データ228として保存する。
イントラ予測部209は、ブロックメモリ207に保存されているブロック単位の復号画像データ227を用いてイントラ予測を行うことで、復号対象ブロックの予測画像データ229を生成する。また、イントラ予測部209は、ピクチャ分割制御部212から送られた分割制御信号232に基づき、タイル間の依存関係を検出する。そして、イントラ予測部209は、依存関係が絶たれているタイルに含まれるブロックの画素情報を用いないでイントラ予測を行う。
インター予測部210は、フレームメモリ208に保存されているフレーム単位の復号画像データ228を用いてインター予測を行うことで、復号対象ブロックの予測画像データ230を生成する。また、インター予測部210は、ピクチャ分割制御部212から送られた分割制御信号232に基づき、タイル間の依存関係を検出する。そして、インター予測部210は、依存関係が絶たれているタイルに含まれるブロックの動きベクトル情報を用いないで動きベクトル予測を行う。
以上の構成により、本実施の形態に係る画像復号装置200は、上記画像符号化装置100により生成されたビットストリームを復号できる。
(実施の形態2)
本実施の形態では、上述した実施の形態1に係る画像符号化装置100の変形例について説明する。なお、以下では、実施の形態1との相違点を主に説明し、重複する説明は省略する。
図6は、本実施の形態に係る画像符号化方法を用いた画像符号化装置の構成を示すブロック図である。なお、図1と同様の要素には同一の符号を付している。
図6に示す画像符号化装置100Aは、図1に示す画像符号化装置100の構成に加え、さらに、入力画像制御部150を備える。また、ピクチャ分割制御部112Aの機能が、ピクチャ分割制御部112と異なる。
具体的には、ピクチャ分割制御部112Aは、分割部の一例であり、実施の形態1で説明したようにピクチャをタイルに分割する機能に加え、タイルを符号化及び復号処理する順序を決定し、決定した順序を示すタイル処理順序情報を含むピクチャ分割情報135Aを生成する。また、ピクチャ分割制御部112Aは、タイル処理順序情報を含むピクチャ分割情報135Aをシーケンスパラメータセット(SPS)又はピクチャパラメータセット(PPS)の一部として、多重化部114に送信する。
また、ピクチャ分割制御部112Aは、ピクチャの分割パターン、タイル間の依存関係及び符号化処理の順序に基づいて、イントラ予測部109、インター予測部110、可変長符号化部113、フレームメモリ108及び入力画像制御部150を制御するための分割制御信号132Aを生成する。なお、ピクチャ分割情報135Aに基づくイントラ予測部109、インター予測部110及び可変長符号化部113の動作は、実施の形態1と同様である。
入力画像制御部150は、入力画像信号120をブロック単位で、所定の順序に並び替え、並び替えた後の画像信号160を符号化部に入力する。ピクチャがタイルに分割される場合には、入力画像制御部150は、ピクチャ分割制御部112から送信される分割制御信号132Aで示される符号化処理の順序に従って、ブロックの順序を決定する。
フレームメモリ108は、分割制御信号132Aに基づき、タイルの処理される順序を認識し、適切なメモリ領域に復号画像データ128を保存する。
次に、タイルを処理(スキャン)する順序を示すタイル処理順序情報について説明する。タイル処理順序情報を用いることで、画像符号化装置及び画像復号装置は、タイルのスキャン方向と、コラム又はロウのスキャンの順序を特定し、ピクチャ内でのタイルの符号化又は復号処理の順序を一意に特定することができる。
図7A〜図7Dは、9つのタイルに分割されたピクチャにおいて、タイルが処理(スキャン)される順序を示す図である。なお、タイルはT1〜T9の順に処理される。
図7Aは、ラスタスキャンの場合を示す。すなわち、上の行(ロウ)が選択され、選択された行において左のタイルから水平方向(右方向)に順次タイルが選択される。一つの行の全てのタイルが選択されると、一つ下の行が選択され、同様に、選択された行において左のタイルから右方向に順次タイルが選択される。
図7Bでは、左の列が選択され、選択された列(コラム)において上のタイルから垂直方向(下方向)に順次タイルが選択される。一つの列の全てのタイルが選択されると、一つ左の列が選択され、同様に、選択された列において上のタイルから下方向に順次タイルが選択される。すなわち、タイルは垂直方向にスキャンされる。
このように、スキャン方向は、水平方向と垂直方向とに大別できる。次に、ロウのスキャンの順序について説明する。図7Aでは、タイルは水平方向にスキャンされ、ロウは上から下に(1行目、2行目、3行目の順序で)スキャンされている。これに対し、図7Cでは、タイルが水平方向にスキャンされるのは図7Aと同じであるが、ロウは中央、上、下(2行目、1行目、3行目)の順序でスキャンされている。なお、図示していないが、ロウは、中央、下、上(2行目、3行目、1行目)、又は、下から上(3行目、2行目、1行目)の順序でスキャンされてもよい。
また、ロウのスキャンの順序には、予め所定のIDが割り当てられており、画像符号化装置と画像復号装置とは、その情報を共有している。例えば、図7Aの順序には、ロウ・スキャンIDとして「1」が割り当てられ、図7Cのスキャン順序には、ロウ・スキャンIDとして「2」が割り当てられる。そして、このロウ・スキャンIDが画像符号装置から画像復号装置へ送られる。これにより、ロウ・スキャンIDを用いて、画像復号装置は、ロウのスキャン順序を特定できる。
コラムのスキャンの順序についてもロウのスキャンの順序と同様である。図7Bでは、タイルは垂直方向にスキャンされ、コラムは左から右に(1列目、2列目、3列目の順序で)スキャンされている。これに対し、図7Dでは、タイルが垂直方向にスキャンされるのは同じであるが、コラムは中央、左、右(2列目、1列目、3列目)の順にスキャンされている。なお、図示していないが、コラムは、中央、右、左(2列目、3列目、1列目)、又は、右から左(3列目、2列目、1列目)の順序でスキャンされてもよい。コラムのスキャンの順序にも、予め所定のIDが割り当てられており、画像符号化装置と画像復号装置とは、その情報を共有している。
タイル処理順序情報は、タイルのスキャン方向(水平方向又は垂直方向)と、コラム又はロウのスキャンIDとを含む。このタイル処理順序情報を用いることで、画像復号装置は、ピクチャ内でタイルの復号処理の順序を一意に特定することが可能となる。なお、図7A〜図7Dでは、ピクチャが9つのタイルに分割される例を示したが、タイルの分割の仕方(コラム数、及びロウ数)はこれ以外であってもよい。
このように、本実施の形態に係る画像符号化装置100Aは、ピクチャ内でのタイルの処理の順序を変更することができる。このようにタイルの処理の順序を制御することにより、通信状況及びアプリケーションに応じて、先頭のタイル群のみを送信することが可能となる。例えば、テレビ会議などにおいては、人物の写っている中央のコラムのタイル群を最初に符号化することができる。
以上のように、本実施の形態に係る画像符号化装置100Aでは、ピクチャ分割制御部112Aは、複数のタイルの符号化順を決定する。符号化部115は、複数のタイルを、ピクチャ分割制御部112Aで決定された符号化順で符号化する。多重化部114は、決定された符号化順を示すタイル処理順序情報を含むビットストリーム134を生成する。
これにより、画像復号装置におけるタイルの復号処理順を任意に設定できる。よって、例えば、ピクチャに含まれる複数の領域の画像のうち、優先度の高い領域の画像を、画像復号装置において先に復号することができる。
以下、本実施の形態に係る画像復号装置について説明する。
図8は、本実施の形態に係る画像復号方法を用いた画像復号装置の構成を示すブロック図である。なお、図5と同様の要素には同一の符号を付している。
ここで、ビットストリーム234は、上記画像符号化装置100Aにより生成されたビットストリーム134に対応する。
図8に示す画像復号装置200Aは、図5に示す画像復号装置200の構成に加え、さらに、出力画像制御部250を備える。また、解析部201A及びピクチャ分割制御部212Aの機能が、解析部201及びピクチャ分割制御部212と異なる。
具体的には、解析部201Aは、ビットストリーム234を解析することにより、符号化データ233と、ピクチャ分割情報235Aとを取得する。ピクチャ分割情報235Aは、上記ピクチャ分割情報135Aに対応し、タイルを復号する順序を示すタイル処理順序情報を含む。
ピクチャ分割制御部212Aは、ピクチャ分割情報235Aで示されるピクチャの分割パターン、タイル間の依存関係及び復号処理の順序に基づいて、イントラ予測部209、インター予測部210、可変長復号部213、フレームメモリ208及び出力画像制御部250を制御するための分割制御信号232Aを生成する。なお、ピクチャ分割情報135Aに基づくイントラ予測部209、インター予測部210及び可変長復号部213の動作は、実施の形態1と同様である。
出力画像制御部250は、復号画像データ226をブロック単位で、所定の順序に並び替え、並び替えた後の画像信号260を外部に出力する。ピクチャがタイルに分割される場合には、出力画像制御部250は、ピクチャ分割制御部212から送信される分割制御信号232Aで示される復号処理の順序に従って、ブロックの順序を決定する。
フレームメモリ208は、分割制御信号232Aに基づき、タイルの処理される順序を認識し、適切なメモリ領域に復号画像データ228を保存する。
以上の構成により、本実施の形態に係る画像復号装置200Aは、上記画像符号化装置100Aにより生成されたビットストリームを復号できる。
(実施の形態3)
本実施の形態では、上述した実施の形態1に係る画像符号化装置100の変形例について説明する。なお、以下では、実施の形態1との相違点を主に説明し、重複する説明は省略する。
実施の形態1で述べたように、ハイビジョンの解像度を越えるスーパーハイビジョン及びUHDTVと呼ばれる高解像度の画像の復号処理は、演算負荷が高く実時間処理が難しい。そこで、高解像度の画像を復号する際、画像復号装置はビットストリームを並列処理する必要がある。タイル間の依存関係を絶つことにより、画像復号装置は他のタイルと独立してタイルを復号することが可能となる。
しかしながら、画像復号装置は、復号の際に、ビットストリーム内でタイルの先頭位置(entry point)を検出することができなければ、並列処理を実現できない。この問題を解決する方法が既に知られている(例えば、非特許文献2参照)。この方法によれば、画像符号化装置はタイルマーカーをビットストリーム内のタイルの先頭位置に挿入する。画像復号装置はビットストリームをスキャンしてタイルマーカーを検出することにより、ビットストリーム内のタイルの先頭位置(entry point)を知ることができる。
しかしながら、ビットストリーム内の全てのタイルの先頭位置(タイル境界)にタイルマーカーを挿入することは、符号化効率の低下を招く。タイル境界では、可変長符号化部が出力するビットストリームはバイトアラインメント処理されていない。したがって、タイルの先頭位置にタイルマーカーを挿入するためには、可変長符号化部によるエントロピー符号化(例えば、CABAC)処理をリセットしなければならない。そして、エントロピー処理をリセットすることは、符号化効率の低下につながる。
これに対して、本実施の形態に係る画像符号化装置は、ビットストリームの各タイル境界に対してタイルマーカーを挿入するか否かを判定し、一部のタイル境界にのみタイルマーカーを挿入する。これにより、当該画像符号化装置は、エントロピー処理のリセット回数を低減できるので、符号化効率を向上できる。
図9は、本実施の形態に係る画像符号化方法を用いた画像符号化装置100Bの構成を示すブロック図である。なお、図1と同様の要素には同一の符号化を付している。
図9に示す画像符号化装置100Bは、図1に示す画像符号化装置100の構成に加え、さらに、マーカー挿入部151を備える。また、可変長符号化部113B及び多重化部114Bの機能が、可変長符号化部113及び多重化部114と異なる。
マーカー挿入部151は、ピクチャ分割制御部112から送信される分割制御信号132に基づき、複数の符号化データ133のタイル境界に、タイル境界を識別するためのタイルマーカー161を挿入する。具体的には、マーカー挿入部151は、独立しているタイル境界を可変長符号化部113Bに通知することで、独立しているタイル境界においてエントロピー符号化(CABAC)処理がリセットされるように可変長符号化部113Bを制御する。また、マーカー挿入部151は、独立しているタイル境界において、多重化部114Bにタイルマーカー161を送信する。
可変長符号化部113Bは、マーカー挿入部151からの通知に従い、指示されたタイル境界でエントロピー符号化(CABAC)処理をリセットする。
多重化部114Bは、マーカー挿入部151により送信されたタイルマーカー161を、複数の符号化データ133の指定されたタイル境界に挿入することでビットストリーム134を生成する。
図10は、本実施の形態に係るマーカー挿入部151によるマーカー挿入処理のフローチャートである。
まず、マーカー挿入部151は、ピクチャ分割制御部112から分割制御信号132を受信する(S121)。この分割制御信号132は、タイルの分割に係る情報を示す。なお、マーカー挿入部151は、分割制御信号132の代わりにピクチャ分割情報135を受信してもよい。なお、ピクチャ内の全てのタイルの分割に係る情報が、一度に受信される必要は無く、画像符号化装置100Bであるタイルが処理されるタイミングで、そのタイルに係る情報だけが受信されてもよい。
次に、マーカー挿入部151は、分割制御信号132に含まれる、現在処理しているタイルと、これから処理すべきタイルとの境界の依存関係を取得し(S122)、現在処理しているタイルと、これから処理すべきタイルとのタイル境界の依存関係を判定する(S123)。
タイルが依存している場合(S123でYes)は、マーカー挿入部151は、処理を終了する。一方、タイルが依存していない、すなわち独立である場合(S123でNo)、マーカー挿入部151は、エントロピー符号化(CABAC)処理がリセットされるように可変長符号化部113Bを制御する(S124)。これにより、可変長符号化部113Bは、現在処理しているタイルの最後でエントロピー符号化(CABAC)処理をリセットするとともに、バイトアライメントを行う。そして、可変長符号化部113Bは、現在処理しているタイルの符号化データ133を多重化部114Bに送る。
次に、マーカー挿入部151は、多重化部114Bにタイルマーカー161を送信する。多重化部114Bは、現在処理しているタイルのビットストリームの直後、すなわち、これから処理すべきタイルのビットストリームの先頭に、タイルマーカー161を挿入する(S125)。
以上のように、マーカー挿入部151は、タイル境界の依存関係に応じて、ビットストリームのタイル境界にタイルマーカー161を挿入するか否かを切り替える。
なお、ステップS121において、受信した分割制御信号132でピクチャ内の全てのタイル境界が依存していることが示される場合には、マーカー挿入部151は、当該ピクチャについてはステップS122〜S125の処理を省略してもよい。
このように、本実施の形態に係る画像符号化装置100Bは、ビットストリームの各タイル境界へのタイルマーカーの挿入を制御することにより、エントロピー符号化(CABAC)処理のリセット回数を低減できる。これにより、画像符号化装置100Bは、符号化効率を向上できる。
以上のように、本実施の形態に係る画像符号化装置100Bでは、マーカー挿入部151は、複数の符号化データ133のデータ境界のうち、当該データ境界を挟む2つの符号化データに対応する2つのタイル間の境界が第2境界(独立)であるデータ境界にのみ、当該データ境界を特定するためのマーカーを挿入する。
これにより、当該画像符号化装置100Bは、全てのタイル境界にマーカーを挿入する場合に比べて、符号化効率を改善できる。
以下、本実施の形態に係る画像復号装置について説明する。
図11は、本実施の形態に係る画像復号方法を用いた画像復号装置の構成を示すブロック図である。なお、図5と同様の要素には同一の符号を付している。
ここで、ビットストリーム234は、上記画像符号化装置100Bにより生成されたビットストリーム134に対応する。
図11に示す画像復号装置200Aは、解析部201Bの機能が、解析部201と異なる。
具体的には、解析部201Bは、ビットストリーム234を解析することにより、符号化データ233と、ピクチャ分割情報235とを取得する。また、解析部201Bは、タイル境界に挿入されているタイルマーカー161を検出し、検出した位置をタイル境界と認識する。また、解析部201Bは、検出したタイル境界を可変長復号部213に通知する。
また、復号部215が並列処理を行う場合には、解析部201Bは、タイル境界に応じて、各タイルに対応する符号化データ233をビットストリーム234から抽出し、復号部215へ送る。
以上の構成により、本実施の形態に係る画像復号装置200Bは、上記画像符号化装置100Bにより生成されたビットストリームを復号できる。
(実施の形態4)
本実施の形態では、タイル境界でバイトアライメント処理を行う画像符号化装置及び画像復号装置について説明する。
図12は、本実施の形態に係る画像符号化装置100Cの構成を示すブロック図である。なお、図1と同様の要素には同一の符号を付している。
図12に示す画像符号化装置100Cは、図1に示す画像符号化装置100の構成に対して、ピクチャ分割制御部112C及び可変長符号化部113Cの機能が、ピクチャ分割制御部112及び可変長符号化部113と異なる。
ピクチャ分割制御部112Cは、分割部の一例であり、ピクチャを複数のタイルに分割する。また、上記実施の形態1では、ピクチャ分割制御部112は、タイル境界ごとにタイルの依存関係を切り替えたが、ピクチャ分割制御部112Cは、全てのタイルが独立であると扱う。また、ピクチャ分割制御部112Cは、ピクチャの分割パターンを示すピクチャ分割情報135Cを生成する。ここで、ピクチャの分割パターンを示す情報は、例えば、上述した、コラム数、ロウ数、コラム幅均等フラグ、ロウ高さ均等フラグ、コラムの幅、及びロウの高さを含む。
なお、以下では、ピクチャ分割制御部112Cが全てのタイルを独立であると扱う例を述べるが、上述した実施の形態1と同様に、ピクチャ分割制御部112Cは、タイル境界ごとに、タイルの依存関係を切り替えてもよい。
そして、ピクチャ分割制御部112Cは、生成したピクチャ分割情報135Cを、シーケンスパラメータセット又はピクチャパラメータセットの一部として、多重化部114に送信する。
また、ピクチャ分割制御部112Cは、ピクチャの分割パターンに基づいて、イントラ予測部109、インター予測部110及び可変長符号化部113Cを制御するための分割制御信号132Cを生成する。なお、ピクチャ分割情報135Cに基づくイントラ予測部109及びインター予測部110の動作は、実施の形態1において、タイルが独立である場合の動作と同様である。
可変長符号化部113Cは、タイル境界においてエントロピー符号化をリセットする処理と、バイトアライメント処理とを行う。
以下、本実施の形態に係る画像符号化装置100Cの動作の流れを説明する。
図13Aは、本実施の形態に係る画像符号化装置100Cによる画像符号化方法のフローチャートである。
まず、ピクチャ分割制御部112Cは、ピクチャを複数のタイルに分割する(S201)。また、ピクチャ分割制御部112Cは、ピクチャの分割パターンを示すピクチャ分割情報135Cを生成する。
次に、符号化部115は、複数のタイルの各々を符号化することで、各々が複数のタイルの各々に対応する複数の符号化データ133を生成する(S202)。
次に、多重化部114は、複数の符号化データ133及びピクチャ分割情報135Cを含むビットストリーム134を生成する(S203)。
図13Bは、符号化部115による符号化処理(S202)のフローチャートである。
まず、符号化部115は、複数のタイルの一つである処理対象のタイルを符号化することで符号列を生成する(S211)。なお、符号化部115による符号化処理の具体的な方法は、例えば、上述した実施の形態1と同様である。また、符号化部115は、処理対象のタイルを他のタイルの符号化に用いられた符号化情報を参照せずに符号化する。
ここで、この符号化処理は、可変長符号化部113Cが、エントロピー符号化(算術符号化)により符号列を生成する処理を含む。
また、可変長符号化部113Cは、処理対象のタイルの符号化処理が終わった後に、エントロピー符号化(算術符号化)をリセットする(S212)。ここで、リセットとは、算術符号化におけるターミネート処理(フラッシュ処理とも呼ばれる)を含む。ターミネート処理とは、処理対象のタイルの符号列を他のタイルの符号列から独立させる処理である。言い換えると、ターミネート処理とは、処理対象のタイルの符号列を完結させる処理である。具体的には、ターミネート処理により、処理途中の符号列の全てが、独立して復号可能な状態で出力される。
次に、可変長符号化部113Cは、処理対象の符号列にバイトアライメント処理を行う(S213)。ここで、バイトアライメント処理とは、処理対象の符号列の後に予め定められたビット列を追加することで、バイト単位の符号化データ133を生成する処理である。言い換えると、バイトアライメント処理とは、符号化データ133がバイト単位となるように、処理対象の符号列のビット数を調整する処理である。
図14は、バイトアライメント処理の一例を示す図である。図14に示すように、可変長符号化部113Cは、処理対象の符号列281の後ろに、ビット列282を追加することで、バイト単位の符号化データ133を生成する。例えば、ビット列282は、最初が「1」であり、その後に「0」が続くビット列である。
なお、ここでは、可変長符号化部113Cが、符号化データ133がバイト単位になるようにアライメント処理を行う例を述べたが、このアライメント処理は、符号化データ133を、予め定められたN(Nは2以上の整数)ビットの倍数に調整する処理であればよい。例えば、可変長符号化部113Cは、符号化データ133がワード単位になるようにアライメント処理を行なってもよい。
また、ここでは、エントロピー符号化として、算術符号化(例えば、CABAC)が行われる場合に、アライメント処理を行う例を述べたが、算術符号化以外のエントロピー符号化を行う場合において、同様にアライメント処理が行われてもよい。
また、ピクチャ分割制御部112Cは、符号化データ133の先頭位置を示す情報を含むピクチャ分割情報135Cを生成してもよい。さらに、この先頭位置を示す情報はバイト単位(または、アライメント処理と同じ単位)で位置を示す情報であってもよい。
以上により、本実施の形態に係る画像符号化装置100Cは、タイル境界においてバイトアライメント処理を行う。これにより、各タイルの符号化データ133はバイト単位となる。よって、画像復号装置における符号化データの扱いが容易になる。また、画像復号装置は、容易にタイルの符号化データの先頭位置を特定できる。このように、当該画像符号化装置100Cは、画像復号装置の処理負荷を低減できる。
また、当該画像符号化装置100Cは、タイル境界においてエントロピー符号化をリセットする。これにより。画像復号装置は、各タイルの符号化データ133を独立して扱うことができる。
以下、本実施の形態に係る画像復号装置について説明する。
図15は、本実施の形態に係る画像復号方法を用いた画像復号装置の構成を示すブロック図である。なお、図5と同様の要素には同一の符号を付している。
ここで、ビットストリーム234は、上記画像符号化装置100Cにより生成されたビットストリーム134に対応する。
図15に示す画像復号装置200Cは、図5に示す画像復号装置200に対して、解析部201C、ピクチャ分割制御部212C及び可変長復号部213Cの機能が、解析部201、ピクチャ分割制御部212及び可変長復号部213と異なる。
具体的には、解析部201Cは、ビットストリーム234を解析することにより、符号化データ233と、ピクチャ分割情報235Cとを取得する。ピクチャ分割情報235Cは、上記ピクチャ分割情報135Cに対応し、ピクチャの分割パターンを示す。
ピクチャ分割制御部212Cは、ピクチャ分割情報235Cで示されるピクチャの分割パターンに基づいて、イントラ予測部209、インター予測部210、及び可変長復号部213Cを制御するための分割制御信号232Cを生成する。なお、ピクチャ分割情報135Cに基づくイントラ予測部209及びインター予測部210の動作は、実施の形態1において、タイルが独立である場合の動作と同様である。
可変長復号部213Cは、符号化データ233に含まれ、符号列の後に位置する予め定められたビット列をスキップする。つまり、可変長復号部213Cは、タイル境界において、アライメント処理により挿入されたビット列をスキップする。
以下、本実施の形態に係る画像復号装置200Cの動作の流れを説明する。
図16Aは、本実施の形態に係る画像復号装置200Cによる画像復号方法のフローチャートである。
まず、解析部201Cは、ビットストリーム234に含まれる、複数のタイルの各々が符号化されることにより生成された複数の符号化データ233と、ピクチャ分割情報235Cとを取得する(S221)。
次に、復号部215は、複数の符号化データ233の各々を復号することで、複数のタイルの画像データである復号画像データ226を生成する(S222)。
図16Bは、復号部215による復号処理(S222)のフローチャートである。また、図16Bは、一つの処理対象の符号化データ233に対する復号処理を示す。
まず、復号部215は、複数のタイルのうちの一つである処理対象の符号化データ233に含まれる符号列を復号することで、処理対象の復号画像データ226を生成する(S231)。なお、復号部215による復号処理の具体的な方法は、例えば、上述した実施の形態1と同様である。また、復号部215は、処理対象のタイルを他のタイルの復号に用いられた復号情報を参照せずに復号する。
ここで、この復号処理は、可変長復号部213Cが、エントロピー復号(算術復号)により符号列(量子化係数223)を生成する処理を含む。
また、可変長復号部213Cは、処理対象のタイルの復号処理が終わった後に、エントロピー復号(算術復号)をリセットする(S232)。ここで、リセットとは、算術復号におけるターミネート処理(フラッシュ処理とも呼ばれる)を含む。ターミネート処理とは、処理対象の符号列に対する算術復号処理を完結する処理である。
次に、可変長復号部213Cは、処理対象の符号化データ233に含まれ、処理対象の符号列の後に位置する、予め定められたビット列をスキップする(S233)。このビット列は、画像符号化装置100Cによるバイトアライメント処理において挿入されたビット列282に対応する。
以上の処理が、各タイルに対応する符号化データ233ごとに行われる。つまり、可変長復号部213Cは、複数の符号化データ233の一つである第1符号化データに含まれる第1符号列を復号することで、第1タイルの画像データを生成し、第1符号化データに含まれ、第1符号列の後に位置する、予め定められたビット列をスキップし、第1符号化データの後に位置する第2符号化データに含まれる第2符号列を復号することで、第2タイルの画像データを生成する。
上記処理により、可変長復号部213Cは、画像符号化装置100Cによるバイトアライメント処理においてビット境界に挿入されたビット列が無視して、必要なデータのみを復号することができる。言い換えると、可変長復号部213Cは、上記ビット列をスキップして、次の符号化データ233の先頭から復号処理を行うことができる。
以上の構成により、本実施の形態に係る画像復号装置200Cは、上記画像符号化装置100Cにより生成されたビットストリームを復号できる。
なお、上記説明では、画像復号装置200Cが、各タイルに対応する符号化データ233を時系列に復号する例を述べたが、画像復号装置200Cは、複数の符号化データ233を並列に復号してもよい。この場合、画像復号装置200Cは、ピクチャ分割情報235Cに含まれる符号化データ233の先頭位置を示す情報を参照することで、各符号化データ233の先頭位置を把握する。また、この先頭位置を示す情報をバイト単位で位置を示す情報であってもよい。
以上、本発明の実施の形態に係る画像符号化装置に及び画像復号装置ついて説明したが、本発明は、この実施の形態に限定されるものではない。
また、上記実施の形態に係る画像符号化装置及び画像復号装置に含まれる各処理部は典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されてもよいし、一部又は全てを含むように1チップ化されてもよい。
また、集積回路化はLSIに限るものではなく、専用回路又は汎用プロセッサで実現してもよい。LSI製造後にプログラムすることが可能なFPGA(Field Programmable Gate Array)、又はLSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用してもよい。
上記各実施の形態において、各構成要素は、専用のハードウェアで構成されるか、各構成要素に適したソフトウェアプログラムを実行することによって実現されてもよい。各構成要素は、CPUまたはプロセッサなどのプログラム実行部が、ハードディスクまたは半導体メモリなどの記録媒体に記録されたソフトウェアプログラムを読み出して実行することによって実現されてもよい。
さらに、本発明は上記ソフトウェアプログラムであってもよいし、上記プログラムが記録された非一時的なコンピュータ読み取り可能な記録媒体であってもよい。また、上記プログラムは、インターネット等の伝送媒体を介して流通させることができるのは言うまでもない。
また、上記で用いた数字は、全て本発明を具体的に説明するために例示するものであり、本発明は例示された数字に制限されない。
また、ブロック図における機能ブロックの分割は一例であり、複数の機能ブロックを一つの機能ブロックとして実現したり、一つの機能ブロックを複数に分割したり、一部の機能を他の機能ブロックに移してもよい。また、類似する機能を有する複数の機能ブロックの機能を単一のハードウェア又はソフトウェアが並列又は時分割に処理してもよい。
また、上記の画像符号化方法又は画像復号方法に含まれるステップが実行される順序は、本発明を具体的に説明するために例示するためのものであり、上記以外の順序であってもよい。また、上記ステップの一部が、他のステップと同時(並列)に実行されてもよい。
(実施の形態5)
上記各実施の形態で示した動画像符号化方法(画像符号化方法)または動画像復号化方法(画像復号方法)の構成を実現するためのプログラムを記憶メディアに記録することにより、上記各実施の形態で示した処理を独立したコンピュータシステムにおいて簡単に実施することが可能となる。記憶メディアは、磁気ディスク、光ディスク、光磁気ディスク、ICカード、半導体メモリ等、プログラムを記録できるものであればよい。
さらにここで、上記各実施の形態で示した動画像符号化方法(画像符号化方法)や動画像復号化方法(画像復号方法)の応用例とそれを用いたシステムを説明する。当該システムは、画像符号化方法を用いた画像符号化装置、及び画像復号方法を用いた画像復号装置からなる画像符号化復号装置を有することを特徴とする。システムにおける他の構成について、場合に応じて適切に変更することができる。
図18は、コンテンツ配信サービスを実現するコンテンツ供給システムex100の全体構成を示す図である。通信サービスの提供エリアを所望の大きさに分割し、各セル内にそれぞれ固定無線局である基地局ex106、ex107、ex108、ex109、ex110が設置されている。
このコンテンツ供給システムex100は、インターネットex101にインターネットサービスプロバイダex102および電話網ex104、および基地局ex106からex110を介して、コンピュータex111、PDA(Personal Digital Assistant)ex112、カメラex113、携帯電話ex114、ゲーム機ex115などの各機器が接続される。
しかし、コンテンツ供給システムex100は図18のような構成に限定されず、いずれかの要素を組合せて接続するようにしてもよい。また、固定無線局である基地局ex106からex110を介さずに、各機器が電話網ex104に直接接続されてもよい。また、各機器が近距離無線等を介して直接相互に接続されていてもよい。
カメラex113はデジタルビデオカメラ等の動画撮影が可能な機器であり、カメラex116はデジタルカメラ等の静止画撮影、動画撮影が可能な機器である。また、携帯電話ex114は、GSM(登録商標)(Global System for Mobile Communications)方式、CDMA(Code Division Multiple Access)方式、W−CDMA(Wideband-Code Division Multiple Access)方式、若しくはLTE(Long Term Evolution)方式、HSPA(High Speed Packet Access)の携帯電話機、またはPHS(Personal Handyphone System)等であり、いずれでも構わない。
コンテンツ供給システムex100では、カメラex113等が基地局ex109、電話網ex104を通じてストリーミングサーバex103に接続されることで、ライブ配信等が可能になる。ライブ配信では、ユーザがカメラex113を用いて撮影するコンテンツ(例えば、音楽ライブの映像等)に対して上記各実施の形態で説明したように符号化処理を行い(即ち、本発明の一態様に係る画像符号化装置として機能する)、ストリーミングサーバex103に送信する。一方、ストリーミングサーバex103は要求のあったクライアントに対して送信されたコンテンツデータをストリーム配信する。クライアントとしては、上記符号化処理されたデータを復号化することが可能な、コンピュータex111、PDAex112、カメラex113、携帯電話ex114、ゲーム機ex115等がある。配信されたデータを受信した各機器では、受信したデータを復号化処理して再生する(即ち、本発明の一態様に係る画像復号装置として機能する)。
なお、撮影したデータの符号化処理はカメラex113で行っても、データの送信処理をするストリーミングサーバex103で行ってもよいし、互いに分担して行ってもよい。同様に配信されたデータの復号化処理はクライアントで行っても、ストリーミングサーバex103で行ってもよいし、互いに分担して行ってもよい。また、カメラex113に限らず、カメラex116で撮影した静止画像および/または動画像データを、コンピュータex111を介してストリーミングサーバex103に送信してもよい。この場合の符号化処理はカメラex116、コンピュータex111、ストリーミングサーバex103のいずれで行ってもよいし、互いに分担して行ってもよい。
また、これら符号化・復号化処理は、一般的にコンピュータex111や各機器が有するLSIex500において処理する。LSIex500は、ワンチップであっても複数チップからなる構成であってもよい。なお、動画像符号化・復号化用のソフトウェアをコンピュータex111等で読み取り可能な何らかの記録メディア(CD−ROM、フレキシブルディスク、ハードディスクなど)に組み込み、そのソフトウェアを用いて符号化・復号化処理を行ってもよい。さらに、携帯電話ex114がカメラ付きである場合には、そのカメラで取得した動画データを送信してもよい。このときの動画データは携帯電話ex114が有するLSIex500で符号化処理されたデータである。
また、ストリーミングサーバex103は複数のサーバや複数のコンピュータであって、データを分散して処理したり記録したり配信するものであってもよい。
以上のようにして、コンテンツ供給システムex100では、符号化されたデータをクライアントが受信して再生することができる。このようにコンテンツ供給システムex100では、ユーザが送信した情報をリアルタイムでクライアントが受信して復号化し、再生することができ、特別な権利や設備を有さないユーザでも個人放送を実現できる。
なお、コンテンツ供給システムex100の例に限らず、図19に示すように、デジタル放送用システムex200にも、上記各実施の形態の少なくとも動画像符号化装置(画像符号化装置)または動画像復号化装置(画像復号装置)のいずれかを組み込むことができる。具体的には、放送局ex201では映像データに音楽データなどが多重化された多重化データが電波を介して通信または衛星ex202に伝送される。この映像データは上記各実施の形態で説明した動画像符号化方法により符号化されたデータである(即ち、本発明の一態様に係る画像符号化装置によって符号化されたデータである)。これを受けた放送衛星ex202は、放送用の電波を発信し、この電波を衛星放送の受信が可能な家庭のアンテナex204が受信する。受信した多重化データを、テレビ(受信機)ex300またはセットトップボックス(STB)ex217等の装置が復号化して再生する(即ち、本発明の一態様に係る画像復号装置として機能する)。
また、DVD、BD等の記録メディアex215に記録した多重化データを読み取り復号化する、または記録メディアex215に映像信号を符号化し、さらに場合によっては音楽信号と多重化して書き込むリーダ/レコーダex218にも上記各実施の形態で示した動画像復号化装置または動画像符号化装置を実装することが可能である。この場合、再生された映像信号はモニタex219に表示され、多重化データが記録された記録メディアex215により他の装置やシステムにおいて映像信号を再生することができる。また、ケーブルテレビ用のケーブルex203または衛星/地上波放送のアンテナex204に接続されたセットトップボックスex217内に動画像復号化装置を実装し、これをテレビのモニタex219で表示してもよい。このときセットトップボックスではなく、テレビ内に動画像復号化装置を組み込んでもよい。
図20は、上記各実施の形態で説明した動画像復号化方法および動画像符号化方法を用いたテレビ(受信機)ex300を示す図である。テレビex300は、上記放送を受信するアンテナex204またはケーブルex203等を介して映像データに音声データが多重化された多重化データを取得、または出力するチューナex301と、受信した多重化データを復調する、または外部に送信する多重化データに変調する変調/復調部ex302と、復調した多重化データを映像データと、音声データとに分離する、または信号処理部ex306で符号化された映像データ、音声データを多重化する多重/分離部ex303を備える。
また、テレビex300は、音声データ、映像データそれぞれを復号化する、またはそれぞれの情報を符号化する音声信号処理部ex304、映像信号処理部ex305(本発明の一態様に係る画像符号化装置または画像復号装置として機能する)を有する信号処理部ex306と、復号化した音声信号を出力するスピーカex307、復号化した映像信号を表示するディスプレイ等の表示部ex308を有する出力部ex309とを有する。さらに、テレビex300は、ユーザ操作の入力を受け付ける操作入力部ex312等を有するインタフェース部ex317を有する。さらに、テレビex300は、各部を統括的に制御する制御部ex310、各部に電力を供給する電源回路部ex311を有する。インタフェース部ex317は、操作入力部ex312以外に、リーダ/レコーダex218等の外部機器と接続されるブリッジex313、SDカード等の記録メディアex216を装着可能とするためのスロット部ex314、ハードディスク等の外部記録メディアと接続するためのドライバex315、電話網と接続するモデムex316等を有していてもよい。なお記録メディアex216は、格納する不揮発性/揮発性の半導体メモリ素子により電気的に情報の記録を可能としたものである。テレビex300の各部は同期バスを介して互いに接続されている。
まず、テレビex300がアンテナex204等により外部から取得した多重化データを復号化し、再生する構成について説明する。テレビex300は、リモートコントローラex220等からのユーザ操作を受け、CPU等を有する制御部ex310の制御に基づいて、変調/復調部ex302で復調した多重化データを多重/分離部ex303で分離する。さらにテレビex300は、分離した音声データを音声信号処理部ex304で復号化し、分離した映像データを映像信号処理部ex305で上記各実施の形態で説明した復号化方法を用いて復号化する。復号化した音声信号、映像信号は、それぞれ出力部ex309から外部に向けて出力される。出力する際には、音声信号と映像信号が同期して再生するよう、バッファex318、ex319等に一旦これらの信号を蓄積するとよい。また、テレビex300は、放送等からではなく、磁気/光ディスク、SDカード等の記録メディアex215、ex216から多重化データを読み出してもよい。次に、テレビex300が音声信号や映像信号を符号化し、外部に送信または記録メディア等に書き込む構成について説明する。テレビex300は、リモートコントローラex220等からのユーザ操作を受け、制御部ex310の制御に基づいて、音声信号処理部ex304で音声信号を符号化し、映像信号処理部ex305で映像信号を上記各実施の形態で説明した符号化方法を用いて符号化する。符号化した音声信号、映像信号は多重/分離部ex303で多重化され外部に出力される。多重化する際には、音声信号と映像信号が同期するように、バッファex320、ex321等に一旦これらの信号を蓄積するとよい。なお、バッファex318、ex319、ex320、ex321は図示しているように複数備えていてもよいし、1つ以上のバッファを共有する構成であってもよい。さらに、図示している以外に、例えば変調/復調部ex302や多重/分離部ex303の間等でもシステムのオーバフロー、アンダーフローを避ける緩衝材としてバッファにデータを蓄積することとしてもよい。
また、テレビex300は、放送等や記録メディア等から音声データ、映像データを取得する以外に、マイクやカメラのAV入力を受け付ける構成を備え、それらから取得したデータに対して符号化処理を行ってもよい。なお、ここではテレビex300は上記の符号化処理、多重化、および外部出力ができる構成として説明したが、これらの処理を行うことはできず、上記受信、復号化処理、外部出力のみが可能な構成であってもよい。
また、リーダ/レコーダex218で記録メディアから多重化データを読み出す、または書き込む場合には、上記復号化処理または符号化処理はテレビex300、リーダ/レコーダex218のいずれで行ってもよいし、テレビex300とリーダ/レコーダex218が互いに分担して行ってもよい。
一例として、光ディスクからデータの読み込みまたは書き込みをする場合の情報再生/記録部ex400の構成を図21に示す。情報再生/記録部ex400は、以下に説明する要素ex401、ex402、ex403、ex404、ex405、ex406、ex407を備える。光ヘッドex401は、光ディスクである記録メディアex215の記録面にレーザスポットを照射して情報を書き込み、記録メディアex215の記録面からの反射光を検出して情報を読み込む。変調記録部ex402は、光ヘッドex401に内蔵された半導体レーザを電気的に駆動し記録データに応じてレーザ光の変調を行う。再生復調部ex403は、光ヘッドex401に内蔵されたフォトディテクタにより記録面からの反射光を電気的に検出した再生信号を増幅し、記録メディアex215に記録された信号成分を分離して復調し、必要な情報を再生する。バッファex404は、記録メディアex215に記録するための情報および記録メディアex215から再生した情報を一時的に保持する。ディスクモータex405は記録メディアex215を回転させる。サーボ制御部ex406は、ディスクモータex405の回転駆動を制御しながら光ヘッドex401を所定の情報トラックに移動させ、レーザスポットの追従処理を行う。システム制御部ex407は、情報再生/記録部ex400全体の制御を行う。上記の読み出しや書き込みの処理はシステム制御部ex407が、バッファex404に保持された各種情報を利用し、また必要に応じて新たな情報の生成・追加を行うと共に、変調記録部ex402、再生復調部ex403、サーボ制御部ex406を協調動作させながら、光ヘッドex401を通して、情報の記録再生を行うことにより実現される。システム制御部ex407は例えばマイクロプロセッサで構成され、読み出し書き込みのプログラムを実行することでそれらの処理を実行する。
以上では、光ヘッドex401はレーザスポットを照射するとして説明したが、近接場光を用いてより高密度な記録を行う構成であってもよい。
図22に光ディスクである記録メディアex215の模式図を示す。記録メディアex215の記録面には案内溝(グルーブ)がスパイラル状に形成され、情報トラックex230には、予めグルーブの形状の変化によってディスク上の絶対位置を示す番地情報が記録されている。この番地情報はデータを記録する単位である記録ブロックex231の位置を特定するための情報を含み、記録や再生を行う装置において情報トラックex230を再生し番地情報を読み取ることで記録ブロックを特定することができる。また、記録メディアex215は、データ記録領域ex233、内周領域ex232、外周領域ex234を含んでいる。ユーザデータを記録するために用いる領域がデータ記録領域ex233であり、データ記録領域ex233より内周または外周に配置されている内周領域ex232と外周領域ex234は、ユーザデータの記録以外の特定用途に用いられる。情報再生/記録部ex400は、このような記録メディアex215のデータ記録領域ex233に対して、符号化された音声データ、映像データまたはそれらのデータを多重化した多重化データの読み書きを行う。
以上では、1層のDVD、BD等の光ディスクを例に挙げ説明したが、これらに限ったものではなく、多層構造であって表面以外にも記録可能な光ディスクであってもよい。また、ディスクの同じ場所にさまざまな異なる波長の色の光を用いて情報を記録したり、さまざまな角度から異なる情報の層を記録したりなど、多次元的な記録/再生を行う構造の光ディスクであってもよい。
また、デジタル放送用システムex200において、アンテナex205を有する車ex210で衛星ex202等からデータを受信し、車ex210が有するカーナビゲーションex211等の表示装置に動画を再生することも可能である。なお、カーナビゲーションex211の構成は例えば図20に示す構成のうち、GPS受信部を加えた構成が考えられ、同様なことがコンピュータex111や携帯電話ex114等でも考えられる。
図23Aは、上記実施の形態で説明した動画像復号化方法および動画像符号化方法を用いた携帯電話ex114を示す図である。携帯電話ex114は、基地局ex110との間で電波を送受信するためのアンテナex350、映像、静止画を撮ることが可能なカメラ部ex365、カメラ部ex365で撮像した映像、アンテナex350で受信した映像等が復号化されたデータを表示する液晶ディスプレイ等の表示部ex358を備える。携帯電話ex114は、さらに、操作キー部ex366を有する本体部、音声を出力するためのスピーカ等である音声出力部ex357、音声を入力するためのマイク等である音声入力部ex356、撮影した映像、静止画、録音した音声、または受信した映像、静止画、メール等の符号化されたデータもしくは復号化されたデータを保存するメモリ部ex367、又は同様にデータを保存する記録メディアとのインタフェース部であるスロット部ex364を備える。
さらに、携帯電話ex114の構成例について、図23Bを用いて説明する。携帯電話ex114は、表示部ex358及び操作キー部ex366を備えた本体部の各部を統括的に制御する主制御部ex360に対して、電源回路部ex361、操作入力制御部ex362、映像信号処理部ex355、カメラインタフェース部ex363、LCD(Liquid Crystal Display)制御部ex359、変調/復調部ex352、多重/分離部ex353、音声信号処理部ex354、スロット部ex364、メモリ部ex367がバスex370を介して互いに接続されている。
電源回路部ex361は、ユーザの操作により終話及び電源キーがオン状態にされると、バッテリパックから各部に対して電力を供給することにより携帯電話ex114を動作可能な状態に起動する。
携帯電話ex114は、CPU、ROM、RAM等を有する主制御部ex360の制御に基づいて、音声通話モード時に音声入力部ex356で収音した音声信号を音声信号処理部ex354でデジタル音声信号に変換し、これを変調/復調部ex352でスペクトラム拡散処理し、送信/受信部ex351でデジタルアナログ変換処理および周波数変換処理を施した後にアンテナex350を介して送信する。また携帯電話ex114は、音声通話モード時にアンテナex350を介して受信した受信データを増幅して周波数変換処理およびアナログデジタル変換処理を施し、変調/復調部ex352でスペクトラム逆拡散処理し、音声信号処理部ex354でアナログ音声信号に変換した後、これを音声出力部ex357から出力する。
さらにデータ通信モード時に電子メールを送信する場合、本体部の操作キー部ex366等の操作によって入力された電子メールのテキストデータは操作入力制御部ex362を介して主制御部ex360に送出される。主制御部ex360は、テキストデータを変調/復調部ex352でスペクトラム拡散処理をし、送信/受信部ex351でデジタルアナログ変換処理および周波数変換処理を施した後にアンテナex350を介して基地局ex110へ送信する。電子メールを受信する場合は、受信したデータに対してこのほぼ逆の処理が行われ、表示部ex358に出力される。
データ通信モード時に映像、静止画、または映像と音声を送信する場合、映像信号処理部ex355は、カメラ部ex365から供給された映像信号を上記各実施の形態で示した動画像符号化方法によって圧縮符号化し(即ち、本発明の一態様に係る画像符号化装置として機能する)、符号化された映像データを多重/分離部ex353に送出する。また、音声信号処理部ex354は、映像、静止画等をカメラ部ex365で撮像中に音声入力部ex356で収音した音声信号を符号化し、符号化された音声データを多重/分離部ex353に送出する。
多重/分離部ex353は、映像信号処理部ex355から供給された符号化された映像データと音声信号処理部ex354から供給された符号化された音声データを所定の方式で多重化し、その結果得られる多重化データを変調/復調部(変調/復調回路部)ex352でスペクトラム拡散処理をし、送信/受信部ex351でデジタルアナログ変換処理及び周波数変換処理を施した後にアンテナex350を介して送信する。
データ通信モード時にホームページ等にリンクされた動画像ファイルのデータを受信する場合、または映像およびもしくは音声が添付された電子メールを受信する場合、アンテナex350を介して受信された多重化データを復号化するために、多重/分離部ex353は、多重化データを分離することにより映像データのビットストリームと音声データのビットストリームとに分け、同期バスex370を介して符号化された映像データを映像信号処理部ex355に供給するとともに、符号化された音声データを音声信号処理部ex354に供給する。映像信号処理部ex355は、上記各実施の形態で示した動画像符号化方法に対応した動画像復号化方法によって復号化することにより映像信号を復号し(即ち、本発明の一態様に係る画像復号装置として機能する)、LCD制御部ex359を介して表示部ex358から、例えばホームページにリンクされた動画像ファイルに含まれる映像、静止画が表示される。また音声信号処理部ex354は、音声信号を復号し、音声出力部ex357から音声が出力される。
また、上記携帯電話ex114等の端末は、テレビex300と同様に、符号化器・復号化器を両方持つ送受信型端末の他に、符号化器のみの送信端末、復号化器のみの受信端末という3通りの実装形式が考えられる。さらに、デジタル放送用システムex200において、映像データに音楽データなどが多重化された多重化データを受信、送信するとして説明したが、音声データ以外に映像に関連する文字データなどが多重化されたデータであってもよいし、多重化データではなく映像データ自体であってもよい。
このように、上記各実施の形態で示した動画像符号化方法あるいは動画像復号化方法を上述したいずれの機器・システムに用いることは可能であり、そうすることで、上記各実施の形態で説明した効果を得ることができる。
また、本発明はかかる上記実施の形態に限定されるものではなく、本発明の範囲を逸脱することなく種々の変形または修正が可能である。
(実施の形態6)
上記各実施の形態で示した動画像符号化方法または装置と、MPEG−2、MPEG4−AVC、VC−1など異なる規格に準拠した動画像符号化方法または装置とを、必要に応じて適宜切替えることにより、映像データを生成することも可能である。
ここで、それぞれ異なる規格に準拠する複数の映像データを生成した場合、復号する際に、それぞれの規格に対応した復号方法を選択する必要がある。しかしながら、復号する映像データが、どの規格に準拠するものであるか識別できないため、適切な復号方法を選択することができないという課題を生じる。
この課題を解決するために、映像データに音声データなどを多重化した多重化データは、映像データがどの規格に準拠するものであるかを示す識別情報を含む構成とする。上記各実施の形態で示す動画像符号化方法または装置によって生成された映像データを含む多重化データの具体的な構成を以下説明する。多重化データは、MPEG−2トランスポートストリーム形式のデジタルストリームである。
図24は、多重化データの構成を示す図である。図24に示すように多重化データは、ビデオストリーム、オーディオストリーム、プレゼンテーショングラフィックスストリーム(PG)、インタラクティブグラフィックスストリームのうち、1つ以上を多重化することで得られる。ビデオストリームは映画の主映像および副映像を、オーディオストリーム(IG)は映画の主音声部分とその主音声とミキシングする副音声を、プレゼンテーショングラフィックスストリームは、映画の字幕をそれぞれ示している。ここで主映像とは画面に表示される通常の映像を示し、副映像とは主映像の中に小さな画面で表示する映像のことである。また、インタラクティブグラフィックスストリームは、画面上にGUI部品を配置することにより作成される対話画面を示している。ビデオストリームは、上記各実施の形態で示した動画像符号化方法または装置、従来のMPEG−2、MPEG4−AVC、VC−1などの規格に準拠した動画像符号化方法または装置によって符号化されている。オーディオストリームは、ドルビーAC−3、Dolby Digital Plus、MLP、DTS、DTS−HD、または、リニアPCMのなどの方式で符号化されている。
多重化データに含まれる各ストリームはPIDによって識別される。例えば、映画の映像に利用するビデオストリームには0x1011が、オーディオストリームには0x1100から0x111Fまでが、プレゼンテーショングラフィックスには0x1200から0x121Fまでが、インタラクティブグラフィックスストリームには0x1400から0x141Fまでが、映画の副映像に利用するビデオストリームには0x1B00から0x1B1Fまで、主音声とミキシングする副音声に利用するオーディオストリームには0x1A00から0x1A1Fが、それぞれ割り当てられている。
図25は、多重化データがどのように多重化されるかを模式的に示す図である。まず、複数のビデオフレームからなるビデオストリームex235、複数のオーディオフレームからなるオーディオストリームex238を、それぞれPESパケット列ex236およびex239に変換し、TSパケットex237およびex240に変換する。同じくプレゼンテーショングラフィックスストリームex241およびインタラクティブグラフィックスex244のデータをそれぞれPESパケット列ex242およびex245に変換し、さらにTSパケットex243およびex246に変換する。多重化データex247はこれらのTSパケットを1本のストリームに多重化することで構成される。
図26は、PESパケット列に、ビデオストリームがどのように格納されるかをさらに詳しく示している。図26における第1段目はビデオストリームのビデオフレーム列を示す。第2段目は、PESパケット列を示す。図26の矢印yy1,yy2,yy3,yy4に示すように、ビデオストリームにおける複数のVideo Presentation UnitであるIピクチャ、Bピクチャ、Pピクチャは、ピクチャ毎に分割され、PESパケットのペイロードに格納される。各PESパケットはPESヘッダを持ち、PESヘッダには、ピクチャの表示時刻であるPTS(Presentation Time−Stamp)やピクチャの復号時刻であるDTS(Decoding Time−Stamp)が格納される。
図27は、多重化データに最終的に書き込まれるTSパケットの形式を示している。TSパケットは、ストリームを識別するPIDなどの情報を持つ4ByteのTSヘッダとデータを格納する184ByteのTSペイロードから構成される188Byte固定長のパケットであり、上記PESパケットは分割されTSペイロードに格納される。BD−ROMの場合、TSパケットには、4ByteのTP_Extra_Headerが付与され、192Byteのソースパケットを構成し、多重化データに書き込まれる。TP_Extra_HeaderにはATS(Arrival_Time_Stamp)などの情報が記載される。ATSは当該TSパケットのデコーダのPIDフィルタへの転送開始時刻を示す。多重化データには図27下段に示すようにソースパケットが並ぶこととなり、多重化データの先頭からインクリメントする番号はSPN(ソースパケットナンバー)と呼ばれる。
また、多重化データに含まれるTSパケットには、映像・音声・字幕などの各ストリーム以外にもPAT(Program Association Table)、PMT(Program Map Table)、PCR(Program Clock Reference)などがある。PATは多重化データ中に利用されるPMTのPIDが何であるかを示し、PAT自身のPIDは0で登録される。PMTは、多重化データ中に含まれる映像・音声・字幕などの各ストリームのPIDと各PIDに対応するストリームの属性情報を持ち、また多重化データに関する各種ディスクリプタを持つ。ディスクリプタには多重化データのコピーを許可・不許可を指示するコピーコントロール情報などがある。PCRは、ATSの時間軸であるATC(Arrival Time Clock)とPTS・DTSの時間軸であるSTC(System Time Clock)の同期を取るために、そのPCRパケットがデコーダに転送されるATSに対応するSTC時間の情報を持つ。
図28はPMTのデータ構造を詳しく説明する図である。PMTの先頭には、そのPMTに含まれるデータの長さなどを記したPMTヘッダが配置される。その後ろには、多重化データに関するディスクリプタが複数配置される。上記コピーコントロール情報などが、ディスクリプタとして記載される。ディスクリプタの後には、多重化データに含まれる各ストリームに関するストリーム情報が複数配置される。ストリーム情報は、ストリームの圧縮コーデックなどを識別するためストリームタイプ、ストリームのPID、ストリームの属性情報(フレームレート、アスペクト比など)が記載されたストリームディスクリプタから構成される。ストリームディスクリプタは多重化データに存在するストリームの数だけ存在する。
記録媒体などに記録する場合には、上記多重化データは、多重化データ情報ファイルと共に記録される。
多重化データ情報ファイルは、図29に示すように多重化データの管理情報であり、多重化データと1対1に対応し、多重化データ情報、ストリーム属性情報とエントリマップから構成される。
多重化データ情報は図29に示すようにシステムレート、再生開始時刻、再生終了時刻から構成されている。システムレートは多重化データの、後述するシステムターゲットデコーダのPIDフィルタへの最大転送レートを示す。多重化データ中に含まれるATSの間隔はシステムレート以下になるように設定されている。再生開始時刻は多重化データの先頭のビデオフレームのPTSであり、再生終了時刻は多重化データの終端のビデオフレームのPTSに1フレーム分の再生間隔を足したものが設定される。
ストリーム属性情報は図30に示すように、多重化データに含まれる各ストリームについての属性情報が、PID毎に登録される。属性情報はビデオストリーム、オーディオストリーム、プレゼンテーショングラフィックスストリーム、インタラクティブグラフィックスストリーム毎に異なる情報を持つ。ビデオストリーム属性情報は、そのビデオストリームがどのような圧縮コーデックで圧縮されたか、ビデオストリームを構成する個々のピクチャデータの解像度がどれだけであるか、アスペクト比はどれだけであるか、フレームレートはどれだけであるかなどの情報を持つ。オーディオストリーム属性情報は、そのオーディオストリームがどのような圧縮コーデックで圧縮されたか、そのオーディオストリームに含まれるチャンネル数は何であるか、何の言語に対応するか、サンプリング周波数がどれだけであるかなどの情報を持つ。これらの情報は、プレーヤが再生する前のデコーダの初期化などに利用される。
本実施の形態においては、上記多重化データのうち、PMTに含まれるストリームタイプを利用する。また、記録媒体に多重化データが記録されている場合には、多重化データ情報に含まれる、ビデオストリーム属性情報を利用する。具体的には、上記各実施の形態で示した動画像符号化方法または装置において、PMTに含まれるストリームタイプ、または、ビデオストリーム属性情報に対し、上記各実施の形態で示した動画像符号化方法または装置によって生成された映像データであることを示す固有の情報を設定するステップまたは手段を設ける。この構成により、上記各実施の形態で示した動画像符号化方法または装置によって生成した映像データと、他の規格に準拠する映像データとを識別することが可能になる。
また、本実施の形態における動画像復号化方法のステップを図31に示す。ステップexS100において、多重化データからPMTに含まれるストリームタイプ、または、多重化データ情報に含まれるビデオストリーム属性情報を取得する。次に、ステップexS101において、ストリームタイプ、または、ビデオストリーム属性情報が上記各実施の形態で示した動画像符号化方法または装置によって生成された多重化データであることを示しているか否かを判断する。そして、ストリームタイプ、または、ビデオストリーム属性情報が上記各実施の形態で示した動画像符号化方法または装置によって生成されたものであると判断された場合には、ステップexS102において、上記各実施の形態で示した動画像復号方法により復号を行う。また、ストリームタイプ、または、ビデオストリーム属性情報が、従来のMPEG−2、MPEG4−AVC、VC−1などの規格に準拠するものであることを示している場合には、ステップexS103において、従来の規格に準拠した動画像復号方法により復号を行う。
このように、ストリームタイプ、または、ビデオストリーム属性情報に新たな固有値を設定することにより、復号する際に、上記各実施の形態で示した動画像復号化方法または装置で復号可能であるかを判断することができる。従って、異なる規格に準拠する多重化データが入力された場合であっても、適切な復号化方法または装置を選択することができるため、エラーを生じることなく復号することが可能となる。また、本実施の形態で示した動画像符号化方法または装置、または、動画像復号方法または装置を、上述したいずれの機器・システムに用いることも可能である。
(実施の形態7)
上記各実施の形態で示した動画像符号化方法および装置、動画像復号化方法および装置は、典型的には集積回路であるLSIで実現される。一例として、図32に1チップ化されたLSIex500の構成を示す。LSIex500は、以下に説明する要素ex501、ex502、ex503、ex504、ex505、ex506、ex507、ex508、ex509を備え、各要素はバスex510を介して接続している。電源回路部ex505は電源がオン状態の場合に各部に対して電力を供給することで動作可能な状態に起動する。
例えば符号化処理を行う場合には、LSIex500は、CPUex502、メモリコントローラex503、ストリームコントローラex504、駆動周波数制御部ex512等を有する制御部ex501の制御に基づいて、AV I/Oex509によりマイクex117やカメラex113等からAV信号を入力する。入力されたAV信号は、一旦SDRAM等の外部のメモリex511に蓄積される。制御部ex501の制御に基づいて、蓄積したデータは処理量や処理速度に応じて適宜複数回に分けるなどされ信号処理部ex507に送られ、信号処理部ex507において音声信号の符号化および/または映像信号の符号化が行われる。ここで映像信号の符号化処理は上記各実施の形態で説明した符号化処理である。信号処理部ex507ではさらに、場合により符号化された音声データと符号化された映像データを多重化するなどの処理を行い、ストリームI/Oex506から外部に出力する。この出力された多重化データは、基地局ex107に向けて送信されたり、または記録メディアex215に書き込まれたりする。なお、多重化する際には同期するよう、一旦バッファex508にデータを蓄積するとよい。
なお、上記では、メモリex511がLSIex500の外部の構成として説明したが、LSIex500の内部に含まれる構成であってもよい。バッファex508も1つに限ったものではなく、複数のバッファを備えていてもよい。また、LSIex500は1チップ化されてもよいし、複数チップ化されてもよい。
また、上記では、制御部ex501が、CPUex502、メモリコントローラex503、ストリームコントローラex504、駆動周波数制御部ex512等を有するとしているが、制御部ex501の構成は、この構成に限らない。例えば、信号処理部ex507がさらにCPUを備える構成であってもよい。信号処理部ex507の内部にもCPUを設けることにより、処理速度をより向上させることが可能になる。また、他の例として、CPUex502が信号処理部ex507、または信号処理部ex507の一部である例えば音声信号処理部を備える構成であってもよい。このような場合には、制御部ex501は、信号処理部ex507、またはその一部を有するCPUex502を備える構成となる。
なお、ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用してもよい。
さらには、半導体技術の進歩または派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適応等が可能性としてありえる。
(実施の形態8)
上記各実施の形態で示した動画像符号化方法または装置によって生成された映像データを復号する場合、従来のMPEG−2、MPEG4−AVC、VC−1などの規格に準拠する映像データを復号する場合に比べ、処理量が増加することが考えられる。そのため、LSIex500において、従来の規格に準拠する映像データを復号する際のCPUex502の駆動周波数よりも高い駆動周波数に設定する必要がある。しかし、駆動周波数を高くすると、消費電力が高くなるという課題が生じる。
この課題を解決するために、テレビex300、LSIex500などの動画像復号化装置は、映像データがどの規格に準拠するものであるかを識別し、規格に応じて駆動周波数を切替える構成とする。図33は、本実施の形態における構成ex800を示している。駆動周波数切替え部ex803は、映像データが、上記各実施の形態で示した動画像符号化方法または装置によって生成されたものである場合には、駆動周波数を高く設定する。そして、上記各実施の形態で示した動画像復号化方法を実行する復号処理部ex801に対し、映像データを復号するよう指示する。一方、映像データが、従来の規格に準拠する映像データである場合には、映像データが、上記各実施の形態で示した動画像符号化方法または装置によって生成されたものである場合に比べ、駆動周波数を低く設定する。そして、従来の規格に準拠する復号処理部ex802に対し、映像データを復号するよう指示する。
より具体的には、駆動周波数切替え部ex803は、図32のCPUex502と駆動周波数制御部ex512から構成される。また、上記各実施の形態で示した動画像復号化方法を実行する復号処理部ex801、および、従来の規格に準拠する復号処理部ex802は、図32の信号処理部ex507に該当する。CPUex502は、映像データがどの規格に準拠するものであるかを識別する。そして、CPUex502からの信号に基づいて、駆動周波数制御部ex512は、駆動周波数を設定する。また、CPUex502からの信号に基づいて、信号処理部ex507は、映像データの復号を行う。ここで、映像データの識別には、例えば、実施の形態6で記載した識別情報を利用することが考えられる。識別情報に関しては、実施の形態6で記載したものに限られず、映像データがどの規格に準拠するか識別できる情報であればよい。例えば、映像データがテレビに利用されるものであるか、ディスクに利用されるものであるかなどを識別する外部信号に基づいて、映像データがどの規格に準拠するものであるか識別可能である場合には、このような外部信号に基づいて識別してもよい。また、CPUex502における駆動周波数の選択は、例えば、図35のような映像データの規格と、駆動周波数とを対応付けたルックアップテーブルに基づいて行うことが考えられる。ルックアップテーブルを、バッファex508や、LSIの内部メモリに格納しておき、CPUex502がこのルックアップテーブルを参照することにより、駆動周波数を選択することが可能である。
図34は、本実施の形態の方法を実施するステップを示している。まず、ステップexS200では、信号処理部ex507において、多重化データから識別情報を取得する。次に、ステップexS201では、CPUex502において、識別情報に基づいて映像データが上記各実施の形態で示した符号化方法または装置によって生成されたものであるか否かを識別する。映像データが上記各実施の形態で示した符号化方法または装置によって生成されたものである場合には、ステップexS202において、駆動周波数を高く設定する信号を、CPUex502が駆動周波数制御部ex512に送る。そして、駆動周波数制御部ex512において、高い駆動周波数に設定される。一方、従来のMPEG−2、MPEG4−AVC、VC−1などの規格に準拠する映像データであることを示している場合には、ステップexS203において、駆動周波数を低く設定する信号を、CPUex502が駆動周波数制御部ex512に送る。そして、駆動周波数制御部ex512において、映像データが上記各実施の形態で示した符号化方法または装置によって生成されたものである場合に比べ、低い駆動周波数に設定される。
さらに、駆動周波数の切替えに連動して、LSIex500またはLSIex500を含む装置に与える電圧を変更することにより、省電力効果をより高めることが可能である。例えば、駆動周波数を低く設定する場合には、これに伴い、駆動周波数を高く設定している場合に比べ、LSIex500またはLSIex500を含む装置に与える電圧を低く設定することが考えられる。
また、駆動周波数の設定方法は、復号する際の処理量が大きい場合に、駆動周波数を高く設定し、復号する際の処理量が小さい場合に、駆動周波数を低く設定すればよく、上述した設定方法に限らない。例えば、MPEG4−AVC規格に準拠する映像データを復号する処理量の方が、上記各実施の形態で示した動画像符号化方法または装置により生成された映像データを復号する処理量よりも大きい場合には、駆動周波数の設定を上述した場合の逆にすることが考えられる。
さらに、駆動周波数の設定方法は、駆動周波数を低くする構成に限らない。例えば、識別情報が、上記各実施の形態で示した動画像符号化方法または装置によって生成された映像データであることを示している場合には、LSIex500またはLSIex500を含む装置に与える電圧を高く設定し、従来のMPEG−2、MPEG4−AVC、VC−1などの規格に準拠する映像データであることを示している場合には、LSIex500またはLSIex500を含む装置に与える電圧を低く設定することも考えられる。また、他の例としては、識別情報が、上記各実施の形態で示した動画像符号化方法または装置によって生成された映像データであることを示している場合には、CPUex502の駆動を停止させることなく、従来のMPEG−2、MPEG4−AVC、VC−1などの規格に準拠する映像データであることを示している場合には、処理に余裕があるため、CPUex502の駆動を一時停止させることも考えられる。識別情報が、上記各実施の形態で示した動画像符号化方法または装置によって生成された映像データであることを示している場合であっても、処理に余裕があれば、CPUex502の駆動を一時停止させることも考えられる。この場合は、従来のMPEG−2、MPEG4−AVC、VC−1などの規格に準拠する映像データであることを示している場合に比べて、停止時間を短く設定することが考えられる。
このように、映像データが準拠する規格に応じて、駆動周波数を切替えることにより、省電力化を図ることが可能になる。また、電池を用いてLSIex500またはLSIex500を含む装置を駆動している場合には、省電力化に伴い、電池の寿命を長くすることが可能である。
(実施の形態9)
テレビや、携帯電話など、上述した機器・システムには、異なる規格に準拠する複数の映像データが入力される場合がある。このように、異なる規格に準拠する複数の映像データが入力された場合にも復号できるようにするために、LSIex500の信号処理部ex507が複数の規格に対応している必要がある。しかし、それぞれの規格に対応する信号処理部ex507を個別に用いると、LSIex500の回路規模が大きくなり、また、コストが増加するという課題が生じる。
この課題を解決するために、上記各実施の形態で示した動画像復号方法を実行するための復号処理部と、従来のMPEG−2、MPEG4−AVC、VC−1などの規格に準拠する復号処理部とを一部共有化する構成とする。この構成例を図36Aのex900に示す。例えば、上記各実施の形態で示した動画像復号方法と、MPEG4−AVC規格に準拠する動画像復号方法とは、エントロピー符号化、逆量子化、デブロッキング・フィルタ、動き補償などの処理において処理内容が一部共通する。共通する処理内容については、MPEG4−AVC規格に対応する復号処理部ex902を共有し、MPEG4−AVC規格に対応しない、本発明の一態様に特有の他の処理内容については、専用の復号処理部ex901を用いるという構成が考えられる。特に、本発明の一態様は、エントロピー復号に特徴を有していることから、例えば、エントロピー復号については専用の復号処理部ex901を用い、それ以外の逆量子化、デブロッキング・フィルタ、動き補償のいずれか、または、全ての処理については、復号処理部を共有することが考えられる。復号処理部の共有化に関しては、共通する処理内容については、上記各実施の形態で示した動画像復号化方法を実行するための復号処理部を共有し、MPEG4−AVC規格に特有の処理内容については、専用の復号処理部を用いる構成であってもよい。
また、処理を一部共有化する他の例を図36Bのex1000に示す。この例では、本発明の一態様に特有の処理内容に対応した専用の復号処理部ex1001と、他の従来規格に特有の処理内容に対応した専用の復号処理部ex1002と、本発明の一態様に係る動画像復号方法と他の従来規格の動画像復号方法とに共通する処理内容に対応した共用の復号処理部ex1003とを用いる構成としている。ここで、専用の復号処理部ex1001、ex1002は、必ずしも本発明の一態様、または、他の従来規格に特有の処理内容に特化したものではなく、他の汎用処理を実行できるものであってもよい。また、本実施の形態の構成を、LSIex500で実装することも可能である。
このように、本発明の一態様に係る動画像復号方法と、従来の規格の動画像復号方法とで共通する処理内容について、復号処理部を共有することにより、LSIの回路規模を小さくし、かつ、コストを低減することが可能である。
以上、複数の態様に係る画像符号化装置及び画像復号装置について、実施の形態に基づいて説明したが、本発明は、この実施の形態に限定されるものではない。本発明の趣旨を逸脱しない限り、当業者が思いつく各種変形を本実施の形態に施したものや、異なる実施の形態における構成要素を組み合わせて構築される形態も、一つまたは複数の態様の範囲内に含まれてもよい。
本発明は、画像符号化方法、画像復号方法、画像符号化装置及び画像復号装置に適用できる。また、本発明は、画像符号化装置を備える、テレビ、デジタルビデオレコーダー、カーナビゲーション、携帯電話、デジタルカメラ、及びデジタルビデオカメラ等の高解像度の情報表示機器又は撮像機器に利用可能である。
100、100A、100B、100C 画像符号化装置
101 減算器
102 直交変換部
103 量子化部
104、204 逆量子化部
105、205 逆直交変換部
106、206 加算器
107、207 ブロックメモリ
108、208 フレームメモリ
109、209 イントラ予測部
110、210 インター予測部
111、211 ピクチャタイプ決定部
112、112A、112C、212、212A、212C ピクチャ分割制御部
113、113B、113C 可変長符号化部
114、114B 多重化部
115 符号化部
120 入力画像信号
121、125、225 予測誤差データ
122、124、224 変換係数
123、223 量子化係数
126、127、128、226、227、228 復号画像データ
129、130、131、229、230、231 予測画像データ
132、132A、132C、232、232A、232C 分割制御信号
133、233 符号化データ
134、234 ビットストリーム
135、135A、135C、235、235A、235C ピクチャ分割情報
140、145 タイル境界独立情報
141、146 全体依存情報
142 水平依存情報
143 垂直依存情報
150 入力画像制御部
151 マーカー挿入部
160、260 画像信号
161 タイルマーカー
200、200A、200B、200C 画像復号装置
201、201A、201B、201C 解析部
213、213C 可変長復号部
215 復号部
250 出力画像制御部
281 符号列
282 ビット列

Claims (2)

  1. ビットストリームに含まれる、ピクチャが分割された複数のタイルの各々が符号化されることにより生成された複数の符号化データを取得する取得ステップと、
    前記複数の符号化データの各々を復号することで、前記複数のタイルの画像データを生成する復号ステップとを含み、
    前記取得ステップでは、前記ビットストリームから前記複数のタイルのタイル間の境界の各々が第1境界であるか第2境界であるかを示すタイル境界独立情報をさらに取得し、
    前記復号ステップは、
    前記複数の符号化データの各々を復号する際に、前記タイル境界独立情報が前記第1境界であることを示す場合は他の復号済みタイルの復号情報を参照して復号し、前記第2境界であることを示す場合は、他の復号済みタイルの復号情報を参照せずに復号することで、前記複数のタイルの各々の画像データを生成する生成ステップを含む
    画像復号方法。
  2. ビットストリームに含まれる、ピクチャが分割された複数のタイルの各々が符号化されることにより生成された複数の符号化データを取得する解析部と、
    前記複数の符号化データの各々を復号することで、前記複数のタイルの画像データを生成する復号部とを備え、
    前記解析部は、前記ビットストリームから前記複数のタイルのタイル間の境界の各々が第1境界であるか第2境界であるかを示すタイル境界独立情報をさらに取得し、
    前記復号部は、
    前記複数の符号化データの各々を復号する際に、前記タイル境界独立情報が前記第1境界であることを示す場合は他の復号済みタイルの復号情報を参照して復号し、前記第2境界であることを示す場合は、他の復号済みタイルの復号情報を参照せずに復号することで、前記複数のタイルの各々の画像データを生成す
    画像復号装置。
JP2013117301A 2011-08-11 2013-06-03 画像復号方法及び画像復号装置 Active JP6074743B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201161522382P 2011-08-11 2011-08-11
US61/522,382 2011-08-11

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2013522753A Division JP5362150B2 (ja) 2011-08-11 2012-08-07 画像符号化方法及び画像符号化装置

Publications (2)

Publication Number Publication Date
JP2013219806A JP2013219806A (ja) 2013-10-24
JP6074743B2 true JP6074743B2 (ja) 2017-02-08

Family

ID=47668156

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2013522753A Active JP5362150B2 (ja) 2011-08-11 2012-08-07 画像符号化方法及び画像符号化装置
JP2013117301A Active JP6074743B2 (ja) 2011-08-11 2013-06-03 画像復号方法及び画像復号装置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2013522753A Active JP5362150B2 (ja) 2011-08-11 2012-08-07 画像符号化方法及び画像符号化装置

Country Status (14)

Country Link
US (10) US8620097B2 (ja)
EP (1) EP2744202B1 (ja)
JP (2) JP5362150B2 (ja)
KR (1) KR101815727B1 (ja)
CN (2) CN106878732B (ja)
AU (1) AU2012294053B2 (ja)
CA (1) CA2827849C (ja)
ES (1) ES2805313T3 (ja)
MX (1) MX2013010003A (ja)
MY (1) MY167857A (ja)
PL (1) PL2744202T3 (ja)
RU (1) RU2595626C2 (ja)
TW (1) TWI566580B (ja)
WO (1) WO2013021619A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4221199A1 (en) * 2017-07-03 2023-08-02 Industry-University Cooperation Foundation Hanyang University Method and device for decoding image by using partition unit including additional region

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200037439A (ko) 2011-07-18 2020-04-08 선 페이턴트 트러스트 화상 부호화 방법, 화상 복호 방법, 화상 부호화 장치, 화상 복호 장치 및 화상 부호화 복호 장치
MY167857A (en) * 2011-08-11 2018-09-26 Sun Patent Trust Image coding method, image decoding method, image coding apparatus, image decoding apparatus, and image coding and decoding apparatus
AU2012327672B2 (en) * 2011-10-24 2015-09-03 Hfi Innovation Inc. Method and apparatus for non-cross-tile loop filtering
US20130107973A1 (en) * 2011-10-28 2013-05-02 Qualcomm Incorporated Loop filtering control over tile boundaries
US10349077B2 (en) * 2011-11-21 2019-07-09 Canon Kabushiki Kaisha Image coding apparatus, image coding method, image decoding apparatus, image decoding method, and storage medium
WO2013111593A1 (ja) 2012-01-27 2013-08-01 パナソニック株式会社 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置及び画像符号化復号装置
CN108429917B (zh) * 2012-09-29 2022-04-29 华为技术有限公司 视频编码及解码方法、装置及系统
US9788002B2 (en) * 2012-11-29 2017-10-10 Samsung Electronics Co., Ltd. Image processing apparatus and method
KR20200045013A (ko) * 2013-07-15 2020-04-29 소니 주식회사 상호작용성을 위한 모션-구속된 타일 세트들 sei 메시지의 확장들
GB2516825B (en) * 2013-07-23 2015-11-25 Canon Kk Method, device, and computer program for encapsulating partitioned timed media data using a generic signaling for coding dependencies
JP6209026B2 (ja) * 2013-08-30 2017-10-04 キヤノン株式会社 画像符号化装置及びその制御方法
US10091519B2 (en) * 2013-10-14 2018-10-02 Electronics And Telecommunications Research Institute Multilayer-based image encoding/decoding method and apparatus
US10547838B2 (en) * 2014-09-30 2020-01-28 Telefonaktiebolaget Lm Ericsson (Publ) Encoding and decoding a video frame in separate processing units
US10506244B2 (en) * 2015-03-06 2019-12-10 Qualcomm Incorporated Method and apparatus for video coding using adaptive tile sizes
US10609419B2 (en) 2015-06-24 2020-03-31 Sony Corporation Encoding apparatus, decoding apparatus and transmission control method
KR20220002736A (ko) * 2015-11-24 2022-01-06 삼성전자주식회사 비디오 복호화 방법 및 장치, 그 부호화 방법 및 장치
CN106851323B (zh) * 2015-12-07 2019-07-19 腾讯科技(深圳)有限公司 解码方法及解码装置
CN107046370B (zh) * 2016-02-09 2020-05-26 松下知识产权经营株式会社 变换器、电力传输系统及控制器
BR112018069135B1 (pt) * 2016-05-10 2023-12-26 Samsung Electronics Co., Ltd Método de decodificação de imagem para decodificar uma imagem, aparelho de decodificação de imagens para decodificar uma imagem, método de codificação de imagem para codificar uma imagem, e aparelho de codificação de imagens para codificar uma imagem
US10880548B2 (en) 2016-06-01 2020-12-29 Samsung Electronics Co., Ltd. Methods and apparatuses for encoding and decoding video according to coding order
US10418002B2 (en) * 2016-10-18 2019-09-17 Mediatek Inc. Merged access units in frame buffer compression
CN110114803B (zh) * 2016-12-28 2023-06-27 松下电器(美国)知识产权公司 三维模型分发方法、三维模型接收方法、三维模型分发装置以及三维模型接收装置
CN114554221B (zh) 2017-07-19 2023-08-01 三星电子株式会社 编码方法及用于其的设备、解码方法及用于其的设备
GB2569107B (en) * 2017-11-29 2022-04-06 Displaylink Uk Ltd Managing display data
HUE061846T2 (hu) 2018-06-15 2023-08-28 Lg Electronics Inc Eljárás és berendezés CABAC-alapú entrópiás kódoláshoz
KR20240027873A (ko) 2018-07-02 2024-03-04 노키아 테크놀로지스 오와이 비디오 코딩에서 타일 관련 어드레싱을 위한 방법 및 장치
US10841602B2 (en) * 2018-07-16 2020-11-17 Tencent America LLC Hierarchical tiles
US11889085B2 (en) * 2019-03-08 2024-01-30 Telefonaktiebolaget Lm Ericsson (Publ) Methods providing encoding/decoding of dependent/independent partitions and related devices
EP3939278A4 (en) 2019-03-11 2023-03-22 Tencent America LLC TILE AND SUB-DIVISION
BR112022012096A2 (pt) * 2019-12-19 2022-08-30 Ericsson Telefon Ab L M Métodos para decodificar e codificar pelo menos uma imagem parada atual, decodificador para decodificar imagens paradas, e, codificador para codificar imagens paradas

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US1000960A (en) 1910-09-22 1911-08-15 Arthur Bell Box-lid.
US6370273B1 (en) * 1998-04-10 2002-04-09 Flashpoint Technology, Inc. Method and system for tiled image data decompression
JP4124910B2 (ja) 1999-05-18 2008-07-23 キヤノン株式会社 画像データの復号化方法及びその装置
US6792153B1 (en) * 1999-11-11 2004-09-14 Canon Kabushiki Kaisha Image processing method and apparatus, and storage medium
US6671413B1 (en) * 2000-01-24 2003-12-30 William A. Pearlman Embedded and efficient low-complexity hierarchical image coder and corresponding methods therefor
US7428338B2 (en) * 2002-01-10 2008-09-23 Ricoh Co., Ltd. Header-based processing of images compressed using multi-scale transforms
US7330596B2 (en) * 2002-07-17 2008-02-12 Ricoh Company, Ltd. Image decoding technique for suppressing tile boundary distortion
AU2004214313B2 (en) * 2003-02-18 2010-05-20 Nokia Technologies Oy Picture coding method
JP2004297321A (ja) * 2003-03-26 2004-10-21 Minolta Co Ltd 画像処理システム
CA2499163A1 (en) * 2004-03-03 2005-09-03 Her Majesty The Queen In Right Of Canada, As Represented By The Minister Of Industry, Through The Communication Research Centre Canada Curved wavelet transform for image and video compression
JP4931034B2 (ja) * 2004-06-10 2012-05-16 株式会社ソニー・コンピュータエンタテインメント 復号装置および復号方法、並びに、プログラムおよびプログラム記録媒体
US20060269151A1 (en) * 2005-05-25 2006-11-30 Hiroyuki Sakuyama Encoding method and encoding apparatus
WO2007116551A1 (ja) * 2006-03-30 2007-10-18 Kabushiki Kaisha Toshiba 画像符号化装置及び画像符号化方法並びに画像復号化装置及び画像復号化方法
US7949054B2 (en) * 2006-06-01 2011-05-24 Microsoft Corporation Flexible data organization for images
US7460725B2 (en) 2006-11-09 2008-12-02 Calista Technologies, Inc. System and method for effectively encoding and decoding electronic information
US8515194B2 (en) * 2007-02-21 2013-08-20 Microsoft Corporation Signaling and uses of windowing information for images
JP4763853B2 (ja) 2008-03-31 2011-08-31 パナソニック株式会社 可変長符号復号化装置及びその方法
JP5340091B2 (ja) * 2008-12-19 2013-11-13 キヤノン株式会社 画像符号化装置及びその制御方法
US10244239B2 (en) * 2010-12-28 2019-03-26 Dolby Laboratories Licensing Corporation Parameter set for picture segmentation
US8990435B2 (en) * 2011-01-17 2015-03-24 Mediatek Inc. Method and apparatus for accessing data of multi-tile encoded picture stored in buffering apparatus
US9325999B2 (en) 2011-03-10 2016-04-26 Sharp Kabushiki Kaisha Video decoder for slices
EP3614665B1 (en) 2011-05-27 2022-03-23 Sun Patent Trust Apparatus, method and program for decoding moving pictures
US9485518B2 (en) 2011-05-27 2016-11-01 Sun Patent Trust Decoding method and apparatus with candidate motion vectors
TW201304552A (zh) 2011-05-31 2013-01-16 Panasonic Corp 動態圖像編碼方法、動態圖像編碼裝置、動態圖像解碼方法、動態圖像解碼裝置、及動態圖像編碼解碼裝置
US9398307B2 (en) * 2011-07-11 2016-07-19 Sharp Kabushiki Kaisha Video decoder for tiles
IN2014CN00729A (ja) 2011-08-03 2015-04-03 Panasonic Corp
MY167857A (en) * 2011-08-11 2018-09-26 Sun Patent Trust Image coding method, image decoding method, image coding apparatus, image decoding apparatus, and image coding and decoding apparatus
US9584819B2 (en) * 2011-10-24 2017-02-28 Qualcomm Incorporated Grouping of tiles for video coding
US9247258B2 (en) * 2011-10-26 2016-01-26 Qualcomm Incorporated Unified design for picture partitioning schemes
KR102145782B1 (ko) * 2011-10-31 2020-08-19 미쓰비시덴키 가부시키가이샤 동화상 부호화 장치, 동화상 부호화 방법 및 컴퓨터 독취 가능한 기억 매체
US9124895B2 (en) * 2011-11-04 2015-09-01 Qualcomm Incorporated Video coding with network abstraction layer units that include multiple encoded picture partitions
US9077998B2 (en) 2011-11-04 2015-07-07 Qualcomm Incorporated Padding of segments in coded slice NAL units
US20130208808A1 (en) * 2012-02-08 2013-08-15 Panasonic Corporation Image coding method and image decoding method
KR102539065B1 (ko) * 2013-01-04 2023-06-01 지이 비디오 컴프레션, 엘엘씨 효율적인 확장가능한 코딩 개념
US9749627B2 (en) * 2013-04-08 2017-08-29 Microsoft Technology Licensing, Llc Control data for motion-constrained tile set
US9628792B2 (en) * 2013-07-15 2017-04-18 Qualcomm Incorporated Cross-layer parallel processing and offset delay parameters for video coding
KR20200045013A (ko) * 2013-07-15 2020-04-29 소니 주식회사 상호작용성을 위한 모션-구속된 타일 세트들 sei 메시지의 확장들
GB2516824A (en) * 2013-07-23 2015-02-11 Nokia Corp An apparatus, a method and a computer program for video coding and decoding

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4221199A1 (en) * 2017-07-03 2023-08-02 Industry-University Cooperation Foundation Hanyang University Method and device for decoding image by using partition unit including additional region

Also Published As

Publication number Publication date
US20190356920A1 (en) 2019-11-21
KR101815727B1 (ko) 2018-01-05
US20200304793A1 (en) 2020-09-24
JP5362150B2 (ja) 2013-12-11
US20220094934A1 (en) 2022-03-24
EP2744202B1 (en) 2020-05-27
KR20140057188A (ko) 2014-05-12
US20180278935A1 (en) 2018-09-27
US20140079331A1 (en) 2014-03-20
US10715808B2 (en) 2020-07-14
US8879860B2 (en) 2014-11-04
US20150010063A1 (en) 2015-01-08
EP2744202A4 (en) 2015-03-04
AU2012294053A1 (en) 2013-09-05
US20130039593A1 (en) 2013-02-14
AU2012294053B2 (en) 2016-07-07
CN103718553A (zh) 2014-04-09
PL2744202T3 (pl) 2020-12-28
MX2013010003A (es) 2013-12-06
US9355467B2 (en) 2016-05-31
JPWO2013021619A1 (ja) 2015-03-05
CN106878732B (zh) 2019-09-17
US10412389B2 (en) 2019-09-10
RU2595626C2 (ru) 2016-08-27
WO2013021619A1 (ja) 2013-02-14
US20160249052A1 (en) 2016-08-25
EP2744202A1 (en) 2014-06-18
US20230345002A1 (en) 2023-10-26
MY167857A (en) 2018-09-26
CN106878732A (zh) 2017-06-20
TW201316779A (zh) 2013-04-16
RU2013138222A (ru) 2015-09-20
ES2805313T3 (es) 2021-02-11
JP2013219806A (ja) 2013-10-24
CA2827849C (en) 2018-01-16
US10009609B2 (en) 2018-06-26
CA2827849A1 (en) 2013-02-14
US9648328B2 (en) 2017-05-09
US11706416B2 (en) 2023-07-18
US20170201750A1 (en) 2017-07-13
TWI566580B (zh) 2017-01-11
US8620097B2 (en) 2013-12-31
US11228765B2 (en) 2022-01-18
CN103718553B (zh) 2017-03-01

Similar Documents

Publication Publication Date Title
JP6074743B2 (ja) 画像復号方法及び画像復号装置
JP6473982B2 (ja) 画像復号方法および画像復号装置
JP6222589B2 (ja) 復号方法及び復号装置
KR102013460B1 (ko) 화상 부호화 방법, 화상 복호 방법, 화상 부호화 장치, 화상 복호 장치, 화상 부호화 복호 장치
JP6176614B2 (ja) 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置及び画像符号化復号装置
JP6210368B2 (ja) 画像復号方法および画像復号装置
JP2018011332A (ja) 符号化復号方法
JP5503091B1 (ja) 画像符号化方法および画像符号化装置
JP6587046B2 (ja) 画像符号化方法、画像復号方法、画像符号化装置及び画像復号装置
JP6483028B2 (ja) 画像符号化方法及び画像符号化装置
JPWO2012114693A1 (ja) 算術復号方法および算術符号化方法
WO2013164903A1 (ja) 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置及び画像符号化復号装置
JP5680812B1 (ja) 画像符号化方法、画像復号方法、画像符号化装置および画像復号装置
JP6365924B2 (ja) 画像復号方法及び画像復号装置
WO2013014884A1 (ja) 動画像符号化方法、動画像符号化装置、動画像復号化方法、および動画像復号化装置
WO2012095930A1 (ja) 画像符号化方法、画像復号方法、画像符号化装置及び画像復号装置

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20140606

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150730

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20160530

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160905

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160913

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161128

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161213

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161219

R150 Certificate of patent or registration of utility model

Ref document number: 6074743

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250