JP5048826B2 - 動画像復号化方法、動画像復号化装置、プログラムおよび記録媒体 - Google Patents

動画像復号化方法、動画像復号化装置、プログラムおよび記録媒体 Download PDF

Info

Publication number
JP5048826B2
JP5048826B2 JP2010276436A JP2010276436A JP5048826B2 JP 5048826 B2 JP5048826 B2 JP 5048826B2 JP 2010276436 A JP2010276436 A JP 2010276436A JP 2010276436 A JP2010276436 A JP 2010276436A JP 5048826 B2 JP5048826 B2 JP 5048826B2
Authority
JP
Japan
Prior art keywords
quantization matrix
color difference
matrix
picture
quantization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010276436A
Other languages
English (en)
Other versions
JP2011091847A (ja
Inventor
ジュファイ・ル
タオ・チェン
吉一郎 柏木
眞也 角野
スン・リム チョン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Publication of JP2011091847A publication Critical patent/JP2011091847A/ja
Application granted granted Critical
Publication of JP5048826B2 publication Critical patent/JP5048826B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/24Systems for the transmission of television signals using pulse code modulation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/188Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a video data packet, e.g. a network abstraction layer [NAL] unit
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、動画像を符号化してストリームを生成する動画像符号化方法、符号化されたストリームを復号化する動画像復号化方法、およびそのストリームに関する。
近年、音声、画像、その他の画素値を統合的に扱うマルチメディア時代を迎え、従来からの情報メディア,つまり新聞,雑誌,テレビ,ラジオ,電話等の情報を人に伝達する手段がマルチメディアの対象として取り上げられるようになってきた。一般に、マルチメディアとは、文字だけでなく、図形、音声、特に画像等を同時に関連づけて表すことをいうが、上記従来の情報メディアをマルチメディアの対象とするには、その情報をディジタル形式にして表すことが必須条件となる。
ところが、上記各情報メディアの持つ情報量をディジタル情報量として見積もってみると、文字の場合1文字当たりの情報量は1〜2バイトであるのに対し、音声の場合1秒当たり64Kbits(電話品質)、さらに動画については1秒当たり100Mbits(現行テレビ受信品質)以上の情報量が必要となり、上記情報メディアでその膨大な情報をディジタル形式でそのまま扱うことは現実的では無い。例えば、テレビ電話は、64Kbit/s〜1.5Mbit/sの伝送速度を持つサービス総合ディジタル網(ISDN : Integrated Services Digital Network)によってすでに実用化されているが、テレビ・カメラの映像をそのままISDNで送ることは不可能である。
そこで、必要となってくるのが情報の圧縮技術であり、例えば、テレビ電話の場合、ITU-T(国際電気通信連合 電気通信標準化部門)で勧告されたH.261やH.263規格の動画圧
縮技術が用いられている。また、MPEG-1規格の情報圧縮技術によると、通常の音楽用CD(コンパクト・ディスク)に音声情報とともに画像情報を入れることも可能となる。
ここで、MPEG(Moving Picture Experts Group)とは、ISO/IEC(国際標準化機構 国際電気標準会議)で標準化された動画像信号圧縮の国際規格であり、MPEG-1は、動画像信号を1.5Mbit/sまで、つまりテレビ信号の情報を約100分の1にまで圧縮する規格である。また、MPEG-1規格では対象とする品質を伝送速度が主として約1.5Mbit/sで実現できる程度の中程度の品質としたことから、さらなる高画質化の要求をみたすべく規格化されたMPEG-2では、動画像信号を2〜15Mbit/sでTV放送品質を実現する。さらに現状では、MPEG-1,MPEG-2と標準化を進めてきた作業グループ(ISO/IEC JTC1/SC29/WG11)によって、MPEG-1,MPEG-2を上回る圧縮率を達成し、更に物体単位で符号化・復号化・操作を可能とし、マルチメディア時代に必要な新しい機能を実現するMPEG-4が規格化された。MPEG-4では、当初、低ビットレートの符号化方法の標準化を目指して進められたが、現在はインタレース画像も含む高ビットレートも含む、より汎用的な符号化に拡張されている。更に、現在は、ISO/IECとITU-Tが共同でより高圧縮率の次世代画像符号化方式として、MPEG-4 AVCおよびITU H.264 の標準化活動が進んでいる。2002年8月の時点で、次世代画像符号化方式はコミッティー・ドラフト(CD)と呼ばれるものが発行されている。
一般に動画像の符号化では、時間方向および空間方向の冗長性を削減することによって情報量の圧縮を行う。そこで時間的な冗長性の削減を目的とする画面間予測符号化では、前方または後方のピクチャを参照してブロック単位で動きの検出および予測画像の作成を行い、得られた予測画像と符号化対象ピクチャとの差分値に対して符号化を行う。ここで、ピクチャとは1枚の画面を表す用語であり、プログレッシブ画像ではフレームを意味し、インタレース画像ではフレームもしくはフィールドを意味する。ここで、インタレース画像とは、1つのフレームが時刻の異なる2つのフィールドから構成される画像である。インタレース画像の符号化や復号化処理においては、1つのフレームをフレームのまま処理したり、2つのフィールドとして処理したり、フレーム内のブロック毎にフレーム構造またはフィールド構造として処理したりすることができる。
参照画像を用いずに画面内予測符号化を行うピクチャをIピクチャと呼ぶ。また、1枚のピクチャのみを参照し画面間予測符号化を行うピクチャをPピクチャと呼ぶ。また、同時に2枚のピクチャを参照して画面間予測符号化を行うことのできるピクチャをBピクチャと呼ぶ。Bピクチャは表示時間が前方もしくは後方から任意の組み合わせとして2枚のピクチャを参照することが可能である。参照画像(参照ピクチャ)は符号化および復号化の基本単位であるブロックごとに指定することができるが、符号化を行ったビットストリーム中に先に記述される方の参照ピクチャを第1参照ピクチャ、後に記述される方を第2参照ピクチャとして区別する。ただし、これらのピクチャを符号化および復号化する場合の条件として、参照するピクチャが既に符号化および復号化されている必要がある。
PピクチャまたはBピクチャの符号化には、動き補償画面間予測符号化が用いられている。動き補償画面間予測符号化とは、画面間予測符号化に動き補償を適用した符号化方式である。動き補償とは、単純に参照ピクチャの画素値から予測するのではなく、ピクチャ内の各部の動き量(以下、これを動きベクトルと呼ぶ)を検出し、当該動き量を考慮した予測を行うことにより予測精度を向上すると共に、データ量を減らす方式である。例えば、符号化対象ピクチャの動きベクトルを検出し、その動きベクトルの分だけ参照ピクチャをシフトした予測値と符号化対象ピクチャとの予測残差を符号化することによりデータ量を減している。この方式の場合には、復号化の際に動きベクトルの情報が必要になるため、動きベクトルも符号化されて記録又は伝送される。
動きベクトルはマクロブロック単位で検出されており、具体的には、符号化対象ピクチャ側のマクロブロックを固定しておき、参照ピクチャ側のマクロブロックを探索範囲内で移動させ、基準ブロックと最も似通った参照ブロックの位置を見つけることにより、動きベクトルが検出される。
図1はビットストリームのデータ構造の例を示した説明図である。図1に示すようにビットストリームは以下のような階層構造を有している。ビットストリーム(Stream)は複数のグループ・オブ・ピクチャ(Group Of Picture)から構成される。グループ・オブ・ピクチャを符号化処理の基本単位とすることで動画像の編集やランダムアクセスが可能になっている。グループ・オブ・ピクチャは、複数のピクチャから構成され、各ピクチャは、Iピクチャ、PピクチャまたはBピクチャがある。各ピクチャはさらに複数のスライスから構成されている。スライスは、各ピクチャ内の帯状の領域であり、複数のマクロブロックから構成されている。ストリーム、GOP、ピクチャおよびスライスはさらにそれぞれの単位の区切りを示す同期信号(sync)と当該単位に共通のデータであるヘッダ(header)から構成されている。
また、ストリームが連続したビットストリームでなく、細切れのデータの単位であるパケット等で伝送する場合はヘッダ部とヘッダ以外のデータ部を分離して別に伝送してもよい。その場合は、図1のようにヘッダ部とデータ部が1つのビットストリームとなることはない。しかしながら、パケットの場合は、ヘッダ部とデータ部の伝送する順序が連続しなくても、対応するデータ部に対応するヘッダ部が別のパケットで伝送されるだけであり、1つのビットストリームとなっていなくても、概念は図1で説明した符号化ビットストリームの場合と同じである。
一般に人間の視覚特性は画像中の低周波数成分に敏感であり、高周波数成分は低周波数成分ほど感度が高くないといわれている。更に、画像信号は低周波数成分のエネルギーが高周波数成分のエネルギーよりも大きいことから、画像符号化は低周波数成分から高周波数成分の順序で行われる。その結果、低周波数成分の符号化に必要なビット数よりも高周波数成分の符号化に必要なビット数の方が多くなる。
以上の観点から、従来の符号化方法では、直交変換により得られる周波数毎の変換係数の量子化において、低周波数成分よりも高周波数成分に対応する量子化ステップを粗くしている。これにより、主観的画質の劣化はわずかでありながら大幅に圧縮率を向上する方法が従来採用されている。
さて、低周波数成分に対して高周波数成分の量子化ステップをどの程度粗くするかについては画像信号に依存するため、画像に応じて各周波数成分の量子化ステップの大きさを変更する手法が採用されている。各周波数成分の量子化ステップを導出するために量子化マトリクスが用いられる。図2は量子化マトリクスの一例を示す図である。図2の量子化マトリクスの例において、左上が直流成分、右方が水平高周波数成分、下方が垂直高周波数成分に対応する。また、数値が大きいほど量子化ステップが粗くなることを示す。量子化マトリクスは、通常各ピクチャ単位で変更可能となっており、ピクチャのヘッダに記述されている。よって、例えば同じ内容の量子化マトリクスであっても、各ピクチャのヘッダに記述され、伝送されることになる。
ところで、現行のMPEG-4 AVCでは、MPEG-2やMPEG-4のように量子化マトリックスを搭載していない。その結果、すべてのDCT(離散コサイン変換)係数もしくはDCT同様の係数において均一の量子化を用いている、現行のMPEG-4 AVC符号化方式やその他の方式において最適な主観的画質を達成することは難しくなっている。このような量子化マトリックス方式を現行のMPEG-4 AVCの規定やその他の規格に導入する際には、これまでとの互換を重視しつつ量子化マトリックスを搭載できるようにしなくてはならない。
さらに、符号化効率が向上するにつれて、MPEG-4 AVCが様々なアプリケーション領域で使用される可能性も出てきた。その汎用性から考えて、異なる量子化マトリックスのセットを異なるアプリケーションで使用したり、異なる量子化マトリックスのセットを異なるカラーチャンネルで使用したりするといったことが、必要になるだろう。エンコーダではアプリケーションや符号化する画像に応じて異なる量子化マトリックスを選択することができる。従って、効率的な量子化マトリックスの定義づけと搭載プロトコルの策定をすすめることによって、量子化マトリックス情報をよりフレキシブルに効果的に伝送できるようにする必要がある。
そこで、本発明は上記の事情に鑑みてなされたものであり、符号化量を減少し、効率よく符号化および復号化を行うことができる動画像符号化方法および動画像復号化方法を提供することを目的とする。
上記目的を達成するために、本発明に係る動画像復号化方法は、量子化マトリクスを用いて、複数の符号化ピクチャをブロック単位で復号化する動画像復号化方法であって、デフォルト量子化マトリクスと異なる第2の量子化マトリクス、及び、前記第2の量子化マトリクスを特定するマトリクスIDを符号列から取得し、保持する保持ステップと、カレントピクチャを符号化して生成されたピクチャ符号化データに付随し、前記カレントピクチャを符号化する際に使用した量子化マトリクスを特定するマトリクスIDを前記符号列から抽出するステップと、抽出された前記マトリクスIDを用いて、前記保持ステップで保持された量子化マトリクスの中から前記マトリクスIDに対応する量子化マトリクスを特定する量子化マトリクス特定ステップと、特定された前記量子化マトリクスを用いて、前記ピクチャ符号化データを復号化するピクチャ復号化ステップとを含み、前記ピクチャは、輝度成分および2つの色差成分により構成され、前記量子化マトリクス特定ステップにおいて、前記マトリクスIDにより特定される前記量子化マトリクスに、輝度成分用量子化マトリクスと前記2つの色差成分の内の片方の色差成分に対応する色差成分用量子化マトリクスが存在するが、前記2つの色差成分の内の他方の色差成分に対応する色差成分用量子化マトリクスが存在しない場合、存在する色差成分用量子化マトリクスを、存在しない色差成分用量子化マトリクスとして代用することにより、前記2つの色差成分の内の前記他方の色差成分に対応する色差成分用量子化マトリクスを特定し、前記ピクチャ復号化ステップにおいて、前記ピクチャの前記輝度成分に対しては、特定された前記輝度成分用量子化マトリクスを用いて復号化を行い、前記2つの色差成分の内の片方の色差成分に対しては、特定された前記色差成分用量子化マトリクスを用いて復号化を行い、前記2つの色差成分の内の他方の色差成分に対しては、代用により特定された色差成分用量子化マトリクスを用いて復号化することを特徴とする。
また、上記目的を達成するために、本発明に係る動画像符号化方法は、動画像を構成するピクチャをブロック単位に符号化して符号化ストリームを生成する動画像符号化方法であって、前記ピクチャをブロック単位に空間周波数成分を示す係数に変換し、変換された前記係数を量子化マトリクスを用いて量子化し、量子化に用いられた前記量子化マトリクスを特定する特定情報を生成し、前記特定情報を所定単位で前記符号化ストリームに付加することを特徴とする。
これによって、例えばピクチャ、スライス、またはマクロブロック等の所定の単位では用いた量子化マトリクスを記載する必要がなく、符号化量を減少し、効率よく符号化を行うことができる。
また、前記量子化マトリクスを用いて量子化されたデータが格納される前記符号化ストリーム中の位置より前の位置に当該量子化マトリクスを格納してもよい。
ここで、前記量子化マトリクスの格納において、前記量子化マトリクスを用いて量子化されたデータが格納される前記符号化ストリーム中の位置より前に位置する、符号化に必要な情報を格納する第1のパラメータセットまたは第2のパラメータセットに前記量子化マトリクスを格納してもよい。
これによって、復号化時に特定情報により特定された量子化マトリクスを用いることができる。
また、前記動画像符号化方法は、さらに、前記特定情報により特定される前記量子化マトリクスとあらかじめ設定されている量子化マトリクスとの切り替えを指定するフラグを所定単位で前記符号化ストリームに付加してもよい。
これによって、特定情報により特定される量子化マトリクスとあらかじめ設定されている量子化マトリクスとの切り替えを指定することができる。
また、本発明に係る動画像復号化方法は、動画像を構成するピクチャがブロック単位に直交変換および量子化されることによって符号化された符号化ストリームを復号化する動画像復号化方法であって、少なくとも1つの量子化マトリクスを保持し、量子化に用いられた量子化マトリクスを特定する特定情報を所定単位で前記符号化ストリームから抽出し、保持されている少なくとも1つの前記量子化マトリクスから、前記特定情報に基づいて量子化マトリクスを特定し、符号化されている前記ピクチャを、特定された前記量子化マトリクスを用いてブロック単位に逆量子化し、逆量子化された空間周波数成分を示す係数を逆直交変換することによって前記ピクチャに復号化することを特徴とする。
これによって、量子化マトリクスがあらかじめ伝送され、例えばピクチャ、スライス、またはマクロブロック等の所定の単位では用いられた量子化マトリクスを特定するマトリクスIDだけが付加されている符号化ストリームを復号化することができる。
また、前記動画像復号化方法は、さらに、前記符号化ストリームから少なくとも1つの量子化マトリクスを抽出するとともに、前記保持において、前記符号化ストリームから抽出した前記量子化マトリクスを保持してもよい。
ここで、前記量子化マトリクスの抽出において、復号化に必要な情報を格納されている第1のパラメータセットまたは第2のパラメータセットから前記量子化マトリクスを抽出してもよい。
これによって、特定情報により特定された量子化マトリクスを用いることができる。
また、前記動画像符号化方法は、さらに、前記特定情報により特定される前記量子化マトリクスとあらかじめ設定されている量子化マトリクスとの切り替えを指定するフラグを所定単位で前記符号化ストリームから抽出し、前記量子化マトリクスの特定において、前記特定情報により特定される前記量子化マトリクスとあらかじめ設定されている量子化マトリクスとを切り替えてもよい。
これによって、特定情報により特定される量子化マトリクスとあらかじめ設定されている量子化マトリクスとの切り替えをフラグに基づいて行うことができる。
また、前記ピクチャは、輝度成分および2つの色差成分により構成され、前記量子化マトリクスの特定において、前記特定情報により特定される前記量子化マトリクスに色差成分用量子化マトリクスが存在しない場合、輝度成分用量子化マトリクスを用いる量子化マトリクスと特定してもよい。
また、前記ピクチャは、輝度成分および2つの色差成分により構成され、前記量子化マトリクスの特定において、前記特定情報により特定される前記量子化マトリクスに対応する色差成分用量子化マトリクスが存在しない場合、他方の色差成分用量子化マトリクスを用いる量子化マトリクスと特定してもよい。
これによって、色差用量子化マトリクスが省略されている場合であっても、符号化ストリームを復号化することができる。
さらに、本発明は、このような動画像符号化方法および動画像復号化方法として実現することができるだけでなく、このような動画像符号化方法および動画像復号化方法が含む特徴的なステップを手段として備える動画像符号化装置および動画像復号化装置として実現することもできる。また、それらのステップをコンピュータに実行させるプログラムとして実現したり、前記動画像符号化方法により符号化した符号化ストリームとして実現したりすることもできる。そして、そのようなプログラムおよび符号化ストリームは、CD−ROM等の記録媒体やインターネット等の伝送媒体を介して配信することができるのは言うまでもない。
以上の説明から明らかなように、本発明に係る動画像符号化方法および動画像復号化方法によれば、符号化量を減少し、効率よく符号化および復号化を行うことができる。
図1は、ビットストリームのデータ構造の例を示した説明図である。 図2は、量子化マトリクスの一例を示す図である。 図3は、本発明に係る動画像符号化方法を実現する動画像符号化装置の構成を示すブロック図である。 図4は、シーケンスパラメータセットおよびピクチャパラメータセットとスライスとの対応関係を示す図である。 図5は、シーケンスパラメータセットの構成の一部を示す図である。 図6は、ピクチャパラメータセットの構成の一部を示す図である。 図7は、パラメータセットにおける量子化マトリクスの記載例を示す図である。 図8は、マトリクスIDを付加する際の動作を示すフローチャートである。 図9は、本発明に係る動画像復号化方法を実現する動画像復号化装置の構成を示すブロック図である。 図10は、量子化マトリクスを特定する際の動作を示すフローチャートである。 図11は、色差成分に用いる量子化マトリクスを特定する際の動作を示すフローチャートである。 図12は、別データとして伝送された量子化マトリクスとシーケンスで用いる量子化マトリクスとの対応関係を示す図である。 図13は、各実施の形態の動画像符号化方法および動画像復号化方法をコンピュータシステムにより実現するためのプログラムを格納するための記録媒体についての説明図であり、(a)記録媒体本体であるフレキシブルディスクの物理フォーマットの例を示した説明図、(b)フレキシブルディスクの正面からみた外観、断面構造、及びフレキシブルディスクを示した説明図、(c)フレキシブルディスクFDに上記プログラムの記録再生を行うための構成を示した説明図である。 図14は、コンテンツ配信サービスを実現するコンテンツ供給システムの全体構成を示すブロック図である。 図15は、携帯電話の一例を示す図である。 図16は、携帯電話の内部構成を示すブロック図である。 図17は、ディジタル放送用システムの全体構成を示すブロック図である。
本発明の実施の形態について、図面を参照して説明する。
(実施の形態1)
図3は、本発明に係る動画像符号化方法を実現する動画像符号化装置の構成を示すブロック図である。
動画像符号化装置3は、入力される画像信号Vin を圧縮符号化して可変長符号化等のビットストリームに変換した符号化ストリームStr を出力する装置であり、図3に示すように動き検出部101、動き補償部102、減算部103、直交変換部104、量子化部105、逆量子化部106、逆直交変換部107、加算部108、ピクチャメモリ109、スイッチ110、可変長符号化部111、および量子化マトリクス保持部112を備えている。
画像信号Vin は、減算部103および動き検出部101に入力される。減算部103は、入力された画像信号Vin と予測画像の差分値を計算し、直交変換部104に出力する。直交変換部104は、差分値を周波数係数に変換し、量子化部105に出力する。量子化部105は、入力された周波数係数を、入力された量子化マトリクスWMを用いて量子化し、量子化値Qcoefを可変長符号化部111に出力する。
逆量子化部106は、入力された量子化マトリクスWMを用いて量子化値Qcoefを逆量子化して周波数係数に復元し、逆直交変換部107に出力する。逆直交変換部107は、周波数係数から画素差分値に逆周波数変換し、加算部108に出力する。加算部108は、画素差分値と動き補償部102から出力される予測画像とを加算して復号化画像とする。スイッチ110は、当該復号化画像の保存が指示された場合にONになり、復号化画像はピクチャメモリ109に保存される。
一方、画像信号Vin がマクロブロック単位で入力された動き検出部101は、ピクチャメモリ109に格納されている復号化画像を探索対象とし、最も入力画像信号に近い画像領域を検出してその位置を指し示す動きベクトルMVを決定する。動きベクトル検出はマクロブロックをさらに分割したブロック単位で行われる。このとき、複数のピクチャを参照ピクチャとして使用することができるため、参照するピクチャを指定するための識別番号(参照インデックスIndex)がブロックごとに必要となる。参照インデックスIndexによって、ピクチャメモリ109中の各ピクチャが有するピクチャ番号との対応を取ることにより参照ピクチャを指定することが可能となる。
動き補償部102では、上記処理によって検出された動きベクトルMVおよび参照インデックスIndexを用いて、ピクチャメモリ109に格納されている復号化画像から予測画像に最適な画像領域を取り出す。
量子化マトリクス保持部112は、すでにパラメータセットで伝送されている量子化マトリクスWMを、この量子化マトリクスWMを特定するためのマトリクスIDと対応付けて保持する。
可変長符号化部111は、量子化に用いられた量子化マトリクスWMに対応するマトリクスIDを量子化マトリクス保持部112より取得する。また、可変長符号化部111は、量子化値Qcoef、マトリクスID、参照インデックスIndex、ピクチャタイプPtype、および動きベクトルMVを可変長符号化して符号化ストリームStrとする。このとき、マトリ
クスIDは、ピクチャ、スライス、またはマクロブロックの単位で付加され、そのピクチャ、スライス、またはマクロブロックで用いられる量子化マトリクスを指定することになる。
図4はシーケンスパラメータセットおよびピクチャパラメータセットとピクチャとの対応関係を示す図である。また、図5はシーケンスパラメータセットの構成の一部を示す図であり、図6はピクチャパラメータセットの構成の一部を示す図である。ピクチャはスライスで構成されるが、同じピクチャに含まれるスライスは全て同じPPSを示す識別子を有している。
MPEG-4 AVCでは、ヘッダという概念は無く、共通データはストリームの先頭にパラメータセットという名称で配置される。パラメータセットには、各ピクチャのヘッダに相当するデータであるピクチャパラメータセットPPSと、MPEG-2のGOPもしくはシーケンス単位のヘッダに相当するシーケンスパラメータセットSPSとがある。 シーケンスパラメータセットSPSには、最大参照可能ピクチャ数、画像サイズ等が含まれており、ピクチャパラメータセットPPSには、可変長符号化のタイプ(ハフマン符号化と算術符号化の切替)、量子化ステップの初期値、参照ピクチャ数等が含まれている。
シーケンスパラメータセットSPSには識別子が付与されており、ピクチャパラメータセットPPSの中でこの識別子を指定することで、どのシーケンスに属するかが識別される。また、ピクチャパラメータセットPPSにも識別子が付与されており、スライスの中でこの識別子を指定することで、どのピクチャパラメータセットPPSを用いるかが識別される。
例えば、図4に示す例では、ピクチャ#1の中に含まれるスライスが参照するピクチャパラメータセットPPSの識別子(PPS=1)が含まれている。また、ピクチャパラメータセットPPS#1の中に参照するシーケンスパラメータセットSPSの識別子(SPS=1)が含まれている。
また、シーケンスパラメータセットSPSおよびピクチャパラメータセットPPSには、図5および図6に示すようにそれぞれ量子化マトリクスが伝送されるか否かを示すフラグ501、601が含まれており、伝送される場合には量子化マトリクス502、602が記載される。
この量子化マトリクスには、量子化を行う単位(例えば水平4×垂直4画素や水平8×垂直8画素)に応じて、4×4用量子化マトリクス、8×8用量子化マトリクス等がある。
図7は、パラメータセットにおける量子化マトリクスの記載例を示す図である。
画像信号Vinは、輝度成分(luma)と2つの色差成分(chroma)とで構成されているので、量子化を行う際に輝度成分と2つの色差成分とでそれぞれ別の量子化マトリクスを用いることが可能である。また、画面内予測符号化(intra)を行う場合と、画面間予測符号化(inter)を行う場合とでも、それぞれ別の量子化マトリクスを用いることが可能である。
よって、量子化マトリクスは、例えば図7に示すように量子化を行う単位、輝度成分および2つの色差成分、画面内予測符号化および画面間予測符号化、それぞれに対応する量子化マトリクスを記載することができる。
次に、上記のように構成された動画像符号化装置においてマトリクスIDを付加する際の動作について説明する。図8は、マトリクスIDを付加する際の動作を示すフローチャートである。
可変長符号化部111は、量子化に用いられた量子化マトリクスWMを取得する(ステップS101)。次に、可変長符号化部111は、取得した量子化マトリクスWMが量子化マトリクス保持部112に保持されているか否かを判定する(ステップS102)。ここで、取得した量子化マトリクスWMが量子化マトリクス保持部112に保持されている場合(ステップS102でYES)には、可変長符号化部111は、取得した量子化マトリクスWMに対応するマトリクスIDを量子化マトリクス保持部112より取得する(ステップS103)。そして、可変長符号化部111は、取得したマトリクスIDを所定の単位(例えばピクチャ、スライス、またはマクロブロック)で付加する(ステップS104)。
一方、取得した量子化マトリクスWMが量子化マトリクス保持部112に保持されていない場合(ステップS102でNO)には、量子化マトリクス保持部112は、この量子化マトリクスWMのマトリクスIDを生成する(ステップS105)。そして、量子化マトリクス保持部112は、この量子化マトリクスWMを生成したマトリクスIDと対応付けて保持する(ステップS106)。可変長符号化部111は、生成されたマトリクスIDを所定の単位(例えばピクチャ、スライス、またはマクロブロック)で付加する(ステップS107)。可変長符号化部111は、生成されたマトリクスIDおよび量子化マトリクスWMをパラメータセットに記載する(ステップS108)。なお、このマトリクスIDおよび量子化マトリクスWMが記載されたパラメータセットは、このマトリクスIDが付加された所定の単位(すなわち、この量子化マトリクスWMを用いて量子化された符号化データ)よりも符号化ストリームStrの中で前に伝送する。
以上のように、量子化マトリクスWMをパラメータセットに記載して伝送し、所定の単位(例えばピクチャ、スライス、またはマクロブロック)では用いた量子化マトリクスWMを特定するマトリクスIDだけを付加しているので、所定の単位ごとに用いた量子化マトリクスWMを記載する必要がない。よって、符号化量を減少し、効率よく符号化を行うことができる。
なお、シーケンスパラメータセットSPSで伝送した量子化マトリクスWMを更新(マトリ
クスIDは同一)してピクチャパラメータセットPPSで伝送しても構わない。この場合、そのピクチャパラメータセットPPSを参照する際のみ、更新された量子化マトリクスWMが用いられる。
また、ディフォルトの量子化マトリクスWMとマトリクスIDにより指定された量子化マトリクスWMとを切り替えるフラグを符号化ストリームに付加しても構わない。この場合、フラグに基づいてディフォルトの量子化マトリクスWMとマトリクスIDにより指定された量子化マトリクスWMとを切り替える。
図9は、本発明に係る動画像復号化方法を実現する動画像復号化装置の構成を示すブロック図である。
動画像復号化装置2は、上記のように動画像符号化装置1により符号化された符号化ストリームStr を復号化する装置であり、可変長復号化部201、量子化マトリクス保持部202、ピクチャメモリ203、動き補償部204、逆量子化部205、逆直交変換部206、および加算部207を備えている。
可変長復号化部201は、符号化ストリームStrを復号化し、量子化値Qcoef、参照インデックスIndex、ピクチャタイプPtypeおよび動きベクトルMVを出力する。また、可変長復号化部201は、符号化ストリームStrを復号化し、抽出したマトリクスIDにより量子化マトリクスWMを特定して出力する。
量子化マトリクス保持部202は、すでにパラメータセットで伝送されている量子化マトリクスWMを、この量子化マトリクスWMを特定するためのマトリクスIDと対応付けて保持する。
量子化値Qcoef、参照インデックスIndexおよび動きベクトルMVは、ピクチャメモリ203、動き補償部204および逆量子化部205に入力され復号化処理が行われるが、その動作は図3に示す動画像符号化装置1と同様である。
次に、上記のように構成された動画像復号化装置において量子化マトリクスを特定する際の動作について説明する。図10は、量子化マトリクスを特定する際の動作を示すフローチャートである。
可変長復号化部201は、符号化ストリームStrを復号化し、所定の単位で付加されているマトリクスIDを抽出する(ステップS201)。次に、可変長復号化部201は、抽出したマトリクスIDにより量子化マトリクス保持部202に保持されている量子化マトリクスWMを特定する(ステップS202)。そして、可変長復号化部201は、特定した量子化マトリクスWMを逆量子化部205へ出力する(ステップS203)。
以上のように、量子化マトリクスWMがパラメータセットに記載されて伝送され、所定の単位(例えばピクチャ、スライス、またはマクロブロック)では用いられた量子化マトリクスWMを特定するマトリクスIDだけが付加されている符号化ストリームを復号化することができる。
なお、本実施の形態では、量子化マトリクスWMをパラメータセットに記載して伝送しているが、これに限られるものではない。例えば、符号化ストリームとは別にあらかじめ送信していても構わない。
ところで、上記で述べたように、画像信号Vinは、輝度成分(luma)と2つの色差成分(chroma)とで構成されているので、量子化を行う際に輝度成分と2つの色差成分とでそれぞれ別の量子化マトリクスを用いることが可能である。また、逆に、輝度成分と2つの色差成分とでそれぞれ別の量子化マトリクスを用いず、同じ量子化マトリクスを用いることも可能である。
次に、色差成分に用いる量子化マトリクスを特定する際の動作を説明する。図11は、色差成分に用いる量子化マトリクスを特定する際の動作を示すフローチャートである。
可変長復号化部201は、上記のように特定した量子化マトリクスWMの中に、対応する色差用量子化マトリクスがあるか否かを判定する(ステップS301)。例えば、復号化対象の量子化値Qcoefが第1色差成分である場合には、第1色差用量子化マトリクスがあるか否かを判定する。また、復号化対象の量子化値Qcoefが第2色差成分である場合には、第2色差用量子化マトリクスがあるか否かを判定する。ここで、対応する色差用量子化マトリクスがある場合(ステップS301でYES)には、対応する色差用量子化マトリクスを用いるとして、逆量子化部205へ出力する(ステップS302)。
一方、対応する色差用量子化マトリクスがない場合(ステップS301でNO)には、他方の色差用量子化マトリクスがあるか否かを判定する(ステップS303)。例えば、復号化対象の量子化値Qcoefが第1色差成分である場合には、第2色差用量子化マトリクスがあるか否かを判定する。また、復号化対象の量子化値Qcoefが第2色差成分である場合には、第1色差用量子化マトリクスがあるか否かを判定する。ここで、他方の色差用量子化マトリクスがある場合(ステップS303でYES)には、他方の色差用量子化マトリクスを用いるとして、逆量子化部205へ出力する(ステップS304)。一方、他方の色差用量子化マトリクスがない場合(ステップS303でNO)には、輝度用量子化マトリクスを用いるとして、逆量子化部205へ出力する(ステップS305)。
これによって、色差用量子化マトリクスが省略されている場合であっても、符号化ストリームを復号化することができる。
(実施の形態2)
最初に、本実施の形態の要点について説明する。
1点目として、ビデオビットストリームの部分部分によって選択可能な、シーケンスレベルのストリーム記述データ構造が複数ある場合、量子化マトリックスは、いずれかのシーケンスヘッダデータ構造とは別個の各データ構造に記載されるものとする。
2点目として、シーケンスビデオストリームの最初にユーザがカスタマイズした複数の量子化マトリックスを定義する。その量子化マトリックスは、ビットストリーム内の異なる場所の異なるピクチャごとに選択可能とする。MPEG-2では量子化マトリックス方式を使っているが、複数のマトリックスのうちのひとつを選択できるマトリックスセットは使っていなかった。また、量子化マトリックスの更新が行われる場合には、新たに量子化マトリックスを再記載しなくてはならなかった。
よって、3点目として、上記の場合に適合した量子化マトリックス更新方式となるように、量子化更新に適用されるシンタックス要素として更新が行われる頻度を規定する。本実施の形態の方式においては、MPEG-2における単一の有効量子化マトリックスと後の更新は、単なる一特例にすぎない。
次に、本実施の形態の概要について説明する。
ビデオ符号化規格の中には、シーケンスの中に異なる符号化構成を用いて符号化されるいくつかのセグメントがある場合があり、その場合は、シーケンス内の各セグメントごとに、異なるシーケンスヘッダまたはセグメントヘッダの記述が必要となる。量子化マトリックスを伝送するには相当なビット数が必要なため、本実施の形態では、シーケンスで使われるすべての量子化マトリックスをシーケンスヘッダまたはセグメントヘッダとは別の場所に置いている。シーケンス内で複数の異なる量子化マトリックスのセットを使用するセグメントについては、識別番号のようなものを使って量子化マトリックスを参照するだけでよく、MPEG-2で用いられているメカニズムのようにマトリックスを使用する度にエンコーダからデコーダにマトリックスを伝送する必要はない。
ビデオコーディック規格で規定されていないすべての量子化マトリックスを定義し、ひとつにまとめなくてはならない。このような量子化マトリックスを記載したビットストリーム内のセグメントやブロックは、符号化ビデオデータを伝送する前にシーケンスのビットストリームの頭に置かなくてはならない。それぞれのビデオコーディック規格による選択肢として、これらの量子化マトリックスをビデオ基本ストリームの一部として含めることもできるし、またはビデオストリームの本体とは別の、トランスポートストリーム、パケットもしくはファイルといったバンド外に記載することもできる。
MPEG-2、MPEG-4といった多くのコーディック規格において、1つのシーケンスセグメントにはより低レベルのデータ構造が含まれる。すなわち、そのシーケンスセグメントは、ビデオデータを、GOP(group of pictures)、ピクチャ、スライス、レイヤ、マクロブロックなどにまとめたものである。シーケンスセグメントのヘッダや記述子が複数の量子化マトリックスからなる1以上のセットを参照する場合、そのうち使用するセットを一つ選択するのは、より低レベルのデータ構造の規定次第で決まる。この点については本実施の形態の中で後述する。
1以上の量子化マトリックスセットを参照するシーケンスセグメントについては、シーケンスの最初にすべての量子化マトリックスが伝送される。シーケンスの最初にすべての量子化マトリックスを受信したデコーダは、次のような方法で内部メモリにその量子化マトリックスを保持するものとする。すなわち、デコーダがある特定の量子化マトリックスを参照する場合、量子化マトリックスと対応づけられた参照テーブルがあれば、それらテーブルすべてを利用することができる。シンタックスの規定を実行するにあたっては、デコーダの能力を考慮し、デコーダが装着されるアプリケーションの要件にその能力が収まるようにしなくてはならない。従って、所定の時間内に利用できる量子化マトリックスの数は、一定の範囲を超えてはならない。
新たな量子化マトリックスセットが必要になったにもかかわらず、デコーダの能力から1以上の量子化マトリックスを格納しておくことができない場合、新しい量子化マトリックスセットが格納されて有効になる前に、古いセットをデコーダのメモリから削除しなくてはならない。これはMPEG-2の規格で用いられているのと同様のシナリオになる。
図12は、別データとして伝送された量子化マトリクスとシーケンスで用いる量子化マトリクスとの対応関係の一例を示す図である。
図12に示す例では、シーケンスSEQ1では量子化マトリクスQ-matrix1およびQ-matrix3を用いることが記載されている。また、シーケンスSEQ2では量子化マトリクスQ-matrix2 、Q-matrix4およびQ-matrix5を、シーケンスSEQ3では量子化マトリクスQ-matrix4を用いることが記載されている。
次に、量子化マトリックスの使用をサポートするシンタクッスの特徴について説明する。
量子化マトリックスは、ピクチャシーケンスあるいはプログラム全体に対して、固定的に使用することができる。
しかし、より高品質を達成するよりフレキシブルな方法では、量子化方式および量子化マトリックスを動的に変えることができる。この場合、問題はどのデータレベルで、どのように量子化方式やマトリックスを変えることができるかということである。アプリケーション領域で可能な複雑度によって、データレベルごとに可能な量子化マトリックスのセット数には制約がある。
すべてのストリームデータ構造レベル、すなわちシーケンス、セグメント、ピクチャ、スライスからマクロブロック(マクロブロックはほとんどすべてのコーディック規格で使われており、16×16画素のブロックのことを指すが、所有権を主張できるコーディックや将来のコーディックではサイズを変えてもよい)までについて、そのビットストリーム内に、すぐ下のレベルの1つのデータから別のデータまでに対して変更できる量子化のタイプを示す以下の表1のビットである6ビットのフラグを有している。例えばMPEG-4 AVCでは、「シーケンス」のすぐ下のレベルは「ピクチャ」で、「ピクチャ」のすぐ下のレベルは「スライス」である。
Figure 0005048826
ただし、ビットAだけが設定されていてビットBが設定されていない場合、ビットCは設定できない。同様に、ビットDだけが設定されていてビットEが設定されていない場合、ビットFは設定できない。
ビットBとビットCが両方設定されている場合、量子化マトリックスセットを別のセットに変えることができるという意味である。一つの量子化マトリックスセットはブロック符号化モードごとに一つのマトリックスを含んでいる。ブロック符号化モードは、特定方向のピクチャ内予測、ピクチャ間予測ブロック、2方向ピクチャ間予測ブロック等などである。
ビットCとビットFは、量子化方式、量子化マトリックス、あるいは両方の変更を示している。MPEG-4 AVCのシーケンスレベルにおいて、量子化マトリックスを使った8×8非均一量子化が設定されている場合、使用される量子化マトリックスは「ピクチャ」データごとに変えることができる。
シーケンスヘッダのようなデータシンタックスの一番高いレベルで、量子化マトリックス方式が用いられる場合、ディフォルトの量子化セットが規定される。
ビットCまたはビットFがあるデータレベルに設定されている場合、それより低レベルのデータヘッダそれぞれにフラッグが設定されて、そのレベルでディフォルトの量子化マトリックスセットを使用するかどうかが示される。
低レベルデータヘッダでフラグがオンであれば、そのデータレベル用に新たなディフォルト量子化セットを定義し、そのデータレベルで6ビットのフラッグを用いて、さらに低いデータレベルでディフォルトが変更されるかどうか示す。同様のことが、最も低いレベルまで、あるいはアプリケーション要件で認められる最も低いレベルまで、すべてのデータレベルについて行われる。
ビットCまたはビットFが設定されていない場合、より低レベルのデータヘッダにおいてこのフラグは使用されず、自動的にディフォルトが使用されるものとする。
このような量子化方式に関する情報を伝送するための再帰的信号送信方法には適用される制約がありうる。例えば、一定のレートを上限とする量子化マトリックスの変更頻度の制約などがある。
次に、ディフォルトおよびカスタマイズ可能な量子化マトリックスについて説明する。
非均一量子化マトリックス方式を使ったビデオ符号化規格において、ビデオコーディック規格に予め定義したマトリックスがいくつかあるかもしれない。このようなディフォルトもしくは規定のマトリックスは規格対応のデコーダにとっては既知であり、そのようなマトリックスをデコーダに転送する必要はない。同様に、このような量子化マトリックスは上記と同じ方法で参照することができる。規定のマトリックスが利用可能な場合、デコーダは、受信したカスタマイズされたマトリックスを、デコーダ自身が保存している量子化マトリックスに加えるものとする。上述した通り、それぞれの量子化マトリックスは、エンコーダが割り振ってデコーダへ送信された識別番号で識別される。
ビットストリームシンタックスにおいて複数の量子化マトリックスを分類するにあたって、同じサイズの量子化をひとまとめにすることができる。あるマトリックスをピクチャ間符号化ブロックで使うのかピクチャ内符号化で使うのか、あるいは輝度成分で使うのか色差成分で使うのかに関する情報も、それぞれの属性で確認できる。
次に、量子化マトリックスの更新について説明する。
ビデオコーディックビットストリームのシンタックスによって、デコーダに既知の量子化マトリックスを追加したり更新したりできる。
ある量子化マトリックスが新たな識別番号と対応づけられている場合、このマトリックスは新たな量子化マトリックスとみなされ、新たな識別番号で参照することができる。その識別番号がすでに別の量子化マトリックスと対応づけられている場合、既存の量子化マトリックスはデコーダにおいて新しいマトリックスに修正される。古いマトリックスと同じサイズの量子化マトリックスだけが古いマトリックスと入れ替えることができる。使用中の量子化マトリックスの状態把握は、エンコーダ側で行われる。更新された量子化マトリックスの送信中は、更新する必要のある量子化マトリックスだけがネットワークパケット内で定義される。
次に、MPEG-4 AVCにおける量子化マトリックスの記載について説明する。
MPEG-4 AVCにおいて、ビデオデータやヘッダはすべてNAL(Network Abstract Layer)というビットストリームレイヤにまとめられる。NALは多数のNAL単位のシーケンスである。各NAL単位は特定のタイプのビデオデータもしくはデータヘッダを含んでいる。
MPEG-4 AVCはまた、1つのデータ階層構造の下にいくつかのピクチャデータグループを定義している。この階層構造はまずシーケンスパラメータセットによって記述されるシーケンスから始まる。「シーケンス」は異なるピクチャパラメータセットを用いて複数のピクチャを含むことができる。「ピクチャ」の下にはスライスがあり、スライスはスライスヘッダを持っている。スライスは通常、マクロブロックと呼ばれる多数の16×16画素のブロックから成る。
量子化マトリックス方式をMPEG-4 AVCに導入する場合、ユーザが定義した量子化マトリックスあるいはエンコーダで規定したマトリックスをNAL単位にも当てはめることができる。NAL単位の使用は以下の3方法で実行可能である。
(1)1つのNAL単位で各マトリックスと対応づけられたすべてのマトリックス情報(量子化テーブルを含む)を記載する。(2)複数のNAL単位のそれぞれが特定のタイプの量子化マトリックスとそれらの情報とを記載する。(3)各NAL単位に1つの量子化マトリックスの定義を記載する。
上記(1)と(2)の場合、NAL単位は量子化マトリックスの総数も規定する。(3)の場合、ユーザ定義の量子化マトリックスの総数は、ビデオ基本ストリームでは明確には示されていない。エンコーダもデコーダも処理の進行に従って総数をカウントしなくてはならない。(2)の例としては、4×4の量子化マトリックスと8×8の量子化マトリックスを分類してそれぞれをNALに記載する場合などがある。
シーケンスパラメータセットにおいて、MPEG-4でどの量子化マトリックスを使うかを規定するものとする。6ビットのフラグを定義して、どの量子化方式が用いられるのか、次のレベル、すなわちヘッダがピクチャパラメータセットとなるピクチャレベルで変更は可能かどうか、を示す。
定義された量子化マトリックスのサブセットを参照するシーケンスパラメータセットはすべての量子化マトリックスIDを列挙する。そのIDとして、ビデオコーディック規格用のディフォルトのID、およびコーディックオペレータによって特にあるコンテンツ用に定義したIDが含まれる。シーケンスパラメータセットは、いくつかの共通の量子化パラメータを記載することができる。シーケンスパラメータセットは、輝度成分について各4×4および8×8ブロックのピクチャ間予測およびピクチャ内予測のそれぞれについて、また色差成分についても同様にピクチャ間予測およびピクチャ内予測のそれぞれについて、ディフォルト量子化マトリックスのセットを宣言することができる。しかし、ピクチャパラメータセット、スライスヘッダ、マクロブロックレベルは、自らの量子化マトリックスのセットを宣言することにより、より高いレベルの規定を無効にすることができる。しかし、これらの量子化マトリックスは現在利用可能なシーケンスパラメータセットにおいても利用可能なものでなくてはならない。
量子化マトリックスをNAL単位に当てはめる場合、その量子化マトリックスはシーケンスのビットストリームの最初に伝送することができる。その位置は、シーケンスパラメータセットを記載したNAL単位の後でも前でもよい。初期定義の後、追加となったカスタマイズされた量子化マトリックスをビットストリームに挿入して、更新したり新しいマトリックスを追加したりすることができる。追加するか更新するかという動作の決定は量子化マトリックスIDによって行う。IDがあれば更新する。IDがなければ、新しいマトリックスが保存してあるマトリックスに追加となる。
(実施の形態3)
さらに、上記各実施の形態で示した動画像符号化方法および動画像復号化方法を実現するためのプログラムを、フレキシブルディスク等の記録媒体に記録するようにすることにより、上記各実施の形態で示した処理を、独立したコンピュータシステムにおいて簡単に実施することが可能となる。
図13は、上記各実施の形態の動画像符号化方法および動画像復号化方法を、フレキシブルディスク等の記録媒体に記録されたプログラムを用いて、コンピュータシステムにより実施する場合の説明図である。
図13(b) は、フレキシブルディスクの正面からみた外観、断面構造、及びフレキシブルディスクを示し、図13(a) は、記録媒体本体であるフレキシブルディスクの物理フォーマットの例を示している。フレキシブルディスクFDはケースF内に内蔵され、該ディスクの表面には、同心円状に外周からは内周に向かって複数のトラックTrが形成され、各トラックは角度方向に16のセクタSeに分割されている。従って、上記プログラムを格納したフレキシブルディスクでは、上記フレキシブルディスクFD上に割り当てられた領域に、上記プログラムが記録されている。
また、図13(c) は、フレキシブルディスクFDに上記プログラムの記録再生を行うための構成を示す。動画像符号化方法および動画像復号化方法を実現する上記プログラムをフレキシブルディスクFDに記録する場合は、コンピュータシステムCsから上記プログラムをフレキシブルディスクドライブを介して書き込む。また、フレキシブルディスク内の動画像符号化方法および動画像復号化方法を実現するプログラムにより上記動画像符号化方法および動画像復号化方法をコンピュータシステム中に構築する場合は、フレキシブルディスクドライブによりプログラムをフレキシブルディスクから読み出し、コンピュータシステムに転送する。
なお、上記説明では、記録媒体としてフレキシブルディスクを用いて説明を行ったが、光ディスクを用いても同様に行うことができる。また、記録媒体はこれに限らず、ICカード、ROMカセット等、プログラムを記録できるものであれば同様に実施することができる。
(実施の形態4)
さらにここで、上記実施の形態で示した動画像符号化方法や動画像復号化方法の応用例とそれを用いたシステムを説明する。
図14は、コンテンツ配信サービスを実現するコンテンツ供給システムex100の全体構成を示すブロック図である。通信サービスの提供エリアを所望の大きさに分割し、各セル内にそれぞれ固定無線局である基地局ex107〜ex110が設置されている。
このコンテンツ供給システムex100は、例えば、インターネットex101にインターネットサービスプロバイダex102および電話網ex104、および基地局ex107〜ex110を介して、コンピュータex111、PDA(personal digital assistant)ex112、カメラex113、携帯電話ex114、カメラ付きの携帯電話ex115などの各機器が接続される。
しかし、コンテンツ供給システムex100は図14のような組合せに限定されず、いずれかを組み合わせて接続するようにしてもよい。また、固定無線局である基地局ex107〜ex110を介さずに、各機器が電話網ex104に直接接続されてもよい。
カメラex113はデジタルビデオカメラ等の動画撮影が可能な機器である。また、携帯電話は、PDC(Personal Digital Communications)方式、CDMA(Code Division Multiple Access)方式、W−CDMA(Wideband-Code Division Multiple Access)方式、若しくはGSM(Global System for Mobile Communications)方式の携帯電話機、またはPHS(Personal Handyphone System)等であり、いずれでも構わない。
また、ストリーミングサーバex103は、カメラex113から基地局ex109、電話網ex104を通じて接続されており、カメラex113を用いてユーザが送信する符号化処理されたデータに基づいたライブ配信等が可能になる。撮影したデータの符号化処理はカメラex113で行っても、データの送信処理をするサーバ等で行ってもよい。また、カメラex116で撮影した動画データはコンピュータex111を介してストリーミングサーバex103に送信されてもよい。カメラex116はデジタルカメラ等の静止画、動画が撮影可能な機器である。この場合、動画データの符号化はカメラex116で行ってもコンピュータex111で行ってもどちらでもよい。また、符号化処理はコンピュータex111やカメラex116が有するLSIex117において処理することになる。なお、画像符号化・復号化用のソフトウェアをコンピュータex111等で読み取り可能な記録媒体である何らかの蓄積メディア(CD−ROM、フレキシブルディスク、ハードディスクなど)に組み込んでもよい。さらに、カメラ付きの携帯電話ex115で動画データを送信してもよい。このときの動画データは携帯電話ex115が有するLSIで符号化処理されたデータである。
このコンテンツ供給システムex100では、ユーザがカメラex113、カメラex116等で撮影しているコンテンツ(例えば、音楽ライブを撮影した映像等)を上記実施の形態同様に符号化処理してストリーミングサーバex103に送信する一方で、ストリーミングサーバex103は要求のあったクライアントに対して上記コンテンツデータをストリーム配信する。クライアントとしては、上記符号化処理されたデータを復号化することが可能な、コンピュータex111、PDAex112、カメラex113、携帯電話ex114等がある。このようにすることでコンテンツ供給システムex100は、符号化されたデータをクライアントにおいて受信して再生することができ、さらにクライアントにおいてリアルタイムで受信して復号化し、再生することにより、個人放送をも実現可能になるシステムである。
このシステムを構成する各機器の符号化、復号化には上記各実施の形態で示した動画像符号化装置あるいは動画像復号化装置を用いるようにすればよい。
その一例として携帯電話について説明する。
図15は、上記実施の形態で説明した動画像符号化方法と動画像復号化方法を用いた携帯電話ex115を示す図である。携帯電話ex115は、基地局ex110との間で電波を送受信するためのアンテナex201、CCDカメラ等の映像、静止画を撮ることが可能なカメラ部ex203、カメラ部ex203で撮影した映像、アンテナex201で受信した映像等が復号化されたデータを表示する液晶ディスプレイ等の表示部ex202、操作キーex204群から構成される本体部、音声出力をするためのスピーカ等の音声出力部ex208、音声入力をするためのマイク等の音声入力部ex205、撮影した動画もしくは静止画のデータ、受信したメールのデータ、動画のデータもしくは静止画のデータ等、符号化されたデータまたは復号化されたデータを保存するための記録メディアex207、携帯電話ex115に記録メディアex207を装着可能とするためのスロット部ex206を有している。記録メディアex207はSDカード等のプラスチックケース内に電気的に書換えや消去が可能な不揮発性メモリであるEEPROM(Electrically Erasable and Programmable Read Only Memory)の一種であるフラッシュメモリ素子を格納したものである。
さらに、携帯電話ex115について図16を用いて説明する。携帯電話ex115は表示部ex202及び操作キーex204を備えた本体部の各部を統括的に制御するようになされた主制御部ex311に対して、電源回路部ex310、操作入力制御部ex304、画像符号化部ex312、カメラインターフェース部ex303、LCD(Liquid Crystal Display)制御部ex302、画像復号化部ex309、多重分離部ex308、記録再生部ex307、変復調回路部ex306及び音声処理部ex305が同期バスex313を介して互いに接続されている。
電源回路部ex310は、ユーザの操作により終話及び電源キーがオン状態にされると、バッテリパックから各部に対して電力を供給することによりカメラ付ディジタル携帯電話ex115を動作可能な状態に起動する。
携帯電話ex115は、CPU、ROM及びRAM等でなる主制御部ex311の制御に基づいて、音声通話モード時に音声入力部ex205で集音した音声信号を音声処理部ex305によってディジタル音声データに変換し、これを変復調回路部ex306でスペクトラム拡散処理し、送受信回路部ex301でディジタルアナログ変換処理及び周波数変換処理を施した後にアンテナex201を介して送信する。また携帯電話機ex115は、音声通話モード時にアンテナex201で受信した受信データを増幅して周波数変換処理及びアナログディジタル変換処理を施し、変復調回路部ex306でスペクトラム逆拡散処理し、音声処理部ex305によってアナログ音声データに変換した後、これを音声出力部ex208を介して出力する。
さらに、データ通信モード時に電子メールを送信する場合、本体部の操作キーex204の操作によって入力された電子メールのテキストデータは操作入力制御部ex304を介して主制御部ex311に送出される。主制御部ex311は、テキストデータを変復調回路部ex306でスペクトラム拡散処理し、送受信回路部ex301でディジタルアナログ変換処理及び周波数変換処理を施した後にアンテナex201を介して基地局ex110へ送信する。
データ通信モード時に画像データを送信する場合、カメラ部ex203で撮像された画像データをカメラインターフェース部ex303を介して画像符号化部ex312に供給する。また、画像データを送信しない場合には、カメラ部ex203で撮像した画像データをカメラインターフェース部ex303及びLCD制御部ex302を介して表示部ex202に直接表示することも可能である。
画像符号化部ex312は、本願発明で説明した動画像符号化装置を備えた構成であり、カメラ部ex203から供給された画像データを上記実施の形態で示した動画像符号化装置に用いた符号化方法によって圧縮符号化することにより符号化画像データに変換し、これを多重分離部ex308に送出する。また、このとき同時に携帯電話機ex115は、カメラ部ex203で撮像中に音声入力部ex205で集音した音声を音声処理部ex305を介してディジタルの音声データとして多重分離部ex308に送出する。
多重分離部ex308は、画像符号化部ex312から供給された符号化画像データと音声処理部ex305から供給された音声データとを所定の方式で多重化し、その結果得られる多重化データを変復調回路部ex306でスペクトラム拡散処理し、送受信回路部ex301でディジタルアナログ変換処理及び周波数変換処理を施した後にアンテナex201を介して送信する。
データ通信モード時にホームページ等にリンクされた動画像ファイルのデータを受信する場合、アンテナex201を介して基地局ex110から受信した受信データを変復調回路部ex306でスペクトラム逆拡散処理し、その結果得られる多重化データを多重分離部ex308に送出する。
また、アンテナex201を介して受信された多重化データを復号化するには、多重分離部ex308は、多重化データを分離することにより画像データのビットストリームと音声データのビットストリームとに分け、同期バスex313を介して当該符号化画像データを画像復号化部ex309に供給すると共に当該音声データを音声処理部ex305に供給する。
次に、画像復号化部ex309は、本願発明で説明した動画像復号化装置を備えた構成であり、画像データのビットストリームを上記実施の形態で示した符号化方法に対応した復号化方法で復号することにより再生動画像データを生成し、これをLCD制御部ex302を介して表示部ex202に供給し、これにより、例えばホームページにリンクされた動画像ファイルに含まれる動画データが表示される。このとき同時に音声処理部ex305は、音声データをアナログ音声データに変換した後、これを音声出力部ex208に供給し、これにより、例えばホームページにリンクされた動画像ファイルに含まる音声データが再生される。
なお、上記システムの例に限られず、最近は衛星、地上波によるディジタル放送が話題となっており、図17に示すようにディジタル放送用システムにも上記実施の形態の少なくとも動画像符号化装置または動画像復号化装置のいずれかを組み込むことができる。具体的には、放送局ex409では映像情報のビットストリームが電波を介して通信または放送衛星ex410に伝送される。これを受けた放送衛星ex410は、放送用の電波を発信し、この電波を衛星放送受信設備をもつ家庭のアンテナex406で受信し、テレビ(受信機)ex401またはセットトップボックス(STB)ex407などの装置によりビットストリームを復号化してこれを再生する。また、記録媒体であるCDやDVD等の蓄積メディアex402に記録したビットストリームを読み取り、復号化する再生装置ex403にも上記実施の形態で示した動画像復号化装置を実装することが可能である。この場合、再生された映像信号はモニタex404に表示される。また、ケーブルテレビ用のケーブルex405または衛星/地上波放送のアンテナex406に接続されたセットトップボックスex407内に動画像復号化装置を実装し、これをテレビのモニタex408で再生する構成も考えられる。このときセットトップボックスではなく、テレビ内に動画像復号化装置を組み込んでも良い。また、アンテナex411を有する車ex412で衛星ex410からまたは基地局ex107等から信号を受信し、車ex412が有するカーナビゲーションex413等の表示装置に動画を再生することも可能である。
更に、画像信号を上記実施の形態で示した動画像符号化装置で符号化し、記録媒体に記録することもできる。具体例としては、DVDディスクex421に画像信号を記録するDVDレコーダや、ハードディスクに記録するディスクレコーダなどのレコーダex420がある。更にSDカードex422に記録することもできる。レコーダex420が上記実施の形態で示した動画像復号化装置を備えていれば、DVDディスクex421やSDカードex422に記録した画像信号を再生し、モニタex408で表示することができる。
なお、カーナビゲーションex413の構成は例えば図16に示す構成のうち、カメラ部ex203とカメラインターフェース部ex303、画像符号化部ex312を除いた構成が考えられ、同様なことがコンピュータex111やテレビ(受信機)ex401等でも考えられる。
また、上記携帯電話ex114等の端末は、符号化器・復号化器を両方持つ送受信型の端末の他に、符号化器のみの送信端末、復号化器のみの受信端末の3通りの実装形式が考えられる。
このように、上記実施の形態で示した動画像符号化方法あるいは動画像復号化方法を上述したいずれの機器・システムに用いることは可能であり、そうすることで、上記実施の形態で説明した効果を得ることができる。
また、本発明はかかる上記実施形態に限定されるものではなく、本発明の範囲を逸脱することなく種々の変形または修正が可能である。
また、図3および図9に示したブロック図の各機能ブロックは典型的には集積回路であるLSIとして実現される。このLSIは1チップ化されても良いし、複数チップ化されても良い。(例えばメモリ以外の機能ブロックが1チップ化されていても良い。)ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適応等が可能性としてありえる。
また、各機能ブロックのうち、符号化または復号化の対象となるデータを格納する手段だけ1チップ化せずに別構成としても良い。
以上のように、本発明に係る動画像符号化方法および動画像復号化方法は、例えば携帯電話、DVD装置、およびパーソナルコンピュータ等で、動画像を構成する各ピクチャを符号化して符号化ストリームを生成したり、生成された符号化ストリームを復号化したりするための方法として有用である。

Claims (6)

  1. 量子化マトリクスを用いて、複数の符号化ピクチャをブロック単位で復号化する動画像復号化方法であって、
    デフォルト量子化マトリクスと異なる第2の量子化マトリクス、及び、前記第2の量子化マトリクスを特定するマトリクスIDを符号列から取得し、保持する保持ステップと、
    カレントピクチャを符号化して生成されたピクチャ符号化データに付随し、前記カレントピクチャを符号化する際に使用した量子化マトリクスを特定するマトリクスIDを前記符号列から抽出するステップと、
    抽出された前記マトリクスIDを用いて、前記保持ステップで保持された量子化マトリクスの中から前記マトリクスIDに対応する量子化マトリクスを特定する量子化マトリクス特定ステップと、
    特定された前記量子化マトリクスを用いて、前記ピクチャ符号化データを復号化するピクチャ復号化ステップと
    を含み、
    前記ピクチャは、輝度成分および2つの色差成分により構成され、
    前記量子化マトリクス特定ステップにおいて、前記マトリクスIDにより特定される前記量子化マトリクスに、輝度成分用量子化マトリクスと前記2つの色差成分の内の片方の色差成分に対応する色差成分用量子化マトリクスが存在するが、前記2つの色差成分の内の他方の色差成分に対応する色差成分用量子化マトリクスが存在しない場合、存在する色差成分用量子化マトリクスを、存在しない色差成分用量子化マトリクスとして代用することにより、前記2つの色差成分の内の前記他方の色差成分に対応する色差成分用量子化マトリクスを特定し、
    前記ピクチャ復号化ステップにおいて、前記ピクチャの前記輝度成分に対しては、特定された前記輝度成分用量子化マトリクスを用いて復号化を行い、前記2つの色差成分の内の片方の色差成分に対しては、特定された前記色差成分用量子化マトリクスを用いて復号化を行い、前記2つの色差成分の内の他方の色差成分に対しては、代用により特定された色差成分用量子化マトリクスを用いて復号化する
    ことを特徴とする動画像復号化方法。
  2. 前記ピクチャ符号化データに付随する前記マトリクスIDは、ピクチャ単位、スライス単位、あるいはマクロブロック単位で前記ピクチャ符号化データに付随する
    ことを特徴とする請求項1に記載の動画像復号化方法。
  3. 前記第2の量子化マトリクス、及び、前記第2の量子化マトリクスを特定するマトリクスIDは、複数のピクチャ単位あるいはピクチャ単位で前記符号列に配置する
    ことを特徴とする請求項1に記載の動画像復号化方法。
  4. 量子化マトリクスを用いて、複数の符号化ピクチャをブロック単位で復号化する動画像復号化装置であって、
    デフォルト量子化マトリクスと異なる第2の量子化マトリクス、及び、前記第2の量子化マトリクスを特定するマトリクスIDを符号列から取得し、保持する量子化マトリクス保持部と、
    カレントピクチャを符号化して生成されたピクチャ符号化データに付随し、前記カレントピクチャを符号化する際に使用した量子化マトリクスを特定するマトリクスIDを前記符号列から抽出し、抽出された前記マトリクスIDを用いて、前記量子化マトリクス保持部に保持されている量子化マトリクスの中から前記マトリクスIDに対応する量子化マトリクスを特定する可変長復号化部と、
    特定された前記量子化マトリクスを用いて、前記ピクチャ符号化データを復号化する逆量子化部と
    を備え、
    前記ピクチャは、輝度成分および2つの色差成分により構成され、
    前記可変長復号化部は、前記マトリクスIDにより特定される前記量子化マトリクスに、輝度成分用量子化マトリクスと前記2つの色差成分の内の片方の色差成分に対応する色差成分用量子化マトリクスが存在するが、前記2つの色差成分の内の他方の色差成分に対応する色差成分用量子化マトリクスが存在しない場合、存在する色差成分用量子化マトリクスを、存在しない色差成分用量子化マトリクスとして代用することにより、前記2つの色差成分の内の前記他方の色差成分に対応する色差成分用量子化マトリクスを特定し、
    前記ピクチャの前記輝度成分に対しては、特定された前記輝度成分用量子化マトリクスを用いて復号化を行い、前記2つの色差成分の内の片方の色差成分に対しては、特定された前記色差成分用量子化マトリクスを用いて復号化を行い、前記2つの色差成分の内の他方の色差成分に対しては、代用により特定された色差成分用量子化マトリクスを用いて復号化する
    ことを特徴とする動画像復号化装置。
  5. コンピュータに、量子化マトリクスを用いて、複数の符号化ピクチャをブロック単位で復号化する処理を実行させるためのプログラムであって、
    デフォルト量子化マトリクスと異なる第2の量子化マトリクス、及び、前記第2の量子化マトリクスを特定するマトリクスIDを符号列から取得し、保持する保持ステップと、
    カレントピクチャを符号化して生成されたピクチャ符号化データに付随し、前記カレントピクチャを符号化する際に使用した量子化マトリクスを特定するマトリクスIDを前記符号列から抽出するステップと、
    抽出された前記マトリクスIDを用いて、前記保持ステップで保持された量子化マトリクスの中から前記マトリクスIDに対応する量子化マトリクスを特定する量子化マトリクス特定ステップと、
    特定された前記量子化マトリクスを用いて、前記ピクチャ符号化データを復号化するピクチャ復号化ステップと
    をコンピュータに実行させ、
    前記ピクチャは、輝度成分および2つの色差成分により構成され、
    前記量子化マトリクス特定ステップにおいて、前記マトリクスIDにより特定される前記量子化マトリクスに、輝度成分用量子化マトリクスと前記2つの色差成分の内の片方の色差成分に対応する色差成分用量子化マトリクスが存在するが、前記2つの色差成分の内の他方の色差成分に対応する色差成分用量子化マトリクスが存在しない場合、存在する色差成分用量子化マトリクスを、存在しない色差成分用量子化マトリクスとして代用することにより、前記2つの色差成分の内の前記他方の色差成分に対応する色差成分用量子化マトリクスを特定し、
    前記ピクチャ復号化ステップにおいて、前記ピクチャの前記輝度成分に対しては、特定された前記輝度成分用量子化マトリクスを用いて復号化を行い、前記2つの色差成分の内の片方の色差成分に対しては、特定された前記色差成分用量子化マトリクスを用いて復号化を行い、前記2つの色差成分の内の他方の色差成分に対しては、代用により特定された色差成分用量子化マトリクスを用いて復号化する
    プログラム。
  6. 請求項5に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2010276436A 2004-01-30 2010-12-10 動画像復号化方法、動画像復号化装置、プログラムおよび記録媒体 Active JP5048826B2 (ja)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US54049904P 2004-01-30 2004-01-30
US60/540,499 2004-01-30
US55290704P 2004-03-12 2004-03-12
US60/552,907 2004-03-12
US56135104P 2004-04-12 2004-04-12
US60/561,351 2004-04-12

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2006551435A Division JP4679524B2 (ja) 2004-01-30 2005-01-26 動画像復号化方法、動画像復号化装置、プログラムおよび記録媒体

Publications (2)

Publication Number Publication Date
JP2011091847A JP2011091847A (ja) 2011-05-06
JP5048826B2 true JP5048826B2 (ja) 2012-10-17

Family

ID=34841730

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2006551435A Active JP4679524B2 (ja) 2004-01-30 2005-01-26 動画像復号化方法、動画像復号化装置、プログラムおよび記録媒体
JP2010276436A Active JP5048826B2 (ja) 2004-01-30 2010-12-10 動画像復号化方法、動画像復号化装置、プログラムおよび記録媒体
JP2010276437A Active JP5102344B2 (ja) 2004-01-30 2010-12-10 動画像符号化方法、動画像符号化装置、プログラムおよび記録媒体

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2006551435A Active JP4679524B2 (ja) 2004-01-30 2005-01-26 動画像復号化方法、動画像復号化装置、プログラムおよび記録媒体

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2010276437A Active JP5102344B2 (ja) 2004-01-30 2010-12-10 動画像符号化方法、動画像符号化装置、プログラムおよび記録媒体

Country Status (8)

Country Link
US (8) US7933327B2 (ja)
EP (2) EP2384002B1 (ja)
JP (3) JP4679524B2 (ja)
KR (1) KR101065998B1 (ja)
CN (2) CN1910922B (ja)
ES (2) ES2392437T3 (ja)
PL (2) PL1709801T3 (ja)
WO (1) WO2005076614A1 (ja)

Families Citing this family (69)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6882685B2 (en) 2001-09-18 2005-04-19 Microsoft Corporation Block transform and quantization for image and video coding
WO2005076614A1 (en) 2004-01-30 2005-08-18 Matsushita Electric Industrial Co., Ltd. Moving picture coding method and moving picture decoding method
EP1610560A1 (en) * 2004-06-24 2005-12-28 Deutsche Thomson-Brandt Gmbh Method and apparatus for generating and for decoding coded picture data
US8422546B2 (en) 2005-05-25 2013-04-16 Microsoft Corporation Adaptive video encoding using a perceptual model
US20060291565A1 (en) * 2005-06-22 2006-12-28 Chen Eddie Y System and method for performing video block prediction
US20100232506A1 (en) * 2006-02-17 2010-09-16 Peng Yin Method for handling local brightness variations in video
ES2612950T3 (es) 2006-03-16 2017-05-19 Huawei Technologies Co., Ltd. Un método y un dispositivo para realizar una cuantificación en codificación-descodificación
US7995649B2 (en) 2006-04-07 2011-08-09 Microsoft Corporation Quantization adjustment based on texture level
US7974340B2 (en) * 2006-04-07 2011-07-05 Microsoft Corporation Adaptive B-picture quantization control
US8059721B2 (en) 2006-04-07 2011-11-15 Microsoft Corporation Estimating sample-domain distortion in the transform domain with rounding compensation
US8503536B2 (en) * 2006-04-07 2013-08-06 Microsoft Corporation Quantization adjustments for DC shift artifacts
US20070237237A1 (en) * 2006-04-07 2007-10-11 Microsoft Corporation Gradient slope detection for video compression
US8130828B2 (en) 2006-04-07 2012-03-06 Microsoft Corporation Adjusting quantization to preserve non-zero AC coefficients
US8711925B2 (en) 2006-05-05 2014-04-29 Microsoft Corporation Flexible quantization
US8718139B2 (en) * 2007-01-12 2014-05-06 Mitsubishi Electric Corporation Image decoding device and image decoding method
JP2008193627A (ja) * 2007-01-12 2008-08-21 Mitsubishi Electric Corp 画像符号化装置、画像復号装置、および画像符号化方法、画像復号方法
US8238424B2 (en) 2007-02-09 2012-08-07 Microsoft Corporation Complexity-based adaptive preprocessing for multiple-pass video compression
US8942289B2 (en) * 2007-02-21 2015-01-27 Microsoft Corporation Computational complexity and precision control in transform-based digital media codec
US8498335B2 (en) 2007-03-26 2013-07-30 Microsoft Corporation Adaptive deadzone size adjustment in quantization
US20080240257A1 (en) * 2007-03-26 2008-10-02 Microsoft Corporation Using quantization bias that accounts for relations between transform bins and quantization bins
US8243797B2 (en) 2007-03-30 2012-08-14 Microsoft Corporation Regions of interest for quality adjustments
US20080253449A1 (en) * 2007-04-13 2008-10-16 Yoji Shimizu Information apparatus and method
US8442337B2 (en) * 2007-04-18 2013-05-14 Microsoft Corporation Encoding adjustments for animation content
US8331438B2 (en) 2007-06-05 2012-12-11 Microsoft Corporation Adaptive selection of picture-level quantization parameters for predicted video pictures
KR101228020B1 (ko) * 2007-12-05 2013-01-30 삼성전자주식회사 사이드 매칭을 이용한 영상의 부호화 방법 및 장치, 그복호화 방법 및 장치
US8189933B2 (en) * 2008-03-31 2012-05-29 Microsoft Corporation Classifying and controlling encoding quality for textured, dark smooth and smooth video content
US8897359B2 (en) 2008-06-03 2014-11-25 Microsoft Corporation Adaptive quantization for enhancement layer video coding
JP2010288166A (ja) * 2009-06-15 2010-12-24 Panasonic Corp 動画像符号化装置、放送波記録装置及び、プログラム
JP5282692B2 (ja) * 2009-07-27 2013-09-04 ソニー株式会社 画像符号化装置と画像符号化方法
JP2011029956A (ja) * 2009-07-27 2011-02-10 Sony Corp 画像符号化装置および画像符号化方法
KR20110017303A (ko) * 2009-08-13 2011-02-21 삼성전자주식회사 회전변환을 이용한 영상 부호화, 복호화 방법 및 장치
KR101504887B1 (ko) 2009-10-23 2015-03-24 삼성전자 주식회사 데이터 단위 레벨의 독립적 파싱 또는 복호화에 따른 비디오 복호화 방법 및 그 장치, 그리고 데이터 단위 레벨의 독립적 파싱 또는 복호화를 위한 비디오 부호화 방법 및 그 장치
MX2012004556A (es) 2009-10-30 2012-05-08 Panasonic Corp Metodo de descodificacion de imagenes, metodo de codificacion de imagenes, dispositivo descodificador de imagenes, dispositivo codificador de imagenes, programas y circuitos integrados.
CA2778280C (en) 2009-10-30 2018-04-24 Panasonic Corporation Decoding method, decoding apparatus, coding method, and coding apparatus using a quantization matrix
KR101457396B1 (ko) 2010-01-14 2014-11-03 삼성전자주식회사 디블로킹 필터링을 이용한 비디오 부호화 방법과 그 장치, 및 디블로킹 필터링을 이용한 비디오 복호화 방법 및 그 장치
BR112013008313A2 (pt) * 2010-10-05 2020-09-15 Empire Technology Devolopment Llc método de geração de dados de profundidade, dispositivo de geração de dados de profundidade e sistema para geração de dados de profundidade
US9167252B2 (en) * 2010-12-01 2015-10-20 Texas Instruments Incorporated Quantization matrix compression in video coding
MX2013008980A (es) 2011-02-10 2013-11-01 Sony Corp Dispositivo de procesamiento de imagenes y metodo de procesamiento de imagenes.
WO2012118359A2 (ko) 2011-03-03 2012-09-07 한국전자통신연구원 색차 성분 양자화 매개 변수 결정 방법 및 이러한 방법을 사용하는 장치
KR101566366B1 (ko) 2011-03-03 2015-11-16 한국전자통신연구원 색차 성분 양자화 매개 변수 결정 방법 및 이러한 방법을 사용하는 장치
BR112013030469B1 (pt) 2011-06-23 2022-07-26 Sun Patent Trust Método de decodificação de imagem, método de codificação de imagem, aparelho de decodificação de imagem, aparelho de codificação de imagem, e aparelho de codificação e decodificação de imagem
EP3407610B1 (en) 2011-06-24 2019-09-04 Sun Patent Trust Coding method and coding apparatus
US9106919B2 (en) 2011-06-24 2015-08-11 Panasonic Intellectual Property Corporation Of America Image decoding method, image coding method, image decoding apparatus, image coding apparatus, and image coding and decoding apparatus
EP4270950A3 (en) 2011-06-27 2024-02-14 Sun Patent Trust Encoding apparatus and decoding apparatus
EP2728867A4 (en) 2011-06-28 2014-12-03 Panasonic Ip Corp America IMAGE DECODING METHOD, IMAGE ENCODING METHOD, IMAGE DECODING DEVICE, IMAGE ENCODING DEVICE, AND IMAGE ENCODING / DECODING DEVICE
KR102006032B1 (ko) 2011-06-29 2019-07-31 선 페이턴트 트러스트 화상 복호 방법, 화상 부호화 방법, 화상 복호 장치, 화상 부호화 장치 및 화상 부호화 복호 장치
WO2013001769A1 (ja) 2011-06-30 2013-01-03 パナソニック株式会社 画像復号方法、画像符号化方法、画像復号装置、画像符号化装置及び画像符号化復号装置
KR102007047B1 (ko) 2011-06-30 2019-08-02 선 페이턴트 트러스트 화상 복호 방법, 화상 부호화 방법, 화상 복호 장치, 화상 부호화 장치 및 화상 부호화 복호 장치
RU2714371C2 (ru) 2011-07-11 2020-02-14 Сан Пэтент Траст Способ декодирования изображений, способ кодирования изображений, устройство декодирования изображений, устройство кодирования изображений и устройство кодирования и декодирования изображений
US9143802B2 (en) * 2011-10-31 2015-09-22 Qualcomm Incorporated Fragmented parameter set for video coding
JP6120490B2 (ja) 2011-11-07 2017-04-26 キヤノン株式会社 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
CN104170382B (zh) * 2012-01-20 2018-08-03 韩国电子通信研究院 用于编码和解码量化矩阵的方法和使用其的设备
US9838682B2 (en) * 2012-02-29 2017-12-05 Sony Corporation Image processing device and method with a scalable quantization matrix
JP2013217631A (ja) 2012-03-14 2013-10-24 Denso Corp 冷凍サイクル装置
WO2013154028A1 (ja) * 2012-04-13 2013-10-17 ソニー株式会社 画像処理装置および方法
BR122020023544B1 (pt) 2012-04-16 2023-03-14 Electronics And Telecommunications Research Institute Método e mídia de gravação não transitória legível por computador para decodificar vídeo
US9516308B2 (en) * 2012-04-27 2016-12-06 Qualcomm Incorporated Parameter set updates in video coding
US9736476B2 (en) 2012-04-27 2017-08-15 Qualcomm Incorporated Full random access from clean random access pictures in video coding
DK2854398T3 (en) 2012-06-11 2018-01-08 Samsung Electronics Co Ltd Method of encoding videos that share SAO parameters by color component
JP6041554B2 (ja) * 2012-06-27 2016-12-07 キヤノン株式会社 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
RU2624103C2 (ru) * 2012-09-06 2017-06-30 Сан Пэтент Траст Способ кодирования изображений, способ декодирования изображений, устройство кодирования изображений, устройство декодирования изображений и устройство кодирования и декодирования изображений
JP6210368B2 (ja) * 2012-09-18 2017-10-11 サン パテント トラスト 画像復号方法および画像復号装置
WO2014166328A1 (en) * 2013-04-08 2014-10-16 Mediatek Singapore Pte. Ltd. Method and apparatus for quantization matrix signaling and representation in scalable video coding
JP2015076861A (ja) * 2013-10-11 2015-04-20 ソニー株式会社 復号装置および復号方法、並びに、符号化装置および符号化方法
WO2016103542A1 (ja) * 2014-12-26 2016-06-30 パナソニックIpマネジメント株式会社 符号化方法、復号方法、符号化装置および復号装置
JP6272441B2 (ja) * 2016-11-08 2018-01-31 キヤノン株式会社 画像復号装置、画像復号方法及びプログラム
CN109918605B (zh) * 2019-03-07 2021-09-24 杭州又拍云科技有限公司 一种基于内容分发网络的生成动态图片的方法
US20220224902A1 (en) * 2019-06-25 2022-07-14 Interdigital Vc Holdings France, Sas Quantization matrices selection for separate color plane mode
US20220109840A1 (en) * 2021-12-17 2022-04-07 Intel Corporation Methods and apparatus to encode and decode video using quantization matrices

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2794842B2 (ja) 1988-11-11 1998-09-10 松下電器産業株式会社 符号化方法とその復号化方法
US5034965A (en) 1988-11-11 1991-07-23 Matsushita Electric Industrial Co., Ltd. Efficient coding method and its decoding method
JP2924416B2 (ja) 1992-02-21 1999-07-26 松下電器産業株式会社 高能率符号化方法
JP2765268B2 (ja) 1991-05-21 1998-06-11 松下電器産業株式会社 高能率符号化方法と高能率符号の復号方法
US5392037A (en) 1991-05-21 1995-02-21 Matsushita Electric Industrial Co., Ltd. Method and apparatus for encoding and decoding
US5784631A (en) * 1992-06-30 1998-07-21 Discovision Associates Huffman decoder
EP0593159A3 (en) 1992-10-09 1994-11-09 Hudson Soft Co Ltd Image processing apparatus.
US5613015A (en) * 1992-11-12 1997-03-18 Fuji Xerox Co., Ltd. Image signal analyzing system and coding system
JPH06284412A (ja) 1993-03-26 1994-10-07 Sony Corp 画像信号符号化方法および画像信号符号化装置、画像信号復号化方法および画像信号復号化装置、ならびに画像信号記録媒体
JPH0775102A (ja) 1993-07-19 1995-03-17 Sharp Corp 画像符号化装置
US5937098A (en) * 1995-02-06 1999-08-10 Asahi Kogaku Kogyo Kabushiki Kaisha Adaptive quantization of orthogonal transform coefficients for setting a target amount of compression
US5963673A (en) * 1995-12-20 1999-10-05 Sanyo Electric Co., Ltd. Method and apparatus for adaptively selecting a coding mode for video encoding
DE69721373T2 (de) * 1996-05-14 2004-04-15 Daewoo Electronics Corp. Quantisierer für ein Videokodierungssystem
JP3579544B2 (ja) * 1996-08-29 2004-10-20 ペンタックス株式会社 画像圧縮伸張装置
CN1140130C (zh) 1997-02-08 2004-02-25 松下电器产业株式会社 静画和动画编码的量化矩阵
JP3234807B2 (ja) 1997-02-08 2001-12-04 松下電器産業株式会社 デコード方法
JP4001969B2 (ja) 1997-03-31 2007-10-31 ソニー株式会社 符号化装置および方法、並びに復号装置および方法
US5879948A (en) * 1997-05-12 1999-03-09 Tennessee Valley Authority Determination of total mercury in exhaust gases
US6126910A (en) * 1997-10-14 2000-10-03 Wilhelm; James H. Method for removing acid gases from flue gas
US6067118A (en) 1997-12-16 2000-05-23 Philips Electronics North America Corp. Method of frame-by-frame calculation of quantization matrices
JP4099682B2 (ja) * 1998-09-18 2008-06-11 ソニー株式会社 画像処理装置および方法、並びに記録媒体
JP2000102007A (ja) * 1998-09-28 2000-04-07 Matsushita Electric Ind Co Ltd マルチメディア情報合成装置、及び圧縮映像信号生成装置
US6259741B1 (en) * 1999-02-18 2001-07-10 General Instrument Corporation Method of architecture for converting MPEG-2 4:2:2-profile bitstreams into main-profile bitstreams
US6999511B1 (en) * 1999-02-23 2006-02-14 International Business Machines Corporation Dynamically switching quant matrix tables within an MPEG-2 encoder
US6658157B1 (en) * 1999-06-29 2003-12-02 Sony Corporation Method and apparatus for converting image information
US6403526B1 (en) * 1999-12-21 2002-06-11 W. R. Grace & Co.-Conn. Alumina trihydrate derived high pore volume, high surface area aluminum oxide composites and methods of their preparation and use
JP4593720B2 (ja) 2000-03-10 2010-12-08 パナソニック株式会社 剰余数係数の動的表示方法および装置
JP5041626B2 (ja) * 2000-04-14 2012-10-03 ソニー株式会社 復号装置、復号方法、およびプログラム
US7295609B2 (en) 2001-11-30 2007-11-13 Sony Corporation Method and apparatus for coding image information, method and apparatus for decoding image information, method and apparatus for coding and decoding image information, and system of coding and transmitting image information
JP4348899B2 (ja) 2001-11-30 2009-10-21 ソニー株式会社 画像情報復号方法
US6818043B1 (en) * 2003-01-23 2004-11-16 Electric Power Research Institute, Inc. Vapor-phase contaminant removal by injection of fine sorbent slurries
WO2005076614A1 (en) * 2004-01-30 2005-08-18 Matsushita Electric Industrial Co., Ltd. Moving picture coding method and moving picture decoding method
US7620103B2 (en) * 2004-12-10 2009-11-17 Lsi Corporation Programmable quantization dead zone and threshold for standard-based H.264 and/or VC1 video encoding
US7373009B2 (en) * 2005-02-09 2008-05-13 Lsi Corporation Method and apparatus for efficient transmission and decoding of quantization matrices
US7929624B2 (en) * 2006-10-26 2011-04-19 Telefonaktiebolaget L M Ericsson (Publ) Cell ID detection in cellular communication systems
EP2216917B1 (en) 2009-02-05 2011-04-13 Research In Motion Limited Mobile wireless communications device having diversity antenna system and related method
CN104170382B (zh) * 2012-01-20 2018-08-03 韩国电子通信研究院 用于编码和解码量化矩阵的方法和使用其的设备

Also Published As

Publication number Publication date
USRE48401E1 (en) 2021-01-19
US8218623B2 (en) 2012-07-10
EP2384002B1 (en) 2016-01-13
US20120243603A1 (en) 2012-09-27
EP1709801A4 (en) 2010-11-24
PL1709801T3 (pl) 2013-02-28
EP1709801A1 (en) 2006-10-11
US20110150083A1 (en) 2011-06-23
USRE49787E1 (en) 2024-01-02
US8194734B2 (en) 2012-06-05
JP2007520165A (ja) 2007-07-19
ES2392437T3 (es) 2012-12-10
US20110150082A1 (en) 2011-06-23
JP2011091848A (ja) 2011-05-06
US20120243604A1 (en) 2012-09-27
KR20060134900A (ko) 2006-12-28
USRE46500E1 (en) 2017-08-01
WO2005076614A1 (en) 2005-08-18
US8396116B2 (en) 2013-03-12
KR101065998B1 (ko) 2011-09-19
CN1910922B (zh) 2013-04-17
PL2384002T3 (pl) 2016-07-29
CN1910922A (zh) 2007-02-07
US20080089410A1 (en) 2008-04-17
JP2011091847A (ja) 2011-05-06
ES2563295T3 (es) 2016-03-14
CN101699866B (zh) 2016-08-03
US7933327B2 (en) 2011-04-26
JP4679524B2 (ja) 2011-04-27
EP2384002A1 (en) 2011-11-02
US8477838B2 (en) 2013-07-02
JP5102344B2 (ja) 2012-12-19
EP1709801B1 (en) 2012-09-19
CN101699866A (zh) 2010-04-28

Similar Documents

Publication Publication Date Title
JP5048826B2 (ja) 動画像復号化方法、動画像復号化装置、プログラムおよび記録媒体
JP4348209B2 (ja) 画像符号化方法および画像復号化方法
JP5242719B2 (ja) 画像符号化方法
JP5674911B2 (ja) 画像符号化復号化装置
JP5355807B2 (ja) 符号化データ配信方法および配信システム
EP1589767A1 (en) Moving picture encoding method and moving picture decoding method
JP2004242286A (ja) 動画像符号化方法および動画像復号化方法
JP2004260236A (ja) 動画像の符号化方法および復号化方法
JP4481612B2 (ja) 画像復号化装置及びその方法
JP4481970B2 (ja) 画像符号化装置及びその方法
JP2004120138A (ja) 動画像符号化方法および動画像復号化方法
KR100943563B1 (ko) 동화상 부호화 장치 및 동화상 복호화 장치
JP2005102159A (ja) 動画像符号化方法および動画像復号化方法

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120626

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120719

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150727

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5048826

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250