JP2012191642A - 画像復号化装置及び方法 - Google Patents

画像復号化装置及び方法 Download PDF

Info

Publication number
JP2012191642A
JP2012191642A JP2012110972A JP2012110972A JP2012191642A JP 2012191642 A JP2012191642 A JP 2012191642A JP 2012110972 A JP2012110972 A JP 2012110972A JP 2012110972 A JP2012110972 A JP 2012110972A JP 2012191642 A JP2012191642 A JP 2012191642A
Authority
JP
Japan
Prior art keywords
bit
pixel
image
image signal
accuracy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012110972A
Other languages
English (en)
Inventor
Reiko Noda
玲子 野田
Takeshi Nakajo
健 中條
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2012110972A priority Critical patent/JP2012191642A/ja
Publication of JP2012191642A publication Critical patent/JP2012191642A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/238Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
    • H04N21/2389Multiplex stream processing, e.g. multiplex stream encrypting
    • H04N21/23892Multiplex stream processing, e.g. multiplex stream encrypting involving embedding information at multiplex stream level, e.g. embedding a watermark at packet level
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/467Embedding additional information in the video signal during the compression process characterised by the embedded information being invisible, e.g. watermarking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/835Generation of protective data, e.g. certificates
    • H04N21/8358Generation of protective data, e.g. certificates involving watermark

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】画面内予測や動き補償の精度を高める事によって符号化効率を向上させる。
【解決手段】画像符号化装置は、入力画像の各画素のビット精度を変換することによって変換入力画像を出力すると共に変換により変更されたビット数を表すビット変換情報を出力する画素ビット長拡張変換器1001と、入変換力画像を符号化し画像符号化情報を出力する画像符号化器10と、ビット変換情報と画像符号化情報とを多重化する多重化器12とを具備する。
【選択図】図1A

Description

本発明は、動画像又は静止画像のための画像符号化装置及び方法並びに画像復号化装置及び方法に関する。
代表的な動画像符号化標準方式であるH.264は、入力画像信号と、画面内予測や動き補償を行うことで作成された予測画像信号との予測誤差信号に対して離散コサイン変換(DCT)等の直交変換を行い、このような周波軸上への変換を行った後、変換係数に対して量子化及び符号化による圧縮処理を行って符号化画像を得るという非可逆圧縮方式である。予測画像信号を作成する際には、画面内予測や動き補償の補間フィルタにおいて、複数画素にフィルタ係数をかけて足し合わせた後、入力画像の画素ビット長と同じ精度に丸めを行う処理を行っている。
特開2003−283872号公報では、入力画像の1フレーム毎に各色信号のダイナミックレンジを拡大した画像を入力として符号化し、復号後に元のダイナミックレンジに復元することにより、表示装置の補正による符号化歪の強調を抑制する手法が示されている。
H.264では、予測信号を作成する際の丸め処理の過程において丸め誤差が発生するため、画面内予測や動き補償の補間フィルタにおいて十分な精度で処理を行うことができず、予測誤差信号の増大を招き、結果的に符号化効率が低下する。これに対し、特開2003−283872号公報では、入力画像のダイナミックレンジを拡大することにより、前述の丸め誤差を若干少なくすることが可能である。しかし、特開2003−283872号公報におけるダイナミックレンジの拡大は、入力画像のビット精度の範囲内で行われるだけであり、また、ダイナミックレンジの拡大の際にも丸め誤差が発生することから、十分に計算精度を向上させることはできない。
特開平4−32667号公報では、エンコーダもデコーダも一体的に設けられたデジタルカメラに適用され、エンコーダもデコーダに共有されるDCTの演算精度に合わせて入力画像のビット長をビットシフトする手法を開示している。この手法では、エンコーダとデコーダが別々に設けられ、それぞれのDCTの演算精度が異なっていれば、それぞれに合わせてビットシフトされるので違うビット数でシフトすることになり、ミスマッチが生じる。
本発明は、画面内予測や動き補償の精度を十分高めることによって符号化効率を向上させるための画像符号化装置及び画像符号化方法並びに画像復号化装置及び画像復号化方法を提供することを目的とする。
本発明の第1の形態は、入力画像の各画素のビット精度を変換することによって異なるビット精度の変換入力画像を生成し、変換により変更されたビット数を表すビット変換情報を出力する画素ビット長変換器と、前記入変換力画像を符号化し画像符号化情報を出力する画像符号化器と、前記ビット変換情報と前記画像符号化情報とを多重化する多重化器とを備えた画像符号化装置を提供する。
本発明の第2の形態は、Nビット精度をそれぞれ持つ複数の画素により構成される入力画像の各画素のビット精度をMビット大きな(N+M)ビット精度に変換する画素ビット精度変換器と、(N+M)ビット精度の前記入力画像に対する(N+M)ビット精度の予測画像を、(N+M)ビット精度の参照画像から作成する予測画像作成器と、(N+M)ビット精度の前記入力画像と(N+M)ビット精度の前記予測画像との差分信号を求める減算器と、前記差分信号を符号化して画像符号化情報を出力する符号化器と、前記画像符号化情報に基づいて復号差分画像を出力する復号化器と、(N+M)ビット精度の前記予測画像と前記復号差分画像とを加算して(N+M)ビット精度の復号画像を出力する加算器と、(N+M)ビット精度の前記復号画像を前記参照画像として保存する参照画像格納メモリとを備えた画像符号化装置を提供する。
本発明の第3の形態は、ビット変換情報と画像符号化情報とが多重化された画像情報を入力してビット変換情報と画像符号化情報に分離する逆多重化器と、前記画像符号化情報を復号化し復号画像を出力する画像復号化器と、前記ビット変換情報に基づいて前記復号画像の各画素の値をビット精度が異なるビット精度に変換する画素ビット精度変換器と、を備えた画像復号化装置を提供する。
本発明の第4の形態は、入力符号化画像情報を(N+M)ビット精度の復号差分画像に復号する復号化器と、前記符号化画像情報を用いて(N+M)ビット精度の参照画像から(N+M)ビット精度の予測画像を作成する予測画像作成器と、前記復号差分画像と前記予測画像とを加算して(N+M)ビット精度の復号画像を得る加算器と、(N+M)ビット精度の前記復号画像を前記参照画像として保存する参照画像格納メモリと、(N+M)ビット精度の前記復号画像の各画素をNビット精度に変換しNビット精度の復号画像を出力する画素ビット精度変換器と、を備えた画像復号化装置を提供する。
本発明の第1の実施形態に係る画像符号化装置の構成例を示すブロック図である。 1Aの画像符号化装置の動作を示すフローチャートである。 画素ビット長拡張器の構成を示すブロック図である。 同実施形態で用いるシンタクスの構造の一例を示す図である。 同実施形態で用いるシーケンスパラメータセットシンタクスの構造を示す図である。 同実施形態で用いるサプリメンタルシンタクスの構造を示す図である。 同実施形態で用いるサプリメンタルシンタクスの構造を示す図である。 同実施形態に係る画像復号化装置の構成例を示すブロック図である。 図7Aの画像復号化装置の動作を示すフローチャートである。 図7の画素ビット長縮小器の構成を示すブロック図である。 本発明の第2の実施形態に係る画像符号化装置の構成例を示すブロック図である。 図9Aの画像復号化装置の動作を示すフローチャートである。 同実施形態に係る画像復号化装置の構成例を示すブロック図である。 図10Aの画像復号化装置の動作を示すフローチャートである。 第3の実施形態に係る画像符号化装置の構成例を示すブロック図である。 図11Aの画像符号化装置の動作を示すフローチャートである。 図11Aの画素ビット長変換器の動作の概要を示す図である。 図11Aの画素ビット長変換器の構成の一例を示すブロック図である。 図11Aの画素ビット長変換器の構成の一例を示すブロック図である。 図11Aのフレームメモリの構成の一例を示すブロック図である。 図11の画素ビット長変換器の構成を示すブロック図である。 同実施形態で用いるシーケンスパラメータセットシンタクスの構造を示す図である。 同実施形態で用いるピクチャーパラメータセットシンタクスの構造を示す図である。 同実施形態で用いるスライスレベルシンタクスの構造を示す図である。 同実施形態で用いるマクロブロックレベルシンタクスの構造を示す図である。 同実施形態に係る画像復号化装置の構成例を示すブロック図である。 図17Aの画像復号化装置の動作を示すフローチャートである。 本発明の第4の実施形態に係る画像符号化装置の構成例を示すブロック図である。 図18Aの画像符号化装置の動作を示すフローチャートである。 同実施形態に係る画像復号化装置の構成例を示すブロック図である。 図19Aの画像復号化装置の動作を示すフローチャートである。 第5の実施形態に係る画像符号化装置の構成例を示すブロック図である。 図20Aの画像符号化装置の動作を示すフローチャートである。 同実施形態に係る画像復号化装置の構成例を示すブロック図である。 図21Aの画像復号化装置の動作を示すフローチャートである。 エンコーダ側の予測画像作成器のブロック図である。 デコーダ側の予測画像作成器のブロック図である。 フレーム間予測器の構成を示すブロック図である。 フレーム間予測器の別の構成を示すブロック図である。 フレーム間予測器の別の構成を示すブロック図である。 エンコーダ側のループフィルタの構成を示すブロック図である。 復号側のループフィルタの構成を示すブロック図である。 画素ビット長拡張器の他の構成を示すブロック図である。 フィルタ処理部のブロック図である。 フィルタ処理部の動作の流れ図である。 画素ビット長縮小器のブロック図である。 第6の実施形態に係る画像符号化装置のブロック図である。 図33Aの画像符号化装置の動作を示すフローチャートである。 第6の実施形態に係る画像復号化装置のブロック図である。 図34Aの画像復号化装置の動作を示すフローチャートである。 第7の実施形態に係る画像符号化装置のブロック図である。 図35Aの画像符号化装置の動作を示すフローチャートである。 シーケンスパラメータセットシンタクスを示す図である。 シーケンスパラメータセットシンタクスを示す図である。 画像符号化装置の処理において使用される制御フラグの設定例を示す図である。 第7の実施形態に係る画像復号化装置の構成を示すブロック図である。 図39Aの画像復号化装置の動作を示すフローチャートである。 ビット変換情報に含まれる制御フラグの設定を示す図である。 ビット精度の拡張の有無によって生じる丸め誤差の相違について説明するための図である。 半画素精度の予測画素値を示す図である。 本発明の実施の形態の画素ビット長拡張および画素ビット長縮小における変換特性を示す図である。
以下、図面を参照しながら本発明の実施形態について説明する。
(第1の実施形態)
図1Aを参照して第1の実施形態に係る動画像符号化のための画像符号化装置の構成を説明する。この画像符号化装置は、入力画像信号100が供給され、画素ビット長を拡張する画素ビット長拡張器(即ち、画素ビット精度を変換する画素ビット精度変換器)1001と、この画像ビット長拡張器1001の出力に接続される画像符号化器10と、この画像符号化器10の出力に接続される多重化器12と、画像ビット長拡張器1001の他の出力に接続され、ビット拡張情報を多重化部12に供給するビット長変換制御器1002とを備えている。
図1Bのフローチャートを参照して画像符号化装置の動作を説明する。この画像符号化装置には、入力画像信号100として例えばフレーム単位で動画像信号が入力される(S11)。画素ビット長拡張器1001は、入力されたNビット精度の画像信号100の各画素をNビットよりMビット大きな(N+M)ビット精度に変換する処理を行う。即ち、図2に示される画素ビット長拡張器1001において、入力されたNビット精度の画像信号100の各画素のビット長を拡張するかどうかがビット長拡張情報1003に基づいてスイッチE0によって選択される(S12)。拡張を行う場合は、スイッチE0をON側に、拡張を行わない場合はOFF側に接続する。スイッチE0をONとした場合は、画像信号は画素ビット長拡張変換器(画素ビット精度変換器)E01に入力され、後述の画素ビット長変換が行われる(S13)。スイッチE0がOFFの場合は、画像信号は画素ビット長変換されず、そのまま出力される。例えば、入力画像信号のある画素の値がKであった場合、その画素値KをMビット拡張した後の画素値K’は、以下の数式(1)のように計算される。
K’=K << M …(1)
また、例えば、表示装置の特性に合わせて、画素をガンマ変換することも可能である。拡張するビット数をM、ガンマ値をγとすると、以下の数式(1−1)のように画素値K’が計算される。
K’=INT〔〔{K/((1 << N)−1)}γ×((1 << M)−1)〕+offset〕 …(1−1)
また、以下の数式(1−2)のように、さらに入力画像の画素の最小値Min、最大値Maxを求め、ダイナミックレンジを広げつつMビット大きなビット精度に画素を拡張することも可能である。
K’=INT〔〔{(K−Min)/(Max−Min)}γ×((1 << M)−1)〕+offset〕
…(1−2)
INTは整数に丸めを行う処理を示す。数式(1−1),(1−2)でのoffsetは、丸めを行うときのオフセットを示し、0〜1の任意の値である。
さらには、上記のような拡張を行った入力画像の系列に対し、ヒストグラム平滑化を行ったり、時空間にフィルタを施したりすることも可能である。
入力画像が例えばRGBなどの複数のコンポーネントからなるカラー画像信号である場合には、各コンポーネントの各画素のビット長をMビット大きなビット精度に拡張した後に、各コンポーネントを別の色空間のコンポーネント信号に変換してもよい。例えば、RGBからYCoCgに変換する場合には以下の数式(1−3)で変換する。この例では、Nビットの入力画像の各コンポーネントの各画素R,G,Bが、各画素の値をMビット大きなビット精度に拡張した後、Y,Co,Cgに変換される。
R’=(R << M)
G’=(G << M)
B’=(B << M)
Y=Round(0.5*G’+0.25*(R’+B’))
Co=Round(0.5*G’−0.25*(R’+B’))+(1 << (N+M−1))
Cg=Round(0.5*(R’−B’))+(1 << (N+M−1))
…(1−3)
ここで、Round(A)はAを四捨五入して整数に丸める処理である。数式(1−3)による変換例では、拡張するビット数Mを2以上にすれば、丸め処理において丸め誤差が発生することなく色変換することが可能である。なお、ここで示した色変換は一例であり、色変換を行う処理であればどのような処理を行ってもよい。
以上の例は画素ビット長拡張器1001が行う変換の一例であり、各画素の値をMビット大きなビット精度に拡張する処理は、上記の例に限るものではなく、ビット長を拡大する処理であればどのような処理を行ってもよい。
上記のようにしてビット拡張が行われたビット拡張入力画像信号1009は、画像符号化器10に導かれる。また、拡張されるビット数M、入力画像信号のビット長Nおよびその他変換に必要なガンマ値、画素最大値、最小値、ヒストグラムなどのビット変換情報1010が生成され(S14)、ビット長変換制御器(ビット精度変換制御器)1002によりビット拡張情報1003として多重化部12に導かれる。
画像符号化器10は、入力されたビット拡張入力画像信号1009を符号化し、画像符号化データ11として多重化部12に出力する(S15)。多重化部12は、画像符号化データ11およびビット拡張情報1003を多重化し(S16)、符号化データ117として図示しない伝送系または蓄積系へ送出する(S17)。
次に、拡張するビット数Mなどの変換に必要なビット拡張情報1003の多重化方法について説明する。
図3に、本実施形態で用いられるシンタクスの構造の例を示す。
このシンタクス構造例において、ハイレベルシンタクス(401)には、スライス以上の上位レイヤのシンタクス情報が詰め込まれている。スライスレベルシンタクス(402)では、スライス毎に必要な情報が明記されており、マクロブロックレベルシンタクス(403)では、マクロブロック毎に必要とされる量子化パラメータの変更値やモード情報などが明記されている。
各シンタクスは、さらに詳細なシンタクスで構成されている。ハイレベルシンタクス(401)では、シーケンスパラメータセットシンタクス(404)とピクチャーパラメータセットシンタクス(405)などのシーケンスおよびピクチャレベルのシンタクスから構成されている。スライスレベルシンタクス(402)では、スライスヘッダーシンタクス(406)、スライスデータシンタクス(407)などから構成されている。さらに、マクロブロックレベルシンタクス(403)は、マクロブロックヘッダーシンタクス(408)、マクロブロックデータシンタクス(409)などから構成されている。
上述したシンタクスは復号化時に必要不可欠な構成要素であり、これらのシンタクス情報が欠けると復号化時に正しくデータを復元できなくなる。一方、復号化時に必ずしも必要とされない情報を多重化するための補助的なシンタクスとしてサプリメンタルシンタクス(410)が存在する。サプリメンタルシンタクスは、復号側で独立に実行可能な処理に対する指示を示す情報を送る役割として用意されている。
本実施形態では、拡張するビット数をシーケンスパラメータセットシンタクス(404)に含めてこのシンタクスを送信することが可能である。それぞれのシンタクスを以下で説明する。
図4のシーケンスパラメータセットシンタクス内に示されるex_seq_bit_extention_flagは、ビット拡張を行うかどうかを示すフラグであり、当該フラグがTRUEであるときは、ビット拡張を行うか否かをシーケンス単位で切り替えることが可能である。フラグがFALSEであるときは、シーケンス内ではビット拡張は行われない。ex_seq_bit_extention_flagがTRUEのときは更に何ビット拡張を行うかを示すex_seq_shift_bitsが送信される。当該フラグのTRUE/FALSEによって例えば図2で示される画素ビット長拡張器1001内のスイッチE0のON/OFFが決定される。
シーケンスパラメータセットシンタクス内には、さらに、どのような変換を行ったかを示すex_bit_transform_typeを含めて送信してもよい。ex_bit_transform_typeは、例えば数式(1)で示される単純なビット拡張変換を示す値BIT_EXT_TRANSや、数式(1−1)で示されるγ変換が行われたことを示すGAMMA_TRANS、数式(1−2)で示されるダイナミックレンジ変換が行われたことを示すDR_TRANSなどが格納されている。ex_bit_transform_typeがGAMMA_TRANSである場合には、さらにどのようなガンマ値で変換を行ったかを示すgamma_valueが送信される。ex_bit_transform_typeがDR_TRANSである場合には、さらにそれぞれ入力画像信号の画素の最大値と最小値を示すmax_value,min_valueが送信される。
本実施形態においては、サプリメンタルシンタクス(410)に多重化されたデータを利用することが可能である。図5にサプリメンタルシンタクスを用いて復号側の出力画像信号のビット精度を送信する例を示す。サプリメンタルシンタクス内に示されるex_sei_bit_extention_flagは、出力画像信号のビット精度を変更するかどうかを示すフラグであり、当該フラグがTRUEのときは、出力画像信号のビット精度を変更することを示す。フラグがFALSEであるときは、出力画像信号のビット精度の変更を行わないことを示す。当該フラグがTRUEであるときは、さらにbit_depth_of_decoded_imageが送信される。bit_depth_of_decoded_imageは、出力画像信号のビット精度を示す値であり、後述の復号側でビット拡張あるいは縮小を行って復号化する能力のある復号化器で画像信号を復号化する場合は、bit_depth_of_decoded_imageの値に従って、復号画像のビット精度を拡大あるいは縮小してbit_depth_of_decoded_imageで示されたビット精度の復号画像を出力することが可能である。
ただし、ビット拡張あるいは縮小を行って復号化する能力がない復号化器で画像信号を復号化する場合や、あるいは能力があったとしても必ずしもbit_depth_of_decoded_imageで示されたビット精度の復号画像を出力する必要はなく、復号されたビット精度のまま出力することも可能である。
また、図6に、サプリメンタルシンタクス410を用いて復号側の出力画像信号の色空間を送信する例を示す。ex_sei_bit_extention_flag, bit_depth_of_decoded_imageについては前述の図4の例と同様である。
サプリメンタルシンタクス内に示されるex_color_transform_flagは、出力画像信号の色空間を変換するかどうかを示すフラグであり、当該フラグがTRUEのときは、出力画像信号の各コンポーネントの色空間を変更することを示す。一方、フラグがFALSEであるときは、出力画像信号の各コンポーネントの色空間の変更を行わないことを示す。当該フラグがTRUEであるときは、さらにcolor_space_of_decoded_imageが送信される。color_space_of_decoded_imageは、出力画像信号の色空間を示す値であり、後述の復号側でビット拡張あるいは縮小を行って復号化する能力がある。color_space_of_decoded_imageの値で指定される色空間に変換する能力のある復号化器で画像信号を復号化する場合は、出力画像信号の各コンポーネントをcolor_space_of_decoded_imageの値で指定される色空間に変換した後、bit_depth_of_decoded_imageの値に従って、復号画像のビット精度を拡大あるいは縮小してbit_depth_of_decoded_imageで示されたビット精度の復号画像を出力することが可能である。
ただし、color_space_of_decoded_imageの値で指定される色空間に出力画像信号の各コンポーネントを変換する能力がない復号化器で復号する場合や、あるいは能力があったとしても、必ずしもcolor_space_of_decoded_imageの値で指定される色空間に変換した復号画像を出力する必要はない。復号された色空間のまま復号画像を出力した後に、bit_depth_of_decoded_imageで示されたビット精度にコンポーネントを変換することも可能である。また、ビット拡張あるいは縮小を行って復号化する能力がない復号化器で画像信号を復号化する場合や、あるいは能力があったとしても必ずしもbit_depth_of_decoded_imageで示されたビット精度の復号画像を出力する必要はなく、復号されたビット精度のまま出力することも可能である。
次に、図7A、図7Bを参照して本実施形態に係る画像復号化装置を説明する。図7Aに示すように、この画像復号化装置は、符号化データが入力される逆多重化部21と、逆多重化部21の出力に接続される画像復号化器20と、画像復号化器20の出力に接続される画素ビット長縮小器(画素ビット精度縮小変換器)2001と、逆多重化部21からビット拡張情報を受け、ビット変換情報を画素ビット長縮小器2001に入力するビット長変換制御器(ビット精度変換制御器)2002とを備えている。
図7Bのフローチャートに示すように、まず、図1Aの画像符号化装置によって符号化された符号化データ117が逆多重化部21に入力される(S21)。逆多重化部21において、符号化データ117がビット拡張情報2004および画像符号化データ11に分離される(S22)。ビット拡張情報2004はビット長変換制御器2002に入力され、画像符号化データ11は画像復号化器20に入力される。画像符号化データ11は、画像符号化器10で行われた符号化と逆の手順で復号化され、ビット拡張復号画像信号203とされる(S23)。ビット拡張復号画像信号203は画素ビット長縮小器2001に入力される。ビット拡張情報2004が、ビット長変換制御器2002に入力されると、ビット長変換制御器2002は復号画像が何ビット拡張されているか、および変換に必要な情報を示すビット変換情報2003を出力する。
図8に示すように画素ビット長縮小器2001においては、入力されたNビット精度の画像信号100はビット変換情報2003に基づいてスイッチE2によって、各画素のビット長を縮小するかどうかが選択される(S24)。スイッチE2は縮小を行う場合は、ON側に、拡張を行わない場合はOFF側に接続する。スイッチE2をONとした場合は、画像信号は画素ビット長縮小変換器E02に入力され、後述の画素ビット長変換が行われる(S25)。スイッチE2がOFFの場合は、画像信号は画素ビット長変換されず、そのまま出力される。例えば、ex_seq_bit_extention_flagがTRUEであり、各画素のビット長が拡張されていることを示している場合はスイッチをON側に、FALSEの場合はOFF側にする。
ビット変換情報2003が、例えば、ex_seq_shift_bitsによってMビット拡張されており、ex_bit_transform_typeによって例えば数式(1)で示される変換が行われたことを示すBIT_EXT_TRANSを示していた場合、画素ビット長縮小器2001に入力されたビット拡張復号画像信号203は、各画素の値をMビット縮小する。例えば、ビット拡張復号画像信号203のある画素の値がKであった場合、Mビット縮小した後の画素値K’は以下のように計算される。
K’=(K+offset)>> M
offset=(1<<(M−1)) …(2)
これは四捨五入を用いて、画素値をMビット小さいビット長に縮小する方法の一例であり、ここでの縮小変換方法は、例えば、offsetを0〜(1<<M)の任意の値にするなど、ビット長を小さくする方法であれば、どのような変換方法でもよい。
ビット変換情報2003が、例えば、ex_seq_shift_bitsによってMビット拡張されており、ex_bit_transform_typeによって例えば数式(1−1)で示されるガンマ変換が行われたことを示すGAMMA_TRANSを示している。gamma_valueによってガンマ値がγであることが示されている場合には、画素ビット長縮小器2001に入力されたビット拡張復号画像信号203は、各画素の値をMビット縮小する。例えば、ビット拡張復号画像信号203のある画素の値がKであった場合、Mビット縮小した後の画素値K’は以下のように計算される。
K’=INT〔〔{K/((1 << M)−1)}1/γ×((1 << N)−1)〕+offset〕
…(2−1)
ビット変換情報2003が、例えば、ex_seq_shift_bitsによってMビット拡張されており、ex_bit_transform_typeによって例えば数式(1−2)で示されるダイナミックレンジ変換が行われたことを示すDR_TRANSを示しており、min_value, maxvalueによって入力画像の画素の最小値と最大値がそれぞれMax,Minであることが示されている場合には、画素ビット長縮小器2001に入力されたビット拡張復号画像信号203は、各画素の値をMビット縮小する。例えば、ビット拡張復号画像信号203のある画素の値がKであった場合、Mビット縮小した後の画素値K’は以下のように計算される。
K’=INT〔〔{(K−(Min <<M))/((Max−Min)<<M)}1/γ×((1 << N)−1)〕+offset〕
…(2−2)
INTは整数に丸めを行う処理を示す。数式(2−1),(2−2)でのoffsetは、丸めを行うときのオフセットを示し、0〜1の任意の値である。
ビット変換情報2003が、例えば、ex_seq_shift_bitsによってMビット拡張されており、復号画像信号のカラースペースが例えば図5に示すサプリメンタルシンタクス内で指定されているcolor_space_of_decoded_imageで指定されている色空間とは異なる色空間であった場合には復号画像の各コンポーネントの各画素をcolor_space_of_decoded_imageで指定されている色空間に変換した後、ビット長をMビット縮小する。例えば、入力画像がRGBからYCoCgに変換されて符号化されており、color_space_of_decoded_imageにRGBが指定されている場合には、復号画像の各コンポーネントの各画素Y,Co,Cgに対し、以下の数式(2−3)によりビット縮小と色空間変換が行われ、各コンポーネントの各画素がそれぞれR,G,Bに変換される。
t=(Y−((Cg−(1 << (N+M−1))) >> 1))
G’=Clip1y(t+(Cg−(1 << (N+M−1))))
B’=Clip1y(t−((Co−(1 << (N+M−1)))>> 1))
R’=Clip1y(B’+(Co−(1 << (N+M−1))))
offset=(1<<(M−1))
R=(R’+offset)>> M
G=(G’+offset)>> M
B=(B’+offset)>> M
…(2−3)
ここで、Clip1y(A)はAが0<A<(1<<(N+M))を満たす場合にはAをそのまま出力し、A<0ならば0を、A≧(1<<(N+M))なら(1<<(N+M))−1を出力する処理を表している。これは四捨五入を用いて、画素値をMビット小さいビット長に縮小する方法の一例であり、ここでの縮小変換方法は、例えば、offsetを0〜(1<<M)の任意の値にするなど、ビット小さくする方法であれば、どのような変換方法でもよい。
ここでは復号画像信号の色空間がサプリメンタルシンタクス内で指定されているcolor_space_of_decoded_imageで指定されている例を示したが、このような指定がない場合や、ハイレベルシンタクス401にサプリメンタルシンタクスで示した例と同様に復号画像信号の色空間を指定している場合でも、復号画像を出力する過程で色変換処理が行われる場合には、色変換処理を行った後、画素値をMビット小さいビット長に縮小してもよい。また、ここで示した色変換は一例であり、色変換を行う処理であればどのような処理を行ってもよい。
以上に示した縮小変換は一例であり、ビット長を小さくする方法であれば、どのような変換方法でもよい。
以上のようにして、画像符号化装置に入力された入力画像と同じNビット精度の復号画像202が画素ビット長縮小器2001より出力される(S25)。
以上の構成によれば、画像符号化および画像復号化が、入力画像のビット精度よりもMビット大きなビット精度で行うことができ、符号化効率を向上させることができる。
(第2の実施形態)
図9Aを参照して第2の実施形態に係る動画像符号化のための画像符号化装置の構成を説明する。図9に示すように、この画像符号化装置は、画素ビット長拡張器(画素ビット精度変換器)1001、ビット長変換制御器(ビット精度変換制御器)1002、減算器101、直交変換器104、量子化器106、逆量子化器109、逆直交変換器110、加算器111、ループフィルタ113、フレームメモリ114、予測画像作成器115、エントロピー符号化器108を備えている。入力画像信号を受ける画素ビット長拡張器1001の出力は減算器101、直交変換器104および量子化器106を介してエントロピー符号化器108に接続される。量子化器106の出力は逆量子化器109,逆直交変換器110,加算器111,ループフィルタ113、フレームメモリ114を介して予測画像作成器115に接続される。予測画像作成器115からの予測画像信号は減算器101および加算器111に入力される。予測画像作成器115からの動きベクトル/予測モード情報はエントロピー符号化器108に入力される。ビット長変換制御器1002はビット変換情報を画素ビット長拡張器1001に入力し、ビット拡張情報をエントロピー符号化器108に入力する。
上記構成の画像符号化装置の動作を図9Bのフローチャートを参照して説明する。画像符号化装置に、入力画像信号100として例えばフレーム単位で動画像信号が入力されると(S31)、画素ビット長拡張器1001は、入力されたNビット精度の画像信号100の各画素の値をNビットよりMビット大きな(N+M)ビット精度に拡張する処理を行う(S32)。例えば、入力画像信号のある画素の値がKであった場合、Mビット拡張した後の画素値K’は例えば数式(1)や数式(1−1),(1−2),(1−3)などによって計算される。
拡張されるビット数Mなどの変換情報は、ビット長変換制御器1002によりビット拡張情報1003としてエントロピー符号化器108に導かれる(S33)。画素ビット長拡張器1001の構成例として、図2の構成をとり、第1の実施形態と同様に各画素のビット長を拡張するかどうかをフラグで切り替えて制御する処理を行ってもよい。
減算器101により、(N+M)ビット精度にビット長が拡張された入力画像信号100と(N+M)ビット精度で作成された予測画像信号102との差分がとられ、(N+M)ビット精度の予測誤差信号103が生成される(S34)。生成された予測誤差信号103は、直交変換器104により直交変換(例えば、離散コサイン変換(DCT))される(S35)。直交変換器104では、直交変換係数情報105(例えば、DCT係数情報)が得られる。直交変換係数情報105は、量子化器106により量子化され、量子化直交変換係数情報107はエントロピー符号化器108および逆量子化器109に入力される。量子化直交変換係数情報107は逆量子化器109及び逆直交変換器110により、量子化器106及び直交変換器104の処理と逆の処理を順次受けて、即ち局部復号化されて予測誤差信号と同様の信号、即ち局部復号誤差信号に変換される。この局部復号誤差信号は加算器111で(N+M)ビット精度の予測画像信号102と加算されることにより、(N+M)ビット精度の局部復号画像信号112が生成される。即ち、量子化直交変換係数情報107が局部復号化される(S36)。局部復号画像信号112は、必要に応じてループフィルタ113によりフィルタ処理がなされた後、フレームメモリ114に格納される。
予測画像作成器115は、(N+M)ビット精度にビット長が拡張された入力画像信号100及びフレームメモリ114に格納された(N+M)ビット精度の局部復号画像信号112から、ある予測モード情報に基づく(N+M)ビット精度の予測画像信号を生成する。この際、加算器111からの(N+M)ビット精度の局部復号画像信号112はフレームメモリ114に一旦蓄えられる。フレーム内のブロック毎に(N+M)ビット精度の入力画像信号100とフレームメモリ114に蓄えられた(N+M)ビット精度の局部復号画像信号112との間のマッチング(例えば、ブロックマッチング)により、動きベクトルが検出される(S37)。この動きベクトルで補償された(N+M)ビット精度の局部画像信号を用いて(N+M)ビット精度の予測画像信号を作成する(S38)。ここで生成された(N+M)ビット精度の予測画像信号102は、選択された予測画像信号の動きベクトル情報/予測モード情報116とともに予測画像作成器115より出力される。
エントロピー符号化器108では、量子化直交変換係数情報107、動きベクトル情報/予測モード情報116およびビット拡張情報1003がエントロピー符号化され(S39)、これによって生成された符号化データ117は、図示しない伝送系または蓄積系へ送出される。
なお、拡張するビット数Mの符号化方法については、第1の実施形態と同様である。また、本実施形態においては、第1の実施形態と同様にサプリメンタルシンタクスに多重化されたデータを利用することが可能である。
次に、図10Aを参照して、本実施形態に係る画像復号化装置の構成を説明する。この画像復号化装置は、エントロピー復号化器200、逆量子化器109、逆直交変換器110、加算器111、ループフィルタ113、フレームメモリ114、予測画像作成器115、画素ビット長縮小器(画素ビット精度変換器)2001、ビット長変換制御器(ビット精度変換制御器)2002を備えている。符号化データを受けるエントロピー復号化器200の係数情報出力は逆量子化器109、逆直交変換器110、加算器111、ループフィルタ113を介して画素ビット長縮小器2001に接続される。ループフィルタ113の出力はフレームメモリ114を介して予測画像作成器115の一方入力に接続される。予測画像作成器115の他方入力は予測画像作成器115から動きベクトル/予測モード情報を受けている。予測画像作成器115の出力は加算器111に接続される。エントロピー復号化器200のビット拡張情報出力はビット長変換制御器2002を介して場素ビット長縮小器2001に接続される。
図10Bを参照して画像復号化装置の動作を説明する。画像復号化装置に図9Aの画像符号化装置によって符号化された符号化データ117が入力されると(S41)、エントロピー復号化器200において、符号化データ117がエントロピー符号化の逆の手順に従って復号化され(S42)、量子化直交変換係数情報107、動きベクトル/予測モード情報116、ビット拡張情報2004が得られる。
量子化直交変換係数情報107は、逆量子化器109及び逆直交変換器110により、量子化器106及び直交変換器104の処理と逆の処理を順次受けて(N+M)ビット精度の残差信号201に変換される(S43)。動きベクトル/予測モード情報116は予測画像作成器115に入力され、フレームメモリ114に格納された(N+M)ビット精度のビット拡張復号画像信号203から動きベクトル/予測モード情報116に基づく(N+M)ビット精度の予測画像信号102が生成される(S44)。(N+M)ビット精度の残差信号201と(N+M)ビット精度の予測画像信号102は、加算器111によって加算され、復号画像信号が生成される(S45)。この復号画像信号はループフィルタ113で必要に応じてフィルタ処理がなされ、(N+M)ビット精度のビット拡張復号画像信号203として出力され、フレームメモリ114に格納される。エントロピー復号化器200から出力されたビット拡張情報2004は、ビット長変換制御器2002に入力されると、ビット長変換制御器2002から復号画像が何ビット拡張されているかを示すビット変換情報2003が出力される。
画素ビット長縮小器2001に入力されたビット拡張復号画像信号203は、ビット変換情報2003に基づいて、例えば数式(2)や数式(2−1),(2−2),(2−3)などに基づいて第1の実施形態と同様の処理を受け、各画素の値をMビット縮小する(S46)。画素ビット長縮小器2001は、図8に示される構成とし、第1の実施形態と同様に各画素のビット長を縮小するかどうかをフラグで切り替える制御が行われてもよい。
以上のようにして、画像符号化装置に入力された入力画像と同じNビット精度の復号画像信号202が画素ビット長縮小器2001より出力される(S47)。
以上の構成によれば、予測画像信号が入力画像信号よりMビット大きな精度をもって作成されるため、動き補償のフィルタやループフィルタ、画面内予測など精度を高めることができ、結果的に予測誤差信号を小さくすることができるため、符号化効率を向上させることができる。
(第3の実施形態)
図11Aに、本発明の第3の実施形態に係る動画像符号化のための画像符号化装置の構成を示す。この画像符号化装置は、第2の実施形態で示した構成例(図9)とほぼ同様の構成であるが、フレームメモリ114の前段に画素ビット長変換器1005を備え、フレームメモリ114の後段に画素ビット長変換器(画素ビット精度変換器)1006を備える点が異なっている。
図11Bを参照してこの画像符号化装置の動作を説明する。この画像符号化装置には、画像信号100として例えばフレーム単位で動画像信号が入力される(S51)。画素ビット長拡張器(画素ビット精度変換器)1001は、第2の実施形態と同様の処理を行うことにより、入力されたNビット精度の画像信号100の各画素の値について、NビットよりMビット大きな(N+M)ビット精度に拡張する処理を行う(S52)。拡張されたビット数Mは、ビット長変換制御器1002によりビット拡張情報1003としてエントロピー符号化器108に導かれる。画素ビット長拡張器1001は、図2の構成とし、第1の実施形態と同様に各画素のビット長を拡張するかどうかをフラグで切り替えて画素ビット長を制御する処理を行ってもよい。
減算器101により、(N+M)ビット精度にビット長が拡張された入力画像信号100と(N+M)ビット精度で作成された予測画像信号102との差分がとられ、(N+M)ビット精度の予測誤差信号103が生成される(S53)。生成された予測誤差信号103は、直交変換器104により直交変換(例えば、離散コサイン変換(DCT))される。直交変換器104では、直交変換係数情報105(例えば、DCT係数情報)が得られる。直交変換係数情報105は、量子化器106により量子化される。即ち、予測誤差信号103は直交変換され、量子化される(S54)。量子化直交変換係数情報107はエントロピー符号化器108および逆量子化器109に導かれる。
量子化直交変換係数情報107は、逆量子化器109及び逆直交変換器110により、量子化器106及び直交変換器104の処理と逆の処理を順次受けて局部復号誤差信号に変換され、加算器111で(N+M)ビット精度の予測画像信号102と加算される。これにより、(N+M)ビット精度の局部復号画像信号112が生成される。即ち、量子化直交変換係数情報107は、局部符号化される(S55)。
(N+M)ビット精度の局部復号画像信号112は、必要に応じてループフィルタ113によりフィルタ処理がなされた後、画素ビット長変換器1005に入力され、各画素の値をLビット小さな値に縮小変換し、または各画素の値をLビット大きな値に拡大変換する(S56)。例えば、(N+M)ビット精度の局部復号画像信号112のある画素の値がKであった場合、Lビット縮小した後の画素値K’は以下のように計算される。
K’=(K+offset)>> L
offset=(1<<(L−1)) …(3)
ここで、縮小するビット数Lは、0<L≦Mを満たす整数である。ビット長を縮小した結果、局部復号画像信号112の各画素のビット長は(N+M−L)ビットとなる。 ここでの縮小変換方法は、例えば、offsetを0〜(1<<L)の任意の値にするなど、ビット長を小さくする方法であれば、どのような変換方法でもよい。
変換方法の他の手法を説明する。図11Cには、符号化単位画像の画素値のヒストグラム(左側)とビット精度変換後のヒストグラム(右側)が示されている。図11Cに示すように、例えば12ビットに拡張された局部復号画像112を8ビット長の画像に縮小する場合、12ビット長に拡張された局部復号画像112を例えばマクロブロック単位などの任意の符号化単位ごとに画素値の最大値mb_maxと最小値mb_minからダイナミックレンジD=(mb_max-mb_min)を算出する。このダイナミックレンジDが8ビットで表される範囲、即ち0〜255であれば、そのブロックは8ビットに変換されてフレームメモリ114に出力される。このとき、このブロックの画素値の最大値mb_max及び/又は最小値mb_minを用いて決められる代表値もフレームメモリ114に出力される。ダイナミックレンジDが8ビットで表現できない値であると、ブロックは2ビット右へのシフトによる除算処理されてから8ビットに変換される。このときには、シフト量Q_bit=2及び代表値とともにブロックがフレームメモリ114に出力される。ダイナミックレンジが更に大きい場合は、図11Cに示されるように8ビット変換ブロックがシフト量Q_bit=4と代表値とともにフレームメモリ114に出力される。
上記の手法をより詳しく説明すると、図11Cに示すように、例えばマクロブロック単位などの任意の符号化単位ごとに、局部復号画像信号112内の画素値の最大値mb_maxと最小値mb_minを求め、そのダイナミックレンジD=(mb_max-mb_min)に応じて縮小するビット数Q_bitを(3-1)式を用いて変更される。
この場合、画素ビット長変換器1005は例えば図11Dのような構成となっており、まず、ダイナミックレンジ算出部10051で局部復号画像信号112内の画素値の最大値mb_maxと最小値mb_minを求め、そのダイナミックレンジD=(mb_max-mb_min)を求める。
次にシフト量/代表値算出部10052において、ダイナミックレンジDに応じてシフト量Q_bitを例えば(3−1a)式を用いて算出する。また例えばmb_minを代表値として設定する。
Q_bit = log2(D) − (N+M-L-1) …(3−1a)
さらに、画素ビット精度変換器10053において、ビット拡張復号画像信号のある画素の値がKであった場合、Lビット(L>0)縮小した後の画素値K’は例えば以下のように計算され、変換された局部復号画像信号112が、代表値mb_min,シフト量Q_bit(代表値/シフト量10054)がフレームメモリ114に出力される。
Offset = (1<<(Q_bit-1))
K’ = (K-mb_min+Offset)>>Q_bit …(3−1b)
このとき、例えばフレームメモリ114を図11Fのように参照画像を格納するメモリ114aと各参照画像の各符号化単位(マクロブロック単位)ごとにどのようにビット精度を変換したかを示す情報を格納するサブメモリ114bとで構成し、サブメモリ114bには例えば代表値mb_minとシフト量Q_bitを保持しておく。
また、復号側でN+Mビット精度で得られるビット拡張復号画像信号をNビット精度に変換して復号画像信号を得る際に例えば(2)式を用いた場合を考える。このとき、 (3-1)式を用いて変換した(N+M−L)ビット精度の局部復号画像信号をフレームメモリに格納し、(3-1)式の逆の手順でフレームメモリからビット精度がN+Mビットに拡張された局部復号画像信号を読み出すと、得られるN+Mビット精度の局部復号画像信号がN+M-Lビットに変換される前の局部復号画像信号を直接(2)式で変換した場合と異なる値が算出される場合がありうる。このことを考慮した変換式が以下の(3-2)-(3-6)式となる。
まず、ダイナミックレンジ算出部10051部において、例えばマクロブロック単位などの任意の符号化単位ごとに、局部復号画像信号112内の画素値の最大値mb_maxと最小値mb_minを求め、そのダイナミックレンジD=(mb_max-mb_min)を求める。
次に、シフト量/代表値算出部10052において、ダイナミックレンジDに応じて縮小する仮のビット数Q_bitとQ_bitでシフト演算を行う際に用いるオフセット値Offsetを(3−2)式を用いて算出する。
mb_min = INT(mb_min>>L)
D = mb_max-(mb_min<<L)
Q_bit = log2(D) − (N+M-L-1)
Offset = (1<<(Q_bit-1)) …(3−2)
次に、Q_bitの値が0かLでない場合に、以下の条件式(3−3)を満たすかどうかを判定する。
D+Offset > (1<<N+M-L+Q_bit) −1−Offset ) …(3−3)
ここで、(3−3)の不等式を満たさない場合は、(3−4)式に示すとおり、Q_bitを1加算し、改めてオフセット値Offsetの再計算を行う。
Q_bit = Q_bit+1
Offset = (1<<(Q_bit-1)) …(3−4)
なお、Q_bitの値が0かLの場合は(3−2)式のQ_bitとOffsetをそのまま用いる。
最後に、画素ビット精度変換器10053において、ビット拡張復号画像信号のある画素の値がKであった場合、Lビット(L>0)縮小した後の画素値K’は例えば以下のように計算され、変換された局部復号画像信号112が、代表値mb_min,シフト量Q_bit(代表値/シフト量10054)がフレームメモリに出力される。
・Q_bitが0かLの場合
K’ = (K − (min_mb<<L) + Offset) >> Q_bit …(3−5)
・Q_bitが0かLでない場合
K’ = (K − (min_mb<<L) + 2*Offset) >> Q_bit …(3−6)
このとき、(3−1)式を用いた場合と同様に、フレームメモリ114は、各フレームの各符号化単位ごとにどのようにビット精度を変換したかを示す情報を記憶するサブメモリ持ち、ここに例えば代表値mb_minとシフト量Q_bitを保持しておく。
以上のように(3−1)や(3−2)〜(3−6)式を用いてマクロブロックなどの符号化単位ごとの各画素のダイナミックレンジを考慮して、各画素値をLビット小さな値に縮小変換した場合、(3)式のように単純にLビット小さな値に縮小変換した場合と比較して、縮小時のシフト演算によって生じる丸め誤差を小さく抑えることができ、参照画像信号をより精度を保った状態でフレームメモリに保存することが可能となる。
上記実施形態では、代表値を画素値の最小値mb_minとしたが、他の値であってもよく、画素値の最大値mb_maxと最小値mb_minによって決まる値であってもよい。
逆に、各画素の値を(−L)ビット大きな値に拡大変換する場合には、例えば、ビット拡張復号画像信号のある画素の値がKであった場合、(−L)ビット拡張した後の画素値K’は例えば以下のように計算される。
K’=K << (−L) …(4)
ここで、拡大するビット数Lは0<(−L)を満たす整数である。ビット長を拡大した結果、局部復号画像信号112の各画素のビット長は(N+M−L)ビットとなる。 図12に画素ビット長変換器1005の構成例を示す。入力されたNビット精度の画像信号100はビット長拡張情報1003に基づいてスイッチE3によって、各画素のビット長を拡張するかどうかを選択される。スイッチE3は拡張を行う場合は、ON側に、拡張を行わない場合はOFF側に接続する。スイッチE3をONとした場合、画素ビット長変換器1005に入力された画像信号は、画素ビット長拡張/縮小変換器E03に入力され、画素ビット長変換される。スイッチE3がOFFの場合は、画像信号は画素ビット長変換されず、そのまま出力される。このように、ビット長を縮小あるいは拡大された局部復号画像信号112は、フレームメモリ114に格納される(S57)。フレームメモリ114に格納された(N+M−L)ビット精度の局部復号画像信号112は、予測画像作成器115に入力される前に、画素ビット長変換器1006に導かれ、L>0の場合には各画素のビット長をLビット大きなビット精度に拡張変換する(S58)。例えば、(N+M−L)ビット精度の局部復号画像信号112のある画素の値がKであった場合、Lビット拡張した後の画素値K’は例えば以下のように計算される。
K’=K << L …(5)
また、変換方法の他の手法として、図11Cに示すように、例えばマクロブロックなどの任意の符号化単位ごとに、局部復号画像信号112内の画素値の最大値mb_maxと最小値mb_minを求め、そのダイナミックレンジD=(mb_max-mb_min)に応じて縮小するビット数Q_bitを(3-1)式に示す式を用いて変更した場合には、画素ビット精度変換器1006は例えば図11Eのような構成を用いて、シフト量/代表値読み出し部10061においてフレームメモリ114内のサブメモリ114bから、該符号化単位の代表値mb_minとシフト量Q_bit(代表値/シフト量10054)を読み出し、画素ビット精度変換部10062において、例えば以下の式を用いてビット精度をLビット拡張した後の画素値K’を計算する。
K’ = (K<<Q_bit) + mb_min …(5−1)
また、変換方法のさらに別の手法として、(3−2)〜(3−6)式に示す式を用いて変更した場合には、シフト量/代表値読み出し部10061においてフレームメモリ114内のサブメモリから、該符号化単位のmb_minとQ_bitを読み出し、画素ビット精度変換部10062において、例えば以下の式を用いてビット精度をLビット拡張した後の画素値K’を計算する。
Q_bitが0かLの場合
K’ = (K <<Q_bit ) + (mb_min<<L)
Q_bitが0かLでない場合
K’ = (K<<Q_bit) + (mb_min<<L)−(1<<(Q_bit−1))
…(5−2)
一方、L<0の場合には、各画素のビット長を(−L)ビット小さなビット精度に縮小変換する。例えば、ビット拡張復号画像信号のある画素の値がKであった場合、(−L)ビット縮小した後の画素値K’は例えば以下のように計算される。
K’=(K+offset)>> (−L)
offset=(1<<(−L−1)) …(6)
ここでの縮小変換方法は、例えば、offsetを0〜(1<<(−L))の任意の値にするなど、ビット長を小さくする方法であれば、どのような変換方法でもよい。画素ビット長変換器1006は、画素ビット長変換器1005と同様の図12に示す構成とし、各画素のビット長を変換するかどうかの処理をフラグで切り替える制御を行ってもよい。このような変換を行うことによって、予測画像作成器115に出力される局部復号画像信号112のビット精度は、(N+M)ビット精度となる。
フレームメモリ114の前後で縮小/拡大されるビット長Lは、L≦Mを満たす整数であり、かつフレームメモリ114の前後で縮小/拡大されるビット数が等しければよい。L=0の場合は、フレームメモリ114に格納する際あるいはフレームメモリ114から出力する際のビット拡張/ビット縮小は行われない。画素ビット長変換器1005および画素ビット長変換器1006で行われる変換は、前述の数式(3)〜(6)に限るものではなく、指定のビット長だけ拡大/縮小が行われる変換であれば、どのような変換を行ってもよい。このビット数Lについても、ビット長変換制御器1002によりビット拡張情報1003としてエントロピー符号化器108に導かれる。
予測画像作成器115は、(N+M)ビット精度にビット長が拡張された入力画像信号100及び(N+M)ビット精度の局部復号画像信号112からある予測モード情報に基づく(N+M)ビット精度の予測画像信号を生成する。この際、フレーム内のブロック毎に(N+M)ビット精度の入力画像信号100と画素ビット長変換器1005によって(N+M)ビット精度に拡大された局部復号画像信号112との間のマッチング(例えば、ブロックマッチング)をとり、動きベクトルを検出する(S59)。この動きベクトルで補償された(N+M)ビット精度の局部画像信号を用いて(N+M)ビット精度の予測画像信号を作成する(S60)。ここで生成された(N+M)ビット精度の予測画像信号102は、選択された予測画像信号の動きベクトル情報/予測モード情報116とともに予測画像作成器115より出力される。
エントロピー符号化器108では、量子化直交変換係数情報107、動きベクトル情報/予測モード情報116およびビット拡張情報1003がエントロピー符号化され(S61)、これによって生成された符号化データ117は、図示しない伝送系または蓄積系へ送出される。
次に、拡張するビット数MおよびLの符号化方法について説明する。本実施形態で使用されるシンタクスの構造の例は、第1の実施形態で用いた図3と同様である。本実施形態では、拡張するビット数をシーケンスパラメータセットシンタクス(404)、ピクチャーパラメータセットシンタクス(405)、スライスレベルシンタクス(402)、および、マクロブロックレベルシンタクス(403)に含めて送信することが可能である。それぞれのシンタクスを以下で説明する。
図13のシーケンスパラメータセットシンタクス内に示されるex_seq_bit_extention_flagは、ビット拡張を行うかどうかを示すフラグであり、当該フラグがTRUEであるときは、ビット拡張を行うか否かをシーケンス単位で切り替えることが可能である。一方、フラグがFALSEであるときは、シーケンス内ではビット拡張は行われない。ex_seq_bit_extention_flagがTRUEのときは更に何ビット拡張を行うかを示すex_seq_shift_bitsを送信してもよい。
ex_seq_bit_extention_flagがTRUEのときは更にフレームメモリ114に格納される際のビット精度を示すex_framemem_bitdepthを送信してもよい。本実施形態では、例えばN+M−Lがex_framemem_bitdepthに格納されて送信されることになる。
本実施形態では、任意の符号化単位でビット拡張を行うか否かを切り替えたり、拡張するビット数を切り替えたりすることも可能である。この場合には、拡張するビット数をさらにピクチャーパラメータセットシンタクス(405)、スライスレベルシンタクス(402)、および、マクロブロックレベルシンタクス(403)に含めて送信することが可能である。
図14のピクチャーパラメータセットシンタクス内に示されるex_pic_bit_extention_flagは、ピクチャ毎にビット拡張を行うかどうかを変更するかどうかを示すフラグである。当該フラグがTRUEであるときは、ピクチャ単位でビット拡張を行うどうかを切り替えることが可能である。一方、フラグがFALSEであるときは、ピクチャ毎にピクチャ単位でビット拡張を行うどうかを変更することが出来ない。ex_pic_bit_extention_flagがTRUEのときは更に何ビット拡張を行うかを示すex_pic_shift_bitsが送信される。ここで、シーケンスパラメータシンタクス内のex_seq_shift_bitsでシーケンスレベルで拡張するビット数が指定されていた場合には、ex_pic_shift_bitsを拡張するビット数として優先してもよいし、ex_seq_shift_bitsを拡張するビット数として優先してもよいし、ex_seq_shift_bits+ex_pic_shift_bitsを拡張するビット数としてもよい。いずれを優先するかは、予め取り決めておくのが好ましい。
ピクチャーパラメータセットシンタクス内には、ex_bit_extention_in_slice_flag、ex_bit_extention_in_mb_flagというフラグが存在していてもよい。これらのフラグはそれぞれ、スライスレベル、マクロブロックレベルでビット拡張を行うかどうかを変更するフラグが存在するかどうかを示すフラグである。
図15に示すとおり、スライスレベルシンタクス内では、ex_bit_extention_in_slice_flagがTRUEのときは、ex_slice_shift_bitsが送信され、スライス単位で拡張するビット数を切り替えて送信することが可能である。ここで、すでにシーケンスパラメータセットシンタクス、ピクチャパラメータシンタクスによって拡張するビット数Sが指定されている場合には、Sを拡張するビット数として優先してもよいし、ex_slice_shift_bitsを拡張するビット数として優先してもよいし、S+ ex_slice_shift_bitsを拡張するビット数として優先してもよい。なお、いずれを優先するかは、予め取り決めておくのが好ましい。一方、ex_bit_extention_in_slice_flagがFALSEの場合には、ex_slice_shift_bitsは送信されない。
図16に示すとおり、マクロブロックレベルシンタクス内では、ex_bit_extention_in_mb_flagがTRUEのときは、ex_mb_shift_bitsが送信され、マクロブロック単位で拡張するビット数を切り替えて送信することが可能である。ここで、すでにシーケンスパラメータセットシンタクス、ピクチャパラメータシンタクス、スライスレベルシンタクスによって拡張するビット数Sが指定されている場合には、Sを拡張するビット数として優先してもよいし、ex_mb_shift_bitsを拡張するビット数として優先してもよいし、S+ ex_mb_ shift_bitsを拡張するビット数として優先してもよい。いずれを優先するかは、予め取り決めておくのが好ましい。一方、ex_bit_extention_in_mb_flagがFALSEの場合には、ex_slice_ shift_bitsは送信されない。
上述のように、任意の符号化単位でビット拡張を行うか否かを切り替える場合、あるいは、拡張するビット数を切り替える場合には、フレームメモリ114に格納される局部復号画像信号のビット精度がシーケンスパラメータセットシンタクス内に示されるex_framemem_bitdepthになるようにLが定められる。
本実施形態においては、第1の実施形態と同様にサプリメンタルシンタクスに多重化されたデータを利用することが可能である。
次に、図17Aを参照して本実施形態に係る画像復号化装置の構成を説明する。この画像復号化装置は、第2の実施形態で示した構成例(図10A)とほぼ同様の構成であるが、加算器111(及びループフィルタ113)の後段に画素ビット長縮小器2001の代わりに画素ビット長変換器(画素ビット精度変換器)2007を備え、フレームメモリ114は加算器111(及びループフィルタ113)の後段ではなく、画素ビット長変換器2007の後段に接続され、さらに、フレームメモリ114の後段に画素ビット長変換器2008が接続されている点が異なる。
図17Bのフローチャートを参照して画像復号化装置の動作を説明する。画像復号化装置に図11Aの画像符号化装置によって符号化された符号化データ117が入力されると(S71)、エントロピー復号化器200において、符号化データ117がエントロピー符号化の逆の手順で復号化され、量子化直交変換係数情報107、動きベクトル/予測モード情報116、ビット拡張情報2004が得られる(S72)。
量子化直交変換係数情報107は、逆量子化器109及び逆直交変換器110により、量子化器106及び直交変換器104の処理と逆の処理を順次受けて(N+M)ビット精度の残差信号201に変換される(S73)(S74)。
エントロピー復号化器200から出力されたビット拡張情報2004は、ビット長変換制御器2002に入力されると、復号画像が何ビット拡張されているかを示すビット数Mと、フレームメモリに格納される際に縮小するビット数Lを示すビット変換情報2003をビット長変換制御器2002から出力する。
画素ビット長変換器2008は、後述の手順でフレームメモリ114に格納された(N+M−L)ビット精度の復号画像信号202に対し、ビット変換情報2003に基づいて、例えばL>0の場合には、数式(5)(5−1)(5−2)などと同等の処理を施すことによって画素ビット長をLビット大きく拡張変換する処理を行い(S75)、L<0の場合には、数式(6)などと同等の処理を施すことによって画素ビット長を(−L)ビット小さく縮小変換する処理を行い、(N+M)ビット精度のビット拡張参照画像信号204を出力する(S75)。なお、(5−1)や(5−2)と同様の処理を施す場合、画素ビット長変換器2008の構成を図11Dと同様の構成としてもよい。またフレームメモリ114を例えば図11Fと同様の構成としてもよい。
動きベクトル/予測モード情報116は予測画像作成器115に入力され、上記(N+M)ビット精度のビット拡張参照画像信号204から動きベクトル/予測モード情報116に基づく(N+M)ビット精度の予測画像信号102が生成される(S77)。(N+M)ビット精度の残差信号201と(N+M)ビット精度の予測画像信号102は、加算器111によって加算される。加算された信号は、ループフィルタ113で必要に応じてフィルタ処理がなされ、(N+M)ビット精度のビット拡張復号画像信号203が出力される(S78)。
ビット拡張復号画像信号203は、画素ビット長変換器2007に入力され、ビット変換情報2003に基づいて各画素の値に対し例えば数式(2)などの第1の実施形態の画像復号化装置における画素ビット長縮小器と同等の処理を施されることにより、Mビット小さな値に画素ビット長が縮小変換され(S79)、画像符号化装置に入力された入力画像と同じNビット精度の復号画像202を得る(S80)。
画素ビット長変換器2007は、図12の構成とし、各画素のビット長を縮小するかどうかをフラグで切り替える制御を行ってもよい。
M=Lの場合には、Nビット精度の復号画像信号202はそのままフレームメモリ114に格納される。M≠Lであり、L>0の場合には、(N+M)ビット精度のビット拡張復号画像信号203に対して、例えば数式(3)(3−1)(3−2)〜(3−6)と同様の処理を各画素毎に行うことで、Lビットだけビット長が縮小された(N+M−L)ビット精度の復号画像を作成し、フレームメモリ114に格納する。逆にL<0の場合には、数式(4)と同様の処理を各画素に対して行うことで、(−L)ビットだけビット長が縮小された(N+M−L)ビット精度の復号画像を作成し、フレームメモリ114に格納する。なお、(3−1)や(3−2)〜(3−6)と同様の処理を施す場合、画素ビット長変換器2007の構成を図11Dと同様の構成としてもよい。
以上の構成によれば、予測画像信号が入力画像信号よりMビット大きな精度をもって作成されるため、動き補償のフィルタやループフィルタ、画面内予測など精度を高めることができ、結果的に予測誤差信号を小さくすることができるため、符号化効率を向上させることができる。また、第1、第2の実施形態と異なり、0<L≦Mの場合には、フレームメモリに格納される参照画像信号を、ビット長が拡張された入力画像信号や予測画像信号より小さなビット長で格納することができ、動き補償のフィルタやループフィルタ、画面内予測など精度を高める効果を保ったまま、フレームメモリの使用量を削減することが可能となる。
以上の構成によれば、任意の符号化単位でビット拡張を行うか否かを切り替えたり、拡張するビット数を切り替えたりすることができ、任意の符号化単位ごとに最も符号化効率のよい拡張ビット数を選択して符号化することができるため、さらに符号化効率を高めることも可能である。
(第4の実施形態)
図18Aを参照して第4の実施形態に係る動画像符号化のための画像符号化装置の構成を説明する。この画像符号化装置は、第2の実施形態で示した構成例(図9)と比較して、入力画像に対し画素ビット長を拡大する画素ビット長拡張器を備えず、フレームメモリ114(及びループフィルタ113)の前段に画素ビット長拡張器(画素ビット精度拡張変換器)1001を備え、予測画像作成器115の後段に画素ビット長縮小器(画素ビット精度縮小変換器)1004を備える点が異なっている。
図18Bのフローチャートを参照して画像符号化装置の動作を説明する。この画像符号化装置には、入力画像信号100として例えばフレーム単位で各画素の精度が例えばNビット精度の動画像信号が入力される(S81)。減算器101により入力画像信号100とNビット精度の予測画像信号102との差分がとられ、Nビット精度の予測誤差信号103が生成される(S82)。Nビット精度の予測画像信号102の生成方法については後述する。生成された予測誤差信号103に対して、直交変換器104により直交変換(例えば、離散コサイン変換(DCT))が施され、直交変換器104では、直交変換係数情報105(例えば、DCT係数情報)が得られる(S83)。直交変換係数情報105は、量子化器106により量子化され、量子化直交変換係数情報107はエントロピー符号化器108および逆量子化器109に導かれる。
量子化直交変換係数情報107は、逆量子化器109及び逆直交変換器110により、量子化器106及び直交変換器104の処理と逆の処理を順次受けて局部復号誤差信号に変換される。この局部復号誤差信号は加算器111でNビット精度の予測画像信号102と加算されることにより、Nビット精度の局部復号画像信号112が生成される(S84)。
局部復号画像信号112は、必要に応じてループフィルタ113によりフィルタ処理がなされた後、画素ビット長拡張器1001に入力され、各画素の値をMビット大きな値に拡張変換する(S85)。例えば、ビット拡張復号画像信号のある画素の値がKであった場合、Mビット縮小した後の画素値K’は第1の実施形態の数式(1)と同様に計算される。ビット精度が(N+M)ビットに拡大された局部復号画像信号112は、フレームメモリ114に格納される(S86)。フレームメモリ114に格納された(N+M)ビット精度の局部復号画像信号112は、予測画像作成器115に入力される。画素ビット長拡張器1001は、図2の構成とし、第1の実施形態と同様に各画素のビット長を拡張するかどうかをフラグで切り替えてビット長を制御する処理を行ってもよい。
予測画像作成器115は、(N+M)ビット精度の局部復号画像信号112からある予測モード情報に基づく(N+M)ビット精度の予測画像信号を生成する。この際、フレーム内のブロック毎に入力画像信号100の各画素を(N+M)ビット精度に拡張した画像信号と、(N+M)ビット精度に拡大された局部復号画像信号112との間のマッチング(例えば、ブロックマッチング)をとり、動きベクトルを検出する(S87)。この動きベクトルで補償された(N+M)ビット精度の局部画像信号を用いて(N+M)ビット精度の拡張予測画像信号117を作成する(S89)。ここで生成された(N+M)ビット精度の拡張予測画像信号117は、選択された予測画像信号の動きベクトル情報/予測モード情報116とともに予測画像作成器115より出力される。
(N+M)ビット精度の拡張予測画像信号117は、画素ビット長縮小器1004に入力され、各画素のビット長がMビット小さくなる画像信号に変換される(S90)。この変換は、例えば第1の実施形態で示した数式(2)と同様の処理により行われる。ここで、縮小されるビット数M、および画素ビット長拡張器1001において拡大されるビット数Mは、ともに同じ値であり、ビット長変換制御器1002によりビット拡張情報1003としてエントロピー符号化器108に導かれる。画素ビット長縮小器1004は、図8の構成とし、実施の形態1と同様に各画素のビット長を拡張するかどうかをフラグで切り替えてビット長を制御する処理を行ってもよい。
エントロピー符号化器108では、量子化直交変換係数情報107、動きベクトル情報/予測モード情報116およびビット拡張情報1003がエントロピー符号化され(S91)、これによって生成された符号化データ117は、図示しない伝送系または蓄積系へ送出される。
拡張するビット数Mの符号化方法は、第1の実施形態と同様である。また、本実施形態においては、第1の実施形態と同様にサプリメンタルシンタクスに多重化されたデータを利用することが可能である。
次に、図19Aを参照して本実施形態に係る画像復号化装置の構成を説明する。この画像復号化装置は、第2の実施形態で示した構成(図10A)と比較して、フレームメモリ114(及びループフィルタ113)の前段に画素ビット長拡張器2005を備え、予測画像作成器115の後段に画素ビット長縮小器(画素ビット精度変換器)2006を備える点が異なっている。
図19Bのフローチャートを参照して画像復号化装置の動作を説明する。画像復号化装置に図18Aの画像符号化装置によって符号化された符号化データ117が入力されると(S101)、エントロピー復号化器200において、符号化データ117がエントロピー符号化の逆の手順で復号化され、量子化直交変換係数情報107、動きベクトル/予測モード情報116、ビット拡張情報2004が得られる(S102)。量子化直交変換係数情報107は逆量子化器109及び逆直交変換器110により、量子化器106及び直交変換器104の処理と逆の処理を順次受けてNビット精度の残差信号201に変換される(S103)。エントロピー復号化器200から出力されたビット拡張情報2004は、ビット長変換制御器2002に入力されると、復号画像が何ビット拡張されているかを示すビット変換情報2003をビット長変換制御器2002から出力する(S104)。
動きベクトル/予測モード情報116が予測画像作成器115に入力されると、後述の手順でフレームメモリ114に格納されたビット拡張復号画像信号203から動きベクトル/予測モード情報116に基づく(N+M)ビット精度の拡張予測画像信号205が生成される(S105)。
画素ビット長縮小器2006は、(N+M)ビット精度の拡張予測画像信号205に対し、ビット変換情報2003に基づいて、例えば数式(2)などの第1の実施形態の画像復号化装置における画素ビット縮小変換器と同等の処理を施すことによって画素ビット長をMビット縮小変換する処理を行い(S106)、Nビット精度の予測画像信号102を出力する。画素ビット長縮小器2006は、図8の構成とし、実施の形態1と同様に各画素のビット長を拡張するかどうかをフラグで切り替えてビット長を制御する処理を行ってもよい。
Nビット精度の残差信号201とNビット精度の予測画像信号102は加算器111によって加算され、縮小復号画像信号が生成される(S107)。縮小復号画像信号は画素ビット長拡張器2005に入力されると、画素ビット長拡張器2005は、ビット変換情報2003に基づいて、例えば数式(1)などの第1の実施形態の画像符号化装置における画素ビット長拡張器で行われる処理と同等の処理を施すことによって画素ビット長をMビット拡張する処理を行う(S108)。画素ビット長拡張器2005から出力された信号は、ループフィルタ113で必要に応じてフィルタ処理がなされ、ビット(N+M)ビット精度の拡張復号画像信号203が出力され(S109)、フレームメモリ114に格納される。画素ビット長拡張器2005は、図2の構成とし、第1の実施形態と同様に各画素のビット長を拡張するかどうかをフラグで切り替えてビット長を制御する処理を行ってもよい。
(N+M)ビット精度のビット拡張復号画像信号203は、画素ビット長縮小器2001に入力され、ビット変換情報2003に基づいて各画素の値に対し例えば数式(2)などの第1の実施形態の画像復号化装置における画素ビット縮小変換器と同等の処理を施されることにより、画像符号化装置に入力された入力画像と同じNビット精度の復号画像202を得る(S110)(S111)。
以上の構成によれば、予測画像信号が入力画像信号よりMビット大きな精度をもって作成されるため、動き補償のフィルタやループフィルタ、画面内予測など精度を高めることができる。従って、結果的に予測誤差信号を小さくすることができるため、符号化効率を向上させることができる。また、第1〜3の実施形態と異なり、予測誤差信号および残差信号の変換・量子化の処理を入力画像のビット精度に対応した精度で行うことが可能となり、動き補償のフィルタやループフィルタ、画面内予測など精度を高める効果を保ったまま、変換・量子化のビット精度を削減し、演算規模を小さくすることが可能となる。
(第5の実施形態)
図20Aを参照して第5の実施形態に係る動画像符号化のための画像符号化装置の構成を説明する。この画像符号化装置は、第2の実施形態で示した構成例(図9)と比較して、入力画像に対し画素ビット長を拡大する画素ビット長拡張器を備えず、予測画像作成器115の前段に画素ビット長拡張器(画素ビット精度拡張変換器)1001を備え、予測画像作成器115の後段に画素ビット長縮小器(画素ビット精度縮小変換器)1004を備える点が異なっている。
図20Bのフローチャートを参照して画像符号化装置の動作を説明する。この画像符号化装置には、入力画像信号100として例えばフレーム単位で各画素の精度が例えばNビット精度の動画像信号が入力される(S121)。減算器101により入力画像信号100とNビット精度の予測画像信号102との差分がとられ、Nビット精度の予測誤差信号103が生成される(S122)。Nビット精度の予測画像信号102の生成方法については後述する。生成された予測誤差信号103に対して、直交変換器104により直交変換、例えば離散コサイン変換(DCT)が施され、直交変換器104では直交変換係数情報105、例えばDCT係数情報が得られる(S123)。直交変換係数情報105は量子化器106により量子化され、量子化直交変換係数情報107は、エントロピー符号化器108および逆量子化器109に導かれる。
量子化直交変換係数情報107は、逆量子化器109及び逆直交変換器110により、量子化器106及び直交変換器104の処理と逆の処理を順次受けて局部復号誤差信号に変換される。この局部復号誤差信号は加算器111でNビット精度の予測画像信号102と加算されることにより、Nビット精度の局部復号画像信号112が生成される(S124)。
Nビット精度の局部復号画像信号112は、必要に応じてループフィルタ113によりフィルタ処理がなされた後、フレームメモリ114に格納される(S125)。フレームメモリ114に格納されたNビット精度の局部復号画像信号112は、画素ビット長拡張器1001に入力され、各画素の値をMビット大きな値に拡張変換する(S126)。例えば、ビット拡張復号画像信号のある画素の値がKであった場合、Mビット縮小した後の画素値K’は第1の実施形態の数式(1)と同様に計算される。ビット精度が(N+M)ビットに拡張された局部復号画像信号112は、予測画像作成器115に入力される。画素ビット長拡張器1001は、図2の構成とし、実施の形態1と同様に各画素のビット長を拡張するかどうかをフラグで切り替えてビット長を制御する処理を行ってもよい。
予測画像作成器115は、(N+M)ビット精度の局部復号画像信号112からある予測モード情報に基づく(N+M)ビット精度の予測画像信号を生成する。この際、フレーム内のブロック毎に入力画像信号100の各画素を(N+M)ビット精度に拡張したものと、(N+M)ビット精度に拡大された局部復号画像信号112との間のマッチング(例えば、ブロックマッチング)をとり、動きベクトルを検出する(S127)。この動きベクトルで補償された(N+M)ビット精度の局部画像信号を用いて(N+M)ビット精度の拡張予測画像信号117を作成する(S128)。ここで生成された(N+M)ビット精度の拡張予測画像信号117は、選択された予測画像信号の動きベクトル情報/予測モード情報116とともに予測画像作成器115より出力される。
拡張予測画像信号117は、画素ビット長縮小器1004に入力され、各画素のビット長がMビット小さくなるよう変換が施される(S129)。この変換は、例えば第1の実施形態の画像復号化器で示した数式(2)と同様の処理を施すことで行われる。ここで、縮小されるビット数M、および画素ビット長拡張器1001において拡大されるビット数Mは、ともに同じ値であり、ビット長変換制御器1002によりビット拡張情報1003としてエントロピー符号化器108に導かれる。画素ビット長縮小器1004は、図8の構成とし、実施の形態1と同様に各画素のビット長を拡張するかどうかをフラグで切り替えて制御する処理を行ってもよい。
エントロピー符号化器108では、量子化直交変換係数情報107、動きベクトル情報/予測モード情報116およびビット拡張情報1003がエントロピー符号化され(S130)、これによって生成された符号化データ117は、図示しない伝送系または蓄積系へ送出される。
拡張するビット数Mの符号化方法は、第1の実施形態と同様である。本実施形態においては、第1の実施形態と同様にサプリメンタルシンタクスに多重化されたデータを利用することが可能である。
次に、図21Aを参照して本実施形態に係る画像復号化装置の構成を説明する。この画像復号化装置は、第2の実施形態で示した構成例(図10)と比較して、加算器111(及びループフィルタ113)の後段に画素ビット縮小器を備えず、加算器111(及びループフィルタ113)から復号画像信号202が出力されるとともに、予測画像作成器115の前段に画素ビット長拡張器(画素ビット精度拡張変換器)2005を備え、予測画像作成器115の後段に画素ビット長縮小器(画素ビット精度縮小変換器)2001を備える点が異なっている。
図21Bのフローチャートを参照して画像復号化装置の動作を説明する。画像復号化装置に図20Aの画像符号化装置によって符号化された符号化データ117が入力されると(S141)、エントロピー復号化器200において、符号化データ117がエントロピー符号化の逆の手順で復号化され、量子化直交変換係数情報107、動きベクトル/予測モード情報116、ビット拡張情報2004が得られる(S142)。量子化直交変換係数情報107は逆量子化器109及び逆直交変換器110により、量子化器106及び直交変換器104の処理と逆の処理を順次受けてNビット精度の残差信号201に変換される(S143)。エントロピー復号化器200から出力されたビット拡張情報2004が、ビット長変換制御器2002に入力されると、復号画像が何ビット拡張されているかを示すビット変換情報2003をビット長変換制御器2002から出力する(S144)。
画素ビット長拡張器2005は、後述の手順でフレームメモリ114に格納されたNビット精度の復号画像信号202に対し、ビット変換情報2003に基づいて、例えば数式(1)などの第1の実施形態の画像符号化装置における画素ビット長拡張器で行われる処理と同等の処理を施すことによって画素ビット長をMビット拡張変換する処理を行い、(N+M)ビット精度のビット拡張参照画像信号204を出力する。画素ビット長拡張器2005は、図2の構成とし、実施の形態1と同様に各画素のビット長を拡張するかどうかをフラグで切り替えて制御する処理を行ってもよい。
動きベクトル/予測モード情報116は予測画像作成器115に入力され、上記(N+M)ビット精度のビット拡張参照画像信号204から動きベクトル/予測モード情報116に基づく(N+M)ビット精度の拡張予測画像信号205が生成される(S145)。画素ビット長縮小器2001は、(N+M)ビット精度の拡張予測画像信号205に対し、ビット変換情報2003に基づいて、例えば数式(2)などの第1の実施形態の画像復号化装置における画素ビット縮小変換器と同等の処理を施すことによって画素ビット長をMビット縮小変換する処理を行い、Nビット精度の予測画像信号102を出力する(S146)。画素ビット長縮小器2001は、図8の構成とし、実施の形態1と同様に各画素のビット長を拡張するかどうかをフラグで切り替えて制御する処理を行ってもよい。
Nビット精度の残差信号201とNビット精度の予測画像信号102は加算器111によって加算される。加算された信号は、ループフィルタ113で必要に応じてフィルタ処理がなされ、Nビット精度の復号画像信号202が出力され(S147)、フレームメモリ114に格納される。ここで得られる復号画像信号202は、画像符号化装置に入力された入力画像と同じNビット精度となる。
以上の構成によれば、予測画像信号が入力画像信号よりMビット大きな精度をもって作成されるため、動き補償のフィルタやループフィルタ、画面内予測など精度を高めることができる。従って、結果的に予測誤差信号を小さくすることができるため、符号化効率を向上させることができる。また、フレームメモリに格納される参照画像信号を、ビット長が拡張された入力画像信号や予測画像信号より小さなビット長で格納することができる。故に、動き補償のフィルタやループフィルタ、画面内予測など精度を高める効果を保ったまま、フレームメモリの使用量を削減することが可能となる。さらに、予測誤差信号および残差信号の変換・量子化の処理を入力画像のビット精度に対応した精度で行うことが可能となる。これにより、動き補償のフィルタやループフィルタ、画面内予測など精度を高める効果を保ったまま、変換・量子化のビット精度を削減し、演算規模を小さくすることが可能となる。
第2から第5の実施形態においては、予測画像作成器115を図22のような構成とすることも可能である。図22に示すエンコーダ側の予測画像作成器115によると、フレーム内予測器B101は、フレームメモリ114内のフレーム内で既に符号化された領域の局部復号画像信号112からフレーム内予測に基づく予測画像信号を作成する。一方、フレーム間予測器B103は、動きベクトル検出器B102で検出された動きベクトルに基づいてフレームメモリ114内の局部復号画像信号112に対して動き補償を施す。適応フィルタ情報生成部B104で入力画像信号101と局部復号画像信号112と動きベクトルから生成された適応フィルタ情報を用いたフレーム間予測に基づく予測画像信号102を作成する。
フレーム内予測器B101はM個(Mは複数)のフレーム内予測モードを有し、フレーム間予測器B103はN個(Nは複数)のフレーム間予測モードを有する。フレーム間予測器B103及びフレーム内予測器B101の出力に、モード判定器B105が接続される。モード判定器B105は、N個のフレーム間予測モードから選択された一つの予測モードに基づく予測画像信号、あるいはM個のフレーム内予測モードから選択された一つの予測モードに基づく予測画像信号102を出力する。
動きベクトル/予測モード情報/適応フィルタ情報116、すなわち動きベクトル検出器B102から出力される動きベクトルとモード判定器によって選択された予測モードを示す予測モード情報と適応フィルタ情報116は、エントロピー符号化器117に送られ、符号化データ117に含めて復号側に送信される。動きベクトルと適応フィルタ情報は、フレーム間予測モードが選択された場合にのみ動きベクトル検出器B102から出力される。
図23を参照してデコーダ側の予測画像作成器115を説明する。この予測画像作成器115によると、切り替え器B201は、予測モード情報116に基づき予測器を選択する。フレーム内予測器B202は、選択された場合、フレームメモリ114内のフレーム内で既に符号化された領域の復号画像信号203からフレーム内予測に基づく予測画像信号102を作成する。一方、フレーム間予測器B203は、選択された場合、動きベクトルに基づいてフレームメモリ114内の復号画像信号203に対して動き補償を施し、適応フィルタ情報116を用いたフレーム間予測に基づく予測画像信号102を作成する。
図24は、フレーム間予測器B103の構成例を示している。フレーム間予測器B103では、動きベクトルと局部復号画像信号と適応フィルタ係数情報からフレーム間予測画像信号102を生成する。整数画素重み/オフセット補正部B301では、整数画素値のいわゆる重みつき予測を行うための処理を行う。具体例としては、以下の数式(7)にしたがって、整数画素の予測画像信号102を作成する。
Y=(W×X+(1<<(L−1))>>L)+O (7)
ここで、Wが重み係数、Lはシフト係数、Oはオフセット係数で、適応フィルタ係数情報に含まれるものである。画素値Xに対して数式(7)に基づく処理を行いYの値に変換することにより、輝度の補正や色の補正が可能となる。
数式(8)は、双方向予測を行う場合の重み/オフセット処理の例である。
Y=(W×X+W×X +(1<<(L−1))>>L)+((O+O)>>1)
(8)
ここで、画素値Xに対する重み係数がW、オフセット係数がO、画素値Xに対する重み係数がW、オフセット係数がO、Lはシフト係数で、適応フィルタ係数情報に含まれるものである。画素値X、Xに対して数式B2の処理を行いYの値に変換することにより、輝度の補正や色の補正が可能となる。
適応フィルタ情報116により、重み/オフセット補正処理を行う必要がない場合は、スイッチB301を切り替えて、小数点画素適応補間画像を作成する。
本発明では、入力画像信号の画素ビット長よりも符号化/復号化処理のビット長が長く設定されるため、重み/オフセット補正処理の計算精度が確保でき、より精度の高い重み/オフセット補正を行うことが可能となる。
小数画素適応補間画像作成部B303では、動きベクトルが、小数点画素位置を示していた場合、適応フィルタ情報の中の補間フィルタ係数を用いて、整数画素値から、小数点画素位置の補間画素値を生成し、予測画像信号102を生成する。この処理に関しても、本発明では、入力画像信号の画素ビット長よりも符号化/復号化処理のビット長が長く設定されるため、補間フィルタ処理の計算精度が確保でき、より良い小数点画素値を得ることが可能となる。
図25は、フレーム間予測器B103の別の構成例を示している。同様にこのフレーム間予測器では、動きベクトルと局部復号画像信号と適応フィルタ係数情報からフレーム間予測画像信号102を生成する。小数画素適応補間画像作成部B401では、動きベクトルが、小数点画素位置を示していた場合、適応フィルタ情報の中の補間フィルタ係数を用いて、整数画素値から、小数点画素位置の補間画素値を生成し、予測画像信号102を生成する。
本実施形態では、入力画像信号の画素ビット長よりも符号化/復号化処理のビット長が長く設定されるため、補間フィルタ処理の計算精度が確保でき、より良い小数点画素値を得ることが可能となる。
重み/オフセット補正部B403では、予測画像信号の画素値のいわゆる重みつき予測を行うための処理を行う。具体的な例としては、上記の数式(7)あるいは数式(8)にしたがって、予測画像信号102を作成する。
本実施形態では、入力画像信号の画素ビット長よりも符号化/復号化処理のビット長が長く設定されるため、重み/オフセット補正処理の計算精度が確保でき、より精度の高い重み/オフセット補正を行うことが可能となる。
図26は、フレーム間予測器の別の構成例を示している。このフレーム間予測器では、動きベクトルと再生画像信号と適応フィルタ係数情報からフレーム間予測画像信号を生成する。これによると、動きベクトルが小数点画素位置を示していた場合、スイッチB501は小数画素適応補間/オフセット補正画像作成部B502に接続され、再生画像信号は小数画素適応補間/オフセット補正画像作成部B502によって処理される。整数画素を示していた場合、スイッチB501は整数画素重み/オフセット補正画像作成部B503に接続され、再生画像信号は整数画素重み/オフセット補正画像作成部B503によって処理される。
小数画素適応補間/オフセット補正画像作成部B502では、動きベクトルが、小数点画素位置を示していた場合、適応フィルタ情報の中の補間フィルタ係数とオフセット補正係数を用いて、整数画素値から、小数点画素位置の補間画素値を生成し、予測画像信号を生成する。具体的な例として、下記の片方予測を行う場合は、数式(9)、双方向予測を行う場合は、数式(10)を用いる。
Figure 2012191642
ここで、再生画像信号Xi,jに対するWi,j が、補間フィルタ係数、Oがオフセット係数、Yが予測画像信号である。
Figure 2012191642
ここで、再生画像信号X(0)i,j に対するW(0)i,j は、補間フィルタ係数、O(0) がオフセット係数、再生画像信号X(1)i,j に対するW(1)i,j は、補間フィルタ係数、O(1) がオフセット係数、Yが予測画像信号である。
整数画素重み/オフセット補正部B503では、予測画像信号の画素値のいわゆる重みつき予測を行うための処理を行う。具体的な例としては、上記の数式(7)あるいは数式(8)にしたがって、予測画像信号を作成する。この時のオフセット補正係数は、入力画素ビット長以上の精度の係数を用いる。
本実施形態では、入力画像信号の画素ビット長よりも符号化/復号化処理の演算ビット長が長く設定されるため、補間フィルタ処理の計算精度が確保でき、より良い予測画素値を得ることが可能となる。
本実施形態では、入力画像信号の画素ビット長よりも符号化/復号化処理のビット長が長く設定されるため、重み/オフセット補正処理の計算精度が確保でき、より精度の高い重み/オフセット補正を行うことが可能となる。
(適応ループフィルタ)
第2から第5の実施形態においては、ループフィルタ113を図27のような構成とすることも可能である。
図27はエンコーダ側のループフィルタ113の構成を示している。フィルタ係数決定部C101は、入力画像信号101および局部復号画像信号112を入力信号とし、局部復号画像信号112に対してフィルタ処理を施した際に例えば入力画像信号101と最小2乗誤差が最も小さくなるようなフィルタ係数を算出し、算出されたフィルタ係数をフィルタ処理部C102に出力するとともに、フィルタ係数情報C103としてエントロピー符号化部108に出力する。ここでのフィルタ係数の決定方法については、この例に限るものではなく、例えばデブロッキングフィルタとデリンギングフィルタなどの複数のフィルタをあらかじめ用意しておき、それらを適応的に切り替え、選択されたフィルタをフィルタ係数情報C103として出力してもよく、あるいは各フィルタを適用するかどうかを適応的に判定するなどの処理を行ってもよく、様々な態様を適用することが可能である。入力される入力画像信号101は、各実施の形態に応じて、ループフィルタに入力される局部画像復号信号112と同じ画素ビット長とした信号を用いる。
フィルタ処理部C102では、フィルタ係数決定部C101より入力されたフィルタ係数を用いて局部復号画像信号の各画素に対してフィルタ処理を施した後、フレームメモリ114等に出力する。
エントロピー符号化部108に出力されたフィルタ係数情報103はエントロピー符号化部108にてエントロピー符号化され、符号化データ117に含められて送信される。
図28は復号側のループフィルタ113の構成例を示している。エントロピー復号化部200より出力されたフィルタ係数情報C103を基にフィルタ処理部C102において復号画像信号の各画素に対してフィルタ処理を施す。フィルタ処理が行われた復号画像信号は各々の実施の形態に応じて、フレームメモリ114や画素ビット長縮小器に出力されるか、あるいは復号画像信号としてそのまま出力される。
以上の構成によれば、入力画像信号の画素ビット長よりも符号化/復号化処理のビット長が長く設定されるため、ループフィルタ113内で行われるフィルタ処理の計算精度が確保でき、より精度の高いループフィルタ処理を行うことが可能となる。
(プレフィルタを含む構成)
第1から第3の実施形態において、入力画像信号101の画素ビット長を変換する画素ビット長拡張器1001を図29のような構成とすることも可能である。この構成では、画素ビット長拡張器1001に入力された入力画像信号は、第1の実施形態と同様の手順で各画素のビット長をNビットよりMビット大きな(N+M)ビット精度に拡張する処理を行った後、フィルタ処理部7000に導かれ、各画素に対してフィルタ処理が行われる。ここで行われるフィルタ処理は、例えばフレーム内の隣接画素にフィルタ係数を掛けた後足し合わせるような空間フィルタを用いる。空間フィルタとして、例えばイプシロンフィルタを用いたフィルタ処理部7000が図30に示されている。
このフィルタ処理部7000によると、入力画素値をP[t],出力画素値をQ[t]とすると,tを画素の位置を示している。tの位置の画素にフィルタをかける場合には,入力画素値P[t]と一時メモリA04に蓄えてあったその一つ手前の出力画素値Q[t−1]とを加算器A01に入力し,差分dが求められる。この差分dでルックアップテーブルA02を引き,F(d)が決定される。この値F(d)を加算器A03に入力して,入力画素値P[t]から引く。この動作を数式で示すと次のようになる。
Q[t] = P[t] − F(P[t]− Q[t-1]) (11)
関数Fは式(12)によって表され,(int)は,0方向への整数化処理とする。
F(d)= (int)(d/(d×d/(u×u)+1.0) (12)
d= P[t] − Q[t-1] (13)
ルックアップテーブルA02の中身は,関数Fで計算される値が予めテーブルとして記憶しておけばよい。例えば,画素値がnビットならば,dの値は,−2+1〜+2−1となって,ルックアップテーブルは,2n+1−1個の配列を用意しておけばよい。ここで,uはフィルタのパラメータで,uが大きいほど強くフィルタがかかる。このフィルタの演算量は,1画素のフィルタ処理に加算2回のみである。
図31は,図30のフィルタを使ったフィルタ処理部7000の具体的な流れ図である。このフィルタ処理部7000では,フレームの4方向からフィルタ処理を行う。まず,フレームの右から左のポストフィルタ処理(S101)を行う。次は,反対方向の左から右のポストフィルタ処理(S102)を行う。同様に今度は,上から下のポストフィルタ処理(S103)を行い,次に反対方向の下からの上のポストフィルタ処理を行う。この処理をYCbCrそれぞれの信号に対して行う。このように互いに反対方向からフィルタ処理を行うことによって,巡回型フィルタの欠点である位相のずれを打ち消すことができる。
また、フィルタ処理として、複数のフレームの対応する画素に対してフィルタ係数を掛けた後足し合わせるような時間フィルタを用いてもよい。また、動き補償を伴う時間フィルタを施してもよい。動き補償を伴う時間フィルタは、例えば、特願2006−36206などに記載されている方法を用いる。
本構成におけるフィルタ処理はここで述べたフィルタ処理に限るわけではなく、フィルタ処理であればどのような処理を行ってもよい。また、第4および第5実施の形態については、入力画像信号101は画素ビット長が変換されずに符号化が行われるが、入力画像信号101に直接、ここで述べたプレフィルタ処理を施してから符号化を行ってもよい。
(ポストフィルタを含む構成)
第1から第5の実施形態において、画素ビット長縮小器2001および2007を図32のような構成とすることも可能である。この構成では、画素ビット長拡張器2001および2007に入力されたビット拡張復号画像信号2003は、フィルタ処理部7001に入力され、各画素に対してフィルタ処理が行われた後、第1の実施形態1と同様の手順で各画素のビット長を(N+M)ビットよりMビット小さなNビット精度に縮小処理が行われ、Nビットの復号画像信号として出力される。ここで行われるフィルタ処理は、例えばフレーム内の隣接画素にフィルタ係数を掛けた後足し合わせるような空間フィルタを用いてもよいし、複数のフレームの対応する画素に対してフィルタ係数を掛けた後足し合わせるような時間フィルタを用いてもよい。
(可逆フィルタの構成)
本構成では、上記の画素ビット長拡張器1001をフィルタ処理を行う構成と組み合わせ、画素ビット長拡張器1001内のフィルタ処理部7000で行われるフィルタ処理の逆フィルタ処理を画素ビット長縮小器2001内のフィルタ処理部で行うことも可能である。例えば、フィルタ処理部7000において、入力画素値として2フレーム間で対応する2点の画素値をそれぞれx, yとして、対応する出力画素値をa, bとした場合に数式(14)に示す処理を施す。
a = (3x+y+2)>>2
b = (x+3y+2)>>2 (14)
数式(14)の処理は2ビットの右シフトによる除算処理を行っているが、例えば画素ビット長拡張器1001において2ビット左シフトによる画素ビット拡張を行っている場合、数式A4で示されるフィルタ処理では丸め誤差が生じず、入力画像の情報を失わずにすむ。
一方、復号側のフィルタ処理部7001において、入力画素として復号画像信号の2フレーム間で対応する2点の画素値をa’, b’とし、対応する出力画素値をx’, y’とした場合に数式(15)に示す処理を施す。
x’ = (3a’-b’ +4)>>3
y’ = (3b’-a’’+4)>>3 (15)
数式(15)の処理は3ビットの右シフトによる除算処理を行っているが、例えば画素ビット長拡張器1001において2ビット左シフトによる画素ビット拡張を行っている場合、数式(14)で示されるフィルタ処理と同様に丸め誤差が発生しない。即ち、符号化と復号化の処理によって生じる量子化誤差が0と仮定すると、数式(14)および数式(15)によるフィルタと逆フィルタは、可逆なフィルタとなる。数式(14)は2フレーム間の対応する2点の画素値をそれぞれ近づける処理を行うため、動き補償が予測をよりあたりやすく、予測残差が小さくなる。従って符号量を削減することが可能となる。さらに、画素ビット拡張をおこなっていることにより、量子化誤差を除けば復号側で元の入力画像に戻すフィルタ処理を行うことが可能となるため、符号化効率を高めることが可能である。
フィルタ処理部7000および7001において用いるフィルタはここで述べた例に限定されるものではなく、どのようなフィルタを用いてもよい。もちろん、画素ビット拡張部1001において拡張されるビット数Mに応じた可逆フィルタを用いることでさらに予測などの精度を高めることが可能であることは言うまでもない。また、ここで述べた例では2フレーム間で対応する2点をフィルタ処理の対象としたが、この例に限定されるものではなく、例えば2フレーム以上のフレームの画素を用いてもよい。また、1フレーム内の隣接する2点や2点以上の複数の点の画素をフィルタ処理の対象としてもよい。更に、インタレース画像においてトップフィールドとボトムフィールドの対応する2点の画素値をフィルタ処理の対象とするなど、様々な形態のフィルタ処理を用いることが可能である。
フィルタ処理部7000および7001において用いた可逆フィルタの係数をエントロピー符号化部108に出力し、符号化データ117に含めることも可能である。このようにすることで、フレームごとに予測などの精度を高める効果が高いフィルタ係数を選択して符号化を行うことができる。
(第6の実施形態)
図33Aを参照して第6の実施形態に係る動画像符号化のための画像符号化装置の構成を説明する。
この画像符号化装置は、第2の実施形態で示した構成例(図9)とほぼ同様の構成であるが、画素ビット長拡張器1001の後段に透かし情報埋め込み器3000を備える点が異なっている。
図33Bのフローチャートを参照して画像符号化装置の動作を説明する。この画像符号化装置には、画像信号100として例えばフレーム単位で動画像信号が入力される(S151)。画素ビット長拡張器(画素ビット精度変換器)1001は、第2の実施形態と同様の処理を行うことにより、入力されたNビット精度の画像信号100の各画素の値について、NビットよりMビット大きな(N+M)ビット精度に拡張する処理を行う(S152)。拡張されたビット数Mは、ビット長変換制御器(ビット精度変換制御器)1002によりビット拡張情報1003としてエントロピー符号化器108に導かれる。
ビット長が拡張された入力画像信号100は透かしデータ埋め込み器3000に入力されると、あらかじめ設定されたパラメータに基づいて生成されたデータ列が入力画像信号100の各画素の例えば下位ビットに埋め込まれる(S153)。ここで、生成されたデータ列は拡張されたビット長であるMビット以下の語長とする。
データ列が埋め込まれた入力画像100は減算器101に導かれると、減算器101により、(N+M)ビット精度にビット長が拡張された入力画像信号100と(N+M)ビット精度で作成された予測画像信号102との差分が求められる。これにより、(N+M)ビット精度の予測誤差信号103が生成される(S154)。生成された予測誤差信号103に対して、直交変換器104により直交変換(例えば、離散コサイン変換(DCT))が施され、直交変換器104では、直交変換係数情報105(例えば、DCT係数情報)が得られる(S155)。直交変換係数情報105は、量子化器106により量子化され、量子化直交変換係数情報107が、エントロピー符号化器108および逆量子化器109に導かれる。
量子化直交変換係数情報107は、逆量子化器109及び逆直交変換器110により、量子化器106及び直交変換器104の処理と逆の処理を順次受けて予測誤差信号と同様の信号、即ち局部復号誤差信号が生成される。この局部復号誤差信号が、加算器111で(N+M)ビット精度の予測画像信号102と加算されることにより、(N+M)ビット精度の局部復号画像信号112が生成される(S156)。(N+M)ビット精度の局部復号画像信号112は、必要に応じてループフィルタ113によりフィルタ処理がなされた後、フレームメモリ114に格納される。フレームメモリ114に格納された局部復号画像信号112は、予測画像作成器115に入力される。
予測画像作成器115は、(N+M)ビット精度にビット長が拡張された入力画像信号100及び(N+M)ビット精度の局部復号画像信号112からある予測モード情報に基づく(N+M)ビット精度の予測画像信号を生成する。この際、フレーム内のブロック毎に(N+M)ビット精度の入力画像信号100と画素ビット長変換器1005によって(N+M)ビット精度に拡大された局部復号画像信号112との間のマッチング(例えば、ブロックマッチング)をとり、動きベクトルを検出する(S157)。この動きベクトルで補償された(N+M)ビット精度の局部画像信号を用いて(N+M)ビット精度の予測画像信号を作成する(S157)。ここで生成された(N+M)ビット精度の予測画像信号102は、選択された予測画像信号の動きベクトル情報/予測モード情報116とともに予測画像作成器115より出力される。
エントロピー符号化器108では、量子化直交変換係数情報107、動きベクトル情報/予測モード情報116およびビット拡張情報1003がエントロピー符号化され(S159)、これによって生成された符号化データ117は、図示しない伝送系または蓄積系へ送出される。
本実施形態においては、第1の実施形態と同様にサプリメンタルシンタクスに多重化されたデータを利用することが可能である。
次に、図34Aを参照して、本実施形態に係る画像復号化装置の構成を説明する。この画像復号化装置は、第2の実施形態で示した構成例(図10)とほぼ同様の構成であるが、ループフィルタ113と画素ビット長縮小器2001(画素ビット精度変換器)の間に透かし検出器3002が接続されている点が異なる。
図34Bのフローチャートを参照して画像復号化装置の動作を説明する。画像復号化装置に図11Aの画像符号化装置によって符号化された符号化データ117が入力されると(S161)、エントロピー復号化器200において、符号化データ117がエントロピー符号化の逆の手順で復号化され、量子化直交変換係数情報107、動きベクトル/予測モード情報116、ビット拡張情報2004が得られる(S162)。
量子化直交変換係数情報107は、逆量子化器109及び逆直交変換器110により、量子化器106及び直交変換器104の処理と逆の処理を順次受けて(N+M)ビット精度の残差信号201に変換される(S163)。エントロピー復号化器200から出力されたビット拡張情報2004は、ビット長変換制御器2002に入力された後、復号画像が何ビット拡張されているかを示すビット数Mを示すビット変換情報2003を出力する。
動きベクトル/予測モード情報116は予測画像作成器115に入力され、上記(N+M)ビット精度のビット拡張参照画像信号204から動きベクトル/予測モード情報116に基づく(N+M)ビット精度の予測画像信号102が生成される(S164)。(N+M)ビット精度の残差信号201と(N+M)ビット精度の予測画像信号102は、加算器111によって加算される。加算された信号は、ループフィルタ113で必要に応じてフィルタ処理がなされ、(N+M)ビット精度のビット拡張復号画像信号203が出力される(S165)。
ビット拡張復号画像信号203は、フレームメモリ114に格納されるとともに、すかし検出部3002に入力される。すかし検出部3002では、ビット拡張復号画像203の各画素の例えば下位ビットが埋め込まれた透かしデータであるかどうかの判定を行い、透かしデータを含むかどうかを示す透かし検出情報3003を出力する(S166)。透かしデータであるかどうかの判定は、例えばあらかじめ既知の透かしパターンと、ビット拡張復号画像203の例えば下位Mビットの相関係数を計算し、その値が一定の閾値以上であった場合は透かしデータであると判定するなどの方法を用いて行う。
ビット拡張復号画像信号203は、画素ビット長変換器2007に入力され、ビット変換情報2003に基づいて各画素の値に対し例えば数式(2)などの第1の実施形態の画像復号化装置における画素ビット長縮小器と同等の処理を施されることにより、Mビット小さな値に画素ビット長が縮小変換され(S167)、画像符号化装置に入力された入力画像と同じNビット精度の復号画像202を得る(S168)。
以上の構成によれば、予測画像信号が入力画像信号よりMビット大きな精度をもって作成されるため、動き補償のフィルタやループフィルタ、画面内予測など精度を高めることができる。結果的に予測誤差信号を小さくすることができるため、符号化効率を向上させることができる。また、拡張した下位ビットを利用して透かし情報を埋め込むことで、入力画像信号を変化させずに透かし情報を埋め込むことが可能となる。
第2〜6の実施形態において、拡張あるいは縮小を行うビット数Mはビット拡張情報としてエントロピー符号化されて符号化データに含められているが、画像符号化装置と画像復号化装置であらかじめ決まった数だけビット長を拡張あるいは縮小する場合には、必ずしもビット数Mを符号化データに含める必要はない。また、あらかじめ決まった数だけビット長を拡張あるいは縮小する場合には、拡張あるいは縮小を行うかどうかを示すフラグだけを符号化データに含めることも可能である。この場合、フラグがTRUEの場合には、第2〜第6の実施形態内の画素ビット長拡張器1001あるいは画素ビット長縮小器2001あるいは画素ビット長変換器2007においてスイッチがON側に接続される。一方、フラグがFALSEの場合には、スイッチがOFF側に接続される。
第2、第3の実施形態において局部復号画像信号をフレームメモリに格納する際に縮小するビット数Lについては、Mと同じ値である場合は必ずしもLを符号化データに含める必要はない。また、M、Lが同じ値であっても異なる値であっても、あらかじめ決まった数である場合には、必ずしもビット数M、Lを符号化データに含める必要はない。
入力画像や局部復号画像信号および復号画像の画素ビット長を拡張するということは、符号化・復号化の処理過程の整数演算の演算精度を向上させていることに等しい。処理過程の任意の箇所の演算精度を可変とし、それらの演算精度を示すフラグあるいは情報を符号化データに含めることも可能である。例えば、第2〜第5の実施形態を組み合わせ、符号化・復号化の処理過程において、フレームメモリに格納される画素ビット精度を拡張するか否かを示すフラグと、直交変換/量子化に入力される予測残差の画素ビット長を拡張するかどうか、すなわち直交変換/量子化の演算精度を拡張するか否かを示すフラグを符号化データに含めておく。これらのフラグのON/OFFに応じて,符号化装置および復号装置でフレームメモリに格納される画素ビット精度を拡張するか否かや、直交変換/量子化に入力される予測残差の画素ビット長を拡張するかどうかを切り替えてもよい。さらには、これらのフラグがONとなっている場合には、何ビット拡張/あるいは縮小するかを示すデータを符号化データに含めてもよい。また、これらの符号化・復号化の処理の一過程の演算精度を拡張するかどうかを示すフラグや拡張するビット数を示すデータは、ここで示したフレームメモリや直交変換・量子化だけを対象とするものではなく、例えばループフィルタに対するフラグや拡張ビット数を示すデータを追加してもよい。処理が符号化・復号化の処理過程の一部であれば、その処理、あるいは複数の処理を1つにまとめて、それぞれに対して演算精度を拡張するかどうかを示すフラグや拡張ビット数を示すデータを設定して符号化データに含めてもよい。
(第7の実施形態)
図35Aを参照して第7の実施形態の画像符号化装置の構成を説明する。この実施形態は基本的には図11の実施形態と同様な構成を持つが、予測画像作成部115と減算器101との間に画素ビット長縮小器(画素ビット精度縮小変換器)1004が設けられ、加算器111とループフィルタ112との間に画素ビット長拡張器(画素ビット精度拡張変換器)1007が設けられている点が図11の実施形態と異なっている。
図35Bのフローチャートを参照して画像符号化装置の動作を説明する。この画像符号化装置には、画像信号100として例えばフレーム単位で動画像信号が入力される(S171)。画素ビット長拡張器1001は図2の構成とし、ビット変換情報1010に含まれている後述のシンタクス情報に基づく制御フラグF1001に基づいて、入力されたNビット精度の画像信号100の各画素の値が、NビットよりMビット大きな(N+M)ビット精度に拡張するかどうかを判定する(S172)。ここで、制御フラグF1001がONの場合は、画素ビット長拡張器1001内のスイッチE0をONに設定し、局部復号画像信号112の各画素のビット長を、第1の実施形態における画素ビット長変換器1001で行われる処理と同様の処理によって拡張する(S173)。例えば、入力画像信号のある画素の値がKであった場合、Mビット拡張した後の画素値K’は例えば数式(1)や数式(1−1),(1−2),(1−3)などの処理によって計算される。
制御フラグF1001がOFFの場合には、スイッチE0がOFF側に接続され、各画素のビット長を拡張する処理は行わない。拡張されるビット数Mなどの変換情報は、ビット長変換制御器1002によりビット拡張情報1003としてエントロピー符号化器108に導かれる。
減算器101により、入力画像信号100と予測画像信号102との差分がとられ、予測残差信号103が生成される(S174)。生成された予測誤差信号103に対して、直交変換器104により直交変換(例えば、離散コサイン変換(DCT))が施され、直交変換器104では、直交変換係数情報105(例えば、DCT係数情報)が得られる(S175)。直交変換係数情報105は、量子化器106により量子化され、量子化直交変換係数情報107は、エントロピー符号化器108および逆量子化器109に導かれる。
量子化直交変換係数情報107は、逆量子化器109及び逆直交変換器110により、量子化器106及び直交変換器104の処理と逆の処理を順次受けて予測誤差信号と同様の信号、即ち局部復号誤差信号に変換される。この局部復号誤差信号は加算器111で予測画像信号102と加算されることにより、局部復号画像信号112が生成される(S176)。局部復号画像信号112は、画素ビット長拡張器1007に入力され、ビット変換情報1010に含まれている後述のシンタクス情報に基づく制御フラグF1007に基づいて、局部復号画像信号112の各画素のビット長を拡張するかどうかを判定する(S177)。制御フラグF1007がONの場合には、画素ビット長拡張器1007内のスイッチE0をONに設定し、局部復号画像信号112の各画素のビット長を、第4の実施形態における画素ビット長変換器1007で行われる処理と同様の処理によって拡張する(S178)。制御フラグF1007がOFFの場合には画素のビット長を拡張する処理は行わない。
画素ビット長拡張器1007から出力された局部復号画像信号112は必要に応じてループフィルタ113によりフィルタ処理がなされた後、画素ビット長変換器1005に入力される。画素ビット長変換器1005では、ビット変換情報1010に含まれている後述のシンタクス情報に基づく制御フラグF1005に基づいて、局部復号画像信号112の各画素のビット長を変換するかどうかを判定する(S179)。ここで、制御フラグF1005がONの場合には、画素ビット長拡張器1005内のスイッチE3をONに設定し、局部復号画像信号112の各画素のビット長を、第3の実施形態における画素ビット長変換器1005で行われる処理と同様の処理によって拡張する(S180)。制御フラグF1005がOFFの場合には画素のビット長を変換する処理は行わない。画素ビット長変換器1005から出力された局部画像信号112は、フレームメモリ114に格納される(S181)。フレームメモリ114に格納された局部画像信号は、さらに、画素ビット長変換器1006に入力される。画素ビット長変換器1006では、ビット変換情報1010に含まれている後述のシンタクス情報に基づく制御フラグF1006に基づいて、局部復号画像信号112の各画素のビット長を変換するかどうかを判定する(S182)。ここで、制御フラグF1006がONの場合には、画素ビット長拡張器1006内のスイッチE3をONに設定し、局部復号画像信号112の各画素のビット長を、第3の実施形態における画素ビット長変換器1006で行われる処理と同様の処理によって拡張する(S183)。制御フラグF1006がOFFの場合には画素のビット長を変換する処理は行わない。画素ビット長変換器1006から出力される局部復号画像信号112は、予測画像作成器115に入力される。
予測画像作成器115は、入力画像信号100及びフレームメモリ114に格納された局部復号画像信号112から、ある予測モード情報に基づく予測画像信号を生成する(S184)。この際、加算器111からの局部復号画像信号112はフレームメモリ114に一旦蓄えられ、フレーム内のブロック毎に入力画像信号100とフレームメモリ114に蓄えられた局部復号画像信号112との間のマッチング(例えば、ブロックマッチング)をとり、動きベクトルを検出し、この動きベクトルで補償された局部画像信号を用いて予測画像信号を作成する。ここで生成された予測画像信号102は、選択された予測画像信号の動きベクトル情報/予測モード情報116とともに予測画像作成器115より出力される。
予測画像信号作成器115から出力された予測画像信号102は画素ビット長縮小器1004に入力される。画素ビット長縮小器1004では、ビット変換情報1010に含まれている後述のシンタクス情報に基づく制御フラグF1004に基づいて、予測画像信号102の各画素のビット長を変換するかどうかを判定する(S185)。制御フラグF1004がONの場合には、画素ビット長拡張器1004内のスイッチE2をONに設定し、予測画像信号102の各画素のビット長を、第4の実施形態と同様の処理によって縮小する(S186)。制御フラグF1004がOFFの場合には画素のビット長を変換する処理は行わない。
エントロピー符号化器108では、量子化直交変換係数情報107、動きベクトル情報/予測モード情報116およびビット拡張情報1003がエントロピー符号化され(S187)、これによって生成された符号化データ117は、図示しない伝送系または蓄積系へ送出される。
次に、ビット長の拡張・縮小・変換を行うかどうかを制御する制御フラグの符号化方法について説明する。
本実施形態では、ビット長の拡張・縮小・変換を行うかどうかを制御する制御フラグや拡張するビット数をシーケンスパラメータセットシンタクス(404)に含めて送信することが可能である。それぞれのシンタクスを以下で説明する。
図36のシーケンスパラメータセットシンタクス内に示されるex_seq_all_bit_extention_flagは、ビット拡張を行うかどうかを示すフラグであり、当該フラグがTRUEであるときは、符号化および復号化の内部のデータパスすべてにおいて、各画素のビット長が拡張されたデータを用いて符号化および復号化を行うことを示す。フラグがFALSEであるときは、このフラグは、符号化および復号化の内部のデータパスのすべてにおいて各画素のビット長が拡張された画像信号を用いて符号化・復号化を行わないか、一部のデータパスでのみ、各画素のビット長が拡張された画像信号を用いて符号化・復号化が行われることをしめす。ex_seq_bit_extention_flagがTRUEのときは、更に何ビット拡張を行うかを示すex_seq_shift_bitsをさらに送信してもよい。
ex_seq_all_bit_extention_flagがFALSEのときには、さらに符号化および復号化内部における、予測画像作成部に入力される画像信号の画素ビット長を拡張するかどうかを示すフラグeex_seq_partial_bit_extention_flagをさらに送信してもよい。当該フラグがTRUEの場合は、符号化・復号化内部処理における、予測画像作成時に各画素のビット長が拡張された画像信号を用いることを示す。一方、フラグがFALSEであるときは、このフラグは、符号化および復号化の内部のデータパスのすべてにおいて各画素のビット長が拡張された画像信号を用いないことを示す。ex_seq_partial_bit_extention_flagがTRUEのときには、さらに、予測画像作成部112に入力される画像信号の画素ビット長を、入力画像信号の画素ビット長と比較して何ビット大きく拡張するかを示すex_seq_partial_shift_bitsを送信してもよい。
ex_seq_partial_bit_extention_flagがTRUEのときには、さらに符号化・復号化内部のデータパスのある一部分で各画素のビット長が拡張された画像信号を用いるかを示すフラグを送信してもよい。図36に示した例では、フレームメモリ114に格納する参照画像信号の画素ビット長を拡張するかどうかを示すフラグex_seq_framemem_bit_extention_flag、および直交変換部と量子化部(直交変換器104、量子化器106、逆量子化器109および逆直交変換器110)に入力あるいは出力される予測残差信号の画素ビット長を拡張するかどうかを示すフラグex_seq_trans_and_quant_bit_extention_flagを送信している。
ex_seq_framemem_bit_extention_flagがTRUEの場合には、このフラグはフレームメモリに格納する参照画像信号の画素ビット長を拡張することを示す。フラグがFALSEの場合には、それはフレームメモリに格納する参照画像信号の画素ビット長を入力画像と同じ画素ビット長とすることを示す。ex_seq_framemem_bit_extention_flagがTRUEの場合にはさらに、フレームメモリに格納される画像信号の画素ビット長を、入力画像信号の画素ビット長と比較して何ビット大きく拡張するかを示すex_seq_framemem_shift_bitsを送信してもよい。
ex_seq_trans_and_quant_bit_extention_flagがTRUEの場合には、このフラグは直交変換部と量子化部(直交変換器104、量子化器106、逆量子化器109および逆直交変換器110)に入力あるいは出力される予測残差信号の画素ビット長が拡張されていることを示す。すなわち、入力画像信号と予測画像信号の各画素のビット長が拡張されており、予測残差信号は、各画素のビット長が拡張された入力画像信号と予測画像信号の差分信号であることを示している。
当該フラグがFALSEの場合には、このフラグは直交変換部と量子化部(直交変換器104、量子化器106、逆量子化器109および逆直交変換器110)に入力あるいは出力される予測残差信号が入力画像信号と同じビット精度の予測画像信号と入力画像信号の差分信号であることを示す。
ex_seq_trans_and_quant_bit_extention_flagがTRUEの場合にはさらに、直交変換部と量子化部(直交変換器104、量子化器106、逆量子化器109および逆直交変換器110)に入力あるいは出力される予測残差信号の生成時における、入力画像信号と予測画像信号の画素ビット長が、入力画像信号の画素ビット長と比較して何ビット大きく拡張するかを示すex_seq_trans_and_quant_shift_bitsを送信してもよい。
符号化側と復号化側において、各フラグがTRUEであった場合に、何ビット拡張あるいは縮小するかをあらかじめ設定されたビット数で行う場合には、図37に示すとおり、画像信号の画素ビット長を変換するかどうかを示すフラグのみを送信してもよい。
これらのシンタクスの値を元に、図35で示した画像符号化装置の処理において使用される制御フラグF1001、F1007、F1005、F1006、F1004の設定例を図38に示す。図38において、allの列はex_seq_all_bit_extention_flagの値を示している。同様に、part、fm、t/q、の列はex_seq_partial_bit_extention_flag、ex_seq_framemem_bit_extention_flag、ex_seq_trans_and_quant_bit_extention_flagの値をそれぞれ示している。0はFALSEを、1はTRUEを示し、−はシンタクスが存在しないことを示している。制御フラグのF1001,F1007,F1005,F1006,F1004は列はそれぞれのシンタクスの値に基づいて設定される制御フラグの値を示している。1はONを0はOFFを示している。例えば、ex_seq_all_bit_extention_flagがTRUEの場合には、制御フラグF1001のみONとし、残りのフラグはOFFとすることを示している。
図40は後述の画像復号化装置の処理において用いる制御フラグF2001、F2005、F2006、F2007、F2008の設定例を示している。それぞれ、図38と同様の値を示している。本実施形態においては、第1の実施形態と同様にサプリメンタルシンタクスに多重化されたデータを利用することが可能である。
図39Aを参照して本実施形態に係る画像復号化装置の構成を説明する。図39Aに示すように、この画像復号化装置は、エントロピー復号化器200、逆量子化器109、逆直交変換器110、加算器111、ループフィルタ113、フレームメモリ114、予測画像作成器115、画素ビット長縮小器(画素ビット精度縮小変換器)2001、2006、画素ビット長拡張器(画素ビット精度拡張変換器)2005、画素ビット長変換器(画素ビット精度変換器)2007、2008、ビット長変換制御器2002を備えている。即ち、エントロピー復号化器200の係数情報出力は逆量子化器109および逆直交変換器110を介して加算器111に接続される。エントロピー復号化器200の動きベクトル/予測モード情報出力は予測画像作成器115に接続され、そのビット拡散情報出力はビット長変換制御器2002に接続される。予測画像作成器115の出力は画素ビット長縮小器を介して加算器111の他の入力に接続される。加算器111の出力は画素ビット長拡張器2005,ループフィルタ113,画素ビット長変換器2007を介してフレームメモリ114に接続される。ループフィルタ113の他の出力は画素ビット長縮小器2001の入力に接続される。フレームメモリ114の出力はビット長変換制御器2002に出力と共に画素ビット長変換器2008に接続される。画素ビット長変換器2008の出力は予測画像作成器115の他の入力に接続される。ビット長変換制御器2002の出力は画素ビット長縮小器2001,画素ビット長拡張器2005、画素ビット長縮小器2006,画素ビット長変換器2007および画素ビット長変換器2008の他の入力に接続される。
図39Bのフローチャートを参照して画像復号化装置の動作を説明する。図9の画像符号化装置によって符号化された符号化データ117が画像復号化装置に入力されると(S201)、エントロピー復号化器200によってエントロピー符号化の逆の手順に従って復号化され、量子化直交変換係数情報107、動きベクトル/予測モード情報116、ビット拡張情報2004が生成される(S202)。ビット拡張情報2004がビット長変換制御器2002に入力されると、ビット長変換制御器2002は画素ビット長縮小器2001,2006、画素ビット長拡張器2005、画素ビット長変換器2007、2008での画素ビット長変換を行うかどうかの制御フラグや、拡張あるいは縮小するビット長を示す情報などを含むビット変換情報2003を出力する。このビット変換情報に含まれる制御フラグは、たとえば符号化データ117にビット拡張情報2004として多重化されているシンタクス(図36)の値に基づいて、図40のようにそれぞれ設定され、ビット変換情報2003に含められる。
量子化直交変換係数情報107は、逆量子化器109及び逆直交変換器110により、量子化器106及び直交変換器104の処理と逆の処理を順次受けて残差信号201に変換される(S203)。動きベクトル/予測モード情報116は予測画像作成器115に入力され、フレームメモリ114に格納され、画素ビット長変換器2008によって必要に応じて各画素のビット長が変換された復号画像信号203から動きベクトル/予測モード情報116に基づく予測画像信号102が生成される(S204)。
予測画像信号102は画素ビット長縮小器2006に入力され、ビット変換情報2003に含まれている制御フラグF2006に基づいて、予測画像信号102の各画素のビット長を変換するかどうかを判定する(S205)。制御フラグF2006がONの場合には、画素ビット長拡張器2006内のスイッチE2をONに設定し、予測画像信号102の各画素のビット長を、第4の実施形態における画素ビット長拡張器2006で行われる処理と同様の処理によって縮小する(S206)。制御フラグF2006がOFFの場合には画素のビット長を変換する処理は行わない。
画素ビット長縮小器2006から出力された予測画像信号102と残差信号201は、加算器111によって加算され、復号画像信号が生成される(S207)。復号画像信号203は画素ビット長拡張器2005に入力される。画素ビット長変換器2005では、ビット変換情報2003に含まれている制御フラグF2005に基づいて、復号画像信号203の各画素のビット長を拡張するかどうかを判定する(S208)。制御フラグF2005がONの場合には、画素ビット長拡張器2005内のスイッチE1をONに設定し、復号画像信号203の各画素のビット長を、第4の実施形態における画素ビット長変換器2005で行われる処理と同様の処理によって拡張する(S209)。制御フラグF2005がOFFの場合には画素のビット長を変換する処理は行わない。
画素ビット長拡張器2005から出力された復号画像信号203はループフィルタ113で必要に応じてフィルタ処理がなされた後出力され、画素ビット長縮小器2001および画素ビット長変換器2007に出力される。
画素ビット長変換器2007に復号画像信号203が入力されると、画素ビット長変換器2007は、ビット変換情報2003に含まれている制御フラグF2007に基づいて、復号画像信号203の各画素のビット長を変換するかどうかを判定する(S210)。制御フラグF2007がONの場合には、画素ビット長拡張器2007内のスイッチE3がONに設定され、復号画像信号203の各画素のビット長が、第3の実施形態における画素ビット長変換器2007で行われる処理と同様の処理によって変換される(S211)。制御フラグF2007がOFFの場合には画素のビット長を変換する処理は行わない。
画素ビット長変換器2007から出力された復号画像信号203はフレームメモリ114に格納される(S212)。フレームメモリ114に格納された復号画像信号203が画素ビット長変換器2008に入力されると、画素ビット長変換器2008はビット変換情報2003に含まれている制御フラグF2008に基づいて、復号画像信号203の各画素のビット長を変換するかどうかを判定する(S213)。制御フラグF2008がONの場合には、画素ビット長拡張器2008内のスイッチE3をONに設定し、復号画像信号203の各画素のビット長を、第3の実施形態における画素ビット長変換器2008で行われる処理と同様の処理によって変換する(S214)。制御フラグF2008がOFFの場合には画素のビット長を変換する処理は行わない。画素ビット長変換器2008から出力された画像信号は予測画像作成器115に入力される(S215)。
復号画像信号203はループフィルタ113で必要に応じてフィルタ処理され、画素ビット長縮小器2001に出力される。画素ビット長縮小器2001に復号画像信号203が入力されると、画素ビット長縮小器2001は、ビット変換情報2003に含まれている制御フラグF2001に基づいて、復号画像信号203の各画素のビット長を変換するかどうかを判定する(S216)。制御フラグF2001がONの場合には、画素ビット長拡張器2001内のスイッチE2をONに設定し、復号画像信号203の各画素のビット長を、第1の実施形態における画素ビット長縮小器2001と同様の処理によって縮小する(S217)。制御フラグF2001がOFFの場合には画素のビット長を変換する処理は行わず、そのまま復号画像信号202として出力される。
以上のようにして、画像符号化装置に入力された入力画像と同じNビット精度の復号画像202が画素ビット長縮小器2001より出力される(S218)。
以上のような図35、39のような構成においては、符号化データに含まれるシンタクス情報に基づいて、フレームメモリ、直交変換および量子化の演算精度をフラグによってそれぞれ切り替えることができ、符号化器側、あるいは復号化器側の演算コストの制約に応じて、適切な演算精度で符号化を行うことが可能となる。この構成においては、いずれかの制御フラグがONとなっていれば、予測画像作成器に入力される画像信号の画素ビット長は、入力画像信号100より大きな精度で入力されるため、予測画像作成の演算精度を高めることができ、符号化効率を向上させることができる。
図35、39において画素ビット長拡張器、画素ビット長縮小器、画素ビット長変換器の一部を省略し、第2〜第5の実施形態で示した構成とし、画素ビット長拡張器、画素ビット長縮小器、画素ビット長変換器において、ビット長の変換を行うかどうかを例えば図36で示したシンタクスにおけるex_seq_all_bit_extention_flagで指定されている値に従って決定する。ex_seq_all_bit_extention_flagがTRUEならば、各構成における画素ビット長拡張器、画素ビット長縮小器、画素ビット長変換器において各画素のビット長を変換する処理を行い、FALSEなら変換処理を行わないような制御を行うことも可能である。
量子化/逆量子化を行う際、入力画像がNビット相当の場合に量子化する量子化ステップ幅をQstepとした場合、第2、第3の実施形態における量子化/逆量子化で用いる量子化ステップ幅Qstep’は、ビット精度をMビット拡大・縮小すると、残差の精度が(N+M)ビットに拡大されていることを考慮し、以下の式で計算されるQstep’を用いてもよい。
Qstep’= Qstep << M …(16)
これによって、Nビット同等の入力画像をそのまま符号化した場合とほぼ同等の符号量の符号化データを得ることができる。このように、量子化ステップ幅を拡張するビット長に応じて変化させた場合に、符号化効率が向上する理由を図41,42を用いて説明する。図41は各画素位置での、入力画素値(8bit)に対する、H.264による8bit精度の予測画素値と、本実施形態による12bit精度の予測画素値とを示すテーブルであり、図42はこれをグラフにしたものである(半画素位置の補間フィルタは、6タップ{1/32,−5/32,20/32,20/32,−5/32,1/32}とする)。
前述のとおり、入力画像信号が8ビットであった場合(図42では正方形のプロットで表わされている)に、予測画像信号を入力画像信号と同じ8ビットで作成した場合(図42ではひし形のプロットで表されている)には、半画素位置に補間される画素の画素値は丸め誤差が生じる。これに対して、例えば本実施形態で述べたようなビット拡張を行い、例えば12ビットの予測画像を作成した場合(図42では円形のプロットで表されている)には、半画素位置に補間される画素の画素値の丸め誤差は小さくなる。ビット拡張を行った場合には、ビット拡張を行う前と比較して残差のビット精度が12ビットに拡大するため、ビット拡張を行わずに8ビットで残差を求めた場合と比較して残差の絶対値は大きくなるが、丸め誤差が小さくなっているため、数式(16)で示した量子化ステップ幅で量子化し、ほぼ同じ符号量とした際の誤差が小さくなり、結果として符号化効率を向上させることが可能となる。
本実施形態では、図43に示すように、入力画像のビット精度よりもMビット大きなビット精度で行うことができ、予測画像信号が入力画像信号よりMビット大きな精度をもって作成されるため、動き補償のフィルタやループフィルタ、画面内予測などの精度を高めることができ、結果的に予測誤差信号を小さくすることができるため、符号化効率を向上させることができる。
なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
本発明によれば、画面内予測や動き補償の精度を十分高めることによって符号化効率を向上させことが可能になる。本発明の構成によれば、予測画像作成器に入力される参照画像のビット精度を入力画像のビット精度よりも大きくすることで、例えばH.264などに適用されている画面内予測や、単方向動き補償予測、双方向動き補償予測、および重みつき動き補償予測の演算時に発生する丸め誤差を小さく抑えることで、予測誤差信号を小さくし、符号化効率を向上させることができる。すなわち、上記で述べた小数画素の演算精度にかかわるビット精度を高く保つことが可能となるだけではなく、整数画素の演算精度にかかわるビット精度を高く保つことが可能となる。また、本発明のいくつかの構成によれば、入力画像のビット精度よりも高いビット精度で参照画像を保存し、予測に用いることで、さらに予測画像作成器で予測画像を作成する際の演算精度を高めることが可能となり、符号化効率を向上させることができる。

Claims (8)

  1. 入力符号化画像情報を(N+M)ビット精度の復号差分画像に復号する復号化器と、
    前記符号化画像情報を用いて(N+M)ビット精度の参照画像から(N+M)ビット精度の予測画像を作成する予測画像作成器と、
    前記復号差分画像と前記予測画像とを加算して(N+M)ビット精度の復号画像を得る加算器と、
    (N+M)ビット精度の前記復号画像の各画素をNビット精度に変換しNビット精度の復号画像を出力する画素ビット精度変換器と、を備え、
    前記予測画像作成器は(N+M)ビット精度の前記復号画像を前記参照画像として用いることを特徴とする、画像復号化装置。
  2. 符号化画像情報を入力して(N+M)ビット精度の復号差分画像を出力する復号化器と、
    (N+M−L)ビット精度の参照画像の各画素を(N+M)ビット精度の画素に変換し(N+M)ビット精度の復号画像を出力する画素ビット精度拡張変換器と、
    前記符号化画像情報を用いて(N+M)ビット精度の参照画像から(N+M)ビット精度の予測画像を作成する予測画像作成器と、
    前記復号差分画像と前記予測画像とを加算して(N+M)ビット精度の復号画像を得る加算器と、
    (N+M)ビット精度の前記復号画像の各画素を(N+M−L)ビット精度の画素に変換し(N+M−L)ビット精度の復号画像を出力するとともに、(N+M)ビット精度の前記復号画像の各画素をNビット精度の画素に変換し、Nビット精度の復号画像を出力する画素ビット精度縮小変換器と、を備え、
    前記予測画像作成器は、(N+M−L)ビット精度の前記復号画像を前記参照画像として用いることを特徴とする、画像復号化装置。
  3. 前記画素ビット精度変換器は、復号化単位ごとに前記参照画像の符号化単位画像内に含まれる画素値の最大値と最小値から代表値を算出する手段と、前記符号化単位画像内の各画素の値と代表値との差をQビット右シフトした値が(N+M−L)ビット精度のダイナミックレンジに収まるシフト量Q(0≦Q≦L)を算出する手段と、前記符号化単位画像内の各画素値を各画素の値と前記代表値との差をQビット右シフトして(N+M−L)精度の値に変換する手段とを含む第1の画素ビット精度変換器を有し、
    前記参照画像格納メモリは(N+M−L)ビット精度の前記復号画像を前記参照画像として保存するとともに前記シフト量Qおよび前記代表値を前記符号化単位ごとに保存し、
    前記画素ビット精度変換器は復号化単位ごとに前記参照画像と前記シフト量Qおよび前記代表値を前記参照画像格納メモリから読み出して前記参照画像の各画素の(N+M−L)ビット精度の画素値をQビット右シフトして前記代表値に加算して(N+M)ビット精度に変換する手段を含む第2の画素ビット精度変換器を有することを特徴とする請求項1に記載の画像復号化装置。
  4. 前記符号化画像情報は、ビット変換情報として、任意の符号化単位毎に、拡張するビット数Mを示すビット変換情報を含み、
    前記変換器は、前記ビット変換情報に基づいて、前記画像の各画素のビット精度の拡張又は縮小を行う、請求項1ないし3のいずれか1項に記載の画像復号化装置。
  5. 前記符号化画像情報は、ビット変換情報として、任意の符号化単位毎に、前記参照画像格納メモリのビット精度(N+M−L)を示すデータを含み、
    前記画素ビット精度拡張変換器及び前記画素ビット精度縮小変換器は、前記ビット変換情報に基づいて前記拡張変換及び前記縮小変換を行い、(N+M−L)ビット精度の前記参照画像として参照画像格納メモリに格納する、請求項2に記載の画像復号化装置。
  6. 前記画像符号化情報は、ビット変換情報として、任意の符号化単位毎に、Mビット拡張するかどうかのフラグを含み、前記フラグがFALSEの場合には前記変換器は変換を行わず、前記フラグがTRUEの場合には、前記変換器は、前記ビット変換情報に基づいて、前記画像の各画素のビット精度の拡張又は縮小を行う、請求項1ないし3のいずれか1項に記載の画像復号化装置。
  7. 前記画像符号化情報は、ビット変換情報として、任意の符号化単位毎に、Mビット拡張するかどうかのフラグと、拡張するビット数Mを示すデータを含み、前記フラグがFALSEの場合には前記変換器は変換を行わず、前記フラグがTRUEの場合には、前記変換器は、前記ビット変換情報に基づいて、前記画像の各画素のビット精度の拡張又は縮小を行う、請求項1ないし3のいずれか1項に記載の画像復号化装置。
  8. 入力符号化画像情報を(N+M)ビット精度の復号差分画像に復号するステップと、
    前記入力符号化画像情報を用いて(N+M)ビット精度の参照画像から(N+M)ビット精度の予測画像を生成するステップと、
    前記復号差分画像と前記予測画像とを加算して(N+M)ビット精度の復号画像を生成するステップと、
    (N+M)ビット精度の前記復号画像を前記参照画像として保存するステップと、
    (N+M)ビット精度の前記復号画像の各画素の値をNビット精度に変換しNビット精度の復号画像を生成するステップとを有する、画像復号化方法。
JP2012110972A 2006-03-30 2012-05-14 画像復号化装置及び方法 Pending JP2012191642A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012110972A JP2012191642A (ja) 2006-03-30 2012-05-14 画像復号化装置及び方法

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2006095597 2006-03-30
JP2006095597 2006-03-30
PCT/JP2006/320876 WO2007116551A1 (ja) 2006-03-30 2006-10-19 画像符号化装置及び画像符号化方法並びに画像復号化装置及び画像復号化方法
JPPCT/JP2006/320876 2006-10-19
JP2012110972A JP2012191642A (ja) 2006-03-30 2012-05-14 画像復号化装置及び方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2008508675A Division JP5254004B2 (ja) 2006-03-30 2007-03-30 画像符号化装置及び方法

Publications (1)

Publication Number Publication Date
JP2012191642A true JP2012191642A (ja) 2012-10-04

Family

ID=38580854

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2008508675A Active JP5254004B2 (ja) 2006-03-30 2007-03-30 画像符号化装置及び方法
JP2012110972A Pending JP2012191642A (ja) 2006-03-30 2012-05-14 画像復号化装置及び方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2008508675A Active JP5254004B2 (ja) 2006-03-30 2007-03-30 画像符号化装置及び方法

Country Status (14)

Country Link
US (1) US8606028B2 (ja)
EP (1) EP2003897A4 (ja)
JP (2) JP5254004B2 (ja)
KR (2) KR101110517B1 (ja)
CN (2) CN102256132A (ja)
AU (1) AU2007232828B2 (ja)
BR (1) BRPI0709853A2 (ja)
CA (1) CA2645931A1 (ja)
HR (1) HRP20080553A2 (ja)
MX (1) MX2008012516A (ja)
NO (1) NO20084509L (ja)
RU (1) RU2433562C2 (ja)
WO (1) WO2007116551A1 (ja)
ZA (1) ZA200807977B (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014156707A1 (ja) * 2013-03-29 2014-10-02 ソニー株式会社 画像符号化装置および方法、並びに、画像復号装置および方法
JP2021530769A (ja) * 2019-06-12 2021-11-11 シャンハイ カンブリコン インフォメーション テクノロジー カンパニー リミテッドShanghai Cambricon Information Technology Co., Ltd. ニューラルネットワークにおける量子化パラメータの確定方法および関連製品

Families Citing this family (124)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8194997B2 (en) * 2006-03-24 2012-06-05 Sharp Laboratories Of America, Inc. Methods and systems for tone mapping messaging
US8208560B2 (en) * 2007-10-15 2012-06-26 Intel Corporation Bit depth enhancement for scalable video coding
US8204333B2 (en) 2007-10-15 2012-06-19 Intel Corporation Converting video and image signal bit depths
KR101365444B1 (ko) * 2007-11-19 2014-02-21 삼성전자주식회사 영상의 해상도의 조정을 통하여 동영상을 효율적으로부호화/복호화하는 방법 및 장치
CN101971632B (zh) * 2008-01-08 2013-10-16 艾利森电话股份有限公司 自适应滤波
JP5697301B2 (ja) * 2008-10-01 2015-04-08 株式会社Nttドコモ 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、動画像符号化プログラム、動画像復号プログラム、及び動画像符号化・復号システム
EP2365694B1 (en) * 2008-11-18 2017-01-04 LG Electronics Inc. Method and apparatus for processing image signal
US9007395B2 (en) * 2008-12-01 2015-04-14 Marvell World Trade Ltd. Bit resolution enhancement
CN102273216A (zh) * 2009-01-08 2011-12-07 日本电气株式会社 分发系统、方法以及变换装置
US8860745B2 (en) * 2009-06-01 2014-10-14 Stmicroelectronics, Inc. System and method for color gamut mapping
US8995526B2 (en) 2009-07-09 2015-03-31 Qualcomm Incorporated Different weights for uni-directional prediction and bi-directional prediction in video coding
US8711930B2 (en) * 2009-07-09 2014-04-29 Qualcomm Incorporated Non-zero rounding and prediction mode selection techniques in video encoding
US9161057B2 (en) 2009-07-09 2015-10-13 Qualcomm Incorporated Non-zero rounding and prediction mode selection techniques in video encoding
KR101474756B1 (ko) 2009-08-13 2014-12-19 삼성전자주식회사 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치
JP5604825B2 (ja) * 2009-08-19 2014-10-15 ソニー株式会社 画像処理装置および方法
JP2011050001A (ja) * 2009-08-28 2011-03-10 Sony Corp 画像処理装置および方法
EP2494780B1 (en) * 2009-10-29 2020-09-02 Vestel Elektronik Sanayi ve Ticaret A.S. Method and device for processing a video sequence
WO2011065886A1 (en) * 2009-11-24 2011-06-03 Telefonaktiebolaget L M Ericsson (Publ) Decoding system and method operable on encoded texture element blocks
WO2011090352A2 (ko) * 2010-01-22 2011-07-28 삼성전자주식회사 영역 기반의 부호화/복호화 장치 및 방법
JP5660361B2 (ja) * 2010-03-26 2015-01-28 ソニー株式会社 画像処理装置および方法、並びにプログラム
JP5323252B2 (ja) 2010-03-30 2013-10-23 株式会社東芝 動画像符号化方法、復号化方法、符号化装置および復号化装置
US9369736B2 (en) 2010-04-05 2016-06-14 Samsung Electronics Co., Ltd. Low complexity entropy-encoding/decoding method and apparatus
WO2011126283A2 (en) * 2010-04-05 2011-10-13 Samsung Electronics Co., Ltd. Method and apparatus for encoding video based on internal bit depth increment, and method and apparatus for decoding video based on internal bit depth increment
WO2011126272A2 (en) * 2010-04-05 2011-10-13 Samsung Electronics Co., Ltd. Method and apparatus for encoding video by using dynamic-range transformation, and method and apparatus for decoding video by using dynamic-range transformation
KR101710623B1 (ko) * 2010-04-05 2017-03-09 삼성전자주식회사 컨텐트에 기반한 다이나믹 레인지 변환을 이용하는 비디오 부호화 방법과 그 장치, 및 컨텐트에 기반한 다이나믹 레인지 변환을 이용하는 비디오 복호화 방법과 그 장치
US20110249736A1 (en) * 2010-04-09 2011-10-13 Sharp Laboratories Of America, Inc. Codeword restriction for high performance video coding
EP2559239A2 (en) * 2010-04-13 2013-02-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for intra predicting a block, apparatus for reconstructing a block of a picture, apparatus for reconstructing a block of a picture by intra prediction
JP5073004B2 (ja) 2010-04-23 2012-11-14 株式会社東芝 画像符号化装置及び画像符号化方法並びに画像復号化装置及び画像復号化方法
US9094658B2 (en) 2010-05-10 2015-07-28 Mediatek Inc. Method and apparatus of adaptive loop filtering
US9210427B2 (en) * 2010-07-13 2015-12-08 Nec Corporation Video encoding device, video decoding device, video encoding method, video decoding method, and program
US8861617B2 (en) 2010-10-05 2014-10-14 Mediatek Inc Method and apparatus of region-based adaptive loop filtering
EP2445214A1 (en) * 2010-10-19 2012-04-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Video coding using temporally coherent dynamic range mapping
BR112013011053A8 (pt) * 2010-11-10 2016-08-23 Sony Corp Dispositivo e método de processamento de imagem
KR101425772B1 (ko) 2010-11-23 2014-08-06 엘지전자 주식회사 영상 부호화 및 복호화 방법과 이를 이용한 장치
CN103503458B (zh) 2011-01-07 2017-09-22 诺基亚技术有限公司 视频编码中的运动预测
US8923389B1 (en) * 2011-01-13 2014-12-30 Zenverge, Inc. Unified scaling with differential coding for internal bit depth extension and reference frame compression
KR20120082606A (ko) * 2011-01-14 2012-07-24 삼성전자주식회사 깊이 영상의 부호화/복호화 장치 및 방법
US8786899B2 (en) 2011-01-28 2014-07-22 Ricoh Production Print Solutions LLC Conversion arrays for print image data transformation
SG188199A1 (en) 2011-02-22 2013-04-30 Panasonic Corp Image coding method, image decoding method, image coding apparatus, image decoding apparatus, and image coding and decoding apparatus
MX2013000093A (es) 2011-02-22 2013-02-27 Panasonic Corp Metodo de filtro, dispositivo de codificacion de imagen dinamica, dispositivo de decodificacion de imagen dinamica y dispositivo de codificacion y decodificacion de imagen dinamica.
CN106454381B (zh) * 2011-03-11 2019-05-28 索尼公司 图像处理装置和方法
US9521434B2 (en) * 2011-06-09 2016-12-13 Qualcomm Incorporated Internal bit depth increase in video coding
JP5552093B2 (ja) * 2011-06-13 2014-07-16 日本電信電話株式会社 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム
EP4199513A1 (en) 2011-06-23 2023-06-21 Huawei Technologies Co., Ltd. Offset decoding device, offset coding device, image filtering device, and data structure
CN110611810B (zh) * 2011-06-28 2021-06-01 索尼公司 图像处理装置和图像处理方法
HUE049204T2 (hu) 2011-07-19 2020-09-28 Tagivan Ii Llc Szûrési eljárás, mozgókép dekódoló eljárás, mozgókép kódoló eljárás, mozgókép dekódoló berendezés, mozgókép kódoló berendezés, mozgókép kódoló/dekódoló berendezés
AU2012294053B2 (en) * 2011-08-11 2016-07-07 Sun Patent Trust Image coding method, image decoding method, image coding apparatus, image decoding apparatus, and image coding and decoding apparatus
US9510020B2 (en) * 2011-10-20 2016-11-29 Qualcomm Incorporated Intra pulse code modulation (IPCM) and lossless coding mode deblocking for video coding
GB201119206D0 (en) 2011-11-07 2011-12-21 Canon Kk Method and device for providing compensation offsets for a set of reconstructed samples of an image
US9350992B2 (en) 2011-11-18 2016-05-24 Google Technology Holdings LLC Explicit way for signaling a collocated picture for high efficiency video coding
US9392235B2 (en) 2011-11-18 2016-07-12 Google Technology Holdings LLC Explicit way for signaling a collocated reference picture for video coding
CN103975594B (zh) * 2011-12-01 2017-08-15 英特尔公司 用于残差预测的运动估计方法
TWI600315B (zh) * 2011-12-28 2017-09-21 Jvc Kenwood Corp 動態影像解碼裝置、動態影像解碼方法及記錄有動態影像解碼程式的記錄媒體
US9860527B2 (en) 2012-01-19 2018-01-02 Huawei Technologies Co., Ltd. High throughput residual coding for a transform skipped block for CABAC in HEVC
US20130188736A1 (en) 2012-01-19 2013-07-25 Sharp Laboratories Of America, Inc. High throughput significance map processing for cabac in hevc
US9743116B2 (en) 2012-01-19 2017-08-22 Huawei Technologies Co., Ltd. High throughput coding for CABAC in HEVC
WO2013109879A1 (en) * 2012-01-19 2013-07-25 Cisco Technology Inc. Digital video compression system, method and computer readable medium
US9654139B2 (en) 2012-01-19 2017-05-16 Huawei Technologies Co., Ltd. High throughput binarization (HTB) method for CABAC in HEVC
US10616581B2 (en) 2012-01-19 2020-04-07 Huawei Technologies Co., Ltd. Modified coding for a transform skipped block for CABAC in HEVC
US9549177B2 (en) 2012-04-11 2017-01-17 Google Technology Holdings LLC Evaluation of signaling of collocated reference picture for temporal prediction
RU2510944C2 (ru) * 2012-07-03 2014-04-10 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Способ кодирования/декодирования многоракурсной видео последовательности на основе адаптивной локальной коррекции яркости опорных кадров без передачи дополнительных параметров (варианты)
MX346795B (es) 2012-07-16 2017-03-31 Samsung Electronics Co Ltd Método de codificación de video y aparato de codificación de video y método de decodificación de video y aparato de decodificación de video para señalar parámetros de compensación adaptiva de muestra (sao).
US9319681B2 (en) 2012-07-18 2016-04-19 Google Technology Holdings LLC Signaling of temporal motion vector predictor (MVP) enable flag
US20140056356A1 (en) * 2012-08-21 2014-02-27 Motorola Mobility Llc Method and apparatus for efficient signaling of weighted prediction in advanced coding schemes
KR101917224B1 (ko) * 2012-09-18 2018-11-13 엘지이노텍 주식회사 영상데이터 전송장치
AU2013352851B2 (en) * 2012-11-27 2016-11-17 Lg Electronics Inc. Signal transceiving apparatus and signal transceiving method
JP6157114B2 (ja) * 2012-12-28 2017-07-05 キヤノン株式会社 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
US20140301447A1 (en) * 2013-04-08 2014-10-09 Research In Motion Limited Methods for reconstructing an encoded video at a bit-depth lower than at which it was encoded
US9674538B2 (en) * 2013-04-08 2017-06-06 Blackberry Limited Methods for reconstructing an encoded video at a bit-depth lower than at which it was encoded
BR112015025623B1 (pt) * 2013-04-08 2023-02-07 Dolby International Ab Método e codificador para codificar uma tabela de busca de cor tridimensional associada a octantes de uma octree, e método e decodificador para decodificar uma tabela de busca de cor tridimensional de octantes
JP2015015595A (ja) * 2013-07-04 2015-01-22 富士通株式会社 動画像符号化装置、符号化モード判定方法及び符号化プログラム
EP3069511A4 (en) * 2013-11-15 2017-09-27 MediaTek Inc. Method of block-based adaptive loop filtering
EP3114835B1 (en) 2014-03-04 2020-04-22 Microsoft Technology Licensing, LLC Encoding strategies for adaptive switching of color spaces
RU2653295C2 (ru) * 2014-03-04 2018-05-07 МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи Адаптивное переключение цветовых пространств, частот цветовой дискретизации и/или битовых глубин
EP3123716B1 (en) 2014-03-27 2020-10-28 Microsoft Technology Licensing, LLC Adjusting quantization/scaling and inverse quantization/scaling when switching color spaces
EP2958329B1 (en) 2014-06-16 2018-12-05 Thomson Licensing Method for encoding and decoding an image block based on dynamic range extension, encoder and decoder
KR102184884B1 (ko) * 2014-06-26 2020-12-01 엘지디스플레이 주식회사 유기발광표시장치의 데이터 처리장치
US9609362B2 (en) * 2014-10-06 2017-03-28 Telefonaktiebolaget Lm Ericsson (Publ) Coding and deriving quantization parameters
WO2016054765A1 (en) 2014-10-08 2016-04-14 Microsoft Technology Licensing, Llc Adjustments to encoding and decoding when switching color spaces
KR20160061172A (ko) 2014-11-21 2016-05-31 삼성전자주식회사 디코더, 상기 디코더를 포함하는 디코딩 시스템, 및 상기 디코더의 동작 방법
US20180048890A1 (en) * 2015-03-02 2018-02-15 Lg Electronics Inc. Method and device for encoding and decoding video signal by using improved prediction filter
US9569816B2 (en) 2015-04-15 2017-02-14 Apple Inc. Debanding image data using bit depth expansion
CN107852492A (zh) * 2015-05-12 2018-03-27 三星电子株式会社 用于对图像进行编码和解码的方法和设备
KR102252298B1 (ko) * 2016-10-21 2021-05-14 삼성전자주식회사 표정 인식 방법 및 장치
JP6324590B2 (ja) * 2017-05-25 2018-05-16 キヤノン株式会社 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
US10897269B2 (en) 2017-09-14 2021-01-19 Apple Inc. Hierarchical point cloud compression
US10861196B2 (en) 2017-09-14 2020-12-08 Apple Inc. Point cloud compression
US11818401B2 (en) 2017-09-14 2023-11-14 Apple Inc. Point cloud geometry compression using octrees and binary arithmetic encoding with adaptive look-up tables
US11113845B2 (en) 2017-09-18 2021-09-07 Apple Inc. Point cloud compression using non-cubic projections and masks
US10909725B2 (en) 2017-09-18 2021-02-02 Apple Inc. Point cloud compression
US10607373B2 (en) 2017-11-22 2020-03-31 Apple Inc. Point cloud compression with closed-loop color conversion
US10699444B2 (en) 2017-11-22 2020-06-30 Apple Inc Point cloud occupancy map compression
EP3754987A4 (en) * 2018-02-14 2021-04-14 Sony Corporation IMAGE PROCESSING DEVICE AND IMAGE PROCESSING METHOD
WO2019159696A1 (ja) * 2018-02-14 2019-08-22 ソニー株式会社 画像処理装置および方法
US11010928B2 (en) 2018-04-10 2021-05-18 Apple Inc. Adaptive distance based point cloud compression
US10939129B2 (en) 2018-04-10 2021-03-02 Apple Inc. Point cloud compression
US10909726B2 (en) 2018-04-10 2021-02-02 Apple Inc. Point cloud compression
US10909727B2 (en) 2018-04-10 2021-02-02 Apple Inc. Hierarchical point cloud compression with smoothing
JP2018142969A (ja) * 2018-04-11 2018-09-13 キヤノン株式会社 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
EP3554082A1 (en) 2018-04-11 2019-10-16 InterDigital VC Holdings, Inc. A method and device for coding the geometry of a point cloud
CN110620935B (zh) * 2018-06-19 2022-04-08 杭州海康慧影科技有限公司 图像处理方法及装置
US11044478B2 (en) * 2018-07-02 2021-06-22 Apple Inc. Compression with multi-level encoding
US11017566B1 (en) 2018-07-02 2021-05-25 Apple Inc. Point cloud compression with adaptive filtering
US11202098B2 (en) 2018-07-05 2021-12-14 Apple Inc. Point cloud compression with multi-resolution video encoding
US11012713B2 (en) 2018-07-12 2021-05-18 Apple Inc. Bit stream structure for compressed point cloud data
US11386524B2 (en) 2018-09-28 2022-07-12 Apple Inc. Point cloud compression image padding
US11367224B2 (en) 2018-10-02 2022-06-21 Apple Inc. Occupancy map block-to-patch information compression
US11430155B2 (en) 2018-10-05 2022-08-30 Apple Inc. Quantized depths for projection point cloud compression
JP7190661B2 (ja) * 2019-02-06 2022-12-16 パナソニックIpマネジメント株式会社 画像処理装置、画像処理方法および画像処理システム
US11057564B2 (en) 2019-03-28 2021-07-06 Apple Inc. Multiple layer flexure for supporting a moving image sensor
US20220272342A1 (en) * 2019-07-05 2022-08-25 V-Nova International Limited Quantization of residuals in video coding
CN114402591A (zh) * 2019-09-13 2022-04-26 北京字节跳动网络技术有限公司 并置运动矢量的推导
US11562507B2 (en) 2019-09-27 2023-01-24 Apple Inc. Point cloud compression using video encoding with time consistent patches
US11627314B2 (en) 2019-09-27 2023-04-11 Apple Inc. Video-based point cloud compression with non-normative smoothing
US11538196B2 (en) 2019-10-02 2022-12-27 Apple Inc. Predictive coding for point cloud compression
US11895307B2 (en) 2019-10-04 2024-02-06 Apple Inc. Block-based predictive coding for point cloud compression
US11798196B2 (en) 2020-01-08 2023-10-24 Apple Inc. Video-based point cloud compression with predicted patches
US11625866B2 (en) 2020-01-09 2023-04-11 Apple Inc. Geometry encoding using octrees and predictive trees
US11620768B2 (en) 2020-06-24 2023-04-04 Apple Inc. Point cloud geometry compression using octrees with multiple scan orders
US11615557B2 (en) 2020-06-24 2023-03-28 Apple Inc. Point cloud compression using octrees with slicing
US11838551B2 (en) * 2020-12-30 2023-12-05 Ofinno, Llc Adaptive block level bit-depth prediction
CN112788338B (zh) * 2020-12-31 2022-08-26 展讯通信(天津)有限公司 图像压缩及解压缩方法、设备、装置和存储介质
US11948338B1 (en) 2021-03-29 2024-04-02 Apple Inc. 3D volumetric content encoding using 2D videos and simplified 3D meshes
CN117136546A (zh) * 2021-03-30 2023-11-28 创峰科技 用于视频编解码的加权预测

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0998429A (ja) * 1995-09-29 1997-04-08 Mitsubishi Electric Corp ディジタル映像信号符号化装置および復号化装置
JP2005051483A (ja) * 2003-07-28 2005-02-24 Sony Corp 画像処理装置、画像処理方法、画像表示装置および信号処理装置
WO2006017230A1 (en) * 2004-07-13 2006-02-16 Dolby Laboratories Licensing Corporation Unbiased rounding for video compression

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04326667A (ja) * 1991-04-26 1992-11-16 Konica Corp 画像データの圧縮伸張装置
JP3165296B2 (ja) * 1992-12-25 2001-05-14 三菱電機株式会社 フレーム間符号化処理方式及びフレーム間符号化処理方法及び符号化制御方式
JPH08237669A (ja) 1995-02-28 1996-09-13 Sony Corp 画像信号処理装置、画像信号処理方法および画像信号復号化装置
JPH09205647A (ja) * 1996-01-24 1997-08-05 Fuji Xerox Co Ltd 画像符号化装置、画像復号化装置および画像処理装置
JP3346229B2 (ja) * 1997-06-27 2002-11-18 日本ビクター株式会社 ディジタル画像信号圧縮装置及びディジタル画像信号記録装置
GB2333657B (en) * 1998-01-22 2002-08-21 Snell & Wilcox Ltd Video signal compression
JP2000023195A (ja) 1998-06-26 2000-01-21 Sony Corp 画像符号化装置及び方法、並びに画像復号装置及び方法、並びに符号化データ提供媒体
US8374237B2 (en) 2001-03-02 2013-02-12 Dolby Laboratories Licensing Corporation High precision encoding and decoding of video images
US6697521B2 (en) 2001-06-15 2004-02-24 Nokia Mobile Phones Ltd. Method and system for achieving coding gains in wavelet-based image codecs
US6950469B2 (en) * 2001-09-17 2005-09-27 Nokia Corporation Method for sub-pixel value interpolation
JP3923898B2 (ja) * 2002-01-18 2007-06-06 株式会社東芝 画像符号化方法及び装置
GB2387054A (en) 2002-01-25 2003-10-01 Snell & Wilcox Ltd Video encoder for producing coded quantised signals
JP2003283872A (ja) 2002-03-26 2003-10-03 Matsushita Electric Ind Co Ltd 画像圧縮伸長処理装置
US7620109B2 (en) * 2002-04-10 2009-11-17 Microsoft Corporation Sub-pixel interpolation in motion estimation and compensation
US7110459B2 (en) * 2002-04-10 2006-09-19 Microsoft Corporation Approximate bicubic filter
JP4427713B2 (ja) 2003-09-03 2010-03-10 ソニー株式会社 符号化装置および符号化方法、撮像装置および画像処理方法、並びに、プログラム
EP1555832A3 (en) 2004-01-14 2011-05-18 Samsung Electronics Co., Ltd. Adaptive loop filtering for reducing blocking artifacts
US20050259729A1 (en) 2004-05-21 2005-11-24 Shijun Sun Video coding with quality scalability
JP4241517B2 (ja) * 2004-06-15 2009-03-18 キヤノン株式会社 画像符号化装置及び画像復号装置
US8218634B2 (en) * 2005-01-13 2012-07-10 Ntt Docomo, Inc. Nonlinear, in-the-loop, denoising filter for quantization noise removal for hybrid video compression
CN101589625B (zh) * 2006-10-25 2011-09-21 弗劳恩霍夫应用研究促进协会 质量可缩放编码
WO2008084378A2 (en) * 2007-01-09 2008-07-17 Nokia Corporation Adaptive interpolation filters for video coding

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0998429A (ja) * 1995-09-29 1997-04-08 Mitsubishi Electric Corp ディジタル映像信号符号化装置および復号化装置
JP2005051483A (ja) * 2003-07-28 2005-02-24 Sony Corp 画像処理装置、画像処理方法、画像表示装置および信号処理装置
WO2006017230A1 (en) * 2004-07-13 2006-02-16 Dolby Laboratories Licensing Corporation Unbiased rounding for video compression

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014156707A1 (ja) * 2013-03-29 2014-10-02 ソニー株式会社 画像符号化装置および方法、並びに、画像復号装置および方法
JP2021530769A (ja) * 2019-06-12 2021-11-11 シャンハイ カンブリコン インフォメーション テクノロジー カンパニー リミテッドShanghai Cambricon Information Technology Co., Ltd. ニューラルネットワークにおける量子化パラメータの確定方法および関連製品

Also Published As

Publication number Publication date
JPWO2007114368A1 (ja) 2009-08-20
EP2003897A4 (en) 2012-08-29
AU2007232828A1 (en) 2007-10-11
WO2007116551A1 (ja) 2007-10-18
RU2008138706A (ru) 2010-04-10
MX2008012516A (es) 2008-11-28
US20090087111A1 (en) 2009-04-02
CN102256132A (zh) 2011-11-23
KR101110517B1 (ko) 2012-02-08
US8606028B2 (en) 2013-12-10
AU2007232828B2 (en) 2011-03-10
HRP20080553A2 (en) 2009-06-30
KR101067955B1 (ko) 2011-09-26
KR20080107436A (ko) 2008-12-10
CN101411202A (zh) 2009-04-15
KR20110013577A (ko) 2011-02-09
EP2003897A2 (en) 2008-12-17
EP2003897A9 (en) 2009-05-06
CA2645931A1 (en) 2007-10-11
BRPI0709853A2 (pt) 2011-07-26
CN101411202B (zh) 2011-12-28
ZA200807977B (en) 2009-06-24
JP5254004B2 (ja) 2013-08-07
RU2433562C2 (ru) 2011-11-10
NO20084509L (no) 2008-12-19

Similar Documents

Publication Publication Date Title
JP5254004B2 (ja) 画像符号化装置及び方法
WO2007114368A1 (ja) 画像符号化装置及び方法並びに画像復号化装置及び方法
CN110024387B (zh) 编码装置、解码装置、编码方法和解码方法
JP6626295B2 (ja) 画像符号化装置、画像処理装置、画像符号化方法
JP6532467B2 (ja) ビデオ符号化および復号におけるシンタックス要素符号化方法および装置
JPWO2009041215A1 (ja) 動画像符号化装置及び動画像復号装置
JP5073004B2 (ja) 画像符号化装置及び画像符号化方法並びに画像復号化装置及び画像復号化方法
JP2007124564A (ja) 画像符号化装置、方法、及びプログラム
WO2020036132A1 (ja) 画像符号化装置、画像復号装置、及びプログラム
JP4574444B2 (ja) 画像復号装置及び方法、画像符号化装置及び方法、コンピュータプログラム及び記憶媒体
JP6502739B2 (ja) 画像符号化装置、画像処理装置、画像符号化方法
JP4708821B2 (ja) 動画像符号化装置及びその制御方法、コンピュータプログラム及び記憶媒体
KR101715007B1 (ko) 매크로 블록 가변 크기 분할 방식의 인트라 프리딕션을 적용한 인코딩 방법 및 장치
JP4359184B2 (ja) 予測情報・量子化値制御圧縮符号化装置、予測情報・量子化値制御圧縮符号化プログラム
JP2014090253A (ja) 動画像符号化装置、動画像符号化方法およびプログラム
WO2022196133A1 (ja) 符号化装置及び方法
JP2007300557A (ja) 画像符号化装置及び画像符号化方法
JP2022145499A (ja) 符号化装置及び方法
JP4262144B2 (ja) 画像符号化装置及び方法
TW202418806A (zh) 影像編碼裝置、影像解碼裝置、影像編碼方法、影像解碼方法、及程式
JP5404857B2 (ja) 画像符号化装置及び画像符号化方法並びに画像復号化装置及び画像復号化方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130930

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131008

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20131219

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20131226

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20140109

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20140225