JP2004194076A - 画像処理装置およびその方法と符号化装置 - Google Patents
画像処理装置およびその方法と符号化装置 Download PDFInfo
- Publication number
- JP2004194076A JP2004194076A JP2002360885A JP2002360885A JP2004194076A JP 2004194076 A JP2004194076 A JP 2004194076A JP 2002360885 A JP2002360885 A JP 2002360885A JP 2002360885 A JP2002360885 A JP 2002360885A JP 2004194076 A JP2004194076 A JP 2004194076A
- Authority
- JP
- Japan
- Prior art keywords
- data
- circuit
- quantization
- index
- change amount
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/115—Selection of the code volume for a coding unit prior to coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
- H04N19/126—Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/14—Coding unit complexity, e.g. amount of activity or edge presence estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/149—Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/152—Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/177—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Algebra (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【解決手段】画像データの複雑度の指標となるアクティビティNactj を生成するアクティビティ算出回路40と、アクティビティNactj が1.12倍になると量子化パラメータの変化量データΔQが1だけ増加するようにアクティビティNactj と変化量データΔQとの対応関係を規定し、当該規定に基づいて、アクティビティ算出回路40が生成したアクティビティNactj に対応する変化量データΔQを得るΔQ算出回路41とを有する。
【選択図】 図10
Description
【発明の属する技術分野】
本発明は、量子化パラメータを適切に規定できる画像処理装置およびその方法と符号化装置に関する。
【0002】
【従来の技術】
近年、画像データとして取り扱い、その際、効率の高い情報の伝送、蓄積を目的とし、画像情報特有の冗長性を利用して、離散コサイン変換等の直交変換と動き補償により圧縮するMEPG(Moving Picture Experts Group)などの方式に準拠した装置が、放送局などの情報配信、及び一般家庭における情報受信の双方において普及しつつある。
【0003】
特に、MPEG2(ISO/IEC13818−2)は、汎用画像符号化方式として定義されており、飛び越し走査画像及び順次走査画像の双方、並びに標準解像度画像及び高精細画像を網羅する標準で、プロフェッショナル用途及びコンシューマー用途の広範なアプリケーションに現在広く用いられている。
MPEG2圧縮方式を用いることにより、例えば720×480画素を持つ標準解像度の飛び越し走査画像であれば4〜8Mbps、1920×1088画素を持つ高解像度の飛び越し走査画像であれば18〜22Mbpsの符号量(ビットレート)を割り当てることで、高い圧縮率と良好な画質の実現が可能である。
【0004】
MPEG2は主として放送用に適合する高画質符号化を対象としていたが、MPEG1より低い符号量(ビットレート)、つまりより高い圧縮率の符号化方式には対応していなかった。携帯端末の普及により、今後そのような符号化方式のニーズは高まると思われ、これに対応してMPEG4符号化方式の標準化が行われた。画像符号化方式に関しては、1998年12月にISO/IEC14496−2としてその規格が国際標準に承認された。
【0005】
さらに、近年、当初テレビ会議用の画像符号化を目的として、H. 26L(ITU−T Q6/16 VCEG)という標準の規格化が進んでいる。H.26LはMPEG2やMPEG4といった従来の符号化方式に比べ、その符号化、復号化により多くの演算量が要求されるものの、より高い符号化効率が実現されることが知られている。また、現在、MPEG4の活動の一環として、このH.26Lをベースに、H.26L規格ではサポートされない機能をも取り入れ、より高い符号化効率を実現する標準化がJoint Model of Enhanced−Compression Video Codingとして行われている。
【0006】
このようなMPEGおよびH.26L規格の符号化装置では、画像の局所的な情報を利用することにより、効率の良い符号化を実現している。
画像には、画像中で複雑な部分は、他の部分よりも量子化を粗くして符号化しても、肉眼では画質劣化が認識され難いという性質がある。
従って、上記符号化装置では、画像を複数の部分に分け、各部分について、画像の複雑度を検出し、その検出結果を基に、複雑な画像の部分は粗く量子化し、そうでない部分は細かく量子化して、画質劣化の影響を抑えながら、データ量を削減している。
このような画像の複雑度の情報は、アクティビティ(activity)と呼ばれている。
上記符号化装置では、量子化対象の画像データのアクティビティを算出し、当該アクティビティに基づいて、量子化スケールを規定する量子化パラメータを生成している。
【0007】
【発明が解決しようとする課題】
ところで、上述したH. 26L規格では、量子化パラメータが1増加するに従って粗さを1.12倍(12%増)にして動画像の画像データを量子化すること(Periodic Quantization)が規定されている。
従って、このことを考慮して、上記アクティビティを基に上記量子化パラメータを生成する必要がある。
【0008】
本発明はかかる事情に鑑みてなされたものであり、量子化パラメータが所定の単位量だけ増加すると動画像の画像データが量子化される粗さがr倍になる場合に、画像データの複雑度を適切に反映させて量子化パラメータの変化量を規定できる画像処理装置およびその方法と符号化装置とを提供することを目的とする。
【0009】
【課題を解決するための手段】
上記の目的を達成するため、第1の発明の画像処理装置は、量子化パラメータが所定の単位量だけ増加すると動画像の画像データが量子化される粗さがr倍になる場合に、前記量子化パラメータの変化量を示す変化量データを生成する画像処理装置であって、前記画像データの複雑度の指標となる指標データを生成する指標データ生成手段と、前記指標データがr倍になると前記変化量データが前記単位量だけ増加するように前記指標データと前記変化量データとの対応関係を規定し、当該規定に基づいて、前記指標データ生成手段が生成した前記指標データに対応する前記変化量データを取得する変化量データ取得手段とを有する。
【0010】
第1の発明の画像処理装置の作用は以下のようになる。
指標データ生成手段が、前記画像データの複雑度の指標となる指標データを生成する。
次に、変化量データ取得手段、前記指標データがr倍になると前記変化量データが前記単位量だけ増加するように前記指標データと前記変化量データとの対応関係を規定し、当該規定に基づいて、前記指標データ生成手段が生成した前記指標データに対応する前記変化量データを取得する。
【0011】
第2の発明の画像処理方法は、量子化パラメータが所定の単位量だけ増加すると動画像の画像データが量子化される粗さがr倍になる場合に、前記量子化パラメータの変化量を示す変化量データを生成する画像処理方法であって、
前記画像データの複雑度の指標となる指標データを生成する第1の工程と、
前記指標データがr倍になると前記変化量データが前記単位量だけ増加するように前記指標データと前記変化量データとの対応関係を規定し、当該規定に基づいて、前記第1の工程で生成した前記指標データに対応する前記変化量データを取得する第2の工程とを有する。
【0012】
第3の発明の符号化装置は、画像データの複雑度の指標となる指標データを生成する指標データ生成手段と、前記指標データがr倍になると前記変化量データが前記単位量だけ増加するように前記指標データと前記変化量データとの対応関係を規定し、当該規定に基づいて、前記指標データ生成手段が生成した前記指標データに対応する前記変化量データを取得する変化量データ取得手段と、符号化対象の前記画像データに割り当てられた符号量を基に規定された参照データと、前記変化量データ取得手段が取得した前記変化量データとを基に前記量子化パラメータを生成する量子化パラメータ生成手段と、画像データを直交変換する直交変換回路と、前記直交変換回路で直交変換された画像データを量子化する量子化回路と、前記量子化パラメータ生成手段が生成した前記量子化パレータを基に、前記量子化パラメータが所定の単位量だけ増加すると量子化の粗さをr倍にするように、前記量子化回路による前記量子化を制御する量子化制御回路と、前記量子化回路が量子化した画像データを基に、参照画像データおよび動きベクトルを生成する動き予測・補償回路と、前記量子化回路が量子化した画像データを符号化する符号化回路とを有する。
【0013】
第3の発明の符号化装置の作用は以下のようになる。
指標データ生成手段が、前記画像データの複雑度の指標となる指標データを生成する。
次に、変化量データ取得手段、前記指標データがr倍になると前記変化量データが前記単位量だけ増加するように前記指標データと前記変化量データとの対応関係を規定し、当該規定に基づいて、前記指標データ生成手段が生成した前記指標データに対応する前記変化量データを取得する。
また、直交変換回路が、画像データを直交変換する。
そして、量子化回路が、前記直交変換回路で直交変換された画像データを量子化する。
このとき、量子化制御回路が、前記量子化パラメータ生成手段が生成した前記量子化パレータを基に、前記量子化パラメータが所定の単位量だけ増加すると量子化の粗さをr倍にするように、前記量子化回路による前記量子化を制御する。
そして、動き予測・補償回路が、前記量子化回路が量子化した画像データを基に、参照画像データおよび動きベクトルを生成する。
また、符号化回路が、前記量子化回路が量子化した画像データを符号化する。
【0014】
【発明の実施の形態】
〔本発明の関連技術〕
図1は、本発明の関連技術に係わる符号化装置500の機能ブロック図である。
図1に示す符号化装置500において、入力となる画像信号は、まず、A/D変換回路501においてデジタル信号に変換される。次に、出力となる画像圧縮情報のGOP(Group of Pictures)構造に応じ、画面並べ替え回路502においてフレーム画像データの並べ替えが行われる。
そして、イントラ符号化が行われる画像に関しては、フレーム画像データの全体が直交変換回路504に入力され、直交変換回路504において離散コサイン変換やカルーネン・レーベ変換等の直交変換が施される。
直交変換回路504の出力となる変換係数は、量子化回路505において量子化処理される。
量子化回路505の出力となる、量子化された変換係数は、可逆符号化回路506に入力され、ここで可変長符号化、算術符号化等の可逆符号化が施された後、バッファ507に蓄積され、圧縮された画像データとして出力される。
量子化回路505における量子化レートは、レート制御回路512によって制御される。同時に、量子化回路505の出力となる、量子化された変換係数は、逆量子化回路508において逆量子化され、続いて逆直交変換回路509において逆直交変換処理が施され、デブロックフィルタ513においてブロック歪みが除去されて復号された参照フレーム画像データが得られる。当該参照フレーム画像データは、フレームメモリ510に蓄積される。
【0015】
一方、インター符号化が行われる画像に関しては、画面並べ替え回路502から出力されたフレーム画像データが、動き予測・補償回路511に入力される。同時に参照フレーム画像データがフレームメモリ510より読み出され、動き予測・補償回路511によって動きベクトルが生成され、当該動きベクトルおよび参照フレーム画像データを用いて予測フレーム画像データが生成される。予測フレーム画像データが演算回路503に出力され、演算回路503において、画面並べ替え回路502からのフレーム画像データと、動き予測・補償回路511からの予測フレーム画像データとの差分を示す画像データが生成され、当該画像データが直交変換回路504に出力される。
また、動き補償・予測回路511は、動きベクトルを可逆符号化回路506に出力し、可逆符号化回路506において、動きベクトルが可変長符号化あるいは算術符号化といった可逆符号化処理され、画像信号のヘッダ部に挿入される。その他の処理はイントラ符号化を施される画像信号と同様である。
【0016】
図2は、図1に示す符号化装置500に対応する復号回路499の機能ブロック図である。
図2に示す復号回路499では、入力となる画像データがバッファ613に格納された後、可逆復号回路614に出力される。そして、可逆復号回路614において、フレーム画像データのフォーマットに基づき、可変長復号化、算術復号化等の処理が行われる。同時に、当該フレーム画像データがインター符号化されたものである場合には、可逆復号回路614において、フレーム画像データのヘッダ部に格納された動きベクトルMVも復号され、その動きベクトルMVが動き予測・補償装置620に出力される。
【0017】
可逆復号回路614の出力となる、量子化された変換係数は、逆量子化回路615に入力され、ここで逆量子化される。当該逆量子化された変換係数には、逆直交変換回路616において、定められたフレーム画像データのフォーマットに基づき、逆離散コサイン変換や逆カルーネン・レーベ変換等の逆直交変換が施される。当該フレーム画像データがイントラ符号化されたものである場合には、逆直交変換処理が施されたフレーム画像データは、デブロックフィルタ621でブロック歪みが除去された後に画面並べ替えバッファ618に格納され、D/A変換回路619によるD/A変換処理を経て出力される。
【0018】
一方、当該フレームがインター符号化されたものである場合には、動き予測・補償回路620において、動きベクトルMV及びフレームメモリ621に格納された参照フレーム画像データを基に予測フレーム画像データが生成され、この予測フレーム画像データと、逆直交変換回路616から出力されたフレーム画像データとが加算器617において加算される。その他の処理はイントラ符号化されたフレーム画像データと同様である。
【0019】
以下、H.26L規格が規定する逆直交変換処理、及び逆量子化処理について述べる。
H.26L規格では、逆量子化処理を行なう場合に、4×4直交変換係数を、図3に示す順番で逆スキャンする。図3において、「0」〜「15」は、4×4のマトリクス状に位置する合計16個の画素位置に対応した直交変換係数を示している。
【0020】
図4に示すように、16×16イントラマクロブロック200においては、当該マクロブロック200に含まれる16個の4×4直交変換ブロック201のそれぞれにおいて直交変換を施した後、その輝度の位置「0」に対応するDC成分である輝度DC係数のみを集めて再び4×4ブロック202を生成し、これに対して直交変換が施される。
そして、4×4ブロック202は、図3で説明した順番でスキャンされる。
また、4×4直交変換ブロック201内の残された輝度の「1」〜「15」で示されるAC成分である輝度AC係数は、2番目の位置(「1」の位置)から順に、図3に示された方法により、ジグザグスキャンされる。
【0021】
また、16×16イントラマクロブロックにおける色差信号成分の符号化方式における逆量子化処理では、図5に示すように、まず、2×2ブロック210内の色差DC係数がラスターの順でスキャンされる。次に4×4色差ブロック211内の残された「1」〜「15」の色差AC係数は、図3に示す2番目の位置(「1」の位置)から順にジグザグスキャンを行う。
【0022】
量子化のパラメータであるQP値としては、0〜51の52の異なる値が設定される。
色差に使われるQPc値は輝度のQPy値と対応づけて、図6に示すように定義されている。
QP値は6増加する毎に量子化スケールが2倍になるよう設定されている(Peridoic Quantization)。すなわち、QP値が1大きくなる毎に量子化スケールが約12%増加する(1.12倍になる)。
【0023】
後述の計算式に用いられる係数R(m,i,j)は下記(1−1)に示す擬似コードを用いて算出される。
【0024】
【数1】
【0025】
上記(1−1)内のVの第1、第2サブスクリプトはそれぞれ下記(1−2)で示されるマトリックスの行と列番号を示す。
【0026】
【数2】
【0027】
16×16イントラモードで符号化された4×4ブロックの輝度成分の量子化されたDC係数を復号処理した後、直交変換処理は以下の説明する方式と数学的に同等な手順で行う。逆量子化処理は直交変換処理の後に行われる。
16×16イントラモードで符号化された4×4ブロックの輝度成分の、DC係数の直交変換処理は下記(1−3)のように定義される。
下記(1−3)において、XQDは、直交変換後の輝度のDC係数の行列を示し
、右辺の中央の行列は直交変換前の輝度のDC係数の行列を示している。
【0028】
【数3】
【0029】
この仕様に準拠する画像圧縮情報は、−215〜215−1の範囲の整数値を超えるXQD(i,j)値を持ってはならない。
【0030】
直交変換処理の後に逆量子化は以下の手順で行われる。
QPが12若しくはそれ以上の値の場合、逆量子化は下記(1−4)を基に処理を行う。
ここで、DCijが逆量子化されたDC係数を示し、Fijが逆量子化前のDC係数を示している。
【0031】
【数4】
【0032】
また、QPが12以下の場合、逆量子化は下記(1−5)を基に処理を行なう。
【0033】
【数5】
【0034】
この仕様に準拠するビットストリームは、−215〜215−1の範囲の整数値を超えるDCij値を持ってはならない。
【0035】
色差成分の2×2ブロックの量子化されたDC係数を復号処理した後、直交変換処理は下記(1−6)と数学的に同等な手順で行う。
【0036】
【数6】
【0037】
この仕様に準拠する画像圧縮情報は、−215〜215−1の範囲の整数値を超えるXQD(i,j)値を持ってはならない。
【0038】
色差成分についての直交変換処理後の逆量子化は以下の手順で行われる。
QPが6若しくはそれ以上の値の場合、逆量子化は下記(1−7)を基に処理を行う。
【0039】
【数7】
【0040】
QPが6より少ない値の場合、逆量子化は下記(1−8)を基に処理を行う。
【0041】
【数8】
【0042】
この仕様に準拠するビットストリームは、−215〜215−1の範囲の整数値を超えるDCij値を持ってはならない。
【0043】
上述した以外の4×4係数の逆量子化処理は下記(1−9)を基に行なわれる。
【0044】
【数9】
【0045】
ここでR(m,i,j)は、上記(1−1)で定義された係数である。
この仕様に準拠する画像圧縮情報は、「−215〜215−1」の範囲の整数値を超えるwij値を持ってはならない。
【0046】
下記(1−10)に示される4×4ブロックの直交変換係数マトリックスを復号化した後、直交変換処理は復号化された直交変換係数のブロックを以下に示す数学的に同等な手順で出力画素値のブロックに変換する。
【0047】
【数10】
【0048】
すなわち、まず、復号化された直交変換係数の行それぞれに対して、一次元直交変換処理を行う。
次に、求められた行列の列に対して、同様な一次元直交変換処理を行う。
ここで、入力となる直交変換係数を、w0,w1,w2,w3とすれば、まず、下記(1−11)により中間値z0,z1,z2,z3が求められ、さらに、下記(1−12)により復号画像における画素値若しくはその差分値であるx0,x1,x2,x3が求められる。
【0049】
【数11】
【0050】
【数12】
【0051】
この仕様に準拠する画像圧縮情報は、第1(水平)及び第2(垂直)直交変換処理それぞれにおいて、「−215〜215−1」の範囲の整数値を超えるz0 ,z1 ,z2 ,z3 ,x0 ,x1 ,x2 ,x3 値を持ってはならない。また、この仕様に準拠するビットストリームは、第2(垂直)直交変換処理において、「−215〜215−1」の範囲の整数値を超えるx0 ,x1 ,x2 ,x3 値をもってはならない。
水平、垂直方向両方において、直交変換処理を施すことにより得られる下記(1−13)のブロックを用いて、下記(1−14)により復号画像の画素値若しくはその差分値を算出する。
【0052】
【数13】
【0053】
【数14】
【0054】
最終的な画素値は、最後に、下記(1−15)に示すように、復号化された予測残差値X’’(i,j)は動き補償予測値または空間予測値P(i,j)と足し合わせ、0〜255の範囲に収まるようクリッピングを行なって算出される。
【0055】
【数15】
【0056】
ところで、MPEG2のTestModel(“TestModel5”,ISO/IEC,JTC/SC29/WG11/N0400,1993)で定められている符号量制御方式のステップ3においては、マクロブロック毎の適応量子化を行う方法が定められている。すなわち、以下に定める方法により、参照量子化スケールコードを、視覚的に劣化の目立ちにくい絵柄の複雑な部分でより粗く量子化するように、各マクロブロック毎のアクティビティを変化させている。
【0057】
以下では、MPEG2のTestModelにおいて定められているレート制御方式の、ステップ1〜ステップ3について述べる。
ステップ1では、GOP(Group Of Pictures) 内の各ピクチャに対する割当ビット量を、割当対象ピクチャを含めて、まだ符号化されていないピクチャに対して、割当られるビット量Rを基にして配分する。この配分をGOP内の符号化ピクチャ順に繰り返す。その際、以下の2つの仮定を用いて、各ピクチャへの符号量割当を行っているのが特徴である。
第1の仮定は、各ピクチャを符号化する際に用いる、平均量子化スケールコードと発生符号量との積は、画面が変化しない限り、ピクチャタイプ毎に一定となるという仮定である。
そこで、各ピクチャを符号化した後、各ピクチャタイプ毎に、画面の複雑さを表す媒介変数XI,XP,XB(Global Complexity Measure)を下記(2−1)により更新する。
この媒介変数により、次のピクチャを符号化する際の量子化スケールコードと発生符号量の関係を推定できる。
【0058】
【数16】
ここで、SI,SP,SBは、ピクチャ符号化時の発生符号化ビット、QI,QP,QBは、ピクチャ符号化時の平均量子化スケールコードである。
また、初期値は、目標符号量であるbit_rate[bits/sec]を用いて、下記(2−2),(2−3),(2−4)で示される値とする。
【0059】
【数17】
【0060】
【数18】
【0061】
【数19】
【0062】
第2の仮定は、Iピクチャの量子化スケールコードを基準としたP,Bピクチャの量子化スケールコードの比率Kp,Kbが、下記(2−5)に定める値になる時、常に全体の画質が最適化されると仮定する。
【0063】
【数20】
【0064】
すなわち、Bピクチャの量子化スケールコードは、I,Pピクチャの量子化スケールコードの常に1.4倍としている。これは、BピクチャをI,Pピクチャに比較して多少粗めに量子化することにより、Bピクチャで節約できる符号量をI,Pピクチャに加えると、I,Pピクチャの画質が改善されるとともに、これを参照するBピクチャの画質をも向上させることを想定している。
【0065】
上記2つの仮定より、GOP中の各ピクチャに対する割当符号量(TI,TP,TB)は、下記(2−6),(2−7),(2−8)で示される値となる。
下記(2−6)において、picture_rateは、(当該シーケンスにおける、1秒あたり表示されるピクチャの数)を示している。
【0066】
【数21】
【0067】
【数22】
【0068】
【数23】
【0069】
ここで、NP,NBは、GOP内でまだ符号化されていない、P,Bピクチャの枚数である。
【0070】
すなわち、まず、GOP内の未符号化ピクチャのうち、割当対象となるピクチャと、異なるピクチャタイプのものに関しては、上述の画質最適化条件の元、そのピクチャの発生する符合量が、割当対象ピクチャの発生符号量の何倍となるかを推定する。
次に、未符号化ピクチャ全体の発生する推定発生符号量が、割当対象ピクチャの何枚分の符号量に相当するかを求める。
例えば、上記(2−6)の、第1引数の分母第2項、NPXP/XIKPは、GOP内の、NP枚の未符号化ピクチャが、Iピクチャに換算すると何枚分に換算するかを表すものであり、NPに、Pピクチャに対する発生符号量の、Iピクチャの発生符号量に対する割合SP/SIを乗じ、上記(2−1)、上記(2−5)を用いて、XI,XP,KBで表すことにより得られる。
【0071】
割当対象ピクチャに対するビット量は、未符号化ピクチャに対する割当ビット量Rを、この枚数で割ることによって得られる。但し、ヘッダなどに、固定的に必要となる符号量を考慮して、その値に下限を設定している。
このようにして求めた割当符号量を基にして、各ピクチャをステップ1,2に従って符号化する毎に、GOP内の未符号化ピクチャに対して割当られる符号量Rを、下記(2−9)により更新する。
【0072】
【数24】
【0073】
また、GOPの最初のピクチャを符号化する際には、以下の(2−10)により、Rを更新する。
【0074】
【数25】
【0075】
ここで、Nは、GOP内のピクチャ数である。また、シーケンス最初でのRの初期値は0とする。
次に、ステップ2について述べる。
ステップ2では、ステップ1で求めた、各ピクチャに対する割当ビット量(TI.TP,TB)を、実際の符号量に一致させるため、各ピクチャタイプ毎に、独立に設定した3種類の仮想バッファの容量を基に、量子化スケールコードを、マクロブロック単位のフィードバック制御により求める。
まず、j番目のマクロブロック符号化に先立ち、仮想バッファの占有量を下記(2−11),(2−12),(2−13)により求める。
【0076】
【数26】
【0077】
【数27】
【0078】
【数28】
【0079】
d0 I,d0 P,d0 Bは、各仮想バッファの初期占有量、Bjは、ピクチャの先頭からj番目のマクロブロックまでの発生ビット量、MBcntは、1ピクチャ内のマクロブロック数である。
【0080】
各ピクチャ符号化終了時の仮想バッファ占有量(dMBcnt I,dMBcnt P,dMBcnt B)は、それぞれ同一のピクチャタイプで、次のピクチャに対する仮想バッファ占有量の初期値(d0 I,d0 P,d0 B)として用いられる。
次に、j番目のマクロブロックに対する量子化スケールコードQj を下記(2−14)により算出する。
ここで、dj は、dj I ,dj P ,dj B を用いて(式2−11〜式2−13)のように定義される。
【0081】
【数29】
【0082】
rはリアクションパラメータと呼ばれるフィードバックループの応答速度を制御する媒介変数で、下記(2−15)により与えられる。
【0083】
【数30】
【0084】
なお、シーケンスの最初における仮想バッファ初期値は下記(2−16)により与えられる。
【0085】
【数31】
【0086】
次に、ステップ3について述べる。
アクティビティは、予測誤差でなく、原画の輝度信号画素値を用い、フレームDCTモードにおける4個の8×8ブロックと、フィールドDCT符号化モードにおける4個の8×8ブロックとの合計8個のブロックの画素値を用いて、下記(2−17),(2−18),(2−19)により与えられる。
下記(2−18)に示すvar_sblkは、各画素の画素データとその平均値との差分の自乗和であり、当該8×8ブロックの画像が複雑になるに従って値が大きくなる。
【0087】
【数32】
【0088】
【数33】
【0089】
【数34】
【0090】
ここでPkは原画の輝度信号ブロック内画素値である。上記(2−17)において最小値(min)を採るのは、16×16のマクロブロック内の一部だけでも平坦部分のある場合には量子化を細かくするためである。
さらに、以下の(2−20)により、その値が0.5〜2の範囲をとる正規化アクティビティNactjを求める。
【0091】
【数35】
【0092】
avg_actは、直前に符号化したピクチャでのactjの平均値である。視覚特性を考慮した量子化スケールコードmquantjは、参照量子化スケールコードQjを基に下記(2−21)により与えられる。
【0093】
【数36】
【0094】
ところで、MPEG2画像情報符号化装置と同様、JVT(Joint Video Team)画像情報符号化装置においても、入力となる画像情報が飛び越し走査フォーマットであっても良い。JVT画像符号化方式においては、以下に述べる通り、ピクチャレベルのフィールド/フレーム適応型符号化方式、及び、マクロブロックレベルのフィールド/フレーム適応型符号化方式が規定されている。
【0095】
図7を用いて、JVT符号化方式において定められている、ピクチャレベルのフィールド/フレーム符号化方式を説明する。
すなわち、各ピクチャにおいて、フレーム符号化と、フィールド符号化のうち、より符号化効率の高い方を選択して符号化することが可能である。
【0096】
図8を用いて、JVT符号化方式において定められている、マクロブロックレベルのフィールド/フレーム符号化方式を説明する。
すなわち、JVT符号化方式において、マクロブロックレベルのフィールド/フレーム符号化を行う場合、図8(A)に示すように、2つのマクロブロックをペアとしてスキャンを行う。
それぞれのマクロブロックペアに対して、図8(B)に示すように、フィールド符号化を行うか、フレーム符号化を行うかを選択することが可能である。
【0097】
ところで、上述したTestModel5によって定められている適応量子化を、H.26L規格の符号化方式にそのまま適応することは、以下の2つの理由により不可能である。
第1の理由は、H.26L規格では、上述のような、量子化パラメータQPが6増加する毎に2倍の粗さで量子化を行う、すなわちQPが1大きくなる毎に量子化スケールが約12%増加する(1.12倍になる)という、Period
ic Quantizationが導入されているということである。
また、第2の理由は、MPEG2符号化方式においては8×8ブロックが直交変換の単位であるのに対し、JVT符号化方式においては、4×4ブロックが直交変換の単位であるということである。
【0098】
以下、上述した問題を解決するための本実施形態の画像処理装置およびその方法と符号化装置について説明する。
第1実施形態
図9は、本実施形態の通信システム1の概念図である。
図9に示すように、通信システム1は、送信側に設けられた符号化装置2と、受信側に設けられた復号装置499とを有する。
符号化装置2が発明の符号化装置に対応している。
符号化装置2および復号装置499は、上述したH.26Lに基づいて符号化および復号を行なう。
復号回路499は、図2を用いて前述したものと同じである。
【0099】
通信システム1では、送信側の符号化装置2において、離散コサイン変換やカルーネン・レーベ変換などの直交変換と動き補償によって圧縮したフレーム画像データ(ビットストリーム)を生成し、当該フレーム画像データを変調した後に、衛星放送波、ケーブルTV網、電話回線網、携帯電話回線網などの伝送媒体を介して送信する。
受信側では、受信した画像信号を復調した後に、上記変調時の直交変換の逆変換と動き補償によって伸張したフレーム画像データを生成して利用する。
なお、上記伝送媒体は、光ディスク、磁気ディスクおよび半導体メモリなどの記録媒体であってもよい。
なお、本実施形態では、符号化装置2における量子化パラメータの変化量データΔQの算出方法に特徴を有している。
【0100】
〔符号化装置2〕
図10は、図9に示す符号化装置2の全体構成図である。
図10に示すように、符号化装置2は、例えば、A/D変換回路22、画面並べ替え回路23、演算回路24、直交変換回路25、量子化回路26、可逆符号化回路27、バッファ28、逆量子化回路29、逆直交変換回路30、フレームメモリ31、レート制御回路32、動き予測・補償回路36、デブロックフィルタ37、アクティビティ算出回路40およびΔQ算出回路41を有する。
【0101】
直交変換回路25が本発明の直交変換回路に対応し、量子化回路26が本実施形態の量子化回路に対応し、可逆符号化回路27が本発明の符号化回路に対応し、動き予測・補償回路36が本発明の動き予測・補償回路に対応し、アクティビティ算出回路40が本発明の指標データ生成手段に対応し、ΔQ算出回路41が本発明の変化量データ取得手段に対応し、レート制御回路32が本発明の量子化パラメータ生成手段に対応している。
【0102】
符号化装置2は、H.26L規格に基づいて、4×4のブロックを単位として直行変換を行なうと共に、上述したPeriodoic Quantizationを基に量子化を行なう。
【0103】
以下、符号化装置2の構成要素について説明する。
A/D変換回路22は、入力されたアナログの輝度信号Y、色差信号Pb,Prから構成される画像信号をデジタルの画像信号に変換し、これを画面並べ替え回路23に出力する。
画面並べ替え回路23は、A/D変換回路22から入力した画像信号内のフレーム画像信号を、そのピクチャタイプI,P,BからなるGOP(Group Of Pictures) 構造に応じて、符号化する順番に並べ替えたフレーム画像データS23を演算回路24、動き予測・補償回路36およびアクティビティ算出回路40に出力する。
【0104】
演算回路24は、フレーム画像データS23がインター(Inter) 符号化される場合には、フレーム画像データS23と、動き予測・補償回路36から入力した予測フレーム画像データS36aとの差分を示す画像データS24を生成し、これを直交変換回路25に出力する。
また、演算回路24は、フレーム画像データS23がイントラ(Intra) 符号化される場合には、フレーム画像データS23を画像データS24として直交変換回路25に出力する。
直交変換回路25は、画像データS24に離散コサイン変換やカルーネン・レーベ変換などの直交変換を施して画像データ(例えばDCT係数信号)S25を生成し、これを量子化回路26に出力する。
直交変換回路25は、上述したH.26L規格に基づいて、4×4のブロックを単位として直交変換を行う。
量子化回路26は、レート制御回路32から入力した量子化スケールで、画像データS25を量子化して画像データS26を生成し、これを可逆符号化回路27および逆量子化回路29に出力する。
【0105】
可逆符号化回路27は、画像データS26を可変長符号化あるいは算術符号化した画像データをバッファ28に格納する。
このとき、可逆符号化回路27は、動き予測・補償回路36から入力した動きベクトルMVあるいはその差分を符号化してヘッダデータに格納する。
バッファ28に格納された画像データは、変調等された後に送信される。
【0106】
逆量子化回路29は、画像データS26を逆量子化したデータを生成し、これをデブロックフィルタ37に出力する。
逆量子化回路29は、H.26L規格に基づいて、上記式(1−4),(1−5),(1−7),(1−8),(1−9)に基づいて量子化処理を行う。
逆直交変換回路30は、量子化され、デブロックフィルタ37でブロック歪みが除去された画像データに上記直交変換の逆変換を施して生成したフレーム画像データをフレームメモリ31に格納する。
逆直交変換回路30は、H.26L規格に基づいて、上述したように4×4のブロックを単位として逆直交変換を行う。
【0107】
レート制御回路32は、バッファ28から読み出した画像データ、並びにΔQ算出回路41から入力した量子化パラメータQPの変化量データΔQPとを基に量子化パラメータQPを生成し、当該量子化パラメータに応じた量子化スケールを基に量子化回路26の量子化を制御する。
レート制御回路32は、量子化パラメータQPとして0〜51の52の異なる値を用いる。
色差に使われるQPc値は輝度のQPy値と対応づけて、図6に示すように定義されている。
また、レート制御回路32は、量子化パラメータQPが6増加する毎に量子化スケールが2倍になるように量子化スケールを決定する(Peridoic Quantization)。すなわち、量子化パラメータQPが1大きくなる毎に量子化スケールを約12%増加させる(1.12倍にする)。
レート制御回路32は、例えば、上記(2−1)〜(2−14)を基に説明したようにMPEG2のTestModelと同様に、符号化対象の画像データ(ピクチャ)に割り当てられた符号量(上記(2−11),(2−12),(2−13)のTI ,TP ,TB )などを用いて、上記(2−14)を基に量子化スケールコードQj を生成し、これを参照データQPref (本発明の参照データ)とする。
この場合に、レート制御回路32は、バッファ28からの画像データを基に上記(2−11),(2−12),(2−13)のBj-1 を取得する。
そして、レート制御回路32は、下記(3−1)を基に、参照データQPrefと変化量データΔQPとを加算して量子化パラメータQPを生成する。
【0108】
【数37】
【0109】
動き予測・補償回路36は、フレームメモリ31からの画像データS31と、画面並べ替え回路23からの画像データとを基に動き予測・補償処理を行って、動きベクトルMVおよび参照画像データS36aを生成する。
動き予測・補償回路36は、動きベクトルMVを可逆符号化回路27に出力し、参照画像データS36aを演算回路24に出力する。
【0110】
アクティビティ算出回路40は、画像データS23(原画のピクチャ)が順次走査画像である場合に、その輝度信号画素値を用い、16×16のマクロブロック(本発明の第1のブロック)内の4つの8×8ブロック(本発明の第2のブロック)のそれぞれについて、下記(3−2),(3−3)を基にvar_sblk(本発明の分散データ)を算出する。
ここで、var_sblkは、各画素の画素データとその平均値との差分の自乗和であり、当該8×8ブロックの画像が複雑になるに従って値が大きくなる。
【0111】
【数38】
【0112】
【数39】
【0113】
そして、アクティビティ算出回路40は、下記(3−4)を基に、上記4つの8×8ブロックについて算出したvar_sblkの最小値を(min(var_sblk)用いてactj を得る。
【0114】
【数40】
【0115】
そして、アクティビティ算出回路40は、下記(3−5)を基にアクティビティNactj (本発明の指標データ)を算出する。
下記(3−4)におけるavg_actは、直前に符号化したピクチャでのactj の平均値である。
ここで、アクティビティNactj は、0.5〜2の範囲の値となるように正規化される。
【0116】
【数41】
【0117】
なお、H.26Lにおいても、MPEG2で行われているのと同様な、マクロブロック単位でのフィールド/フレーム適応符号化処理を行うことが、文献” MB adaptive field/frame coding for interlace sequences” (Wang et al, JVT-D108, Joint Video Team (JVT) of ISO/IEC MPEG & ITU-T VCEG,ISO/IEC JTC1/SC29/WG11 and ITU-T SG16 Q.6, Klagenfurt, Austria,July, 2002) で提案されているが、この方式に基づいた符号化処理を行う場合には、8×8ブロックを、アクティビティを算出する単位として処理を行う。
【0118】
ΔQ算出回路41は、アクティビティ算出回路40から入力したアクティビティNactj を用いて、例えば、下記(3−6)に示す演算を行って量子化パレータQPの変化量データΔQPを生成する。
【0119】
【数42】
【0120】
すなわち、ΔQ算出回路41は、アクティビティNactj が1.12倍(本発明のr倍)になると変化量データΔQPが1(本発明の所定の単位量)だけ増加するように、アクティビティNactj と変化量データΔQPとの関係を規定する。
これにより、量子化対象の画像の複雑度を示すアクティビティNactj が2倍になると、それに応じて量子化パラメータQPが6増加し、量子化スケールが2倍になるように規定できる。
すなわち、量子化パラメータQPが1大きくなる毎に量子化スケールを約12%増加させる(1.12倍にする)というH.26Lで規定されたPeridoic Quantizationを実現できる。
なお、ΔQ算出回路41は、例えば、図11に示す表データ80を基に、アクティビティNactj が図11に示す最小値と最大値との間にある場合に、それに対応する値の変化量データΔQPを出力するようにしてもよい。
【0121】
次に、図10に示す符号化装置2の全体動作を説明する。
入力となる画像信号は、まず、A/D変換回路22においてデジタル信号に変換される。次に、出力となる画像圧縮情報のGOP構造に応じ、画面並べ替え回路23においてフレーム画像データの並べ替えが行われる。
そして、アクティビティ算出回路40において、アクティビティNactj が生成され、これがΔQ算出回路41に出力される。
そして、ΔQ算出回路41において、アクティビティNactj が1.12倍になると変化量データΔQPが1だけ増加するように、アクティビティNactj を基に変化量データΔQPを生成し、これをレート制御回路32に出力する。そして、レート制御回路32が、参照データQPref と変化量データΔQPとを加算して量子化パラメータQPを生成する。
【0122】
また、イントラ符号化が行われるフレーム画像データに関しては、フレーム画像データ全体の画像情報が直交変換回路25に入力され、直交変換回路25において離散コサイン変換やカルーネン・レーベ変換等の直交変換が施される。
直交変換回路25の出力となる変換係数は、量子化回路26において量子化処理される。
量子化回路26は、レート制御回路32からの制御に基づいて、量子化パラメータQPを基に規定された量子化スケールで量子化を行う。
量子化回路26の出力となる、量子化された変換係数は、可逆変換回路27に入力され、ここで可変長符号化、算術符号化等の可逆符号化が施された後、バッファ28に蓄積され、圧縮された画像データとして出力される。
同時に、量子化回路26の出力となる、量子化された変換係数は、逆量子化回路29に入力され、さらに逆直交変換回路30において逆直交変換処理が施されて、復号されたフレーム画像データとなり、そのフレーム画像データがフレームメモリ31に蓄積される。
【0123】
一方、インター符号化が行われる画像に関しては、先ず、そのフレーム画像データS23が動き予測・補償回路36に入力される。また、参照画像のフレーム画像データS31がフレームメモリ31より読み出され、動き予測・補償回路36に出力される。
そして、動き予測・補償回路36において、参照画像のフレーム画像データS31を用いて、動きベクトルMVおよび予測フレーム画像データS36aが生成される。
【0124】
そして、演算回路24において、画面並べ替え回路23からのフレーム画像データと、動き予測・補償回路36からの予測フレーム画像データS36aとの差分信号である画像データS24が生成され、当該画像データS24が直交変換回路25に出力される。
そして、可逆符号化回路27において、動きベクトルMVが可変長符号化あるいは算術符号化といった可逆符号化処理され、画像データのヘッダ部に挿入される。その他の処理はイントラ符号化を施される画像データと同様である。
【0125】
以上説明したように、符号化装置2によれば、ΔQ算出回路41において、上記(3−6)あるいは図11に示す表データを基に、アクティビティNactjが1.12倍(本発明のr倍)になると変化量データΔQPが1(本発明の所定の単位量)だけ増加するように、アクティビティNactj と変化量データΔQPとの関係を規定することで、アクティビティNactj の値を適切に反映させてH.26Lで規定されたPeridoic Quantizationを実現できる。
【0126】
また、符号化装置2によれば、直交変換の単位は4×4のブロックがであるが、アクティビティ算出回路40がマクロブロック内の4つの8×8ブロックについて算出したvar_sblkの最小値を基にアクティビティNactj を算出する。そのため、画面全体の複雑度の分散を適切に示したアクティビティNactj を基に適応量子化の効果を高めることができる。
【0127】
第2実施形態
本実施形態では、アクティビティ算出回路40が、16×16ブロックをactj の算出単位とする点を除いて、第1実施形態と同様である。
本実施形態では、アクティビティ算出回路40が、下記(3−7),(3−8),(3−9)を基に、actj を算出する。
【0128】
【数43】
【0129】
【数44】
【0130】
【数45】
【0131】
HDTV(Hight Definition TeleVision) のように、画枠に比して一つのマクロブロックの大きさが相対的に小さい場合、このような適応量子化を行うことで視覚特性に基づいた良好な画質を得ることが可能である。
なお、16×8ブロックあるいは8×16ブロックをactj の算出の単位としても良い。これらを、画像の局所的性質に応じて適応的に切り替えても良い。
【0132】
ところで、H.26L規格においては、図12に示すように、可変サイズの動き予測・補償ブロックを用いることが可能である。
インターマクロブロックにおいては、当該マクロブロックにおける動き予測・補償ブロックを、アクティビティを算出する単位として用いることも考えられる。
当該動き予測・補償ブロックがサブパーティションモード、すなわち8×8以下である場合には、上述の通り、画面全体に渡るアクティビティの分散を十分に得ることが不可能となる可能性があるため、8×8ブロックをアクティビティ算出の単位としても良い。
【0133】
第3実施形態
上述した第1実施形態では、入力となる画像データが順次走査画像データである場合を例示したが、本実施形態では、入力となる画像データ飛び越し走査画像(インタレース画像)であり、図7および図8を用いて前述したように、ピクチャレベルあるいはマクロブロックレベルのフィールド/フレーム適応型符号化を行う場合を説明する。
【0134】
例えば、図7に示したような、ピクチャレベルのフィールド/フレーム適応型符号化を行う場合、当該フレームをフィールド符号化する際、第1フィールドおよび第2フィールドのそれぞれをフレームと見なし、入力となる画像データが順次走査である場合(第1実施形態の場合)と同様に適応量子化処理、すなわち第1実施形態で説明したアクティビティ算出回路40、ΔQ算出回路41、レート制御回路32および量子化回路26の処理を行う。
【0135】
また、図8に示したような、マクロブロックレベルのフィールドフレーム適応符号化を行う場合には、図8(A)で説明したように、アクティビティ算出回路40が、1つのマクロブロックペアに対してactj を算出する。
すなわち、当該マクロブロックペアを、フィールド符号化した場合と、フレーム符号化した場合を考慮すれば、8×8ブロックを、slbkを算出する単位とすれば、フレーム符号化による合計8つのブロック、フィールド符号化される8つのブロックの、合計16のブロックに対して、下記(3−10)を基に当該マクロブロックペアについてのactj を算出する。
【0136】
【数46】
【0137】
また、16×16ブロックを、actj の算出単位とするなら、下記(3−11)を基に、フレーム符号化による合計2つのブロック、フィールド符号化される2つのブロックの、合計4のブロックに対して、当該マクロブロックペアについてのactj を算出する。
【0138】
【数47】
【0139】
以上、H.26Lへの適用を例にして、本発明の概要を述べてきたが、本発明の適用範囲はこれに限らず、Periodic Quantization、4×4DCTを用いた任意の画像符号化方式に適用可能である。
また、上述した実施形態では、本発明の単位量が1、rが1.12の場合を例示したが、単位量およびrはその他の値でもよい。
【0140】
【発明の効果】
本発明によれば、量子化パラメータが所定の単位量だけ増加すると動画像の画像データが量子化される粗さがr倍になる場合に、画像データの複雑度を適切に反映させて量子化パラメータの変化量を規定できる画像処理装置およびその方法と符号化装置を提供することができる。
【図面の簡単な説明】
【図1】図1は、本発明の関連技術に係わる符号化装置の機能ブロック図である。
【図2】図2は、本発明の関連技術に係わる復号装置の機能ブロック図である。
【図3】図3は、JVT画像圧縮情報における、4×4ジグザグスキャン方式を示した図である。
【図4】図4は、JVT符号化方式におけるイントラ16×16マクロブロックの輝度信号成分の符号化方式を示した図である。
【図5】図5は、JVT符号化方式におけるイントラ16×16マクロブロックの色差信号成分の符号化方式を示した図である。
【図6】図6は、JVT符号化方式において定められている、輝度信号に対する量子化パラメータQPYと、色差信号に対する量子化パラメータQPCの対応関係を示した図である。
【図7】図7は、JVT符号化方式において定められている、ピクチャレベルのフィールド/フレーム適応型符号化方式を説明するための図である。
【図8】図8は、JVT符号化方式において定められている、マクロブロックレベルのフィールド/フレーム適応型符号化方式を説明するための図である。
【図9】図9は、本発明の第1実施形態の通信システムの概念図である。
【図10】図10は、本発明の第1実施形態に係わる符号化装置の機能ブロック図である。
【図11】図11は、ΔQ算出回路における、入力値Nactjと、出力値ΔQPとの対応関係を示した図である。
【図12】図12は、JVT符号化方式において定められている、可変サイズの動き予測補償ブロックを示した図である。
【符号の説明】
1…通信システム、2…符号化装置、3…復号装置、22…A/D変換回路、23…画面並べ替え回路、24…演算回路、25…直交変換回路、26…量子化回路、27…可逆符号化回路、28…バッファ、29…逆量子化回路、30…逆直交変換回路、31…フレームメモリ、32…レート制御回路、36…動き予測・補償回路、40…アクティビティ算出回路、41…ΔQ算出回路
Claims (11)
- 量子化パラメータが所定の単位量だけ増加すると動画像の画像データが量子化される粗さがr倍になる場合に、前記量子化パラメータの変化量を示す変化量データを生成する画像処理装置であって、
前記画像データの複雑度の指標となる指標データを生成する指標データ生成手段と、
前記指標データがr倍になると前記変化量データが前記単位量だけ増加するように前記指標データと前記変化量データとの対応関係を規定し、当該規定に基づいて、前記指標データ生成手段が生成した前記指標データに対応する前記変化量データを取得する変化量データ取得手段と
を有する画像処理装置。 - 符号化対象の前記画像データに割り当てられた符号量を基に規定された参照データと、前記変化量データ取得手段が取得した前記変化量データとを基に前記量子化パラメータを生成する量子化パラメータ生成手段
をさらに有する請求項1に記載の画像処理装置。 - 前記指標データ生成手段は、前記画像データの第1のブロック内に規定された複数の第2のブロックを単位として当該第2のブロック内の画素データの分散を示す分散データを算出し、複数の前記第2のブロックについて算出した前記分散データのうち最小の前記分散データを用いて前記指標データを生成する
請求項1に記載の画像処理装置。 - 前記指標データ生成手段は、前記第2のブロック内の画素データと前記第2のブロック内の全ての画素データの平均値との差分に応じた値を累積して前記分散データを算出する
請求項3に記載の画像処理装置。 - 前記指標データ生成手段は、前記画像データに直交変換を施す単位となるブロックより大きいサイズの前記第2のブロックを単位として前記分散データを算出する
請求項3に記載の画像処理装置。 - 前記画像データが第1のフィールドおよび第2のフィールドで構成される場合に、
前記指標データ生成手段は、前記第1のフィールドおよび前記第2のフィールドのそれぞれについて前記指標データを生成し、
前記変化量データ取得手段は、前記指標データ生成手段が生成した前記指標データを基に、前記前記第1のフィールドおよび前記第2のフィールドのそれぞれについての前記変化量データを取得する
請求項1に記載の画像処理装置。 - 前記指標データ生成手段は、前記画像データがインタレース走査画像データである場合に、複数の前記第1のブロック内に規定された複数の前記第2のブロックについて前記分散データを算出する
請求項3に記載の画像処理装置。 - 前記指標データ生成手段は、フィールド符号化に対応した前記第2のブロックと、フレーム符号化に対応した前記第2のブロックとを含む前記複数の第2のブロックについて前記分散データを算出する
請求項6に記載の画像処理装置。 - 量子化パラメータが所定の単位量だけ増加すると動画像の画像データが量子化される粗さがr倍になる場合に、前記量子化パラメータの変化量を示す変化量データを生成する画像処理方法であって、
前記画像データの複雑度の指標となる指標データを生成する第1の工程と、
前記指標データがr倍になると前記変化量データが前記単位量だけ増加するように前記指標データと前記変化量データとの対応関係を規定し、当該規定に基づいて、前記第1の工程で生成した前記指標データに対応する前記変化量データを取得する第2の工程と
を有する画像処理方法。 - 符号化対象の前記画像データに割り当てられた符号量を基に規定された参照データと、前記第2の工程で取得した前記変化量データとを基に前記量子化パラメータを生成する第3の工程
をさらに有する請求項9に記載の画像処理方法。 - 画像データの複雑度の指標となる指標データを生成する指標データ生成手段と、
前記指標データがr倍になると前記変化量データが前記単位量だけ増加するように前記指標データと前記変化量データとの対応関係を規定し、当該規定に基づいて、前記指標データ生成手段が生成した前記指標データに対応する前記変化量データを取得する変化量データ取得手段と、
符号化対象の前記画像データに割り当てられた符号量を基に規定された参照データと、前記変化量データ取得手段が取得した前記変化量データとを基に前記量子化パラメータを生成する量子化パラメータ生成手段と、
画像データを直交変換する直交変換回路と、
前記直交変換回路で直交変換された画像データを量子化する量子化回路と、
前記量子化パラメータ生成手段が生成した前記量子化パレータを基に、前記量子化パラメータが所定の単位量だけ増加すると量子化の粗さをr倍にするように、前記量子化回路による前記量子化を制御する量子化制御回路と、
前記量子化回路が量子化した画像データを基に、参照画像データおよび動きベクトルを生成する動き予測・補償回路と、
前記量子化回路が量子化した画像データを符号化する符号化回路と
を有する符号化装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002360885A JP4214771B2 (ja) | 2002-12-12 | 2002-12-12 | 画像処理装置およびその方法と符号化装置 |
US10/733,255 US7409098B2 (en) | 2002-12-12 | 2003-12-12 | Image processing apparatus and method for coding with complexity-based quantization |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002360885A JP4214771B2 (ja) | 2002-12-12 | 2002-12-12 | 画像処理装置およびその方法と符号化装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004194076A true JP2004194076A (ja) | 2004-07-08 |
JP4214771B2 JP4214771B2 (ja) | 2009-01-28 |
Family
ID=32759825
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002360885A Expired - Fee Related JP4214771B2 (ja) | 2002-12-12 | 2002-12-12 | 画像処理装置およびその方法と符号化装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US7409098B2 (ja) |
JP (1) | JP4214771B2 (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006074347A (ja) * | 2004-09-01 | 2006-03-16 | Sony Corp | 画像処理装置および画像処理方法 |
JP2007116558A (ja) * | 2005-10-21 | 2007-05-10 | Matsushita Electric Ind Co Ltd | 動画像符号化装置 |
JP2007124122A (ja) * | 2005-10-26 | 2007-05-17 | Sony Corp | 符号化装置、符号化方法およびプログラム |
JP2011205683A (ja) * | 2011-05-27 | 2011-10-13 | Canon Inc | 画像符号化装置 |
JP2012504911A (ja) * | 2008-10-03 | 2012-02-23 | クゥアルコム・インコーポレイテッド | クロマビデオブロックおよびルマビデオブロックの符号化のための量子化パラメータ選択 |
JP2012085367A (ja) * | 2006-04-07 | 2012-04-26 | Microsoft Corp | テクスチャレベルに基づく量子化調整 |
US8711925B2 (en) | 2006-05-05 | 2014-04-29 | Microsoft Corporation | Flexible quantization |
US8897359B2 (en) | 2008-06-03 | 2014-11-25 | Microsoft Corporation | Adaptive quantization for enhancement layer video coding |
US9049453B2 (en) | 2004-12-14 | 2015-06-02 | Canon Kabushiki Kaisha | Image encoding apparatus and method based on intensity of edge information |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1906672A1 (en) * | 2005-07-15 | 2008-04-02 | Matsushita Electric Industrial Co., Ltd. | Image encoding device and image encoding method |
JP4644097B2 (ja) * | 2005-10-31 | 2011-03-02 | 富士通セミコンダクター株式会社 | 動画像符号化プログラム、プログラム記憶媒体、および符号化装置。 |
US11310504B2 (en) * | 2020-07-30 | 2022-04-19 | Tencent America LLC | Complexity reduction for 32-p and 64-p LGT |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3245977B2 (ja) * | 1992-06-30 | 2002-01-15 | ソニー株式会社 | ディジタル画像信号の伝送装置 |
US6078615A (en) * | 1993-03-31 | 2000-06-20 | Canon Kabushiki Kaisha | Encoding/decoding apparatus which performs an inverse orthogonal transformation on decoded data |
KR0134343B1 (ko) * | 1993-04-13 | 1998-04-29 | 김광호 | 양자화레벨을 이용한 부호화방법 및 그 장치 |
KR950010632A (ko) * | 1993-09-17 | 1995-04-28 | 배순훈 | 동영상부호화기 |
US6137835A (en) * | 1993-11-16 | 2000-10-24 | Canon Kabushiki Kaisha | Picture coding apparatus using orthogonal transforms |
US5592226A (en) * | 1994-01-26 | 1997-01-07 | Btg Usa Inc. | Method and apparatus for video data compression using temporally adaptive motion interpolation |
KR100213015B1 (ko) * | 1994-03-31 | 1999-08-02 | 윤종용 | 양자화 방법 및 회로 |
KR100297830B1 (ko) * | 1996-11-09 | 2001-08-07 | 윤종용 | 영상단위별 비트발생량 조절 장치 및 방법 |
JPH10174103A (ja) * | 1996-12-13 | 1998-06-26 | Matsushita Electric Ind Co Ltd | 画像符号化装置、符号化画像記録媒体、画像復号化装置、画像符号化方法、および符号化画像伝送方法 |
KR100243430B1 (ko) * | 1997-12-31 | 2000-02-01 | 구자홍 | 적응형 양자화 제어방법 |
JP3508916B2 (ja) * | 1999-03-11 | 2004-03-22 | 日本電気株式会社 | 動画像可変ビットレート符号化方法および装置 |
US6831947B2 (en) * | 2001-03-23 | 2004-12-14 | Sharp Laboratories Of America, Inc. | Adaptive quantization based on bit rate prediction and prediction error energy |
JP4144357B2 (ja) * | 2001-03-28 | 2008-09-03 | ソニー株式会社 | 画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体 |
CN1206864C (zh) * | 2002-07-22 | 2005-06-15 | 中国科学院计算技术研究所 | 结合率失真优化的码率控制的方法及其装置 |
US7016410B2 (en) * | 2002-08-23 | 2006-03-21 | Ess Technology, Inc. | Adaptive bit rate allocation |
US7046729B2 (en) * | 2002-08-27 | 2006-05-16 | Ess Technology, Inc. | Bit rate control for motion compensated video compression system |
-
2002
- 2002-12-12 JP JP2002360885A patent/JP4214771B2/ja not_active Expired - Fee Related
-
2003
- 2003-12-12 US US10/733,255 patent/US7409098B2/en not_active Expired - Fee Related
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006074347A (ja) * | 2004-09-01 | 2006-03-16 | Sony Corp | 画像処理装置および画像処理方法 |
US9049453B2 (en) | 2004-12-14 | 2015-06-02 | Canon Kabushiki Kaisha | Image encoding apparatus and method based on intensity of edge information |
JP2007116558A (ja) * | 2005-10-21 | 2007-05-10 | Matsushita Electric Ind Co Ltd | 動画像符号化装置 |
JP4593437B2 (ja) * | 2005-10-21 | 2010-12-08 | パナソニック株式会社 | 動画像符号化装置 |
JP2007124122A (ja) * | 2005-10-26 | 2007-05-17 | Sony Corp | 符号化装置、符号化方法およびプログラム |
JP4622804B2 (ja) * | 2005-10-26 | 2011-02-02 | ソニー株式会社 | 符号化装置、符号化方法およびプログラム |
US8767822B2 (en) | 2006-04-07 | 2014-07-01 | Microsoft Corporation | Quantization adjustment based on texture level |
JP2012085367A (ja) * | 2006-04-07 | 2012-04-26 | Microsoft Corp | テクスチャレベルに基づく量子化調整 |
US8711925B2 (en) | 2006-05-05 | 2014-04-29 | Microsoft Corporation | Flexible quantization |
US9967561B2 (en) | 2006-05-05 | 2018-05-08 | Microsoft Technology Licensing, Llc | Flexible quantization |
US8897359B2 (en) | 2008-06-03 | 2014-11-25 | Microsoft Corporation | Adaptive quantization for enhancement layer video coding |
US9185418B2 (en) | 2008-06-03 | 2015-11-10 | Microsoft Technology Licensing, Llc | Adaptive quantization for enhancement layer video coding |
US9571840B2 (en) | 2008-06-03 | 2017-02-14 | Microsoft Technology Licensing, Llc | Adaptive quantization for enhancement layer video coding |
US10306227B2 (en) | 2008-06-03 | 2019-05-28 | Microsoft Technology Licensing, Llc | Adaptive quantization for enhancement layer video coding |
JP2012504911A (ja) * | 2008-10-03 | 2012-02-23 | クゥアルコム・インコーポレイテッド | クロマビデオブロックおよびルマビデオブロックの符号化のための量子化パラメータ選択 |
JP2011205683A (ja) * | 2011-05-27 | 2011-10-13 | Canon Inc | 画像符号化装置 |
Also Published As
Publication number | Publication date |
---|---|
US20040228536A1 (en) | 2004-11-18 |
JP4214771B2 (ja) | 2009-01-28 |
US7409098B2 (en) | 2008-08-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4617644B2 (ja) | 符号化装置及び方法 | |
WO2011125729A1 (ja) | 画像処理装置と画像処理方法 | |
JP2005503737A (ja) | 境界強度に基づく適応フィルタリング | |
JP2004140473A (ja) | 画像情報符号化装置、復号化装置並びに画像情報符号化方法、復号化方法 | |
US10271070B2 (en) | Image processing system, image processing method and program | |
JP4360093B2 (ja) | 画像処理装置および符号化装置とそれらの方法 | |
JP4254147B2 (ja) | 画像情報符号化方法及び装置、並びにプログラム及び記録媒体 | |
JP4214771B2 (ja) | 画像処理装置およびその方法と符号化装置 | |
JP5375938B2 (ja) | 復号装置及び方法 | |
JP2006191253A (ja) | レート変換方法及びレート変換装置 | |
JP2008004984A (ja) | 画像理装置および方法、プログラム、並びに記録媒体 | |
JP4277530B2 (ja) | 画像処理装置および符号化装置とそれらの方法 | |
KR100366382B1 (ko) | 동영상 부호화 장치 및 방법 | |
JP4924708B2 (ja) | 復号装置及び方法 | |
JP4292659B2 (ja) | 画像情報変換装置及び画像情報変換方法 | |
JP3568392B2 (ja) | 動画像復号化装置 | |
JP4348899B2 (ja) | 画像情報復号方法 | |
JP5375935B2 (ja) | 符号化装置及び方法 | |
JP4983908B2 (ja) | 復号装置及び方法 | |
JP4983907B2 (ja) | 符号化装置及び方法 | |
JP5375937B2 (ja) | 符号化装置及び方法 | |
JP3343553B1 (ja) | 画像予測符号化装置及び方法 | |
JP3481112B2 (ja) | 動画像復号化装置 | |
JP5375936B2 (ja) | 復号装置及び方法 | |
JP4292658B2 (ja) | 画像情報変換装置及び画像情報変換方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051209 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20071218 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080122 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080321 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080422 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080623 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080715 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080916 |
|
A911 | Transfer of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20080926 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20081014 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20081027 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111114 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121114 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131114 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |