JPWO2009157579A1 - 画像処理装置及び画像処理方法 - Google Patents

画像処理装置及び画像処理方法 Download PDF

Info

Publication number
JPWO2009157579A1
JPWO2009157579A1 JP2010518089A JP2010518089A JPWO2009157579A1 JP WO2009157579 A1 JPWO2009157579 A1 JP WO2009157579A1 JP 2010518089 A JP2010518089 A JP 2010518089A JP 2010518089 A JP2010518089 A JP 2010518089A JP WO2009157579 A1 JPWO2009157579 A1 JP WO2009157579A1
Authority
JP
Japan
Prior art keywords
code amount
image
unit
control unit
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010518089A
Other languages
English (en)
Other versions
JP5472106B2 (ja
Inventor
孝明 渕江
孝明 渕江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2010518089A priority Critical patent/JP5472106B2/ja
Publication of JPWO2009157579A1 publication Critical patent/JPWO2009157579A1/ja
Application granted granted Critical
Publication of JP5472106B2 publication Critical patent/JP5472106B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本発明は、使用量子化因子を大きく変動させることなく、画像単位ごとの発生符号量を目標符号量以下に確実に抑制することができる。画像符号化装置(200)は、入力画像(91)を符号化したときの本エンコード発生符号量が目標符号量の近傍になると予測される基本量子化因子としての基本量子化パラメータ(QPMB)を決定する。画像符号化装置(200)は、少なくとも基本量子化パラメータ(QPMB)に基づいて決定された使用量子化因子としての平均量子化パラメータBaseQPに基づく適応量子化パラメータ(QPt)を用いて量子化することにより、入力画像(91)をフィードバック制御単位ごとに符号化する。画像符号化装置(200)は、符号化された入力画像(91)の発生符号量をフィードバック制御単位ごとに確認し、画像単位ごとの発生符号量が画像単位ごとの目標符号量を超えると予測する場合に、平均量子化パラメータBaseQPを増大させることにより、適応量子化パラメータ(QPt)の値を増大させる。

Description

本発明は、例えば画像符号化装置等に係り、特に1ピクチャに与えられた目標符号量に画面内フィードバック制御を行わずに発生符号量を合わせ込む技術分野に関する。
従来、動画のビットストリームを伝送したり記録メディアに記録したりするシステム等においては、伝送路或いは記録容量を効率良く利用するために、高能率符号化が実施されている。これを実現する画像符号化装置では、エンコーダで発生するビットストリームの符号化ビットレートは伝送メディアの転送レートに合わせて一定とされており、この制限の下でデータ発生量、つまり、エンコーダにおける量子化の量子化ステップが制御されている。すなわち、画像符号化装置は、例えば絵柄が複雑な画像が連続するときは量子化ステップを大きくしてデータ発生量を抑圧し、これとは逆に単純な絵柄が連続するときは量子化ステップを小さくしてデータ発生量を増加させることで、バッファメモリのオーバーフロー又はアンダーフローを生じさせないようにして固定レートを保持している。
従って、このような従来技術に係る画像符号化装置は、複雑な画像が連続するときは量子化ステップが大きくなり画質を劣化させ、単純な画像が連続するときは量子化ステップが小さくなり全体を通じて均等な画質を得ることができなかった。この問題に鑑みて、例えば特許文献1では、GOP(Group Of Pictures)毎の符号化の難易度と複数のGOPの符号化の難易度の総和の比に従って各GOP自身に割り当てられる割当符号量を、絵柄が複雑な画像を含むGOPに対しては多く割り当て、絵柄が単純な画像を含むGOPに対しては少なく割り当てるように算出する画像符号化装置が開示されている。
一方、1ピクチャに与えられた目標符号量に発生符号量を合わせ込む方法として、例えばTM5(test model 5)のstep2が良く知られている。これは、ピクチャに割り当てられた符号量をマクロブロック(MB;Macro block)に均等に配分したものをMBの目標符号量とし、ピクチャ内でフィードバック(feed back)制御をかける事で、目標符号量に合わせ込む手法である。
また、MPEG等の冗長圧縮方式の符号化処理において、画像符号化装置はDCT(Discrete Cosine Transform;離散コサイン変換)等の直行変換を施した後、量子化処理を行うことで情報量を減らす処理を行う。そして、画像符号化装置は、この量子化の値を制御して、符号量の制御を行う。このとき、量子化パラメータと発生符号量との間には単調な減少関係が成立する。このため、画像符号化装置は、適当な間隔の量子化値で実際に符号量を計算して、その中間に位置する符号量の予測値については直線的な補間を行う等すれば、発生符号量を予測することができる(DV等のイントラVTRで行われるバイナリサーチ等)。
この方法は、MPEG2等の固定テーブルを使用した符号化方式だけでなく、AVC等で用いられる適応型(Context Adaptive)な符号化方式においても適用可能である。
特許第3358620号公報。
しかしながら、前述したTM5のstep2の方法では、シーケンス先頭ピクチャやシーンチェンジ直後ピクチャのエンコードにおいて、量子化ステップの初期値が、そのピクチャの絵柄に合ったものではないため、画質が劣化する場合があった。
例えばTM5のstep2の方法において、画像符号化装置は、フォードバックが絵柄に追従するまでの部分の量子化ステップが大きすぎる場合は、その部分の画質が他の部分に比べて劣化してしまい、量子化値が小さすぎる場合は、その部分で符号量を使いすぎてしまい、他の部分にその影響が及ぶおそれがある。
また、画像符号化装置は、MBの目標符号量を常に一定にしているため、画面内で画の難しさに偏りがある時などは、不適切な符号量配分になっていた。
そこで、本発明は、量子化ステップの基になる使用量子化因子を大きく変動させることなく、画像単位ごとの発生符号量を目標符号量以下に確実に抑制することを課題とする。
かかる課題を解決するため本発明の画像処理装置においては入力画像を符号化したときの画像単位ごとの発生符号量が画像単位ごとの目標符号量の近傍になると予測される基本量子化因子を決定する基本量子化因子決定部と、少なくとも基本量子化因子に基づいて決定された使用量子化因子を用いて量子化することにより、入力画像をフィードバック制御単位ごとに符号化する符号化部と、符号化部によって符号化された入力画像の発生符号量をフィードバック制御単位ごとに確認し、画像単位ごとの発生符号量が画像単位ごとの目標符号量を超えると予測する場合に、使用量子化因子を増大させるフィードバック制御部とを設けるようにした。
これにより、画像処理装置は、限定的な条件において、使用量子化因子を増大のみさせるため、使用量子化因子の変動を最小限に抑制することができる。
また、本発明の画像処理方法では、入力画像を符号化したときの画像単位ごとの発生符号量が画像単位ごとの目標符号量の近傍になると予測される基本量子化因子を決定する基本量子化因子決定ステップと、少なくとも基本量子化因子に基づいて決定された使用量子化因子を用いて量子化することにより、入力画像をフィードバック制御単位ごとに符号化して符号化ストリームを生成する符号化ステップと、符号化ステップにおいて符号化された入力画像の発生符号量をフィードバック制御単位ごとに確認し、画像単位ごとの発生符号量が画像単位ごとの目標符号量を超えると予測する場合に、使用量子化因子を増大させるフィードバック制御ステップとを設けるようにした。
これにより、画像処理方法は、限定的な条件において、使用量子化因子を増大のみさせるため、使用量子化因子の変動を最小限に抑制することができる。
本発明によれば、限定的な条件において、使用量子化因子を増大のみさせるため、使用量子化因子の変動を最小限に抑制することができる。かくして使用量子化因子を大きく変動させることなく、画像単位ごとの発生符号量を目標符号量以下に確実に抑制することができる画像処理装置及び画像処理方法を実現できる。
図1は、本発明の第1の形態に係る画像符号化装置の構成図。
図2は、本発明の第1の実施の形態に係る画像符号化装置による符号化の処理手順を詳細に説明するフローチャート。
図3は、適応的なQ Matrixの切り替え処理について更に説明するフローチャート。
図4は、離散的な値のQPの補正を行い、間のQPについて補間により符号量を計算することを説明する概念図。
図5は、本発明の第2の形態に係る画像符号化装置の構成図。
図6は、フィードバック制御での基本QPの決定処理について、その処理手順を説明するフローチャート。
1…第1のプレエンコード部、2…第2のプレエンコード部、3…エンコード部、4…符号量制御部、5,6…ディレイバッファ、11…画面内予測モード決定部、12…画面内予測処理部、13…DCT部、14…量子化部、15…エントロピー符号長計算部、21…画面内予測処理部、22…DCT部、23…量子化部、24…エントロピー符号長計算部、25…バッファ、26…IDCT部、27…逆量子化部、31…画面内予測処理部、32…DCT部、33…量子化部、34…エントロピー符号化部、35…バッファ、36…IDCT部、37…逆量子化部
以下、図面を参照して、本発明を実施するための最良の形態(以下、単に実施の形態と称する)について詳細に説明する。なお説明は以下の順序で行う。
1.第1の実施の形態(離散的な選択量子化パラメータを用いた発生符号量の推測)
2.第2の実施の形態(フィードバック制御)
3.他の実施の形態
<1.第1の実施の形態>
[1−1.本発明の特徴]
この実施の形態に係る画像符号化装置100及び画像符号化方法は、以下などを特徴とする。
画像符号化装置100は、H.264/AVC(Advanced Video Coding;高度動画像圧縮符号化標準)等に代表される算術符号化を用いた画像圧縮方式でなる。画像符号化装置100は、符号量制御を行う際に、ピクチャ内で良好な符号量分布を実現するために、並列プレエンコード(Pre Encode)と直列プレエンコードを組み合わせる。これにより、画像符号化装置100は、回路規模とLatency(遅延時間)の増加を抑えつつ、精度のよい予測を行う。
より詳細には、画像符号化装置100は、第1及び第2のプレエンコード部1及び2により、量子化と符号長計算部のみ並列に行い、他の処理要素は共用することで、回路共通化による回路規模の削減を図る。
つまり、本来であれば、並列プレエンコードを行う場合には、全ての処理要素を並列に設ける必要があるところ、この実施の形態に係る画像符号化装置100では、精度に影響なく共通化できる処理要素を的確に特定し、該処理要素につき回路を共通化する。これにより、第1及び第2のプレエンコード部1及び2自体の回路規模とlatency(遅延時間)の増加を抑える。
そして、第1のプレエンコード部1では、少し精度を落とし回路規模並びに処理負荷を抑えた並列プレエンコードを広い範囲の量子化パラメータ(QP)で行い、目標符号量を実現するQPを粗く見積もる。第2のプレエンコード部2では、精度を上げた並列プレエンコードを狭い範囲で行い、本エンコード部3で使用する基本量子化パラメータQPMBを決定する。以上により、画像符号化装置100は、画像符号化の精度を上げつつ処理負荷を軽減する。さらに、プレエンコードを簡略化したことによる誤差がビットレートや量子化パラメータQPと相関を持つことから、詳細は後述するような統計モデルを予め作成しておき、ビットレートや量子化パラメータQPから誤差の補正を行うこととしている。
図1には、本発明の一実施の形態に係る画像符号化装置100の構成を示し説明する。
この画像符号化装置100は、第1のプレエンコード部1、第2のプレエンコード部2、本エンコード部3、符号量制御部4、ディレイバッファ5,6を有している。
第1のプレエンコード部1は、第1のプレエンコードを行うモジュールであり、画面内予測モード決定部11、画面内予測処理部12、DCT(Discrete Cosine Transform;離散コサイン変換)部13、量子化部14、エントロピー符号長計算部15、アクティビティ(Activity)計算部16を備えている。
第2のプレエンコード部2は、第2のプレエンコードを行うモジュールであり、画面内予測処理部21、DCT部22、量子化部23、エントロピー符号長計算部24、バッファ25、IDCT(Inverse DCT)部26、逆量子化部27を備えている。
そして、本エンコード部3は、本エンコードを行うモジュールであり、画面内予測処理部31、DCT部32、量子化部33、エントロピー符号化部34、バッファ35、IDCT部36、逆量子化部37を備えている。
符号量制御部4は、符号量制御を行うモジュールである。
[1−2.量子化パラメータ及び量子化行列の予測]
[1−2−1.低精度発生符号量の算出]
画像符号化装置100は、符号化難易度に応じて例えば3つの量子化行列Q Matrixを適用的に選択して使用する(詳しくは後述する)。画像符号化装置100は、一の量子化行列Q Matrixを設定すると共に、当該設定された量子化行列Q Matrixの取り得る範囲の量子化パラメータQPについて、第1のプレエンコード部1による簡易な処理によって発生符号量を粗く見積もる。以下、当該プレエンコード部1の結果により見積もられた発生符号量を低精度発生符号量と呼ぶ。画像符号化装置100は、全ての量子化行列Q Matrixについて同様の処理を実行し、量子化行列Q Matrix及び量子化パラメータQPを変更したときの低精度発生符号量を算出する。そして画像符号化装置100は、低精度発生符号量が目標符号量に最も近くなる量子化パラメータQP及び量子化行列Q Matrixを次のステップ(第2のプレエンコード部2)でピクチャの平均量子化パラメータBase QPとして使用する予測量子化パラメータQPd、次のステップで使用するピクチャの量子化行列Q Matrix(以下、これを予測量子化行列Q MatrixDと呼ぶ)とする。
このとき画像符号化装置100は、離散的に選択された一部の量子化パラメータQP(以下、これを選択量子化パラメータQPlと呼ぶ)を用いて入力画像91における低精度発生符号量を算出する。画像符号化装置100は、選択量子化パラメータQPl間の低精度発生符号量を補間によって算出することにより、量子化行列Q Matrixが取り得る範囲の量子化パラメータQPの全てについて、低精度発生符号量を算出するようになされている。
実際上、入力画像91は、最初に第1のプレエンコード部1の画面内予測モード決定部11に入力される。画面内予測モード決定部11は、この入力画像91に基づいて、全ての画面内予測モードによって差分画像データを生成すると共に、当該差分画像データの発生符号量の予測に基づいて画面内予測モードを決定する。予測モード(予測方向)は、最小4×4画素単位で9通りの予測モードの中から決定されることになる。
この決定された画面内予測モードは、画面内予測処理部12に送出されると共に、第2のプレエンコード部2や本エンコード部3にも送出される。この画面内予測モードは、第2のプレエンコード部2による第2のプレエンコード、本エンコード部3による本エンコードでも使用される。
次に画面内予測処理部12は、予測画像と入力画像91との差分画像を計算し、差分画像データを生成する。ここでの予測画像は、処理を削減するため入力画像91から作られる。このように、第1のプレエンコード部1は、入力画像を用いて画面内予測処理を行うことで、逆量子化部、IDCT部、バッファを削減することができ、回路規模を削減することが可能となる。
DCT部13は、差分画像データに対して整数精度DCT処理を実行し、DCT係数を生成すると、これを量子化部14に送出する。量子化部14は、このDCT係数について量子化を行い、量子化係数を生成すると、これをエントロピー符号長計算部15に送出する。エントロピー符号長計算部15は、量子化係数に対し、コンテキスト適応型可変長符号化方式(CAVLC;Context−Adaptive Variable Length Coding)を行うことにより符号量を計算する。CAVLCによれば、周囲の状況に応じて高効率の符号化方式を適応的に選択できる。
このように第1のプレエンコードでは、本エンコードにおいてエントロピー符号化方式としてCABAC(Context−Adaptive Binary Arithmetic Coding)を用いる場合でも、符号量計算にCAVLCを用いることを特徴の一つとしている。尚、CABACとは、コンテキスト適応型2値算術符号化方式である。
ここで、量子化部14は、並列に設けられた量子化部14−1,…,14−n(n=1,2,3・・)により構成され、エントロピー符号長計算部15は、並列に設けられたエントロピー符号長計算部15−1,…,15−n(n=1,2,3・・)により構成されている。nの値は、例えば15に設定されている。量子化部14は、0〜51でなる量子化パラメータQPのうち、設定されている量子化行列Q Matrixに対応した選択量子化パラメータQPlを各量子化部14−1,…,14−nに設定する。この選択量子化パラメータQPlは、量子化行列Q Matrixが取り得る量子化パラメータQPの範囲から、任意の間隔で離散的に選択される。なお選択量子化パラメータQPlは、例えば一定間隔で選択されても良く、量子化パラメータQPの値に応じて変化する間隔で選択されても良い。このような構成の下、第1のプレエンコード部1は、量子化と符号長計算を、上記並列数と同数の複数の量子化パラメータQPに対して並列に実行し、それぞれの発生符号量を符号量制御部4に出力する。
即ち、第1のプレエンコード部1は、量子化部14、エントロピー符号長計算部15による回路規模を抑えた並列プレエンコードにより、広い範囲の量子化パラメータQPで第1のプレエンコードを行うことで、広い範囲の量子化パラメータQPに対する発生符号量を算出する。
ここで、アクティビティ計算部16は、画面内予測モード決定部11による画面内予測モードの決定と同時並行して、アクティビティ(Activity)を計算し、該アクティビティによりマクロブロック(MB;Macro Block)をグループ分けする。つまり、NumOfActivityGroupのグループに分ける場合を想定すると、アクティビティ計算部16は、ActivityTheshold[0]〜ActivityTheshold[NumOfActivityGroup−2]とアクティビティの値とを比較することにより、アクティビティグループを決定する。
尚、量子化処理において実際に使用される量子化パラメータQPは、ピクチャの平均量子化パラメータQP(BaseQP)に対して、アクティビティグループに依存したオフセット(AdaptQPDelta)を加えることで求められる。
Figure 2009157579
例えば、NumOfActivityGroupを13とするなら、AdaptQPDeltaの各値は、
AdaptQPDelta[13]={−6,−5,−4,−3,−2,−1,0,1,2,3,4,5,6}
とすることができる。
各MBに対して決定されたアクティビティグループ(Activity Group)番号は、量子化部14に入力される。量子化部14は、選択量子化パラメータQPlに対し、アクティビティグループに応じたオフセットを付加して適応量子化パラメータQPtを算出する。量子化部14は、適応量子化パラメータQPtに基づいて、DCT係数に対する量子化処理を実行する。
第1のプレエンコード部1は、次の量子化行列Q Matrix及び当該量子化行列Q Matrixに対応する選択量子化パラメータQPlを設定することにより、同様にして発生符号量を算出する。この結果、第1のプレエンコード部1は、量子化行列Q Matrix及び当該量子化行列Q Matrixに対応する選択量子化パラメータQPlについて、発生符号量をそれぞれ算出することになる。
[1−2−2.発生符号量の誤差の補正]
符号量制御部4は、第1のプレエンコード部1において算出された発生符号量に対して補正を行う。
ここでの補正は、誤差が、ある程度の傾向を持っている事を利用して行う。
一つ目の誤差要因は、画面内予測処理にローカルデコード(Local Decode)画ではなく入力画像91を用いている事である。この場合、画面内予測に使う画にコーデック(Codec)による歪がのっていないので、実際のエンコードより符号化効率が良くなり、符号量が少なめに出る傾向がある。この誤差の大きさは、歪の大きさに依存するので、発生符号量と誤差の関係では、ビットレート(Bit rate)が小さくなると誤差が大きくなる傾向がある。また、量子化パラメータQPと誤差の関係では、量子化パラメータQPが大きくなると誤差が大きくなる傾向にある。よって、予め誤差の大きさの統計データを取り、ビットレート“r”とQP“q”の関数として定義する。
具体的に、符号量制御部4は、CAVLCによって符号化されたときの発生符号量について、ビットレートによる平均的な誤差のモデル、量子化パラメータQPによる平均的な誤差のモデルをそれぞれ作成しておく。この誤差モデルは、量子化パラメータQP及びビットレートにそれぞれ対応する例えば数式やテーブルとして予め記憶される。符号量制御部4は、量子化パラメータQP及びビットレートから補正すべき誤差を表す補正量C_rate、C_qpを、対応する誤差モデルからそれぞれ算出する。符号量制御部4は、量子化パラメータQP及びビットレートに対応する補正量C_rate、C_qpのうち、次式に従って小さい値を補正量Cvとして選択する。
補正量Cv=min(C_rate、C_qp)
これにより、誤差の補正量が大きくなり過ぎてしまい、補正された発生符号量が第2のプレエンコード部2において算出される高精度発生符号量よりも大きくなってしまうことを防止し得るようになされている。なおこの補正量C_rate、C_qpは、第1のプレエンコード部1によって算出された発生符号量(Pre−Encode符号量)に対する補正量の割合(%)を表している。
符号量制御部4は、第1のプレエンコード部1によって算出された発生符号量に対し、次式に従って補正量Cvを乗算することにより、発生符号量に対する補正量(以下、これをCAVLC補正符号量と呼ぶ)を算出する。
CAVLC補正符号量=Pre−Encode符号量×Cv
符号量制御部4は、発生符号量に対してCAVLC補正符号量を加算することにより、CAVLCについての低精度発生符号量を算出する。
二つ目の誤差要因は、エントロピー符号化方式でCABACを選択したときのみ発生するものである。第1のプレエンコード部1では、CABACによる符号化を実行せず、CAVLCの符号量からCABACによって符号化したときの低精度発生符号量を予測する。CABACはCAVLCより符号化効率が良いので、CAVLCでプレエンコードした発生符号量は、実際の符号量より多めに出る傾向がある。例えば、発生符号量と誤差の関係では、この誤差の大きさは統計的に見てビットレート(Bit rate)が小さくなるとCABACの効率が良くなることに起因して、大きくなる傾向にある。これも同様に、予め誤差の大きさの統計データを取り、平均的な誤差のモデルを作成しておくことで補正する。
CABACに起因する誤差は、CAVLCの符号量による符号化において生じる誤差と比較して、量子化パラメータQP及びビットレートに関し反対側に変化し、その変化量は小さいことが明らかになった。
そこで、CABACについての補正量(以下、これをCABAC補正量と呼ぶ)をビットレート“r”とQP“q”の関数として定義する。このとき、補正量Cbは、次式によって算出される。
補正量Cb=min(r,q)
符号量制御部4は、第1のプレエンコード部1によって算出された発生符号量(Pre−Encode符号量)に対し、次式に従って補正量Cvを乗算することにより、発生符号量に対する補正量(以下、これをCABAC補正符号量と呼ぶ)を算出する。
CABAC補正符号量=Pre−Encode符号量×Cb
符号量制御部4は、低精度発生符号量に対してCABAC補正符号量を加算することにより、CABACについての低精度発生符号量を算出する。符号量制御部4は、図2に示すように、第1のプレエンコード部1によって算出された発生符号量(四角で表す)に対して補正されたCAVLC補正量及びCABAC補正符号量(黒丸で表す)をそれぞれ算出することができる。
次に、符号量制御部4は、量子化パラメータ(QP)の推定処理を行う。上述したように、第1のプレエンコード部1は、任意の間隔で、離散的な値の選択量子化パラメータQPlでプレエンコードを行って発生符号量を取得している。符号量制御部4は、量子化行列Q Matrixの取り得る量子化パラメータQPの範囲のうち、選択量子化パラメータQPl以外の量子化パラメータQPに関して、補間により発生符号量を計算する(白丸で示す)。補間処理としては、線形補間など一般的な補間処理を用いることができる。
即ち、図2に示されるように、第1のプレエンコード部1で得た離散的な値の量子化パラメータQP(四角で示す)ついて、補正を行い補正後の量子化パラメータQP(黒丸で示す)を得て、更に、その間の量子化パラメータQP(白に丸で示す)について補間により符号量を計算することになる。
このように、符号量制御部4は、第1のプレエンコード部1によって算出された発生符号量に対し、当該第1のプレエンコード部1において簡易化した処理に応じて発生する発生符号量の誤差を補正してCAVLCについての低精度発生符号量を算出する。これにより、符号量制御部4は、簡易化された符号化処理による発生符号量の予測精度を向上させ得る。符号量制御部4は、CAVLCについての低精度発生符号量を用いてCABACによる発生符号量の予測量である低精度発生符号量を算出する。これにより、符号量制御部4は、処理の複雑なCABACを行うことなく、CABACによる低精度発生符号量を見積もることができる。符号量制御部4は、離散的に選択された選択量子化パラメータQPlによって予測された低精度発生符号量から、補間処理により、当該選択量子化パラメータQPl以外の量子化パラメータQPについての低精度発生符号量を予測する。これにより、符号量制御部4は、わざわざ全ての量子化パラメータQPを用いて入力画像91を符号化せずに済み、第1のプレエンコード部1の構成を簡易にすることができる。
[1−2−3.予測量子化行列の決定]
上述したように、量子化行列Q Matrixが取り得る全ての量子化パラメータQPについて、低精度発生符号量が算出された。符号量制御部4は、符号化難易度に応じて量子化行列Q Matrixを変更し、変更された量子化行列Q Matrixに対応する低精度発生符号量に基づいて、目標符号量に最も近い量子化パラメータQPを基本量子化パラメータQPMBとして選択するようになされている。
符号量制御部4は、量子化行列Q Matrix毎に、目標符号量に一番近い低精度発生符号量が生成されたときに使用された量子化パラメータQPを近傍量子化パラメータQPnとして選択する。符号量制御部4は、符号化難易度として、例えば各量子化行列Q Matrix毎に選択された近傍量子化パラメータQPnを使用する。もちろん、アクティビティなど別の指標を用いることも可能である。ここでは、切り替えて使う量子化行列Q Matrixの数をNumOfQMatrixIdとし、傾斜の緩やかな量子化行列Q Matrixから昇順にId(識別子)を付け、各量子化行列Q Matrixの取り得る範囲における最大の量子化パラメータQPをQMatrixTheshold[Id]とする。
符号量制御部4は、Idの値の小さい量子化行列Q Matrixから近傍量子化パラメータQPnとQMatrixThesholdとを比較する。符号量制御部4は、近傍量子化パラメータQPnがQMatrixTheshold[Id]より小さい量子化行列Q Matrixのうち、最小のIdを有する量子化行列Q Matrixを予測量子化行列Q MatrixDとして決定する。符号量制御部4は、当該予測量子化行列Q MatrixDにおける近傍量子化パラメータQPnを予測量子化パラメータQPdとして決定する。
すなわち符号量制御部4は、低精度発生符号量が目標符号量に近い量子化パラメータQPを取り得る量子化行列Q Matrixのうち、最小の傾斜を有する量子化行列Q Matrixを予測量子化行列Q MatrixDとして決定する。この予測量子化行列Q MatrixDは本エンコード部3による本エンコードにも使用されることになる。符号量制御部4は、低精度発生符号量の条件を満たす中で最小の傾斜を有する量子化行列Q Matrixを用いることができるため、画質の劣化を極力防止することができる。
なお、符号量制御部4は、第1のプレエンコード部1によってIdの小さい量子化行列Q Matrixから順に当該量子化行列Q Matrixの取り得る範囲の選択量子化パラメータQPlについて低精度発生符号量を算出する。そして符号量制御部4は、近傍量子化パラメータQPnがQMatrixTheshold[Id]より小さい量子化行列Q Matrixを検出した場合には、当該量子化行列Q Matrix及び近傍量子化パラメータQPnを予測量子化行列Q MatrixD及び予測量子化パラメータQPdとして決定する。このとき符号量制御部4は、第1のプレエンコード部1に次のピクチャに対する処理を開始させる。すなわち符号量制御部4は、第1のプレエンコード部1に処理中のピクチャに関する次のIdでなる量子化行列Q Matrixについての低精度発生符号量を算出させない。これにより、符号量制御部4は、予測量子化パラメータQPd及び予測量子化行列Q MatrixDを決定するのに要する処理時間を短縮し得る。
このように、符号量制御部4は、低精度発生符号量が目標符号量に近くなる量子化パラメータQPを取り得る量子化行列Q Matrixのうち、画質の低下を防止するために最も傾斜の小さい量子化行列Q Matrixを予測量子化行列Q MatrixDとして選択する。符号量制御部4は、予測量子化行列Q MatrixDにおいて低精度発生符号量が目標符号量に最も近くなる量子化パラメータQPを予測量子化パラメータQPdとして選択する。これにより、符号量制御部4は、画質を極力低下させないように適応的に量子化行列Q Matrixを変更しつつ、低精度発生符号量が目標符号量に最も近くなる量子化パラメータQPを予測量子化パラメータQPdとして選択することができる。
[1−3.基本量子化パラメータの決定]
第2のプレエンコード部2は、予測量子化パラメータQPd及び予測量子化行列Q MatrixDを用いて実際にエンコーダ3と同様の符号化を実行することにより、高精度発生符号量を高い精度で算出する。以下、この第2のプレエンコード部2によって算出された発生符号量を高精度発生符号量と呼ぶ。このとき第2のプレエンコード部2は、予測量子化パラメータQPdだけでなく、当該予測量子化パラメータQPdの前後の量子化パラメータQPを用いて高精度発生符号量を算出し、その変動率を用いて予測量子化パラメータQPd近傍の高精度発生符号量を予測する。
符号量制御部4は、予測量子化パラメータQPd、予測量子化行列Q MatrixD及び各MBのアクティビティグループを第2のプレエンコード部2に供給する。第2のプレエンコード部2は、これらの値に基づいて第2のプレエンコードを行う。
第2のプレエンコード部2では、入力画像91が、ディレイバッファ5を介して遅延処理された後に画面内予測処理部21に入力される。画面内予測処理部21は、予測画像と入力画像91との差分を計算し、差分画像データを生成する。そして、DCT部22は、差分画像データに対してDCT処理を実行しDCT係数を生成する。量子化部23は、DCT係数に対して量子化処理を実行し、量子化係数を生成する。エントロピー符号長計算部24は、CAVLC又はCABACを用いて量子化係数をそれぞれエントロピー符号化し、高精度発生符号量を計算する。
尚、第2のプレエンコード部2における処理の過程において、量子化部23は量子化係数を逆量子化部27に送出する。逆量子化部27は、量子化係数を逆量子化してDCT係数を再生する。そして、IDCT部26はDCT係数をIDCT変換し、ローカルデコード画像を生成し、バッファ25に保存することになる。
ここで、量子化部23は、この例では3段の量子化部23−1,23−2,23−3により構成され、エントロピー符号長計算部24は、この例では3段のエントロピー符号長計算部24−1,24−2,24−3により構成されている。3段と少なくしているのは、既に第1のプレエンコードで量子化パラメータQPが広い範囲で粗く見積もられているからである。
このような構成の下、量子化部23、エントロピー符号長計算部24は、並列に処理を実行し、予測量子化パラメータQPd及び当該予測量子化パラメータQPdの前後の量子化パラメータQPでの高精度発生符号量を得ることになる。このとき、エントロピー符号長計算部24は、本エンコード部3による本エンコードのエントロピー符号化方式と同じ方式をCABAC/CAVLCのいずれかから選択する。
続いて、符号量制御部4は、第2のプレエンコードにより得られた高精度発生符号量から、本エンコードで使用するピクチャの基本量子化パラメータQPMBを決定する。そして、符号量制御部4は、この決定されたピクチャの基本量子化パラメータQPMBや予測量子化行列Q MatrixD、各MBのアクティビティグループから、量子化の情報(Q Matrix、各MBのQP等)を本エンコード部3に送出する。
より詳細には、目標符号量が、第2のプレエンコードで得られた高精度発生符号量に挟まれている場合、つまり、
Figure 2009157579
の場合には、目標符号量に最も近い量子化パラメータQPを基本量子化パラメータQPMBとして選択する。
そうでない場合、符号量制御部4は、量子化パラメータQPの変化に対する高精度発生符号量の変動率を、第2のプレエンコードの結果から求める。予測量子化パラメータQPdは、第1のプレエンコード部1による低精度発生符号量に基づいて算出されている。このため目標符号量に最も近い量子化パラメータQPは、予測量子化パラメータQPdの近傍に存在する。量子化パラメータQPの値が近い場合、発生符号量の変動率は略一定である。そこで、符号量制御部4は、予測量子化パラメータQPd及び当該予測量子化パラメータQPdの前後の量子化パラメータQPにおける高精度発生符号量の変動率から各量子化パラメータQPでの高精度発生符号量を予測し、目標符号量に最も近い量子化パラメータQPを基本量子化パラメータQPMBとして選択する。
まず、量子化パラメータQPが「1」減算されたときに、高精度発生符号量が何%変わるかを表すDiffRatio_1を、第2のプレエンコード2の結果から以下のようにして求める。なお、Generated_bitsは第2のプレエンコード2における発生符号量を表しており、QP_precode1は、予測量子化パラメータQPdを、QP_precode1−1は予測量子化パラメータQPdより「1」小さい量子化パラメータQPを表している。
Figure 2009157579
量子化パラメータQPが「1」加算されたときに、高精度発生符号量が何%変わるかを表すDiffRatio_2を、第2のプレエンコード2の結果から以下のようにして求める。QP_precode1+1は予測量子化パラメータQPdより「1」大きい量子化パラメータQPを表している。
Figure 2009157579
予測量子化パラメータQPdの近傍における高精度発生符号量の変動率DiffRatioを、以下のようにして求める。
DiffRatio=(DiffRatio_1+DiffRatio_2)/2
すなわち、予測量子化パラメータQPdから正負の方向にそれぞれ「1」だけ変化したときの発生符号量の変動の平均値としてDiffRatioを算出する。
DeltaQPを、高精度発生符号量が目標符号量に最も近い量子化パラメータQPと予測量子化パラメータQPd(QP_precode1)との差の絶対値とすると、目標符号量に最も近い高精度発生符号量に対応する量子化パラメータQPが予測量子化パラメータQPdより1だけ小さい量子化パラメータQP(QP_precode1−1)より小さいときには、高精度発生符号量が目標符号量に最も近い量子化パラメータQPの高精度発生符号量(Generated_bits(QP))を以下のように算出する。
Figure 2009157579
目標符号量に最も近い高精度発生符号量に対応する量子化パラメータQPが予測量子化パラメータQPdより1だけ大きい量子化パラメータQP(QP_precode1+1)より大きいときには、高精度発生符号量が目標符号量に最も近い量子化パラメータQPの高精度発生符号量(Generated_bits(QP))を以下のように算出する。
Figure 2009157579
すなわち、符号量制御部4は、予測量子化パラメータQPdの前後の量子化パラメータQPを用いたときの高精度発生符号量に対し、予測量子化パラメータQPdを中心に量子化パラメータQPの値が「1」だけ変化したときの変動率に応じた符号量だけ増減させる。符号量制御部4は、予測量子化パラメータQPdの近傍の量子化パラメータQPを用いた場合の高精度発生符号量を高い精度で算出することができる。
以上のようにして、符号量制御部4は、目標符号量に最も近い量子化パラメータQPを本エンコードにおいて平均量子化パラメータ(BaseQP)として使用する基本量子化パラメータQPMBとして選択することになる。
上述したように、第2のプレエンコード部2では、第1のプレエンコード部1により推定された予測量子化パラメータQPd(QP_precode1)と、ひとつ大きい量子化パラメータQP(QP_precode1+1),ひとつ小さい量子化パラメータQP(QP_precode1−1)でプレエンコードする。ここで、回路規模削減のため、前述したように、量子化部23とエントロピー符号長計算部24のみ並列化し、その他の処理は共用する。
このとき、画面内予測処理で使用するローカルデコード(Local Decode)画は、第1のプレエンコード部1の結果に基づいて推定された予測量子化パラメータQPd(QP_precode1)で量子化したデータとする。つまり、逆量子化とIDCTで処理されるデータは、予測量子化パラメータQPd(QP_precode1)の量子化の出力である。これは、予測量子化パラメータQPdの前後の量子化パラメータQP(QP_precode1+1、QP_precode1−1)を使うプレエンコードの画面内予測処理の入力を、自分自身のローカルデコード(Local Decode)画ではなく、予測量子化パラメータQPd(QP_precode1)のローカルデコード(Local Decode)画で代用することを意味する。
このように、符号量制御部4は、第1のプレエンコード部1の結果に基づく低精度発生符号量の予測により、低精度発生符号量が目標符号量に最も近くなる可能性が極めて高い予測量子化パラメータQPd及びその前後の量子化パラメータQPによって本エンコードと同様の符号化によって高精度発生符号量を算出する。これにより、符号量制御部4は、予測量子化パラメータQPd及びその前後の量子化パラメータQPを用いた場合の高精度発生符号量をほぼ正確に算出することができる。さらに本発明は、狭い範囲内では量子化パラメータQPの変化に伴う高精度発生符号量の変動率がほぼ一定であることに着目した。符号量制御部4は、予測量子化パラメータQPd及びその前後の量子化パラメータQPにおける高精度発生符号量の変動率に基づいて、予測量子化パラメータQPdの近傍の量子化パラメータQPを用いたときの高精度発生符号量を算出する。これにより符号量制御部4は、予測量子化パラメータQPdの近傍の量子化パラメータQPについても、ほぼ正確に高精度発生符号量を算出することができる。
[1−4.本エンコード]
本エンコード部3は、第2のプレエンコード部2の結果に基づいて得られる基本量子化パラメータQPMB、並びに第1のプレエンコード部1の結果に基づいて得られる予測量子化行列Q Matrix、アクティビティグループ、画面内予測モード等を使用して本エンコードを行う。即ち、本エンコード部3は、ディレイバッファ6を介して遅延処理された入力画像91を受けると、画面内予測処理部31では第1のプレエンコード時に決定された画面内予測モードで、予測画像と入力画像91との差分画像データが計算される。DCT部32はDCT処理を行い、量子化部33はDCT係数の量子化を行う。量子化部33の出力(量子化係数)は逆量子化部37にも送られる。逆量子化部37は、量子化係数を逆量子化してDCT係数を再生する。そして、IDCT部36はDCT係数をIDCT変換し、予測画像を生成し、バッファ35に保存する。
こうして、前述したようなDCT部32によるDCT、量子化部33によるDCT係数の量子化を経て、エントロピー符号化部34によりエントロピー符号化がなされ、目標符号量とされた出力ストリーム92が出力される。
[1−5.まとめ]
このように、この実施の形態に係る画像符号化装置100では、第1のプレエンコード部1による第1のプレエンコードにおいて、複数の選択量子化パラメータQPlでエンコードした時の低精度発生符号量を粗く計算することにより、目標符号量になる予測量子化パラメータQPdを見積もる。
このとき、第1のプレエンコード部1は、任意の間隔の選択量子化パラメータQPlでエンコードした場合の発生符号量を計算するために、並列にエンコードを行うこととしている。
一般的には、並列にエンコードを行うためには、回路規模が非常に大きくなってしまうが、この実施の形態では、回路規模削減のために並列エンコードを実現しつつ、出来るだけ共通に処理を行うようにして問題を解消している。
即ち、より具体的に、第1のプレエンコード部1は、先に説明したように、量子化部14とエントロピー符号長計算部15のみ並列に設け、他の処理は共用する。また、逆量子化部、IDCT部、バッファを削減するために、予測画像として入力画像を用いて、画面内予測処理を行うこととしている。
一方、エントロピー符号化でCABACを用いる場合、高いビットレートでは、処理できない事である。即ち、第1のプレエンコード部1は、仮にエントロピー符号化でCABACを用いる場合、符号量予測のために、ある量子化パラメータQPで符号量計算を行おうとしたとき、その量子化パラメータQPでの符号量が大きい場合(すなわち量子化係数における各値が大きい場合)、発生符号量を予測することが出来ない。
CABACは1bit毎に確率計算を行ってデータを圧縮していくエントロピー符号化方式である。1bitずつ処理するということは、符号量が多くなると処理時間が長くなることを意味し、一定の時間内(例えば1フレームの時間)に処理が終了しなくなる。よって、第1のプレエンコード部1は、仮にエントロピー符号化でCABACを用いる場合、符号量が多い場合は、エントロピー符号化後の発生符号量を計算することができなくなり、高いビットレートにおいて発生符号量を予測することができないのである。
この点、第1の実施の形態において、第1のプレエンコード部1は、符号量計算にCAVLCを用いる。このように、第1のプレエンコード部1では、回路規模を削減し、処理を削減し、簡略化したプレエンコードを行うことで、低精度発生符号量を粗く見積もる。そして符号量制御部4は、目標符号量に近い低精度発生符号量を有する量子化パラメータQPを予測量子化パラメータQPdとして選択する。
第2のプレエンコード部2では、第1のプレエンコード部1による予測量子化パラメータQPdの推定が誤差を持っていることに鑑み、再度プレエンコードすることで、量子化パラメータQP推定の精度を上げる。即ち、第1のプレエンコード部1により大まかに見積もった予測量子化パラメータQPdの周辺の量子化パラメータQPで、再度プレエンコードすることにより高精度発生符号量を取得し、目標とする高精度発生符号量に一番近い量子化パラメータQPを再度求める。エントロピー符号長計算は、本エンコードと同じ方式(CABAC又はCAVLC)を用いる。
尚、画面内予測処理の入力(ローカルデコード画像)が異なる事による誤差は存在するが、量子化パラメータQPが略同じ値であり、エンコードによる歪も略同じ量であるので、無視できるものとする。
[1−6.処理手順]
以下、図3のフローチャートを参照して、本発明の一実施の形態に係る画像符号化装置100による符号化の処理手順RT1を詳細に説明する。この処理手順の一部または全部は、一実施の形態に係る画像符号化方法にも相当する。
先ず、アクティビティ計算部16は、MB毎にアクティビティを計算し、その値に応じてMBをアクティビティグループに分ける(ステップS1)。
続いて、画面内予測モード決定部11は、入力画像91に基づいて画面内予測モードを決定する(ステップS2)。この画面内予測モードは、第2のプレエンコード部2による第2のプレエンコード、本エンコード部3による本エンコードでも使用される。
次に画面内予測処理部12は、予測画像と入力画像との差分画像データを計算する。ここでの予測画像は、処理を削減するため入力画像91が用いられる。次いで、DCT部13は、整数精度DCTを行い、DCT係数を量子化部14に送出する(ステップS3)。
量子化部14は、任意の間隔の複数の選択量子化パラメータQPlをピクチャの平均量子化パラメータ(BaseQP)としてDCT係数値を量子化する。エントロピー符号長計算部15は、量子化係数を可変長符号化し、符号長計算を行うことで、選択量子化パラメータQPlごとの発生符号量を取得する(ステップS4)。この時、MBの量子化パラメータQPは、前述したようにアクティビティを考慮した値が与えられて、エンコードされる。即ち、前述したように、MBの量子化パラメータQPは、ピクチャの平均量子化パラメータ(BaseQP)に対して、アクティビティグループに依存したオフセットを加えることで求められる。
尚、適応的な量子化行列Q Matrix切り替え処理に対応させる場合には、上記の処理を量子化行列Q Matrix毎に行う。つまり、量子化行列Q Matrix毎に、離散的な(飛び飛びの)値の選択量子化パラメータQPlでプレエンコードを行って、1ピクチャ分の発生符号量を取得する。この時、量子化行列Q Matrix毎に量子化パラメータQPの取り得る範囲をカバーするように選択量子化パラメータQPlを選択する。
次に符号量制御部4が、第1のプレエンコード部1によって算出された発生符号量の補正処理を行い、低精度発生符号量を算出する。符号量制御部4は、プレエンコードを簡略化したことによる誤差の補正を行うと共に、補間処理により、選択量子化パラメータQPl以外の量子化パラメータQPに対応する低精度発生符号量を算出する(ステップS5)。
符号量制御部4は、各量子化行列Q Matrixに対し、ステップS5の処理を実行し、量子化行列Q Matrixごとの低精度発生符号量を算出する(ステップS6)。以上の処理で、必要となる全ての量子化パラメータQPに対する低精度発生符号量が求められるので、その中で目標符号量に最も近い低精度発生符号量を生成し得る量子化パラメータQPのうち、傾斜の最も小さい量子化行列Q Matrixを予測量子化行列Q MatrixDとして選択する。さらに符号量制御部4は、予測量子化行列Q MatrixDに対応する目標符号量に最も近い低精度発生符号量を生成し得る量子化パラメータQPを予測量子化パラメータQPdとして選択する。(ステップS7)。また、上記の様に量子化行列Q Matrixを選択することで、取り得る量子化パラメータQPの範囲を限定することになり、第1のプレエンコード部1で低精度発生符号量を算出する際の選択量子化パラメータQPlの範囲を減らすことが可能になる。これが、第1のプレエンコード部1にて決定された予測量子化行列Q MatrixDと予測量子化パラメータQPdとなる。
続いて、第2のプレエンコード部2による発生符号量取得処理を行う(ステップS8〜S10)。この第2のプレエンコード部2の目的は、第1のプレエンコード部1による予測量子化パラメータQPdの推定が誤差を持っていることに鑑みて、再度プレエンコードすることで、基本量子化パラメータQPMB推定の精度を上げることにある。
即ち、第1のプレエンコード部1の結果により大まかに見積もった予測量子化パラメータQPdの周辺の量子化パラメータQPで、再度プレエンコードすることにより高精度発生符号量を取得し、目標符号量に一番近い量子化パラメータQPを再度求める。エントロピー符号長計算は、本エンコードと同じ方式(CABAC又はCAVLC)が用いられる。
具体的には、第1のプレエンコード部1の結果により決定された画面内予測モードを用いて画面内予測処理部21による画面内予測処理及びDCT部22によるDCTを行う(ステップS8)。第2のプレエンコード部2は、画面内予測で使用するローカルデコード画像(予測画像)として、第1のプレエンコード部1の結果により推定された予測量子化パラメータQPd(QP_precode1)で量子化したローカルデコード画像を共用する。
量子化に際しては、第1のプレエンコード部1の結果により決定された予測量子化パラメータQPd(QP_precode1)、量子化行列Q Matrix及びアクティビティグループ(Activity Group)が用いられる。量子化部23−1には予測量子化パラメータQPd(QP_precode1)が設定され、量子化部23−2には予測量子化パラメータQPdよりも「1」だけ小さい量子化パラメータQP(QP_precode1−1)が設定され、量子化部23−3には予測量子化パラメータQPdよりも「1」だけ大きい量子化パラメータ(QP_precode1+1)が設定される。
さらに、MBの量子化パラメータ(QP)には、アクティビティを考慮した値が与えられてエンコードされる。以上の第2のプレエンコードにより、1ピクチャの高精度発生符号量を取得することができる(ステップS9)。
続いて、符号量制御部4は、第2のプレエンコード部2に基づいて得られた高精度発生符号量から基本量子化パラメータQPMBを決定する(ステップS10)。
続いて、本エンコード部3が本エンコードを行う(ステップS11)。本エンコードでは、第2のプレエンコード部2の結果により決定されたピクチャの基本量子化パラメータQPMB、第1のプレエンコード部1の結果により決定された予測量子化行列Q MatrixD、Activity Groupを使用してエンコードを行う。こうして符号化に関わる一連の処理を終了する。
以下、図4のフローチャートを参照して、画像符号化装置100による符号化の処理手順RT1のステップS7において実行されるQ Matrix決定処理手順RT2について更に説明する。
この処理を開始すると、符号量制御部4は、先ずIdをId=0にイニシャライズした後(ステップS21)、Idの値の小さい量子化行列Q−Matrixから、低精度発生符号量が目標符号量に最も近い量子化パラメータ(QP)と、量子化行列Q−Matrixにおいて取り得る最大の量子化パラメータQP(QMatrixTheshold[Id])とを比較する(ステップS22)。そして、符号量制御部4は、Id番目の量子化行列Q−Matrixでの低精度発生符号量が目標符号量に最も近い量子化パラメータ(QP)がQMatrixTheshold[Id]より小さければ、現在の量子化行列Q−Matrixを予測量子化行列Q MatrixDに決定する。さらに符号量制御部4は、予測量子化行列Q MatrixDにおける低精度発生符号量が目標符号量に最も近い量子化パラメータ(QP)を予測量子化パラメータQPdに決定すると(ステップS23)、Q Matrix決定処理手順RT2を終了する。
一方、ステップS22において、符号量制御部4は、Id番目の量子化行列Q−Matrixでの低精度発生符号量が目標符号量に最も近い量子化パラメータ(QP)がQMatrixTheshold[Id]以上であれば、Idをインクリメント(ステップS24)する。符号量制御部4は、Id=量子化行列Q−Matrixの総数よりも「1」小さい(NumOfQMatrixId−1)であるか否かを判断する(ステップS25)。そして、Id=NumOfQMatrixId−1でなければステップS22に戻り、次の量子化行列Q−Matrixをチェックする。一方、Id=NumOfQMatrixId−1であれば、一番急峻な傾斜を有する量子化行列Q−Matrix(IDがNumOfQMatrixIdの量子化行列Q−Matrix)が選択され(ステップS23)、Q Matrix決定処理手順RT2を終了する。
この図4のQ Matrix決定処理手順RT2により、符号量制御部4は、量子化行列Q−Matrix毎に、取り得る最大の量子化パラメータQPを設定して、傾斜の緩やかな量子化行列Q−Matrixから順に、低精度発生符号量が目標符号量に最も近いと推定された量子化パラメータQPに対応する低精度発生符号量が目標符号量に本当に近い値を示すか否かを判断する。そして、近い値であれば対応する量子化行列Q−Matrixを本エンコードで用いる予測量子化行列Q MatrixDとして決定することになる。
以上説明したように、本発明の一実施の形態では、ピクチャ単位の2回のプレエンコードを実施する。そして、画像符号化装置100は、効率向上のためには、処理量が増大し、それに起因してエンコードの回路規模が増大するとの問題を解消するために、回路一部共有化による部分的並列構成を採用する。これにより、プレエンコーダの構成を簡略化しつつ、該簡略化に伴う誤差を統計データで補正する。
従って、画像符号化装置100は、1ピクチャに与えられた目標符号量に、画面内Feed Back制御を行わずに本エンコードにおいて発生する本エンコード発生符号量を合わせ込むことが可能になる。これにより、画像符号化装置100は、Feed Backパラメータの不適切な初期値による弊害や、不適切な目標符号量配分など、Feed Back制御の問題を取り除くことが可能になる。その結果、画像符号化装置100は、目標符号量に本エンコード発生符号量を一致させ、視覚特性を考慮した符号量配分、つまり適切な量子化パラメータの決定が可能となる。
なお、本発明は前述した実施の形態に限定されるものではなく、その趣旨を逸脱しない範囲で種々の改良や変更が可能である。
たとえば、上記画像符号化装置100及び画像符号化方法は、該装置に実装されるコンピュータプログラム或いは該プログラムを記録した記録媒体、該方法を実施するコンピュータプログラム或いは該プログラムを記録した記録媒体としての実施も可能である。
[1−7.動作及び効果]
以上の構成によれば、画像処理装置としての画像符号化装置100は、入力画像91が簡易な処理により符号化されてなる簡易符号化データであるDCT係数を、量子化因子である量子化パラメータQPから離散的に選択された選択量子化パラメータQPlに基づいて入力画像である入力画像91を少なくとも量子化することにより入力画像91を符号化し、符号化による入力画像91の発生符号量を算出する。
画像符号化装置100は、符号化による入力画像の発生符号量における簡易な処理に応じて発生する誤差を補正し、低精度発生符号量を算出する。
画像符号化装置100は、選択量子化パラメータQPlに基づいて入力画像91が符号化されたときの低精度発生符号量に対する補間処理により、選択量子化パラメータQPl以外の量子化パラメータQPに基づいて入力画像91が符号化されたときの低精度発生符号量を算出する。
これにより、画像符号化装置100は、全ての量子化パラメータQPを符号化しなくても、当該全ての量子化パラメータQPに基づく低精度発生符号量を算出することができ、低精度発生符号量の算出を簡易にすると共に、算出回路を削減することができる。
画像符号化装置100は、選択量子化パラメータQPlに基づく符号化及び補間処理により算出された低精度発生符号量に基づいて、入力画像91を符号化したときの本エンコード発生符号量が目標符号量に最も近いと予測される量子化パラメータQPを基本量子化パラメータQPMBとして決定する。画像符号化装置100は、本エンコード部3により基本量子化パラメータQPMBに基づいて入力画像91を符号化(本エンコード)する。
これにより、画像符号化装置100は、簡易な処理により生成された低精度発生符号量に基づいて基本量子化パラメータQPMBを決定することができるため、基本量子化パラメータQPMBを決定するための処理を簡易化することができる。
<2.第2の実施の形態>
図5〜図6に示す第2の実施の形態においては、図1〜図4に示した第1の実施の形態と対応する箇所に同一符号を附して示すように、画像符号化装置200における本エンコード部3が、実際に発生した本エンコード発生符号量に応じてフィードバック制御を行う点が、第1の実施の形態と異なっている。
[2−1.本エンコードにおけるフィードバック制御]
画像符号化装置200は、第1の実施の形態と同様、本エンコード発生符号量が目標符号量に最も近くなると予測される基本量子化パラメータQPMBを用いたフィードフォワード制御により、本エンコードを実行する。このため、画像符号化装置200は、殆どの場合、本エンコード発生符号量を目標符号量に抑えることができる。しかしながら、画像符号化装置200は、ごく稀に高精度発生符号量の算出を失敗し、不適切な基本量子化パラメータQPMBを選択してしまう場合がある。そこで、画像符号化装置200は、かかる場合に対処するべく、本エンコード発生符号量のフィードバック制御により、本エンコード発生符号量を目標符号量に確実に抑えるようになされている。なお、第2の実施の形態において、符号量制御部4は、例えば高精度発生符号量が目標符号量を超えず、かつ高精度発生符号量が目標符号量に最も近い量子化パラメータQPを基本量子化パラメータQPMBに決定する。これにより、符号量制御部4は、本エンコード発生符号量が目標符号量より少し小さくなるように基本量子化パラメータQPMBを決定している。
図5に示すように、画像符号化装置200は、H.264/AVC(Advanced Video Coding;高度動画像圧縮符号化標準)などに代表される画像圧縮方式に従い、符号量制御を行う際に、ピクチャ内で良好な符号量分布を実現し、且つ、Picture固定長符号化を実現するために、以下の処理を実施する。
・ 画像符号化装置200は、3passエンコードの本エンコードにおいて、画面内フィードバック(Feed Back)によるレート制御を行い、符号量を一定値以下に抑える。
・ 画像符号化装置200は、フィードバック制御による量子化パラメータQPの不要な変動を抑えるため、ピクチャごとの発生符号量が目標符号量を超えないと予測される場合には、視覚特性(アクティビティ)によってのみ、使用する量子化パラメータQP(使用量子化因子)を基本量子化パラメータQPMBから変更する。すなわち、画像符号化装置200は、基本量子化パラメータQPMBを平均ピクチャBaseQPとしたときの適応量子化パラメータQPtを、使用する量子化パラメータQPとする。
・ 画像符号化装置200は、フィードバック制御により、本エンコード発生符号量が目標符号量を超えてしまうと予測される場合、平均量子化パラメータBaseQPを基本量子化パラメータQPMBから変更する。このとき、画像符号化装置200は、平均量子化パラメータBaseQPの不要な変動を抑えるため、量子化パラメータQPが大きくなる方向にのみ(すなわち発生符号量が小さくなる方向にのみ)平均量子化パラメータBaseQPを変更する。この結果、画像符号化装置200は、変更された平均量子化パラメータBaseQPに基づく適応量子化パラメータQPtを使用する量子化パラメータQPとする。なお一旦大きい方向に変更された平均量子化パラメータBaseQPは、小さくなる方向に戻ることはない。
具体的に、画像符号化装置200の本エンコード部3は、第2のプレエンコード部2の結果に基づいて決定された基本量子化パラメータQPMBを平均量子化パラメータBaseQPとし、第1のプレエンコード部1により決定された量子化行列Q Matrix、Activity Groupを使用してエンコードを行う。この時、画像符号化装置200は、目標符号量を越えることが無い様に平均量子化パラメータBaseQPをフィードバック制御する。
画像符号化装置200の符号量制御部4は、複数のMBからなるフィードバック制御単位FeedBackUnitごとに、フィードバック制御を実行する。符号量
制御部4には、エントロピー符号化部34から出力ストリーム92の発生符号量が供給される。符号量制御部4は、第2のプレエンコードの予測量子化パラメータQPd(QP_precode1)でのMB毎の発生符号量(つまり、量子化部23−1、エントロピー符号長計算部24−1の出力)を用い、ピクチャごとの目標符号量(以下、これをピクチャ目標符号量と呼ぶ)から、フィードバック制御単位FeedBackUnit毎の目標符号量(以下、これをフィードバック目標符号量と呼ぶ)を算出する。
いま、第2のプレエンコード部2の結果に基づくフィードバック制御単位(FeedBackUnit)の高精度発生符号量をPrecodeGeneratedBits_FeedBackUnit[no]、第2のプレエンコード部2の結果に基づくピクチャごとの高精度発生符号量をPrecodeGeneratedBitsとすると、フィードバック制御単位FeedBackUnitのフィードバック目標符号量(TargetBit_FeedBackUnit[no])は次式で求められる。なお、noはFeedBackUnitの番号(0〜FeedBackUnit個数−1)、TargetBitはピクチャ目標符号量である。
Figure 2009157579
Figure 2009157579
すなわち、符号量制御部4は、フィードバック制御単位の高精度発生符号量(PrecodeGeneratedBits_FeedBackUnit[no])のピクチャの高精度発生符号量(PrecodeGeneratedBits)に対する割合に対し、ピクチャ目標符号量TargetBitを乗算することにより、フィードバック目標符号量(TargetBit_FeedBackUnit[no])を算出する。
具体的に、画像符号化装置200の符号量制御部4は、以下の様な処理を行う。
(1)符号量制御部4は、エンコードを前半処理、後半処理に分け、前半処理ではフィードバック制御を行わない。符号量制御部4は、プレエンコードのフィードバック制御単位(FeedBackUnit)の符号量比によりフィードバック制御単位(FeedBackUnit)の目標符号量を決定している。この符号量比は、量子化パラメータQPの変動により変化する。よって、画像符号化装置200は、エンコード前半の発生符号量が少ない時点でフィードバック制御を行うと、不必要な平均量子化パラメータBaseQPの変更を行ってしまう可能性がある。言い換えると、画像符号化装置200は、本エンコード発生符号量がピクチャ目標符号量に近くなるよう、基本量子化パラメータQPMBを選定している。従って、ピクチャの早い段階で平均量子化パラメータBaseQPを変動させてしまうと、本エンコード発生符号量とピクチャ目標符号量とが乖離してしまう可能性が生じてしまうためである。
(2)符号量制御部4は、量子化パラメータQPの安定化と、本エンコード発生符号量を目標符号量以下に抑えることの両面から前半処理、後半処理の切り替えタイミングを判定する。すなわち、符号量制御部4は、(a)及び(b)に示す以下に示す条件のうちのいずれか一方を満たす場合に、後半処理に移行する。
(a)符号量制御部4は、ピクチャを一定割合以上エンコードしている、換言すれば、一定数以上のMBをエンコードし終えとき、後半処理に移行する。量子化パラメータQPを安定化させるためである。
(b)符号量制御部4は、エンコードしていない部分(MB)で使用できる残り符号量(ピクチャ目標符号量からその時点までの本エンコード発生符号量を減算した値)と、エンコードしていない部分(MB)の目標符号量(ピクチャ目標符号量からその時点までのフィードバック目標符号量を減算した値)とを比較する。残り符号量が一定割合以下になると、後半処理に移行する。本エンコード発生符号量を目標符号量以下に抑えるためである。
この(2)(b)の条件を式で表すと以下のようになる。
Figure 2009157579
ここで、TargetBit_Accum、GeneratedBits_Accumは、それぞれこの時点までのフィードバック目標符号量(TargetBit_FeedBackUnit[no])、フィードバック制御単位の本エンコード発生符号量(GeneratedBits_FeedBackUnit[no])の積算値である。また、ThresholdRatioは、許容できるずれの割合である。本エンコード発生符号量が目標符号量になっている場合、残り符号量とエンコードしていない部分の目標符号量がイコールとなる。一方、本エンコード発生符号量が目標符号量をオーバーしている場合、残り符号量がエンコードしていない部分の目標符号量よりも小さくなる。例えば、符号量制御部4は、残り符号量がエンコードしていない部分の目標符号量のThresholdRatio倍未満になったとき、後半処理に移行する。符号量制御部4は、発生符号量が目標符号量を必ず下回るように制御する場合、ThresholdRatioを1未満に設定する。これにより、符号量制御部4は、エンコードが終了した部分の発生符号量が目標符号量を下回り、かつ当該目標符号量に近づいてきたときに後半処理に移行することができる。また、符号量制御部4は、発生符号量が目標符号量の近傍になるよう制御する場合、このThresholdRatioを1超に設定する。これにより、符号量制御部4は、エンコードが終了した部分の発生符号量が目標符号量を一定の比率以上で上回ったときに後半処理に移行することができる。もちろん、ThresholdRatioを「1」に設定することも可能である。
これにより、符号量制御部4は、目標符号量と実際の本エンコード発生符号量が乖離する前に、フィードバック制御に入ることができ、残り符号量が少なすぎて本エンコード発生符号量が制御できなくなることを確実に防止することができる。
言い換えると、符号量制御部4は、本エンコード発生符号量の少ないうちは、残り符号量の絶対量が大きいため、目標符号量と本エンコード発生符号量が極めて大きく乖離しない限り、条件を満たすことはなく、後半処理に移行してフィードバック制御に入ることはない。符号量制御部4は、本エンコード発生符号量が大きくなってきたら、残り符号量の絶対量が小さいため、目標符号量と本エンコード発生符号量が小さく乖離しただけでも条件を満たすことになり、後半処理に移行して、フィードバック制御に入ることになる。
(3)符号量制御部4は、後半処理において、ピクチャごとの本エンコード発生符号量がピクチャ目標符号量を超えると予想した場合にのみ、平均量子化パラメータBaseQPを基本量子化パラメータQPMBより大きくする方向に変更する。符号量制御部4は、平均量子化パラメータBaseQPを大きくする場合には、一回のフィードバック処理(すなわちフィードバック制御単位ごと)で、平均量子化パラメータBaseQPを「1」のみ変化させる。これにより、符号量制御部4は、過剰な平均量子化パラメータBaseQPの変化を抑えるようになされている。
符号量制御部4は、以下の(a)又は(b)のいずれかの条件に当て嵌まる場合、ピクチャごとの本エンコード発生符号量がピクチャ目標符号量を超えると予想し、平均量子化パラメータBaseQPを大きくする。
(a)符号量制御部4は、フィードバック制御単位のエンコードが終了した時点で直前(処理を終えた直後)のフィードバック発生符号量を確認し、フィードバック発生符号量(GeneratedBits_FeedBackUnit[cur])とフィードバック目標符号量(TargetBit_FeedBackUnit[cur])とを次式に従って比較する。
Figure 2009157579
フィードバック発生符号量(GeneratedBits_FeedBackUnit[cur])がフィードバック目標符号量(TargetBit_FeedBackUnit[cur])より大きいことは、発生符号量が増大する傾向にあるため、以降のエンコードにおいて生じる本エンコー
ド発生符号量が目標符号量を超える可能性があることを示唆している。このとき、符号量制御部4は、平均量子化パラメータBaseQPを大きくするか否かを判別する。このときの条件を以下に示す。
符号量制御部4は、この時点でエンコードが終了した部分についての目標符号量から発生符号量を減算することにより、発生符号量の余りSurplusBitsを以下の様に計算する。
Figure 2009157579
符号量制御部4は、次のフィードバック制御単位において本エンコード発生符号量が目標符号量を超えると予測した場合にのみ、平均量子化パラメータBaseQPを大きくする。
符号量制御部4は、次のフィードバック制御単位の目標符号量に対して次のフィードバック制御単位でオーバーすると予測される最大の符号量(以下、これを過剰最大符号量と呼ぶ)を、次のフィードバック制御単位の目標符号量から以下の様に求める。ここで、MaxErrorRatioは、フィードバック発生符号量がフィードバック目標符号量に対する誤差として取り得る最大比率である。
Figure 2009157579
これを元に、以下の判定を行う。
Figure 2009157579
符号量制御部4は、発生符号量の余りSurplusBitsと次のフィードバック制御単位の過剰最大符号量とを比較する。符号量制御部4は、発生符号量の余りSurplusBitsよりも過剰最大符号量が大きい場合、次のフィードバック制御単位においてエンコードが終了した部分の本エンコード発生符号量が目標符号量を超える可能性があると判別し、平均量子化パラメータBaseQPを+1する。
すなわち、符号量制御部4は、「直前のフィードバック制御単位の発生符号量が、直前のフィードバック制御単位の目標符号量より大きい」且つ、「この時点での符号量の余りSurplusBitsが、次のフィードバック制御単位でオーバーする可能性のある過剰最大符号量より小さい」とき、平均量子化パラメータBaseQPを+1する。発生符号量が増大する傾向にあり、かつ符号量の余りに余裕がないため、最終的なピクチャ発生符号量がピクチャ目標符号量を超えてしまうと予測されるからである。
言い換えると、符号量制御部4は、現状維持でも次のフィードバック制御単位でエンコードが終了した部分の本エンコード発生符号量が目標符号量を超えないと判断されれば、平均量子化パラメータBaseQPを+1しない。これにより、符号量制御部4は、エンコードが終了した部分の本エンコード発生符号量が目標符号量を超えそうな兆候が見られた時でも、過度に反応することを避け、平均量子化パラメータBaseQPを不要に大きくし過ぎることを防止し、平均量子化パラメータBaseQPを安定化させ得る。
(b)符号量制御部4は、(a)に当て嵌まらない場合、すなわち「直前のフィードバック制御単位の発生符号量が、直前のフィードバック制御単位の目標符号量より小さい」又は「この時点での符号量の余りSurplusBitsが、次のフィードバック制御単位でオーバーする可能性のある過剰最大符号量より大きい」とき、発生符号量の余りSurplusBitsが負であるかを確認する。SurplusBitsが負である場合、エンコードが終了した時点での本エンコード発生符号量が目標符号量を超えてしまっていることを意味している。このとき、符号量制御部4は、以下の様に、直前のフィードバック制御単位の目標符号量と発生符号量の比から、残りの符号化部分での発生符号量の、目標からのずれを予測する。
符号量制御部4は、直前のFeed Back制御単位の目標符号量と発生符号量の比Diff_Ratioを以下のように算出する。
Figure 2009157579
符号量制御部4は、残りの符号化部分の目標符号量TargetBit_Remを以下のように算出する。
TargetBit_Rem=TargetBit−TargetBit_Accum
符号量制御部4は、残りの符号化部分での発生符号量が、直前のフィードバック制御単位の目標符号量と発生符号量の比Diff_Ratioと同一比率でずれると仮定し、目標からのずれを、以下のように算出する。
TargetBit_RemDiff_Ratio
符号量制御部4は、符号化した部分と符号化してない部分のずれを足したものが、正であり、以下の条件を満たす場合、平均量子化パラメータBaseQPを+1する。
Figure 2009157579
符号量制御部4は、「エンコードした部分の発生符号量が、目標符号量を超えている」且つ、「直前のフィードバック制御単位の目標符号量と発生符号量の比から求めたピクチャの予測発生符号量が、ピクチャ目標符号量を超えている」時、平均量子化パラメータBaseQPを+1する。
すなわち、符号量制御部4は、ある時点で発生符号量が目標符号量を超えていても、目標符号量に対して発生符号量が減少傾向にあるため最終的にはピクチャ発生符号量がピクチャ目標符号量以下に収まると判断されれば、平均量子化パラメータBaseQPを+1しない。
このように、画像符号化装置200は、入力画像91を本エンコードする際、ピクチャに対する本エンコードを開始した時点ではフィードバック制御を実行せず、一定条件を満たしたときのみ後半処理としてフィードバック制御を実行する。
すなわち、画像符号化装置200は、原則的にピクチャの後半部分に対してのみフィードバック制御を実行する。画像符号化装置200は、ピクチャの前半部分であっても、エンコードした部分の発生符号量と目標符号量との比率が一定以上となる場合には、以降の発生符号量が目標符号量から乖離する可能性があるため、フィードバック制御を実行する。
画像符号化装置200は、フィードバック制御として、平均量子化パラメータBaseQPの変動を最小限に抑制するため、ピクチャごとの本エンコード発生符号量をピクチャ目標符号量以下に抑えることができないと予測したときのみ、平均量子化パラメータBaseQPを「1」だけ増大させる。
すなわち、画像符号化装置200は、フィードバック発生符号量がフィードバック目標符号量よりも大きく、発生符号量が目標符号量よりも増大する傾向があり、かつ次のフィードバック制御単位でエンコードした部分の発生符号量が目標符号量を超える可能性がある場合、最終的なピクチャ発生符号量がピクチャ目標符号量を超えると予測されるため、平均量子化パラメータBaseQPを+1する。
これにより、画像符号化装置200は、発生符号量が目標符号量よりも増大する傾向がある場合であっても、残り符号量に余裕がある場合には、平均量子化パラメータBaseQPを+1しないようにでき、平均量子化パラメータBaseQPを不要に増大させずに済む。
さらに、画像符号化装置200は、平均量子化パラメータBaseQPを+1していない場合において、エンコードした部分の発生符号量が目標符号量を超えており、最終的なピクチャの発生符号量がピクチャ目標符号量を超えると予測される場合には、平均量子化パラメータBaseQPを+1する。
これにより、画像符号化装置200は、エンコードした部分の発生符号量が目標符号量を超えている場合であっても、発生符号量が減少傾向にあり、ピクチャの発生符号量がピクチャ目標符号量を超えないと予測される場合には、最終的な平均量子化パラメータBaseQPを+1しないようにでき、平均量子化パラメータBaseQPを不要に増大させずに済む。
[2−2.処理手順]
以下、図6のフローチャートを参照して、フィードバック制御処理手順RT4について説明する。この処理を開始すると、符号量制御部4は、プレエンコードで決定された基本量子化パラメータQPMBを平均量子化パラメータBaseQPにセットする(ステップS31)。続いて、符号量制御部4は、フィードバック制御単位FeedBackUnitごとに入力画像91をエンコードする(ステップS32)。
続いて、符号量制御部4は、ピクチャにおける全てのMBをエンコードしたか否かを判断する(ステップS33)。ここで、符号量制御部4は、全てのMBをエンコードした場合には、終了ステップへ移って処理を終了する。一方、符号量制御部4は、全てのMBをエンコードしていない場合には、次のステップS34へ移る。符号量制御部4は、一定数以上のMBをエンコードしたか否かを判断する(ステップS34)。これは、前述したように、エンコード前半の発生符号量が少ない時点で、フィードバック制御を行うと平均量子化パラメータBaseQPを不必要に変更する可能性があるからである。
ここで、符号量制御部4は、一定数以上のMBをエンコードしたと判断した場合には、ステップS36に移行する。一方、符号量制御部4は、一定数以上のMBをエンコードしていないと判断した場合には、ステップ35に移り、エンコードしていない部分(MB)で使用できる残り符号量(目標符号量からその時点までの発生符号量を引いたもの)と、エンコードしていない部分(MB)の目標符号量とを比較し、残り符号量とエンコードしていない部分の目標符号量との比率が一定割合以下か否かを判断する(ステップS35)。ここで、符号量制御部4は、残り符号量とエンコードしていない部分の目標符号量との比率が一定割合以下でないと判断した場合には、現在エンコード処理しているMBが後半部分ではなく、かつエンコードした部分の発生符号量が目標符号量から乖離もしていないため、ステップS32に戻り上記処理を繰り返す。一方、使用できる符号量が一定割合以下であると判断した場合にはステップS36に移行し、フィードバック制御を実行する。
続いて、符号量制御部4は、直前のフィードバック制御単位の発生符号量が、直前のフィードバック制御単位の目標符号量より大きいか否かを判断する(ステップS36)。ここで、符号量制御部4は、直前のフィードバック制御単位の発生符号量が、直前のフィードバック制御単位の目標符号量より大きいと判断した場合には、この時点での符号量の余りが、次のフィードバック制御単位でオーバーする可能性があるか否かを判断する(ステップS37)。符号量制御部4は、直前のフィードバック制御単位の発生符号量が、直前のフィードバック制御単位の目標符号量より小さい場合には、ステップS39へ移る。
符号量制御部4は、この時点での符号量の余りが、次のフィードバック制御単位でオーバーする可能性があると判断した場合、平均量子化パラメータBaseQPを+1し(ステップS38)、ステップS32に戻る。一方、符号量制御部4は、この時点での符号量の余りが、次のフィードバック制御単位でオーバーする可能性がないと判断した場合、ステップS39に進む。
そして、ステップS39において、符号量制御部4は、エンコードした部分の発生符号量が、目標符号量を超えているか否かを判断する(ステップS39)。ここで、符号量制御部4は、エンコードした部分の発生符号量が、目標符号量を超えていないと判断した場合には、ステップS32に戻り、上記処理を繰り返す。
一方、符号量制御部4は、エンコードした部分の発生符号量が、目標符号量を超えていると判断した場合には、直前のフィードバック制御単位の目標符号量と発生符号量の比から求めたピクチャの予測発生符号量がピクチャ目標符号量を超えているか否かを判断する(ステップS40)。そして、符号量制御部4は、ピクチャの予測発生符号量がピクチャ目標符号量を超えていないと判断した場合には、ステップS32に戻り、上記処理を繰り返す。
符号量制御部4は、ピクチャの予測発生符号量がピクチャ目標符号量を超えていると判断した場合には、平均量子化パラメータBaseQPを+1し(ステップS38)、ステップS32に戻り、上記処理を繰り返す。こうして、符号量制御部4は、ステップS33において、全てのMBをエンコードしたと判断するまで、この処理を継続する。
以上説明したように、本実施の形態によれば、画像符号化装置200は、二分探索法を用いることなく、ピクチャをほぼ固定長にして符号化する事が可能になるため、回路規模、消費電力を小さくすることができ、符号化遅延も短く出来る。この際、画像符号化装置200は、フィードバック制御による平均量子化パラメータBaseQPの不要な変動が抑えられるため、フィードバック制御を導入していても、最適な符号量配分つまり、ピクチャ目標符号量にピクチャ発生符号量を一致させ、視覚特性を考慮した符号量配分が可能になる。
なお、本発明は前述した実施の形態に限定されるものではなく、その趣旨を逸脱しない範囲で種々の改良や変更が可能である。
たとえば、上記画像符号化装置及び画像符号化方法は、該装置に実装されるコンピュータプログラム或いは該プログラムを記録した記録媒体、該方法を実施するコンピュータプログラム或いは該プログラムを記録した記録媒体としての実施も可能である。
上述した一連の符号化処理は、ハードウェアにより実行させることもでき、また、ソフトウェアにより実行させることも可能である。符号化処理をソフトウェアによって実現する場合、CPU及びRAMに仮想的に画像符号化装置100が形成される。そして、ROMに格納された符号化プログラムをRAMに展開することにより、符号化処理が実行される。
[2−3.動作及び効果]
以上の構成において、画像符号化装置200は、入力画像91を符号化したときのピクチャごとの本エンコード発生符号量がピクチャ目標符号量の近傍になると予測される基本量子化因子としての基本量子化パラメータQPMBを決定する。
画像符号化装置200は、少なくとも基本量子化パラメータQPMBに基づいて決定された使用量子化因子としての平均量子化パラメータBaseQPに基づく適応量子化パラメータQPtを用いて量子化することにより、入力画像91をフィードバック制御単位ごとに符号化する。
画像符号化装置200は、符号化された入力画像91の発生符号量をフィードバック制御単位ごとに確認し、画像単位ごとの発生符号量が画像単位ごとの目標符号量を超えると予測する場合に、平均量子化パラメータBaseQPを増大させることにより、適応量子化パラメータQPtの値を増大させる。
これにより、画像符号化装置200は、ピクチャごとの本エンコード発生符号量がピクチャ目標符号量の近傍になるよう予め調整された状態において、限定的に平均量子化パラメータBaseQPを増大させるため、使用する量子化パラメータQP(適応量子化パラメータQPt)の値が不要に変動することを防止することができる。
AVCなどの量子化を伴う符号化方式では、複数回に亘って符号化を実行することによる画質の劣化が確認されている。この画質の劣化を防止するため、前回の符号化の際に使用された量子化パラメータQPを検出して再度使用するバックサーチと呼ばれる手法が提案されている(例えば特許文献2参照)。
国際出願番号PCT/JP2008/066917。
このバックサーチでは、予測量子化パラメータQPdに基づいてバックサーチの検索範囲を設定することにより、バックサーチの検索範囲を限定して処理を簡易にすることができる。
画像符号化装置200は、使用する量子化パラメータQPの変動を極力抑制することができるため、使用する量子化パラメータQPがバックサーチの検索範囲から外れてしまうことを抑制でき、バックサーチの検出率を低下させずに済む。
画像符号化装置200は、フィードバック制御単位ごとのフィードバック発生符号量が増大する傾向にあり、かつ画像単位であるピクチャにおいて符号化された部分の目標符号量から符号化された部分の発生符号量を減算した符号量の余りに余裕がない場合、ピクチャ発生符号量がピクチャ目標符号量を超えると予測する。
画像符号化装置200は、直前のフィードバック制御単位の発生符号量が、直前のフィードバック制御単位の目標符号量より大きいとき、フィードバック制御単位ごとの発生符号量が増大する傾向にあると判別する。
画像符号化装置200は、次のフィードバック制御単位における発生符号量が目標符号量を超える可能性のある過剰最大符号量より小さいとき、符号量の余りに余裕がないと判別する。
これにより、画像符号化装置200は、フィードバック発生符号量が増大する傾向にあり、符号量の余りに余裕がないといった限定的な場合にのみ平均量子化パラメータBaseQPを増大させるため、平均量子化パラメータBaseQPの不要な変動を防止することができる。
画像符号化装置200は、ピクチャにおいて符号化された部分の発生符号量が当該符号化された部分の目標符号量を超えており、かつ目標符号量と発生符号量の比率が変化しないと仮定したときにピクチャ発生符号量がピクチャ目標符号量を超える場合に、ピクチャ発生符号量がピクチャ目標符号量を超えると予測する。
画像符号化装置200は、直前のフィードバック制御単位のフィードバック目標符号量とフィードバック発生符号量の比から求めたピクチャ発生符号量の予測値(ピクチャ予測発生符号量)が目標符号量を超えた場合に、目標符号量と発生符号量の比率が変化しないと仮定したときにピクチャ発生符号量がピクチャ目標符号量を超えると判別する。
これにより、画像符号化装置200は、フィードバック発生符号量とフィードバック目標符号量の比率が現状維持された場合にピクチャ発生符号量がピクチャ目標符号量を超えるといった限定的な場合にのみ平均量子化パラメータBaseQPを増大させるため、平均量子化パラメータBaseQPの不要な変動を防止することができる。
画像符号化装置200は、ピクチャにおける後半部分において、ピクチャ発生符号量がピクチャ目標符号量を超えるか否かを予測する。
これにより、画像符号化装置200は、これからエンコードされる残り部分が多く、平均量子化パラメータBaseQPの変動がピクチャ発生符号量に大きな影響を与える前半部分において極力フィードバック制御を実行しない。この結果、画像符号化装置200は、前半部分において不要に平均量子化パラメータBaseQPが変動したことによりピクチャ発生符号量のバランスが崩れることを防止できる。
画像符号化装置200は、ピクチャにおいて符号化された部分の発生符号量が当該符号化された部分の目標符号量と乖離する場合には、ピクチャにおける位置に拘らず、ピクチャ発生符号量がピクチャ目標符号量を超えかるか否かを予測する。
画像符号化装置200は、ピクチャにおいて符号化された部分の発生符号量が、当該符号化された部分の目標符号量に対して許容されるずれ量ThresholdRatioを乗算した値よりも小さい場合に、ピクチャにおいて符号化された部分の発生符号量が当該符号化された部分の目標符号量と乖離すると判別する。
これにより、画像符号化装置200は、例えば基本量子化パラメータQPMBの推測に失敗した場合には、ピクチャの早い段階でもフィードバック制御を実行でき、不測の事態にも対応することができる。
画像符号化装置200は、ピクチャ発生符号量がピクチャ目標符号量を超えると予測する場合に、平均量子化パラメータBaseQPを1だけ増大させる。
これにより、画像符号化装置200は、平均量子化パラメータBaseQPの変動を最小限に抑制でき、ピクチャ内における画質を安定させ得る。
画像符号化装置200は、入力画像91を符号化したときの発生符号量が目標符号量よりも小さくなるよう、基本量子化パラメータQPMBを決定する。
これにより、画像符号化装置200は、ピクチャ発生符号量を抑制できるため、ピクチャ発生符号量がピクチャ目標符号量を超えないように一段と制御し易くなる。
画像符号化装置200は、許容されるずれ量ThresholdRatioとして、1未満の値を設定する。これにより、画像符号化装置200は、符号化された部分の発生符号量が、当該符号化された部分の目標符号量より小さいものの近接してきた場合に、フィードバック制御を実行できるため、ピクチャ発生符号量がピクチャ目標符号量を超えないように確実に制御することができる。
画像符号化装置200は、広範囲に亘る量子化パラメータQP(選択量子化パラメータQPl)を用いて入力画像91を符号化することにより算出された低精度発生符号量に基づいて、基本量子化パラメータQPMBの近傍であると予測される予測量子化パラメータQPdを決定し、当該予測量子化パラメータQPd及び当該予測量子化パラメータQPdの近傍の量子化パラメータQPを用いて入力画像91を符号化することにより算出された高精度発生符号量に基づいて、基本量子化パラメータQPMBを決定する。
これにより、画像符号化装置200は、高い精度で基本量子化パラメータQPMBを決定しているため、当該基本量子化パラメータQPMBを用いることによりピクチャごとの本エンコード発生符号量をピクチャ目標符号量に近くできる。従って、画像符号化装置200は、極稀にフィードバック制御による平均量子化パラメータBaseQPを変動させるだけで済み、平均量子化パラメータBaseQPの変動を極力抑制できる。
以上の構成によれば、画像符号化装置200は、符号化された部分の発生符号量及び当該符号化された部分の目標符号量から、ピクチャ発生符号量がピクチャ目標符号量を超えると予測された場合にのみ平均量子化パラメータBaseQPを増大させるよう、フィードバック制御を実行する。
これにより、画像符号化装置200は、平均量子化パラメータBaseQPの変動を最小限に抑制しつつ確実にピクチャ発生符号量をピクチャ目標符号量以下にすることができる。かくして本発明は、均質な画質を維持しつつ確実にピクチャ発生符号量をピクチャ目標符号量以下にすることができる画像処理装置及び画像処理方法を実現できる。
<3.他の実施の形態>
なお上述した第2の実施の形態においては、画像符号化装置200が第1のプレエンコード部1の結果に基づいて予測量子化パラメータQPdを決定し、第2のプレエンコード部2の結果に基づいて基本量子化パラメータQPMBを決定する3パス構成でなるようにした場合について述べた。本発明はこれに限らず、例えば第1のエンコード部1が基本量子化パラメータQPMBを決定する2パス構成や、4パス以上の構成でなる画像符号化装置に本発明を適用するようにしても良い。
また上述した第1及び第2の実施の形態においては、入力画像91を画面内予測、DCTによる直交変換、量子化及びCAVLC又はCABACによる符号化によって符号化するようにした場合について述べた。本発明はこれに限らず、いずれを省略しても良く、少なくとも入力画像91を量子化すれば良い。また、これら以外の符号化方法を用いて入力画像91を符号化することもできる。
さらに上述した第2の実施の形態においては、複数のMBでなるフィードバック制御単位ごとにフィードバック発生符号量を確認するようにした場合について述べた。本発明はこれに限らず、フィードバック制御単位のサイズに制限はなく、例えばフィードバック制御単位をMBやスライスに設定するようにしても良い。
さらに上述した第2の実施の形態においては、画像単位としてピクチャごとの発生符号量を目標符号量以下に抑制するようにした場合について述べた。本発明はこれに限らず、例えば画像単位としてスライスごとや複数のピクチャごとに発生符号量を目標符号量以下に抑制するようにしても良い。
さらに上述した第2の実施の形態においては、1のフィードバック制御単位に対するフィードバック制御につき、平均量子化パラメータBaseQPを1だけ増大させるようにした場合について述べた。本発明はこれに限らず、条件に応じて2以上増大させるようにしても良い。
さらに上述した第1及び第2の実施の形態においては、直前のフィードバック発生符号量がフィードバック目標符号量を超えた場合に、フィードバック制御単位ごとの発生符号量が増大する傾向にあると判別するようにした場合について述べた。本発明はこれに限らず、例えば直前の複数のフィードバック制御単位ごとに発生符号量が目標符号量を超えるか否かにより、フィードバック制御単位ごとの発生符号量が増大する傾向にあると判別するようにしても良い。
さらに、上述した第2の実施の形態においては、(3)(a)及び(3)(b)のいずれかに該当するときに、画像単位ごとの発生符号量が上記画像単位ごとの目標符号量を超えると予測するようにした場合について述べた。本発明はこれに限らず、いずれか一方に該当する場合や、他の手法により画像単位ごとの発生符号量が上記画像単位ごとの目標符号量を超えると予測するようにしても良い。
さらに上述した第2の実施の形態においては、直前のフィードバック発生符号量とフィードバック目標符号量の比率からピクチャ発生符号量がピクチャの目標符号量を超えるか否かを予測するようにした場合について述べた。本発明はこれに限らず、例えば複数のフィードバック制御単位ごとやMBごとの目標符号量と発生符号量の比率からピクチャ発生符号量がピクチャの目標符号量を超えるか否かを予測するようにしても良い。
さらに上述した第2の実施の形態においては、ピクチャの後半部分に入ると、自動的にフィードバック制御を実行するようにした場合について述べた。本発明はこれに限らず、例えばエンコードした部分の発生符号量が目標符号量を超えた場合にのみフィードバック制御を実行するようにしても良い。
さらに上述した第2の実施の形態においては、エンコードした部分の発生符号量が目標符号量を超えた場合にフィードバック制御を実行するようにした場合について述べた。本発明はこれに限らず、その他種々の条件に応じてフィードバック制御を実行するようにしても良い。
さらに上述した第2の実施の形態においては、本エンコード発生符号量がピクチャ目標符号量を少し下回るように基本量子化パラメータQPMBを決定するようにした場合について述べた。本発明はこれに限らず、本エンコード発生符号量がピクチャ目標符号量に最も近くなるよう基本量子化パラメータQPMBを決定しても良い。
さらに、上述した第1及び第2の実施の形態においては、AVCに本発明を適用するようにした場合について述べた。本発明はこれに限らず、適応的にVLCテーブルを選択する種々の符号化方式に本発明を適用することが可能である。例えばMPEG−2に本発明を適用する場合、量子化因子として量子化スケールが用いられる。
さらに上述した第2の実施の形態においては、基本量子化因子決定部としての第1のプレコード部1、第2のプレコード部2及び符号量制御部4と、符号化部としての本エンコード部3と、フィードバック制御部としての符号量制御部4とによって画像処理装置としての画像符号化装置200を構成するようにした場合について述べた。本発明はこれに限らず、その他種々の構成による基本量子化因子決定部と、符号化部と、フィードバック制御部とによって本発明の画像処理装置を構成するようにしても良い。

Claims (15)

  1. 入力画像を符号化したときの画像単位ごとの発生符号量が上記画像単位ごとの目標符号量の近傍になると予測される基本量子化因子を決定する基本量子化因子決定部と、
    少なくとも上記基本量子化因子に基づいて決定された使用量子化因子を用いて量子化することにより、上記入力画像をフィードバック制御単位ごとに符号化する符号化部と、
    上記符号化部によって符号化された上記入力画像の発生符号量を上記フィードバック制御単位ごとに確認し、上記画像単位ごとの発生符号量が上記画像単位ごとの目標符号量を超えると予測する場合に、上記使用量子化因子を増大させるフィードバック制御部と
    を有する画像処理装置。
  2. 上記フィードバック制御部は、
    上記フィードバック制御単位ごとの発生符号量が増大する傾向にあり、かつ上記画像単位において符号化された部分の目標符号量から符号化された部分の発生符号量を減算した符号量の余りに余裕がない場合、上記画像単位ごとの発生符号量が上記画像単位ごとの目標符号量を超えると予測する
    請求項1に記載の画像処理装置。
  3. 上記フィードバック制御部は、
    直前のフィードバック制御単位の発生符号量が、直前のフィードバック制御単位の目標符号量より大きいとき、上記フィードバック制御単位ごとの発生符号量が増大する傾向にあると判別する
    請求項2に記載の画像処理装置。
  4. 上記フィードバック制御部は、
    上記符号量の余りが、次のフィードバック制御単位における発生符号量が目標符号量を超える可能性のある過剰最大符号量より小さいとき、上記符号量の余りに余裕がないと判別する
    請求項3に記載の画像処理装置。
  5. 上記フィードバック制御部は、
    上記画像単位において符号化された部分の発生符号量が当該符号化された部分の上記目標符号量を超えており、かつ目標符号量と発生符号量の比率が変化しないと仮定したときに画像単位ごとの発生符号量が上記画像単位ごとの目標符号量を超える場合に、画像単位ごとの発生符号量が上記画像単位ごとの目標符号量を超えると予測する
    請求項2に記載の画像処理装置。
  6. 上記フィードバック制御部は、
    直前のフィードバック制御単位の目標符号量と発生符号量の比から求めた画像単位の発生符号量の予測値が目標符号量を超えた場合に、上記目標符号量と発生符号量の比率が変化しないと仮定したときに画像単位ごとの発生符号量が上記画像単位ごとの目標符号量を超えると判別する
    請求項5に記載の画像処理装置。
  7. 上記フィードバック制御部は、
    上記画像単位における後半部分において、上記画像単位ごとの発生符号量が上記画像単位ごとの目標符号量を超えかるか否かを予測する
    請求項6に記載の画像処理装置。
  8. 上記フィードバック制御部は、
    上記画像単位において符号化された部分の発生符号量が当該符号化された部分の目標符号量と乖離する場合には、上記画像単位における位置に拘らず、上記画像単位ごとの発生符号量が上記画像単位ごとの目標符号量を超えかるか否かを予測する
    請求項7に記載の画像処理装置。
  9. 上記フィードバック制御部は、
    上記画像単位において符号化された部分の発生符号量が、当該符号化された部分の目標符号量に対して許容されるずれ量を乗算した値よりも小さい場合に、上記画像単位において符号化された部分の発生符号量が当該符号化された部分の目標符号量と乖離すると判別する
    請求項1に記載の画像処理装置。
  10. 上記フィードバック制御部は、
    上記画像単位ごとの発生符号量が上記画像単位ごとの目標符号量を超えると予測する場合に、上記使用量子化因子を1だけ増大させる
    を有する請求項1に記載の画像処理装置。
  11. 上記基本量子化因子は、
    上記入力画像を符号化したときの発生符号量が上記目標符号量よりも小さくなるよう、上記基本量子化因子を決定する
    請求項9に記載の画像処理装置。
  12. 上記許容されるずれ量は、1未満の値でなる
    請求項11に記載の画像処理装置。
  13. 上記符号化部は、
    上記画像単位ごとに決定される上記基本量子化因子を平均量子化因子とし、当該平均量子化因子に対してアクティビティに応じたオフセットが付加された値を、上記使用量子化因子として使用し、
    上記フィードバック制御部は、
    上記平均量子化因子を増大させることにより、上記使用量子化因子を増大させる
    請求項1に記載の画像処理装置。
  14. 上記基本量子化因子決定部は、
    広範囲に亘る量子化因子を用いて上記入力画像を符号化することにより算出された発生符号量に基づいて、基本量子化因子の近傍であると予測される予測量子化因子を決定し、当該予測量子化因子及び当該予測量子化因子の近傍の量子化因子を用いて上記入力画像を符号化することにより算出された発生符号量に基づいて、上記基本量子化因子を決定する
    請求項7に記載の画像処理装置。
  15. 入力画像を符号化したときの画像単位ごとの発生符号量が上記画像単位ごとの目標符号量の近傍になると予測される基本量子化因子を決定する基本量子化因子決定ステップと、
    少なくとも上記基本量子化因子に基づいて決定された使用量子化因子を用いて量子化することにより、上記入力画像をフィードバック制御単位ごとに符号化して符号化ストリームを生成する符号化ステップと、
    上記符号化ステップにおいて符号化された上記入力画像の発生符号量を上記フィードバック制御単位ごとに確認し、上記画像単位ごとの発生符号量が上記画像単位ごとの目標符号量を超えると予測する場合に、上記使用量子化因子を増大させるフィードバック制御ステップと
    を有する画像処理方法。
JP2010518089A 2008-06-27 2009-06-23 画像処理装置及び画像処理方法 Expired - Fee Related JP5472106B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010518089A JP5472106B2 (ja) 2008-06-27 2009-06-23 画像処理装置及び画像処理方法

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2008169397 2008-06-27
JP2008169397 2008-06-27
JP2010518089A JP5472106B2 (ja) 2008-06-27 2009-06-23 画像処理装置及び画像処理方法
PCT/JP2009/061805 WO2009157579A1 (ja) 2008-06-27 2009-06-23 画像処理装置及び画像処理方法

Publications (2)

Publication Number Publication Date
JPWO2009157579A1 true JPWO2009157579A1 (ja) 2011-12-15
JP5472106B2 JP5472106B2 (ja) 2014-04-16

Family

ID=41444638

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010518089A Expired - Fee Related JP5472106B2 (ja) 2008-06-27 2009-06-23 画像処理装置及び画像処理方法

Country Status (6)

Country Link
US (1) US8731052B2 (ja)
JP (1) JP5472106B2 (ja)
CN (1) CN101779468B (ja)
BR (1) BRPI0904320A2 (ja)
RU (1) RU2471306C2 (ja)
WO (1) WO2009157579A1 (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110110422A1 (en) * 2009-11-06 2011-05-12 Texas Instruments Incorporated Transmission bit-rate control in a video encoder
JP5331024B2 (ja) * 2010-02-16 2013-10-30 株式会社メガチップス 画像符号化装置及び画像変換装置
JP5641755B2 (ja) * 2010-03-25 2014-12-17 キヤノン株式会社 符号化装置、符号化装置の制御方法、プログラム
JP5762026B2 (ja) * 2011-02-01 2015-08-12 キヤノン株式会社 画像処理装置
JP5787135B2 (ja) * 2011-04-06 2015-09-30 ソニー株式会社 画像処理装置および方法、プログラム、並びに、記録媒体
JP6056124B2 (ja) * 2011-09-05 2017-01-11 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
EP2608537A1 (en) * 2011-12-21 2013-06-26 Thomson Licensing Parallel and distributed processing of video data
US9762902B2 (en) * 2012-01-09 2017-09-12 Futurewei Technologies, Inc. Weighted prediction method and apparatus in quantization matrix coding
JP2013150215A (ja) * 2012-01-20 2013-08-01 Fujitsu Ltd 動画像復号装置、動画像符号化装置、動画像復号方法、動画像符号化方法、動画像復号プログラム及び動画像符号化プログラム
RU2647693C9 (ru) * 2012-03-28 2018-09-03 ДжейВиСи КЕНВУД КОРПОРЕЙШН Устройство декодирования изображения и способ декодирования изображения
US9756327B2 (en) * 2012-04-03 2017-09-05 Qualcomm Incorporated Quantization matrix and deblocking filter adjustments for video coding
JP5900163B2 (ja) * 2012-05-30 2016-04-06 ソニー株式会社 画像処理装置、画像処理方法およびプログラム
US10650621B1 (en) 2016-09-13 2020-05-12 Iocurrents, Inc. Interfacing with a vehicular controller area network
CN107257461B (zh) * 2017-04-21 2019-08-20 中国计量大学 基于上下文自适应偏移模型的视音频编码硬判决量化方法
EP3935581A4 (en) 2019-03-04 2022-11-30 Iocurrents, Inc. DATA COMPRESSION AND COMMUNICATION USING MACHINE LEARNING
CN110852421B (zh) * 2019-11-11 2023-01-17 北京百度网讯科技有限公司 模型生成方法和装置
CN113132728B (zh) * 2019-12-31 2023-06-27 上海海思技术有限公司 编码方法及编码器

Family Cites Families (75)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4791483A (en) * 1987-11-20 1988-12-13 The Grass Valley Group, Inc. Adaptive differential pulse code modulation video encoder
US4979498A (en) 1989-10-30 1990-12-25 Machida Incorporated Video cervicoscope system
JP3085465B2 (ja) 1989-10-31 2000-09-11 オリンパス光学工業株式会社 画像データの符号化装置および符号化方法
JPH04114585A (ja) 1990-09-04 1992-04-15 Matsushita Electric Ind Co Ltd 動き補償フレーム間符号化装置
JP2908550B2 (ja) 1990-09-28 1999-06-21 株式会社東芝 養液栽培装置
EP0493130B1 (en) 1990-12-28 1997-06-11 Canon Kabushiki Kaisha Image encoding apparatus optimizing the amount of generated code
DE69228841T2 (de) 1991-02-07 1999-09-16 Canon Kk Vorrichtung zum Kodieren von Bildern
DE69222332T2 (de) 1991-02-21 1998-01-29 Nec Corp Kodierungsgerät zur Kompression von bewegten Bilddaten
TW224553B (en) * 1993-03-01 1994-06-01 Sony Co Ltd Method and apparatus for inverse discrete consine transform and coding/decoding of moving picture
DE69424591T2 (de) 1993-03-29 2001-01-18 Canon Kk Verfahren zur Kontrolle der Datenmenge und Kodierer zur Durchführung desselben.
JP3358620B2 (ja) 1993-04-09 2002-12-24 ソニー株式会社 画像符号化方法及び画像符号化装置
EP0892561B1 (en) 1993-04-09 2002-06-26 Sony Corporation Picture encoding method and apparatus
US5703646A (en) 1993-04-09 1997-12-30 Sony Corporation Picture encoding method, picture encoding apparatus and picture recording medium
JP3264043B2 (ja) 1993-04-30 2002-03-11 ソニー株式会社 量子化コントロール装置および方法
JP2968666B2 (ja) 1993-06-10 1999-10-25 日本電気株式会社 画像符号化方法および装置
EP0671816B1 (en) 1993-09-28 2000-03-29 Sony Corporation Encoding/decoding device with all odd or all even value rounding
JP2720926B2 (ja) 1993-10-26 1998-03-04 富士ゼロックス株式会社 画像符号化装置
JPH07322252A (ja) 1994-05-23 1995-12-08 Canon Inc 画像符号化装置
JP3561962B2 (ja) 1994-07-25 2004-09-08 ソニー株式会社 量子化コントロール装置および方法
JP2882287B2 (ja) 1994-08-22 1999-04-12 日本電気株式会社 動画像符号化装置
JPH08115205A (ja) 1994-10-14 1996-05-07 Matsushita Electric Ind Co Ltd 高速剰余演算装置
WO1996028937A1 (en) 1995-03-09 1996-09-19 Sony Corporation Method and device for encoding picture signal
US5612900A (en) 1995-05-08 1997-03-18 Kabushiki Kaisha Toshiba Video encoding method and system which encodes using a rate-quantizer model
JPH09247675A (ja) 1996-03-13 1997-09-19 Fuji Film Micro Device Kk 画像圧縮方法および画像圧縮システム
US6100931A (en) 1996-03-19 2000-08-08 Sony Corporation Method and apparatus for controlling a target amount of code and for compressing video data
JPH1023413A (ja) 1996-07-03 1998-01-23 Fuji Xerox Co Ltd 符号化装置
US6337879B1 (en) 1996-08-14 2002-01-08 Sony Corporation Video data compression apparatus and method of same
JP3864461B2 (ja) 1996-08-30 2006-12-27 ソニー株式会社 映像データ圧縮装置およびその方法
US6014467A (en) 1996-09-18 2000-01-11 Fuji Photo Film Co., Ltd. High speed, high precision image compression
US6163573A (en) 1996-12-12 2000-12-19 Sony Corporation Equipment and method for compressing picture data
JP4114210B2 (ja) 1996-12-12 2008-07-09 ソニー株式会社 映像データ圧縮装置およびその方法
JP3432392B2 (ja) 1997-04-07 2003-08-04 三菱電機株式会社 画像符号化装置、画像符号化方法および画像蓄積/伝送装置
JP3978810B2 (ja) * 1997-05-28 2007-09-19 ソニー株式会社 符号化方法およびこれを使用した符号化装置
JPH10336654A (ja) 1997-06-02 1998-12-18 Nec Corp 画像符号化装置
KR100610520B1 (ko) 1997-07-08 2006-08-09 소니 가부시끼 가이샤 비디오 데이터 부호화 장치, 비디오 데이터 부호화 방법, 비디오데이터 전송 장치 및 비디오 데이터 기록 매체
WO1999007158A2 (en) 1997-07-29 1999-02-11 Koninklijke Philips Electronics N.V. Variable bitrate video coding method and corresponding video coder
JPH1198502A (ja) 1997-09-25 1999-04-09 Toshiba Corp 動画像符号化装置
JP2000261805A (ja) 1999-03-10 2000-09-22 Fuji Film Microdevices Co Ltd 画像圧縮システム
JP3324551B2 (ja) * 1999-03-18 2002-09-17 日本電気株式会社 画像信号の符号化制御装置
JP2002359853A (ja) 2001-03-26 2002-12-13 Sony Corp 画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体
JPWO2002080573A1 (ja) 2001-03-28 2004-07-22 ソニー株式会社 量子化装置、量子化方法、量子化プログラムおよび記録媒体
EP1271926B1 (en) * 2001-06-18 2015-08-12 Canon Kabushiki Kaisha Image processing method, apparatus and computer program for compression-encoding
JP2003032677A (ja) 2001-07-18 2003-01-31 Hitachi Ltd 動画像圧縮符号化装置
US6934330B2 (en) 2001-08-01 2005-08-23 Sony Corporation Image processing apparatus
JP4135427B2 (ja) 2001-08-01 2008-08-20 ソニー株式会社 画像処理装置および方法、ならびに、画像処理プログラム
US7123655B2 (en) * 2001-08-09 2006-10-17 Sharp Laboratories Of America, Inc. Method for reduced bit-depth quantization
JP4042597B2 (ja) 2002-03-28 2008-02-06 ソニー株式会社 画像符号化装置及び方法、プログラム、記録媒体
JP4571489B2 (ja) * 2002-04-23 2010-10-27 ノキア コーポレイション ビデオ符号化システムにおける量子化器パラメータを表示するための方法および装置
JP2004056680A (ja) 2002-07-23 2004-02-19 Ricoh Co Ltd 画像処理装置および画像処理方法
JP4114585B2 (ja) 2002-09-27 2008-07-09 東洋インキ製造株式会社 ガスバリア性積層体の製造方法
JP2004297696A (ja) * 2003-03-28 2004-10-21 Matsushita Electric Ind Co Ltd 映像信号符号化装置
JP2005203905A (ja) 2004-01-13 2005-07-28 Sony Corp 画像符号化装置、画像符号化方法並びに画像符号化プログラム
US20050259730A1 (en) 2004-05-18 2005-11-24 Sharp Laboratories Of America, Inc. Video coding with residual color conversion using reversible YCoCg
JP2006067302A (ja) * 2004-08-27 2006-03-09 Toshiba Corp 画像符号化装置、画像符号化方法および画像符号化プログラム
US20060062481A1 (en) 2004-09-21 2006-03-23 Markus Suvanto Apparatuses, computer program product and method for bit rate control of digital image encoder
JP2006191253A (ja) 2005-01-05 2006-07-20 Matsushita Electric Ind Co Ltd レート変換方法及びレート変換装置
JP2006222555A (ja) 2005-02-08 2006-08-24 Matsushita Electric Ind Co Ltd 符号化装置及び符号化方法
JP4543971B2 (ja) * 2005-03-07 2010-09-15 ソニー株式会社 符号化方法、符号化装置、符号化処理のプログラム及び符号化処理のプログラムを記録した記録媒体
JP2007089035A (ja) * 2005-09-26 2007-04-05 Toshiba Corp 動画像符号化方法、装置及びプログラム
JP4828925B2 (ja) * 2005-11-30 2011-11-30 パナソニック株式会社 符号化装置
JP4529919B2 (ja) 2006-02-28 2010-08-25 日本ビクター株式会社 適応量子化装置及び適応量子化プログラム
US8077775B2 (en) * 2006-05-12 2011-12-13 Freescale Semiconductor, Inc. System and method of adaptive rate control for a video encoder
US7885471B2 (en) 2006-07-10 2011-02-08 Sharp Laboratories Of America, Inc. Methods and systems for maintenance and use of coded block pattern information
JP4354520B2 (ja) 2006-11-30 2009-10-28 パナソニック株式会社 符号化装置
US9455739B2 (en) 2007-03-14 2016-09-27 Nippon Telegraph And Telephone Corporation Code amount estimating method and apparatus, and program and storage medium therefor
JP2008283560A (ja) 2007-05-11 2008-11-20 Canon Inc 画像処理装置およびその方法
JP4569840B2 (ja) 2007-09-12 2010-10-27 ソニー株式会社 画像符号化装置、画像符号化方法
JP5212373B2 (ja) 2007-09-12 2013-06-19 ソニー株式会社 画像処理装置及び画像処理方法
CN101637026B (zh) 2007-09-12 2012-03-28 索尼株式会社 图像处理装置和方法
KR101350723B1 (ko) 2008-06-16 2014-01-16 돌비 레버러토리즈 라이쎈싱 코오포레이션 비디오 코딩을 위한 슬라이스 종속성에 기초한 레이트 제어 모델 적응 방법
US8270744B2 (en) 2008-06-27 2012-09-18 Sony Corporation Image processing apparatus and image processing method
WO2009157580A1 (ja) 2008-06-27 2009-12-30 ソニー株式会社 画像処理装置及び画像処理方法
US7887471B2 (en) * 2008-11-25 2011-02-15 Mcsorley Tyrone G Neuromuscular training apparatus and method of use
JP5257215B2 (ja) 2009-04-16 2013-08-07 ソニー株式会社 画像符号化装置と画像符号化方法
US8411750B2 (en) 2009-10-30 2013-04-02 Qualcomm Incorporated Global motion parameter estimation using block-based motion vectors

Also Published As

Publication number Publication date
US20110176606A1 (en) 2011-07-21
CN101779468A (zh) 2010-07-14
RU2010105039A (ru) 2011-08-20
BRPI0904320A2 (pt) 2015-06-30
CN101779468B (zh) 2012-07-04
US8731052B2 (en) 2014-05-20
JP5472106B2 (ja) 2014-04-16
WO2009157579A1 (ja) 2009-12-30
RU2471306C2 (ru) 2012-12-27

Similar Documents

Publication Publication Date Title
JP5472106B2 (ja) 画像処理装置及び画像処理方法
JP5472105B2 (ja) 画像処理装置及び画像処理方法
US6587508B1 (en) Apparatus, method and computer program product for transcoding a coded moving picture sequence
JP5257215B2 (ja) 画像符号化装置と画像符号化方法
US8270745B2 (en) Image processing device and image processing method
KR100471956B1 (ko) 화상압축부호화장치및방법
US8238423B2 (en) Image processing apparatus and method
US6229849B1 (en) Coding device and method
US8050322B2 (en) Bitrate control method and apparatus for intra-only video sequence coding
JP5900163B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP5770476B2 (ja) ビデオ符号化に於いてレート制御を正確にする方法及び装置
JP2006295535A (ja) 動画像符号化装置および方法
US7451080B2 (en) Controlling apparatus and method for bit rate
US20110019736A1 (en) Image encoding device and image encoding method
US6226326B1 (en) Coding device and coding method
KR20070034869A (ko) 동영상 부호화기의 비트율 제어 장치 및 방법
JP3626779B2 (ja) 画像符号化方法及び装置
US8755617B2 (en) Image encoding device and image encoding method
JP2008271213A (ja) 画像符号化装置
JP4193080B2 (ja) 符号化装置及び方法
JP4282974B2 (ja) 符号量制御装置、プログラム及び記録媒体
JP2007116655A (ja) 動画像符号化装置
EP1944980A2 (en) Bit rate control algorithm
JPH11243539A (ja) 符号化装置および符号化方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120315

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120315

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130618

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130812

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131022

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131203

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140107

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140120

R151 Written notification of patent or utility model registration

Ref document number: 5472106

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees