JP2006157214A - 動画像符号化装置 - Google Patents

動画像符号化装置 Download PDF

Info

Publication number
JP2006157214A
JP2006157214A JP2004341781A JP2004341781A JP2006157214A JP 2006157214 A JP2006157214 A JP 2006157214A JP 2004341781 A JP2004341781 A JP 2004341781A JP 2004341781 A JP2004341781 A JP 2004341781A JP 2006157214 A JP2006157214 A JP 2006157214A
Authority
JP
Japan
Prior art keywords
encoding
coding
prediction mode
inter
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004341781A
Other languages
English (en)
Inventor
Kazumi Arakage
和美 荒蔭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP2004341781A priority Critical patent/JP2006157214A/ja
Publication of JP2006157214A publication Critical patent/JP2006157214A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】ラグランジュ乗数を用いたレート歪み評価値を用いて符号化を行う場合に、いかなる符号化対象画像においても最適なインター予測符号化を行うことができ、符号化効率を向上させ、良好な画質を得ることが可能な動画像符号化装置を提供する。
【解決手段】前回の符号化で採用した量子化係数Qpと符号量とから、今回の符号化にて採用候補となる量子化係数Qpの中心値を求めて、その前後の所定値を決定する。決定した前記所定値毎に、前回の符号化時に算出したラグランジュ乗数算出係数Lと今回の符号化にて採用候補となる量子化係数Qpとを用いて算出したラグランジュ乗数を用いて符号化を行う。その符号化の結果、最も符号化効率の良かった量子化係数Qpの値を選択する。選択した量子化係数Qpの値とラグランジュ乗数λによりラグランジュ乗数算出係数Lを求め、次回の符号化に用いることにより、最適な符号化を行うことができる。
【選択図】 図1

Description

本発明は、特にレート歪み特性を考慮して予測モード判定を行う動画像符号化装置に関するものである。
動画像符号化方式の国際標準規格としてH.264がある。H.264は従来方式であるMPEG−2やMPEG−4と同程度の画質を維持しながら、より圧縮効率を向上させた符号化方式であり、MPEG−4 AVC、MPEG−4 Part10等とも呼ばれている。
H.264では、イントラ予測符号化、インター予測符号化、直交変換符号化、量子化、エントロピー符号化などの符号化手法が用いられている。以下、それぞれの手法について説明する。
[イントラ予測符号化]
イントラ予測符号化は、同一画像内の所定画素の周辺には画像相関性が高い画素が存在する可能性が高いことを利用して符号量を圧縮する符号化手法である。イントラ予測符号化は従来のMPEG−2規格等には無かった手法である。
符号化対象画像を16×16画素、または4×4画素のブロックに分割して、分割したブロック毎に、近傍の参照画素領域との差分である残差成分を求めて符号量を圧縮する。
前記近傍の参照画素領域は、H.264で定義されている13種類のイントラ予測モードにてどの位置の参照画素領域を用いるかが決定される。イントラ予測符号化は、前記イントラ予測モードのうち一番符号化効率が良いと推定できる予測モードを選択して行うのが一般的である。
[インター予測符号化]
インター予測符号化は、一般に時間的に連続する動画像間においては画像相関性が高いという特性を利用して符号量を圧縮する符号化手法である。動き補償予測符号化とも呼ばれる。
符号化対象画像を所定の画素数の2次元ブロックに分割し、分割したブロック毎に、時間的に連続する参照画像で一番相関の高いブロック領域を検出する。そして前記符号化対象画像ブロックと前記参照画像上で一番相関の高いブロック領域との差分をとった残差成分と、前記参照画像上のブロック領域が符号化対象画像ブロックからどのくらいずれた位置に存在するのかを表す動きベクトルとを求めて符号量を圧縮する手法である。
インター予測符号化の際に符号化対象画像より時間的に前の画像のみを参照画像として符号化した符号化画像をPピクチャと呼ぶ。また、インター予測符号化の際に符号化対象画像の時間的に前と後の画像のうち2枚の画像を参照画像として符号化した符号化画像をBピクチャと呼ぶ。インター予測符号化を行なわずに前述のイントラ予測符号化のみを行った符号化画像をIピクチャと呼ぶ。
従来のMPEG−2等では、インター予測符号化で用いられる分割ブロック領域は16×16画素、または8×8画素に固定されていた。H.264では、符号化効率を高めるために、16×16画素のブロック内を図9に示すようにさらに細かい7つのパターンのパーティションに分けてインター予測符号化を行う。16×16画素のブロックをマクロブロック(以下MBと略する)と呼ぶ。8×16画素、16×8画素、8×8画素のブロックをMBパーティションと呼ぶ。4×8画素、8×4画素、4×4画素のブロックをMBサブパーティションと呼ぶ。
また従来のMPEG−2等では、インター予測符号化で用いられる参照画像は、Pピクチャでは前方の直近1ピクチャ、Bピクチャでは前後それぞれの直近の1ピクチャに固定されていた。H.264では符号化効率を高めるために、参照画像として、Pピクチャは前方最大16ピクチャの中から所定の1ピクチャ、Bピクチャは前後それぞれ最大16ピクチャのうち所定の2ピクチャを参照画像として使用可能である。
従って、H.264では、前記7パターンのブロック内パーティションと、前記参照画像との組み合わせの数だけインター予測符号化を行えるモードが存在することになる。これらのモードをインター予測モードと呼ぶ。インター予測符号化は、前記インター予測モードのうち一番符号化効率が良いと推定できる予測モードを選択して行うのが一般的である。
[直交変換符号化]
直交変換符号化は、前記インター予測符号化が行われた後の残差成分、または前記イントラ予測符号化が行われた後の残差成分を、所定の画素数のブロックに分割して、前記ブロック毎に2次元直交変換を施すと、ある直交変換係数の周りに大きな値が集中する画像の特性を利用した符号化手法である。
従来のMPEG−2等では、分割ブロックサイズを8×8画素とし、直交変換には離散コサイン変換を用いていた。H.264では、符号化効率を高めるために、分割ブロックサイズを4×4画素とし、直交変換には整数変換を用いている。
[量子化]
量子化は直行変換符号化を行うことによって発生した直交変換係数をマクロブロック毎に決定される所定の除数で割り算を行い、余りを丸めることで得られる値(変換係数と呼ぶ)を以後の符号化に用いることで符号量を圧縮する手法である。このマクロブロック毎に決定する所定の除数を量子化係数Qpと呼ぶ。この値を大きくすると圧縮効率は向上するが復号再生時の画質は劣化する方向となる。
[エントロピー符号化]
エントロピー符号化は、出現頻度の高い変換係数値には短いビット長の符号を割り当て、出現頻度の低い変換係数値には長いビット長の符号を割り当てることにより符号量を圧縮する手法である。前記量子化にて得られた変換係数に対して行う。
前述のようにH.264におけるインター予測符号化では、7種類のMB内分割ブロックパターンと、参照画像との組み合わせの数だけインター予測モードが存在する。インター予測符号化は、前記インター予測モードのうち一番符号化効率が良いと判断できる予測モードを選択してインター予測符号化を行うのが一般的である。
また動きベクトル検出に関しても、複数ある参照画像から一番符号化効率が良いと判断できる参照画像を選択し、その選択した参照画像中の所定範囲のブロック領域から一番符号化効率が良いと判断できる領域を指し示す動きベクトルを求めてインター予測符号化を行うのが一般的である。
従って、インター予測符号化においては、前述したインター予測モード、動きベクトル、参照画像の選択において、符号化効率の良し悪しの判断を精度良く行うことが重要であり、さまざまな符号化効率判定手法が提案されている。
[H.264の符号化効率判定手法]
H.264規格で提供されている検証用エンコーダの仕様では、動きベクトル検出とインター予測モード選択において、レート歪み特性を考慮した符号化効率判定手法が公開されている。以下に簡単に説明する。
下記式6はこの符号化効率判定手法の一般式である。符号化誤差量Distortinと符号量Rateを、ラグランジュ乗数λを用いて線形結合して算出した値を符号化効率評価値Jとする。動きベクトル検出およびインター予測モード選択において、前述したそれぞれ全てのパターンもしくはモードについて符号化誤差量Distortinと符号量Rateを求める。そして求めた符号化誤差量Distortinと符号量Rateを下記式6に代入し符号化効率評価値Jを求める。この符号化効率評価値Jが最小となる組み合わせの動きベクトル、参照画像、インター予測モードをインター予測符号化に用いると最も符号化効率がよくなるという手法である。
Figure 2006157214
前記式6は一般式であり、インター予測モード選択時と動きベクトル検出時とではそれぞれに符号化誤差量Distortinと符号量Rateの算出パラメータが異なる。またラグランジュ乗数λの値も異なる。次に詳細に説明する。
インター予測モード選択に用いるラグランジュ乗数λをインター予測モード選択用ラグランジュ乗数λMODEと定義する。このインター予測モード選択用ラグランジュ乗数λMODEは、量子化係数Qpから下記式7のように算出される。
また、動きベクトル検出に用いるラグランジュ乗数λを動きベクトル検出用ラグランジュ乗数λMOTIONと定義する。動きベクトル検出用ラグランジュ乗数λMOTIONはインター予測モード選択用ラグランジュ乗数λMODEから下記式4のように算出される。
Figure 2006157214
Figure 2006157214
インター予測モード選択時の符号化効率評価値JMODE(第一の符号化効率評価値:以下インター予測モード符号化評価値と呼ぶ)を求める算出式を下記式1に示す。この算出式でインター予測モード符号化効率評価値JMODEが最小となるインター予測モードを選択する。
Figure 2006157214
動きベクトル検出時の符号化効率評価値JMOTIN(第二の符号化効率評価値:以下動きベクトル符号化効率評価値と呼ぶ)を求める算出式を下記式3に示す。この算出式で動きベクトル符号化効率評価値JMOTIONが最小となる動きベクトルおよび参照画像の組み合わせを選択する。
Figure 2006157214
ところで、このインター予測モード選択に使用するラグランジュ乗数であるインター予測モード選択用ラグランジュ乗数λMODEの算出式である前記式7は、H.264検討当初から用いられてきた算出式であり、その後の標準化作業において数々の仕様変更がなされた符号化方式に対して、必ずしも最適な算出式とはなっていない。
そこで、非特許文献1では、インター予測モード選択用ラグランジュ乗数λMODEの算出式を最適化したとする報告がなされている。この報告では、H.264標準化団体(JVT)が用いている数枚の標準動画像において量子化係数Qp及びインター予測モード選択用ラグランジュ乗数λMODEのパラメータを複数の所定値に変更して実験した結果、インター予測モード選択用ラグランジュ乗数λMODEは前記式7の算出式で導かれる値よりも多少小さくすると良い結果が得られると結論付けられている。
高木他,RD特性に基づくJVT符号化方式の検証,2002年映像情報メディア学会年次大会12−5
しかしながら、インター予測モード選択用ラグランジュ乗数λMODE及び動きベクトル検出用ラグランジュ乗数λMOTIONの最適値は、符号化対象画像の複雑さや動きの激しさ、画像サイズなどによって影響を受け変動する。従って、非特許文献1で報告されているような数枚の標準動画像を用いて得られた前記式7で算出される値よりも多少小さい値にインター予測モード選択用ラグランジュ乗数λMODEを決定してインター予測符号化を行っても、全ての符号化対象画像において符号化効率が向上するとは言い難い。
本発明は上記課題を鑑みてなされたものである。
本発明は、いかなる画像においても最適なインター予測符号化を行うことができ、符号化効率を向上させ、良好な画質を得ることが可能な動画像符号化装置を実現することを目的とする。
そこで上記課題を解決するために本発明は、下記の装置を提供するものである。
(1)画像信号を複数の画素の2次元配列からなるマクロブロックに分割し、前記マクロブロック単位で順次、インター予測符号化またはイントラ予測符号化を行い、前記イントラ予測符号化または前記インター予測符号化にて生成された予測符号化信号を入力として直交変換符号化を行い、前記直交変換符号化にて生成された直交変換符号化信号を入力として、既に符号化が行われた符号化対象画像の符号量に対応した量子化係数Qpの値を用いて当該マクロブロックの量子化を行う動画像符号化装置において、
前記マクロブロック毎に、前記インター予測符号化にて採用候補となる複数のインター予測モード全てに対して、下記式1に示す算出式より第一の符号化効率評価値JMODEの値を算出し、算出した全ての前記第一の符号化効率評価値JMODEの値を比較して、最も値が小さい前記第一の符号化効率評価値JMODEの値に対応するインター予測モードを最も符号化効率がよい予測モードとして選択するインター予測モード選択手段と、
Figure 2006157214
Figure 2006157214
前記マクロブロック毎に、前記インター予測符号化において使用する動きベクトルと参照画像とを検出する際に、前記動きベクトルと前記参照画像との全ての組み合わせにおいて、下記式3に示す算出式より第二の符号化効率評価値JMOTIONの値を算出し、算出した全ての前記第二の符号化効率評価値JMOTIONの値を比較して、最も値が小さい前記第二の符号化効率評価値JMOTIONの値となる動きベクトルと参照画像との組み合わせを、最も符号化効率のよい組み合わせと判断して検出する動きベクトル検出手段と、
Figure 2006157214
Figure 2006157214
前記インター予測モード選択用ラグランジュ乗数の値と前記動きベクトル検出用インター予測モード選択用ラグランジュ乗数の値とをそれぞれ前記式2及び前記式4に基づいて制御するラグランジュ乗数制御手段とを有し、
前記ラグランジュ乗数制御手段は、
前回の符号化で採用した量子化係数Qpと前回の符号化で発生した符号量とから所定の算出手順に従って今回の符号化で採用候補となる量子化係数Qpの値を求め、
求めた前記今回の符号化で採用候補となる量子化係数Qpと、前回の符号化で算出したラグランジュ乗数算出係数Lとを用いて上記式2より今回の符号化で用いるインター予測モード選択用ラグランジュ乗数λMODEを求め、
前記今回の符号化で採用候補となる量子化係数Qpを中心値として所定数の前後複数の値を選択し、選択した前記複数の値を新たに今回の符号化で採用候補となる量子化係数Qpとして決定し、
前記インター予測モード選択用ラグランジュ乗数λMODEと、前記決定した複数の今回の符号化で採用候補となる量子化係数Qpと、前記インター予モードとの全ての組み合わせにおいて前記式1を用いて前記符号化効率評価値JMODEを算出し、算出した全ての前記符号化効率評価値JMODEの値を比較して、最も値が小さい前記符号化効率評価値JMODEに対応する前記インター予測モードと前記量子化係数Qpの組み合わせを選択し、
前記選択した量子化係数Qpと、前記インター予測モード選択用ラグランジュ乗数λMODEとから前記式2を変形した下記式5を用いて、次の符号化に用いるラグランジュ乗数算出係数Lを求めるように制御する、
ことを特徴とする動画像符号化装置。
Figure 2006157214
本発明によれば、いかなる画像においても符号化効率の良い最適な符号化を行うことができ、符号化効率を向上させ、良好な画質を得ることが可能となる。
本発明の実施の最良の形態を以下に説明する。
従来から使用されているインター予測モード選択用ラグランジュ乗数λMODEを算出する式は下記式7である。本算出式はこれまで述べてきたように、H.264検討当初から用いられてきた算出式であり、その後の標準化作業において数々の仕様変更がなされた符号化方式に対して、必ずしも最適な算出式とはなっていない。
本発明では、下記式7を下記式2に示すように、係数0.85にあたるパラメータを、ラグランジュ乗数算出係数Lと定義する変数に置き換える。
そして、最初の符号化においては、予め所定値に決定してあるインター予測モード選択用ラグランジュ乗数λMODEと、予め所定値に決定してある複数の量子化係数Qpとの組み合わせにおいてそれぞれ符号化を行い、その各符号化の結果最も符号化効率が良いものを実際の符号化とすると同時に、その符号化で採用した量子化係数Qpを記憶する。
次に前記記憶した量子化係数Qpと、前記所定値のインター予測モード選択用ラグランジュ乗数λMODEとから下記式2を変形した下記式5を用いて、次の符号化に用いるためのラグランジュ乗数算出係数Lを求めて記憶する。
2回目以降の符号化においては、まず前回の符号化で採用して記憶してある量子化係数Qpと前回の符号化で発生した符号量とから所定の算出手順に従って今回の符号化で採用候補となる量子化係数Qpの値を求める。
そして、求めた今回の符号化で採用候補となる量子化係数Qpと、前回の符号化で算出して記憶してあるラグランジュ乗数算出係数Lとを用いて下記式2より今回の符号化で用いるインター予測モード選択用ラグランジュ乗数λMODEを求める。
また前述の今回の符号化で採用候補となる量子化係数Qpを中心値として前後複数の所定値をおのおの新たな採用候補の量子化係数Qpと決定する。決定した前記複数の今回の符号化で採用候補となる各量子化係数Qpと、求めたインター予測モード選択用ラグランジュ乗数λMODEとにおいてそれぞれ符号化を行い、その各符号化の結果最も符号化効率が良いものを実際の符号化とすると同時に、その符号化で採用した量子化係数Qpを記憶する。そして前記記憶した量子化係数Qpと、前記所定値のインター予測モード選択用ラグランジュ乗数λMODEとから下記式2を変形した下記式5を用いて、次の符号化に用いるためのラグランジュ乗数算出係数Lを求めて記憶しておく。
以降は符号化処理終了まで上記の2回目以降の処理を繰り返し実行する。
なお符号化処理で使用する動きベクトル検出用ラグランジュ乗数λMOTIONは
それぞれの符号化で求めたインター予測モード選択用ラグランジュ乗数λMODEから下記式4により一意に導かれる値を使用するものとする。
上記のような符号化処理を行うことで、いかなる画像においても符号化効率の良い最適な符号化を行うことができ、符号化効率を向上させ、良好な画質を得ることが可能となる。
Figure 2006157214
Figure 2006157214
Figure 2006157214
Figure 2006157214
以下図面とフローチャートを用いて、本発明の実施例を説明する。
図1は、本発明の動画像符号化装置の第一の実施例を示すブロック図である。
フレームメモリ101、直交変換符号化部102、符号列生成部103、直交変換復号化部104、量子化係数制御部105、符号量算出部106、予測モード選択部107、インター予測部108、フレームメモリ109、符号列出力部110、差分演算部111、加算演算部112、スイッチ113、114、ラグランジュ乗数制御部120から構成されている。
また図3は、本発明の動画像符号装置の第一の実施例の処理の流れを示すフローチャートである。
符号化対象画像データは、フレームメモリ101に所定枚数分蓄積され、あらかじめ決定されているピクチャタイプ(Iピクチャ、Pピクチャ、Bピクチャ)の符号化順序に従って並び替えが行われる。その後、マクロブロック(以下MBと呼ぶ)単位で読み出され、符号化処理が行われる。ここでは、MBの大きさを水平16画素×垂直16画素であるとする。
符号化対象画像MBをIピクチャとしてイントラ予測符号化を行う場合、スイッチ113、114はオフとする(S301)。
読み出された符号化対象画像MBは直交変換符号化部102および予測モード選択部107、差分演算部111に入力される。
直交変換符号化部102に入力された符号化対象画像MBは、従来例で説明したとおりH.264で定義されている13種類のイントラ予測モードについて、それぞれ直交変換されたのち、量子化係数制御部105から入力される量子化係数Qpを用いて量子化される。
量子化係数制御部105は、符号量算出部106から入力される既に符号化が行われた符号化対象画像の符号量と、予測モード選択部107から入力された、既に符号化が行われた前回の符号化対象画像MBに採用した量子化係数Qpから、今回の符号化で採用候補となる量子化係数Qpを決定し、ラグランジュ乗数制御部120に出力する。さらにこの量子化係数Qpを中心としてあらかじめ決められた範囲で変化させた値を直交変換符号化部102に出力する。ここでは、前回の符号化対象画像MBの符号化に採用した量子化係数Qp±2の範囲の値を出力することとする。すなわち、前回の符号化対象画像MBの符号化で選択した量子化係数Qpが26であるとすると、ラグランジュ乗数制御部120には量子化係数Qpとして26が入力され、直交変換符号化部102には、今回の符号化で採用候補となる量子化係数Qpとして26、25、24、27、28が入力される。
なお、最初の符号化対象画像MBの符号化時の採用候補となる量子化係数は、あらかじめ連続する例えば22、23、24,25,26といった所定の値を用いるものとする。
直交変換符号化部102は入力された今回の符号化で採用候補となる各量子化係数Qpを用いてそれぞれ量子化および直交変換を行い、イントラ予測符号化データを生成して符号列生成部103および直交変換復号化部104に出力する(S302)。
直交変換復号化部104では、入力されたイントラ予測符号化データに対して逆量子化、直交逆変換といった復号化処理を施し、復号画像MBを生成する。生成された復号画像MBは、加算演算部112を経て予測モード選択部107に出力される(S303)。
<インター予測符号化>
符号化対象画像MBをPピクチャまたはBピクチャとして符号化する場合、まず、スイッチ113および114はオフとして前述したIピクチャの場合と同じ方法で、イントラ予測符号化処理を行う。
次に、スイッチ113および114をオンにして以下に述べるインター予測符号化処理を行う(S301)。
読み出された符号化対象画像MBは直交変換符号化部102および予測モード選択部107、インター予測部108、差分演算部111に入力される。
インター予測部108では、入力された符号化対象画像MBと、フレームメモリ109に蓄積された参照画像を用いて動きベクトルを検出し、動き補償を行う。動きベクトルの検出及び動き補償は、複数のインター予測モードにおいてそれぞれ行われる。インター予測モードは従来例でも説明したとおり図2に示すような7パターンのブロック内パーティションと、選択する参照画像の組み合わせの数だけ存在する。
動きベクトルと参照画像の検出は、下記式3の評価式の動きベクトル符号化効率評価値JMOTIONが最小になる組み合わせを選択することで行われる。
ここで使用する動きベクトル検出用ラグランジュ乗数λMOTIONは、符号化対象画像MBを1つの符号化の単位として、ラグランジュ乗数制御部120で算出されるインター予測モード選択用ラグランジュ乗数λMODEから下記式4を用いて与えられるものとする。
Figure 2006157214
Figure 2006157214
インター予測部108は検出された動きベクトルと参照画像を用いて動き補償された参照画像ブロックを差分演算部111及び加算演算部112に出力する(S304)。
差分演算部111では、符号化対象画像MBと検出した参照画像ブロックとの差分を演算し、インター予測誤差データを生成して直交変換符号化部102に出力する(S305)。
インター予測誤差データは、直交変換符号化部102において直交変換されたのち、前述したイントラ予測符号化処理のときと同様に量子化係数制御部105から与えられる今回の符号化で採用候補となる各量子化係数Qpを用いておのおの量子化される。すなわち、前回の符号化対象画像MBの符号化で選択した量子化係数Qpが26であるとすると、ラグランジュ乗数制御部120には量子化係数Qpとして26が入力され、直交変換符号化部102には、今回の符号化で採用候補となる量子化係数Qpとして26、25、24、27、28が入力される。
直交変換符号化部102ではこれらの今回の符号化で採用候補となる各量子化係数Qpを用いてそれぞれ量子化および直交変換を行い、それぞれの結果をインター予測符号化データとして符号列生成部103および直交変換復号化部104に出力する(S306)。
直交変換復号化部104では、入力された各インター予測符号化データに対してそれぞれ逆量子化、直交逆変換といった復号化処理を施し、復号予測誤差データを生成して加算演算部112に出力する(S307)。
加算演算部112では、インター予測部108から入力された参照画像ブロックと直交変換復号化部104から入力された復号予測誤差データとで加算演算を行い、復号画像MBを生成して予測モード選択部107に出力する(S308)。
一方、符号列生成部103では、直交変換符号化部102から入力されたイントラ予測符号化データまたはインター予測符号化データから、あらかじめ決められた規則に従って符号列データを生成し、符号量算出部106および符号列出力部110に出力する(S309)。
符号量算出部106は入力されたそれぞれの符号列データの符号量を算出し、量子化係数制御部105および予測モード選択部107に出力する(S310)。
予測モード選択部107は加算演算部112から入力された復号画像MBと、フレームメモリ101から入力される符号化対象画像MBから符号化誤差量DMODEを算出する。そしてこの算出した符号化誤差量DMODEと、符号量算出部106から入力される符号量RMODEと、ラグランジュ乗数制御部120で前回の符号化時に求められているラグランジュ乗数算出係数Lと、同じく前回の符号化時に求められている量子化係数Qpとにより下記式2により算出され入力されるインター予測モード選択用ラグランジュ乗数λMODEとを用いて、下記式1のインター予測モード符号化評価値JMODEを最小にする予測モードおよび量子化係数Qpを選択する。
Figure 2006157214
Figure 2006157214
復号画像MBと符号量RMODEは、全てのイントラ予測モードおよびインター予測モードと、量子化係数Qpの組み合わせについて入力される。従って、予測モードは全てのイントラ予測モードとインター予測モードの中から選択される。また量子化係数Qpは{26、25、24、27、28}の中から選択される(S311)。
なお、イントラ予測モードの選択方法の詳細に関しては本発明とは直接関係が無いので説明は省略する。
予測モード選択部107は、選択した量子化係数Qpを量子化係数制御部105に出力し、また前記選択した量子化係数Qpと選択した予測モードに使用したインター予測モード選択用ラグランジュ乗数λMODEとを、ラグランジュ乗数制御部120に出力し、選択した予測モードおよび量子化係数Qpに対応する復号画像MBをフレームメモリ109に出力すると共に、選択した予測モードを符号列出力部110に出力する。
符号列出力部110は予測モード選択部107から入力された選択ブロックモードに対応する符号列を符号化ビットストリームとして出力する。
ラグランジュ乗数制御部120では、入力された、今回の符号化で選択された量子化係数Qpと、同じく今回の符号化で選択された予測モードに使用したラグランジュ乗数λMODEとにより、下記式5を用いて次の符号化に使用する為のラグランジュ乗数算出係数Lを算出する。(S312)
Figure 2006157214
ここまでに述べてきたS301からS312までの符号化処理を全符号化対象画像終了まで繰り返して行う(S313)。
図4は、本発明の動画像符号化装置の第二の実施例を示すブロック図である。
フレームメモリ101、直交変換符号化部102、符号列生成部103、直交変換復号化部104、量子化係数制御部105、符号量算出部106、予測モード選択部107、インター予測部108、フレームメモリ109、符号列出力部110、差分演算部111、加算演算部112、スイッチ113、114、量子化係数及びラグランジュ乗数記憶部119、ラグランジュ乗数制御部120から構成されている。
また図6は、本発明の動画像符号装置の第二の実施例の処理の流れを示すフローチャートである。
符号化対象画像データは、フレームメモリ101に所定枚数分蓄積され、あらかじめ決定されているピクチャタイプ(Iピクチャ、Pピクチャ、Bピクチャ)の符号化順序に従って並び替えが行われる。その後、マクロブロック(以下MBと呼ぶ)単位で読み出され、符号化処理が行われる。ここでは、MBの大きさを水平16画素×垂直16画素であるとする。
符号化対象画像MBをIピクチャとしてイントラ予測符号化を行う場合、スイッチ113、114はオフとする(S401)。
読み出された符号化対象画像MBは直交変換符号化部102および予測モード選択部107、差分演算部111に入力される。
直交変換符号化部102に入力された符号化対象画像MBは、従来例で説明したとおりH.264で定義されている13種類のイントラ予測モードについて、それぞれ直交変換されたのち、量子化係数制御部105から入力される量子化係数Qpを用いて量子化される。
量子化係数制御部105は、符号量算出部106から入力される既に符号化が行われた符号化対象画像の符号量と、予測モード選択部107から入力された、既に符号化処理が行われた前回の符号化対象画像MBに採用した量子化係数Qpから、今回の符号化で採用候補となる量子化係数Qpを決定し、ラグランジュ乗数制御部115に出力する。さらにこの量子化係数Qpを中心としてあらかじめ決められた範囲で変化させた値を直交変換符号化部102に出力する。ここでは、前回の符号化対象画像MBの符号化に採用した量子化係数Qp±2の範囲の値を出力することとする。すなわち、前回の符号化対象画像MBの符号化で選択した量子化係数Qpが26であるとすると、ラグランジュ乗数制御部115には量子化係数Qpとして26が入力され、直交変換符号化部102には、今回の符号化で採用候補となる量子化係数Qpとして26、25、24、27、28が入力される。
なお、最初の符号化対象画像MBの符号化時の採用候補となる量子化係数は、あらかじめ連続する例えば22、23、24,25,26といった所定の値を用いるものとする。
直交変換符号化部102は入力された今回の符号化で採用候補となる各量子化係数Qpを用いてそれぞれ量子化および直交変換を行い、イントラ予測符号化データを生成して符号列生成部103および直交変換復号化部104に出力する(S402)。
直交変換復号化部104では、入力されたイントラ予測符号化データに対して逆量子化、直交逆変換といった復号化処理を施し、復号画像MBを生成する。生成された復号画像MBは、加算演算部112を経て予測モード選択部107に出力される(S403)。
符号化対象画像MBをPピクチャまたはBピクチャとして符号化する場合、まず、スイッチ113および114はオフとして前述したIピクチャの場合と同じ方法で、イントラ予測符号化処理を行う。
次に、スイッチ113および114をオンにして以下に述べるインター予測符号化処理を行う(S401)。
読み出された符号化対象画像MBは直交変換符号化部102および予測モード選択部107、インター予測部108、差分演算部111に入力される。
インター予測部108では、入力された符号化対象画像MBと、フレームメモリ109に蓄積された参照画像を用いて動きベクトルを検出し、動き補償を行う。動きベクトルの検出及び動き補償は、複数のインター予測モードにおいてそれぞれ行われる。インター予測モードは従来例でも説明したとおり図2に示すような7パターンのブロック内パーティションと、選択する参照画像の組み合わせの数だけ存在する。
動きベクトルと参照画像の検出は、下記式3の評価式の動きベクトル符号化効率評価値JMOTIONが最小になる組み合わせを選択することで行われる。
ここで使用する動きベクトル検出用ラグランジュ乗数λMOTIONは、符号化対象画像を1つの符号化の単位として、ラグランジュ乗数制御部120で算出されるインター予測モード選択用ラグランジュ乗数λMODEから下記式4を用いて与えられるものとする。
Figure 2006157214
Figure 2006157214
インター予測部108は検出された動きベクトルと参照画像を用いて動き補償された参照画像ブロックを差分演算部111及び加算演算部112に出力する(S404)。
差分演算部111では、符号化対象画像MBと検出した参照画像ブロックとの差分を演算し、インター予測誤差データを生成して直交変換符号化部102に出力する(S405)。
インター予測誤差データは、直交変換符号化部102において直交変換されたのち、前述したイントラ予測符号化処理のときと同様に量子化係数制御部105から与えられる今回の符号化で採用候補となる量子化係数Qpを用いて量子化される。すなわち、前回の前回の符号化対象画像MBの符号化で選択した量子化係数Qpが26であるとすると、ラグランジュ乗数制御部115には量子化係数Qpとして26が入力され、直交変換符号化部102には、今回の符号化で採用候補となる量子化係数Qpとして26、25、24、27、28が入力される。
直交変換符号化部102ではこれらの今回の符号化で採用候補となる各量子化係数Qpを用いてそれぞれ量子化および直交変換を行い、それぞれの結果をインター予測符号化データとして符号列生成部103および直交変換復号化部104に出力する(S406)。
直交変換復号化部104では、入力された各インター予測符号化データに対してそれぞれ逆量子化、直交逆変換といった復号化処理を施し、復号予測誤差データを生成して加算演算部112に出力する(S407)。
加算演算部112では、インター予測部108から入力された参照画像ブロックと直交変換復号化部104から入力された復号予測誤差データとで加算演算を行い、復号画像MBを生成して予測モード選択部107に出力する(S408)。
一方、符号列生成部103では、直交変換符号化部102から入力されたイントラ予測符号化データまたはインター予測符号化データから、あらかじめ決められた規則に従って符号列データを生成し、符号量算出部106および符号列出力部110に出力する(S409)。
符号量算出部106は入力されたそれぞれの符号列データの符号量を算出し、量子化制御部105および予測モード選択部107に出力する(S410)。
予測モード選択部107は加算演算部111から入力された復号画像MBと、フレームメモリ101から入力される符号化対象画像MBから符号化誤差量DMODEを算出する。そしてこの算出した符号化誤差量DMODEと、符号量算出部106から入力される符号量RMODEと、ラグランジュ乗数制御部120で前回の符号化時に求められているラグランジュ乗数算出係数Lと、同じく前回の符号化時に求められている量子化係数Qpとにより下記式2により算出され入力されるインター予測モード選択用ラグランジュ乗数λMODEとを用いて、下記式1のインター予測モード符号化評価値JMODEを最小にする予測モードおよび量子化係数Qpを選択する。
Figure 2006157214
Figure 2006157214
復号画像MBと符号量RMODEは全てのイントラ予測モードおよびインター予測モードと、量子化係数Qpの組み合わせについて入力される。従って、予測モードは全てのイントラ予測モードとインター予測モードの中から選択される。また量子化係数Qpは{26、25、24、27、28}の中から選択される(S411)。
なお、イントラ予測モードの選択方法の詳細に関しては本発明とは直接関係が無いので説明は省略する。
予測モード選択部107は、選択した量子化係数Qpを量子化係数制御部105に出力し、また前記選択した量子化係数Qpと選択した予測モードに使用したインター予測モード選択用ラグランジュ乗数λMODEとを、量子化係数及びラグランジュ乗数記憶部119に出力し、選択した予測モードおよび量子化係数Qpに対応する復号画像MBをフレームメモリ109に出力すると共に、選択された予測モードを符号列出力部110に出力する。
符号列出力部110は予測モード選択部107から入力された選択ブロックモードに対応する符号列を符号化ビットストリームとして出力する。
ラグランジュ乗数制御部120では、入力された、今回の符号化で選択された量子化係数Qpと、同じく今回の符号化で選択された予測モードに使用したラグランジュ乗数λMODEとにより、式5を用いて次の符号化に使用する為のラグランジュ乗数算出係数Lを算出する。
実施例1と異なる点を以下に説明する。実施例1は符号化対象画像MBを1つの符号化の単位として、符号化対象画像MB毎にラグランジュ乗数算出係数Lを求め、求めたラグランジュ乗数算出係数Lと前回の符号化対象画像MBで採用した量子化係数Qpと符号量から求まる量子化係数Qpとからインター予測モード選択用ラグランジュ乗数λMODEを求めている。
対して本実施例ではラグランジュ乗数算出係数Lを求める符号化の単位を、ピクチャ毎としている。従って、実施例1では符号化対象画像MB毎にラグランジュ乗数算出係数Lを算出するのに対して、本実施例では符号化対象のピクチャ毎にラグランジュ乗数算出係数Lを算出する。従ってラグランジュ乗数算出係数Lを算出するための、量子化係数Qpおよびインター予測モード選択用ラグランジュ乗数λMODEは、前回の符号化対象のピクチャを符号化した際に求まっている各符号化対象画像MB毎の値を、それぞれ量子化係数及びラグランジュ乗数記憶部119に一旦記憶しておく(S412)。
そして1ピクチャ内の全ての符号化対象画像MBの符号化が終了したか否かを判断する(S413)。
1ピクチャ内の全ての符号化対象画像MBの符号化が終了したならば、前記量子化係数及びラグランジュ乗数記憶部119から、記憶してある各符号化対象画像MBに対応する量子化係数Qp及びインター予測モード選択用ラグランジュ乗数λMODEを読み出し、おのおのの平均値である量子化係数平均値AveQpおよびインター予測モード選択用ラグランジュ乗数平均値AveλMODEを算出する。そして算出した前記量子化係数平均値AveQpおよびインター予測モード選択用ラグランジュ乗数平均値AveλMODEにて下記式5を用いて、次の符号化対象のピクチャの符号化に用いるラグランジュ乗数算出係数Lを求める(S414)。
Figure 2006157214
ここまでに述べてきたS401からS414までの処理を符号化対象画像全てに対して行う(S415)。
本発明の実施例1と実施例2の違いを再度明確にする。
実施例1では予測モード選択部107で選択した量子化係数Qpをラグランジュ乗数制御部120に入力し、その量子化係数Qpを用いて符号化対象画像MB毎にラグランジュ乗数算出係数Lを更新する。
対して実施例2では量子化係数及びラグランジュ乗数記憶部119を設けて、予測モード選択部107で選択された各符号化対象画像MB毎の量子化係数Qpとインター予測モード選択用ラグランジュ乗数λMODEとを量子化係数及びラグランジュ乗数記憶部119に一度記憶する。そして記憶した各符号化対象画像MB毎の量子化係数Qpとインター予測モード選択用ラグランジュ乗数λMODEとをラグランジュ乗数制御部120はピクチャ毎に読み出して量子化係数平均値AveQP及びインター予測モード選択用ラグランジュ乗数平均値AveλMODEを求める。最後に求めた量子化係数平均値AveQPとインター予測モード選択用ラグランジュ乗数平均値AveλMODEとを用いてランジュ乗数算出係数Lを算出、更新する。
実施例2は量子化係数及びラグランジュ乗数記憶部119を設けているので、実施例1に比べて回路規模は増大するが、符号化対象のピクチャ全体の画像の特徴をより正確にランジュ乗数算出係数Lに反映させることができる。実施例2では1ピクチャ毎に量子化係数平均値AveQP及びインター予測モード選択用ラグランジュ乗数平均値AveλMODEを求め、ラグランジュ乗数算出係数Lを更新しているが、もちろん1ピクチャ毎である必要はなく、それ以外の頻度での更新としてもよい。どちらの実施例においても、複数の量子化係数Qpの中から、式1の評価値が最小となるインター予測モードと量子化係数Qpを選択し、その量子化係数Qpに応じてラグランジュ乗数算出係数Lを更新している。
これにより、いかなる画像においても符号化効率の良い最適な符号化を行うことができ、符号化効率を向上させ、良好な画質を得ることが可能となる。
さらにまた、本発明は上記した動画像符号化装置の機能をコンピュータに実現させるためのプログラムも含むものである。これらのプログラムは、記録媒体から読み取られてコンピュータに取り込まれてもよいし、通信ネットワークを介して伝送されてコンピュータに取り込まれてもよい。


本発明の第一の実施例の形態を説明するブロック図である。 従来のインター予測モードに使用する分割ブロックの様子を示す図である。 本発明の第一の実施の形態に係る符号化手順の流れを示すフローチャートである。 本発明の第二の実施例の形態を説明するブロック図である。 本発明の第二の実施の形態に係る符号化手順の流れを示すフローチャートである。
符号の説明
101 フレームメモリ
102 直交変換符号化部
103 符号列生成部
104 直交変換復号化部
105 量子化係数制御部
106 符号量算出部
107 予測モード選択部
108 インター予測部
109 フレームメモリ
110 符号列出力部
111 差分演算部
112 加算演算部
120 ラグランジュ乗数制御部

Claims (1)

  1. 画像信号を複数の画素の2次元配列からなるマクロブロックに分割し、前記マクロブロック単位で順次、インター予測符号化またはイントラ予測符号化を行い、前記イントラ予測符号化または前記インター予測符号化にて生成された予測符号化信号を入力として直交変換符号化を行い、前記直交変換符号化にて生成された直交変換符号化信号を入力として、既に符号化が行われた符号化対象画像の符号量に対応した量子化係数Qpの値を用いて当該マクロブロックの量子化を行う動画像符号化装置において、
    前記マクロブロック毎に、前記インター予測符号化にて採用候補となる複数のインター予測モード全てに対して、下記式1に示す算出式より第一の符号化効率評価値JMODEの値を算出し、算出した全ての前記第一の符号化効率評価値JMODEの値を比較して、最も値が小さい前記第一の符号化効率評価値JMODEの値に対応するインター予測モードを最も符号化効率がよい予測モードとして選択するインター予測モード選択手段と、
    Figure 2006157214
    Figure 2006157214
    前記マクロブロック毎に、前記インター予測符号化において使用する動きベクトルと参照画像とを検出する際に、前記動きベクトルと前記参照画像との全ての組み合わせにおいて、下記式3に示す算出式より第二の符号化効率評価値JMOTIONの値を算出し、算出した全ての前記第二の符号化効率評価値JMOTIONの値を比較して、最も値が小さい前記第二の符号化効率評価値JMOTIONの値となる動きベクトルと参照画像との組み合わせを、最も符号化効率のよい組み合わせと判断して検出する動きベクトル検出手段と、
    Figure 2006157214
    Figure 2006157214
    前記インター予測モード選択用ラグランジュ乗数の値と前記動きベクトル検出用インター予測モード選択用ラグランジュ乗数の値とをそれぞれ前記式2及び前記式4に基づいて制御するラグランジュ乗数制御手段とを有し、
    前記ラグランジュ乗数制御手段は、
    前回の符号化で採用した量子化係数Qpと前回の符号化で発生した符号量とから所定の算出手順に従って今回の符号化で採用候補となる量子化係数Qpの値を求め、
    求めた前記今回の符号化で採用候補となる量子化係数Qpと、前回の符号化で算出したラグランジュ乗数算出係数Lとを用いて上記式2より今回の符号化で用いるインター予測モード選択用ラグランジュ乗数λMODEを求め、
    前記今回の符号化で採用候補となる量子化係数Qpを中心値として所定数の前後複数の値を選択し、選択した前記複数の値を新たに今回の符号化で採用候補となる量子化係数Qpとして決定し、
    前記インター予測モード選択用ラグランジュ乗数λMODEと、前記決定した複数の今回の符号化で採用候補となる量子化係数Qpと、前記インター予モードとの全ての組み合わせにおいて前記式1を用いて前記符号化効率評価値JMODEを算出し、算出した全ての前記符号化効率評価値JMODEの値を比較して、最も値が小さい前記符号化効率評価値JMODEに対応する前記インター予測モードと前記量子化係数Qpの組み合わせを選択し、
    前記選択した量子化係数Qpと、前記インター予測モード選択用ラグランジュ乗数λMODEとから前記式2を変形した下記式5を用いて、次の符号化に用いるラグランジュ乗数算出係数Lを求めるように制御する、
    ことを特徴とする動画像符号化装置。
    Figure 2006157214

JP2004341781A 2004-11-26 2004-11-26 動画像符号化装置 Pending JP2006157214A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004341781A JP2006157214A (ja) 2004-11-26 2004-11-26 動画像符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004341781A JP2006157214A (ja) 2004-11-26 2004-11-26 動画像符号化装置

Publications (1)

Publication Number Publication Date
JP2006157214A true JP2006157214A (ja) 2006-06-15

Family

ID=36635004

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004341781A Pending JP2006157214A (ja) 2004-11-26 2004-11-26 動画像符号化装置

Country Status (1)

Country Link
JP (1) JP2006157214A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010507946A (ja) * 2006-10-27 2010-03-11 アクトイマジン ビデオストリームの圧縮を最適化するための方法および装置
WO2016058357A1 (zh) * 2014-10-17 2016-04-21 华为技术有限公司 视频处理方法、编码设备和解码设备

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010507946A (ja) * 2006-10-27 2010-03-11 アクトイマジン ビデオストリームの圧縮を最適化するための方法および装置
WO2016058357A1 (zh) * 2014-10-17 2016-04-21 华为技术有限公司 视频处理方法、编码设备和解码设备
US10645382B2 (en) 2014-10-17 2020-05-05 Huawei Technologies Co., Ltd. Video processing method, encoding device, and decoding device

Similar Documents

Publication Publication Date Title
JP6863669B2 (ja) 画像符号化装置、画像符号化方法、画像復号装置および画像復号方法
JP6851429B2 (ja) 画像復号装置、画像復号方法、画像符号化装置及び画像符号化方法
JP6807987B2 (ja) 画像符号化装置、動画像復号装置、動画像符号化データ及び記録媒体
KR101643121B1 (ko) 화상 부호화 장치, 화상 복호 장치, 화상 부호화 방법, 화상 복호 방법 및 기억 매체
KR101774392B1 (ko) 화면 내 예측 방법 및 이러한 방법을 사용하는 장치
KR100739714B1 (ko) 인트라 예측 모드 결정 방법 및 장치
US20100118945A1 (en) Method and apparatus for video encoding and decoding
WO2012176381A1 (ja) 動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法
KR20080069069A (ko) 인트라/인터 예측 방법 및 장치
CN112543323B (zh) 一种编解码方法、装置及其设备
WO2019007492A1 (en) INTRAMODE BYPASS LINE MEMORY HARMONIZATION DECODER SIDE WITH UNBLOCKING FILTER
CN113891089B (zh) 一种运动信息候选列表的构建方法、装置及其设备
JP2009049969A (ja) 動画像符号化装置及び方法並びに動画像復号化装置及び方法
JP2006157214A (ja) 動画像符号化装置
JP2006129153A (ja) 動画像符号化装置及び動画像符号化プログラム
KR20160106348A (ko) 비디오 부호화 방법 및 그 장치
JP2008017304A (ja) 画像符号化装置、画像復号装置、画像符号化方法、及び画像符号化するプログラム