JP2012034213A - 画像処理装置、画像処理システムおよび画像処理方法 - Google Patents

画像処理装置、画像処理システムおよび画像処理方法 Download PDF

Info

Publication number
JP2012034213A
JP2012034213A JP2010172465A JP2010172465A JP2012034213A JP 2012034213 A JP2012034213 A JP 2012034213A JP 2010172465 A JP2010172465 A JP 2010172465A JP 2010172465 A JP2010172465 A JP 2010172465A JP 2012034213 A JP2012034213 A JP 2012034213A
Authority
JP
Japan
Prior art keywords
frame
reference frame
image
unit
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2010172465A
Other languages
English (en)
Inventor
Hajime Matsui
井 一 松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2010172465A priority Critical patent/JP2012034213A/ja
Priority to US12/886,707 priority patent/US20120027092A1/en
Publication of JP2012034213A publication Critical patent/JP2012034213A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation

Abstract


【課題】演算量を抑制しつつ、高画質かつ高圧縮率で動画像を圧縮符号化可能な画像処理装置、画像処理システムおよび画像処理方法を提供する。
【解決手段】本実施形態によれば、動き検出部と、重み付け予測部と、参照フレーム選択部と、フレーム間予測部と、差分部と、直交変換量子化部と、符号化部と、を備える画像処理装置が提供される。重み付け予測部は、前記第1の参照フレームと輝度成分が等しく、色差成分が異なる第2の参照フレームを生成する。参照フレーム選択部は、符号化効率がより高くなるように、前記第1および第2の参照フレームのうちいずれか一方を最適参照フレームとして選択する。フレーム間予測部は、前記動きベクトルおよび前記選択された最適参照フレームに基づいてフレーム間予測画像を生成する。
【選択図】図1

Description

本発明の実施形態は、画像処理装置、画像処理システムおよび画像処理方法に関する。
高画質な動画像を記憶容量が限られたハードディスク等に記録するために、動画像を効率よく圧縮符号化する技術が不可欠になってきている。そのため、H.264などの動画像圧縮符号化方式において、フレーム間動き予測符号化が行われている。フレーム間動き予測符号化は、動き検出を行ってフレーム間予測画像を生成し、フレーム間予測画像と実際の画像との差分を圧縮符号化する手法である。動画像ではフレーム間の相関度が高いため、正確なフレーム間予測画像を生成できれば、画質を劣化させることなく高圧縮率で動画像を圧縮できる。
正確なフレーム間予測画像を生成するには、動き検出においてブロックマッチングを多数回行ってフレーム間の相関度が高い部分を検索する必要がある。そのため、動き検出には非常に多くの演算およびメモリアクセスが必要となる。したがって、動画像が輝度成分および色差成分で構成される場合でも、輝度成分のみを用いて動き検出を行うことが多い。
しかしながら、輝度成分のみを用いて動き予測を行うと、輝度成分が一様で色差成分が一様でない画像などで、色差成分の動き予測の精度が低くなる。その結果、圧縮符号化された動画像の画質が劣化してしまうことがある。
特開2007−25143号公報
本発明は、演算量を抑制しつつ、高画質かつ高圧縮率で動画像を圧縮符号化可能な画像処理装置、画像処理システムおよび画像処理方法を提供するものである。
本実施形態によれば、動き検出部と、重み付け予測部と、参照フレーム選択部と、フレーム間予測部と、差分部と、直交変換量子化部と、符号化部と、を備える画像処理装置が提供される。動き検出部は、符号化済のフレームを復号して得られる第1の参照フレームの輝度成分と、入力映像信号における符号化対象マクロブロックの輝度成分とを用いて動きベクトルを生成する。重み付け予測部は、前記第1の参照フレームと輝度成分が等しく、色差成分が異なる第2の参照フレームを生成する。参照フレーム選択部は、符号化効率がより高くなるように、前記第1および第2の参照フレームのうちいずれか一方を最適参照フレームとして選択する。フレーム間予測部は、前記動きベクトルおよび前記選択された最適参照フレームに基づいてフレーム間予測画像を生成する。差分部は、前記符号化対象マクロブロックと前記フレーム間予測画像との予測残差画像を算出する。直交変換量子化部は、前記予測残差画像を直交変換および量子化して量子化データを生成する。符号化部は、前記量子化データを符号化して前記出力映像信号を生成する。
本発明の第1の実施形態に係る画像処理システムの概略ブロック図。 図1の画像処理装置100の処理動作の一例を示すフローチャート。 符号化対象MBとフレーム間予測画像の輝度成分Yおよび色差成分Cb,Crの一例を示す図。 予測残差画像の一例を示す図。 本発明の第2の実施形態に係る画像処理システムの概略ブロック図。 図5の画像処理装置100の処理動作の一例を示すフローチャート。 フレーム内予測画像の一例を示す図。 第3の予測残差画像の一例を示す図。
以下、本発明に係る画像処理装置、画像処理方法および画像処理システムの実施形態について、図面を参照しながら具体的に説明する。
(第1の実施形態)
図1は、本発明の第1の実施形態に係る画像処理システムの概略ブロック図である。図1の画像処理システムは、画像処理装置100と記録媒体200とを備えている。本実施形態の画像処理装置100は、輝度成分Yおよび色差成分Cb,Crで表される入力映像信号をH.264方式でフレーム間動き予測を行って圧縮符号化する。また、記録媒体200は例えばハードディスクまたはフラッシュメモリであり、圧縮符号化された映像信号が記録される。
本実施形態に係る画像処理システムは、例えばデジタルビデオカメラに内蔵され、撮影された画像を画像処理装置100により圧縮符号化して記録媒体200に記録する。また、画像処理システムはDVDレコーダに内蔵され、放送波を画像処理装置100により圧縮符号化して記録媒体200に記録してもよい。
図1の画像処理装置100は、フレームメモリ1と、動き検出部2と、重み付け予測部3と、参照フレーム選択部4と、フレーム間予測部5と、差分部6と、DCT量子化部(直交変換量子化部)7と、符号化部8と、コスト算出部9と、制御部10と、逆量子化逆DCT部11と、加算部12とを備えている。
フレームメモリ1は既に符号化済のフレームを復号した局所復号画像を記憶する。動き検出部2はフレームメモリ1に記憶されている局所復号画像を第1の参照フレームとし、第1の参照フレームの輝度成分Yと入力映像信号の輝度成分Yとのブロックマッチングを行い、動きベクトルを生成する。
重み付け予測部3は第1の参照フレームの色差成分Cb,Crに重み付けを行い、第1の参照フレームと輝度成分Yが等しく、色差成分Cb,Crが異なる第2の参照フレームを生成する。参照フレーム選択部4は、制御部10の制御に応じて、第1の参照フレームまたは第2の参照フレームを最適参照フレームとして選択する。フレーム間予測部5は、動きベクトルおよび最適参照フレームに基づいてフレーム間予測画像を生成する。
差分部6は入力映像信号とフレーム間予測画像との差分データを算出し、予測残差画像を生成する。DCT量子化部7は予測残差画像の離散コサイン変換(Discrete Cosine Transform:DCT)および量子化を行い、量子化データを生成する。符号化部8は量子化データ、動きベクトルおよび最適参照フレームのインデックスの可変長符号化を行い、出力映像信号を生成する。
コスト算出部9は、第1の参照フレームを用いて入力映像信号を圧縮符号化した場合の符号化効率を示す第1のコストと、第2の参照フレームを用いて入力映像信号を圧縮符号化した場合の符号化効率を示す第2のコストとを算出する。制御部10は第1のコストと第2のコストとを比較して、符号化効率がより高くなる参照フレームが選択されるよう、参照フレーム選択部4を制御する。符号化効率とは出力映像信号に対応する画像の画質と圧縮率とのバランスである。
逆量子化逆DCT部11は量子化データの逆量子化および逆DCTを行い、予測残差復号画像を生成する。加算部12は予測残差復号画像にフレーム間予測画像を加算し、局所復号画像を生成する。
本実施形態の特徴の1つは、輝度成分Yが互いに等しく、色差成分Cb,Crが互いに異なる第1および第2の参照フレームを用いて、入力映像信号を圧縮符号化した場合の符号化効率を予め見積もり、より効率よく圧縮符号化できる参照フレームを選択してフレーム間予測画像を生成して、入力映像信号を圧縮符号化する点である。以下、この点を中心に説明する。
図2は、画像処理装置100の処理動作の一例を示すフローチャートである。図2の処理動作は入力映像信号における符号化対象フレーム内の複数画素から構成されるマクロブロック(以下、MB)を単位として行われる。MBは、例えば水平方向16画素、垂直方向16画素(16×16画素)の合計256画素から構成される。
まず、動き検出部2は、フレームメモリ1からの第1の参照フレーム内の動き補償ブロックと、符号化対象MB内の動き補償ブロックとの間でブロックマッチングを行う。そして、符号化対象MB内の動き補償ブロックと最も近似する第1の参照フレーム内の動き補償ブロックを探索する。これにより、動き検出部2は動き補償ブロックがどの方向にどれだけ動いたのかを示す動きベクトルを生成する(S1)。
動き補償ブロックとは動きベクトルを生成する単位である。動き補償ブロックはMBのサイズと等しくてもよいし、これより小さくてもよい。例えば、MBの大きさが16×16画素である場合、動き補償ブロックの大きさは16×16画素でもよいし、これより小さい16×8,8×16または8×8画素でもよい。動き補償ブロックがMBより小さい場合、MB内に複数の動きベクトルが生成される。
ここで、入力映像信号は輝度成分Yおよび色差成分Cb,Crから構成されるが、動き検出部2は第1の参照フレームの輝度成分Yと入力映像信号の輝度成分Yのみのブロックマッチングを行い、動きベクトルを生成する。色差成分Cb,Crのブロックマッチングを行わないため、フレームメモリ1へのアクセス数およびブロックマッチング演算量を削減できる。
次に、重み付け予測部3は、第1の参照フレームに対して重み付けを行い、第1の参照フレームと輝度成分Yが等しく、色差成分Cb,Crが異なる第2の参照フレームを生成する(S2)。本実施形態では、第2の参照フレームの色差成分Cb,Crを固定値とする。H.264方式で規定される各パラメータを例えば以下の(1)〜(4)式のように設定し、重み付け予測部3は設定されたパラメータに基づいて重み付けを行う。
luma_weight_lx_flag = 0 ・・・(1)
chroma_weight_lx_flag = 1 ・・・(2)
chroma_weight_lx[0] = chroma_weight_lx[1] = 0 ・・・(3)
chroma_offset_lx[0] = chroma_offset_lx[1] = 128 ・・・(4)
上記(1)式のパラメータluma_weight_lx_flagは輝度成分Yに対して重み付けを行うか否かを示すパラメータである。このパラメータを0に設定すると重み付けを行わない。これにより、第2の参照フレームの輝度成分Yを第1の参照フレームの輝度成分Yと等しくできる。
上記(2)式のパラメータchroma_weight_lx_flagは色差成分Cb,Crに対して重み付けを行うか否かを示すパラメータである。このパラメータを1に設定すると重み付けを行う。これにより、第1の参照フレームとは色差成分Cb,Crが異なる第2の参照フレームを生成できる。
上記(3)式のパラメータchroma_weight_lx[0]およびchroma_weight_lx[1]は、それぞれ色差成分Cb,Crに乗じる定数(第1の定数)である。また、上記(4)式のパラメータchroma_offset_lx[0]およびchroma_offset_lx[1]は、それぞれ色差成分Cb,Crに加算する定数(第2の定数)である。
すなわち、色差成分Cbに対する重み付けとは、第1の参照フレームの色差成分Cbにパラメータchroma_weight_lx[0]を乗じ、パラメータchroma_offset_lx[0]を加算して第2の参照フレームの色差成分Cbを生成することをいう。色差成分Crについても同様である。
本実施形態では、パラメータchroma_weight_lx[i](i=0,1)を0に設定し、色差成分Cb,CrをMB内で固定値とする。また、パラメータchroma_offset_lx[i]を128に設定する。これは、色差成分Cb,Crが8ビットのデジタル信号で表される場合の設定例である。より一般的には、色差成分Cb,Crの最大値の1/2を四捨五入した値に設定する。このように設定される色差成分Cb,Crはいわゆる無彩色である。
上記のようにすることにより、簡易にパラメータchroma_offset_lx[i]を設定できる。但し、この場合、第2の参照フレームは無彩色となるため、極端に色が濃いMBなどでは、予測精度が低下する。
これに対し、符号化対象フレームの色差成分Cb,Crの平均値を予め算出しておき、パラメータchroma_offset_lx[i]をその平均値に設定してもよい。平均値を算出するための処理が必要となるが、第2の参照フレームの色差成分をMBに近い値に設定できるため、予測精度が向上する。
第2の参照フレームが生成されると、以下のS3〜S11の処理により第1および第2の参照フレームのうちのいずれかを最適参照フレームとして選択する。
まず、参照フレーム選択部4により第1の参照フレームを選択し、フレーム間予測部5は第1の参照フレームおよび動きベクトルに基づいて、第1のフレーム間予測画像を生成する(S3)。図3は、符号化対象MBとフレーム間予測画像の輝度成分Yおよび色差成分Cb,Crの一例を示す図である。簡略化のために、符号化対象MB内の輝度成分Yと、色差成分Cb,Crのうちの一方とを一次元で示している。図3(a)は符号化対象MBを、図3(b)は第1のフレーム間予測画像を示している。
上述のように、動きベクトルは輝度成分Yのみを用いて生成したものである。よって、第1のフレーム間予測画像の輝度成分Yについては予測精度が高く、符号化対象MBの輝度成分Yと第1のフレーム間予測画像の輝度成分Yはほぼ等しい。これに対し、色差成分Cb,Crを用いずに動きベクトルを生成したため、色差成分Cb,Crについては必ずしも予測精度が高くない。よって、図3(a)および図3(b)に示すように、符号化対象MBの色差成分Cb,Crと第1のフレーム間予測画像の色差成分Cb,Crはあまり一致しないこともある。
次に、差分部6は符号化対象MBと第1のフレーム間予測画像との画素ごとの差分を算出し、第1の予測残差画像を生成する(S4)。図4は、予測残差画像の一例を示す図である。図3(a)に示す符号化対象MBと同図(b)に示す第1のフレーム間予測画像との差分が図4(a)に示す第1の予測残差画像である。
コスト算出部9は、第1の予測残差画像に基づいて、第1のフレーム間予測画像を用いて圧縮符号化する場合のコスト(第1のコスト)を算出する(S5)。コスト算出部9は、例えば予測残差画像の絶対値の総和、すなわち、符号化対象MBと第1のフレーム間予測画像との画素ごとの差分絶対値の総和(Sum of Absolute Differences:以下、SAD)をコストとする。この場合、コストは図4(a)の斜線部の面積に対応する。同図に示すように、輝度成分Yのコストはほとんど0である。これは、輝度成分Yの予測精度が高いためである。ところが、色差成分Cb,Crのコストは輝度成分Yのコストより大きな値となる。これは、色差成分Cb,Crの予測精度は必ずしも高くないためである。
このコストは符号化効率に対応しており、圧縮符号化された出力映像信号に対応する画像の画質と、出力映像信号のデータ量とのバランスを示す。コストが大きい場合、予測残差画像は大きな値を持っている。フレーム間動き予測では、予測残差画像を圧縮符号化するため、コストが大きい場合に一定の圧縮率で入力映像信号を圧縮符号化すると、出力映像信号のデータ量が多くなってしまう。しかしながら、記録媒体200の容量は限られている。そのため、出力映像信号のデータ量が所定量に収まるように圧縮符号化を行うためには、コストが大きいほど圧縮率を大きくせざるを得ない。よって、コストが大きい場合は、圧縮符号化後の画質が劣化してしまう。一方、コストが小さい場合、圧縮率を大きくする必要がないため、高画質に入力映像信号を圧縮符号化できる。
SADをコストと定義することで、符号化効率を簡易に見積もることができる。制御部10は、輝度成分Yのコストと色差成分Cb,Crのコストとの和を第1のコストとして保持する。
次に、参照フレーム選択部4により第2の参照フレームを選択し、フレーム間予測部5は第2の参照フレームおよび動きベクトルに基づいて、第2のフレーム間予測画像を生成する(S6)。図3(c)は第2のフレーム間予測画像を示している。第1および第2の参照フレームの輝度成分Yは等しいため、第2のフレーム間予測画像の輝度成分Yは第1のフレーム間予測画像の輝度成分Yと等しい。一方、第2の参照フレームの色差成分Cb,Crは第1の参照フレームの色差成分Cb,Crと異なるため、第2のフレーム間予測画像の色差成分Cb,Crと第1のフレーム間予測画像の色差成分Cb,Crとは異なる。
次に、差分部6は符号化対象MBと第2のフレーム間予測画像との差分を算出し、第2の予測残差画像を生成する(S7)。図3(a)に示す符号化対象MBと同図(c)に示す第2のフレーム間予測画像との差分が、図4(b)に示す第2の予測残差画像である。
コスト算出部9は、第2の予測残差画像に基づいて、第2のフレーム間予測画像を用いて圧縮符号化する場合のコスト(第2のコスト)を算出する(S8)。図4(a)に示す第1の参照フレームを選択した場合と同様に、輝度成分Yのコストはほとんど0である。一方、色差成分Cb,Crのコストはやはり輝度成分Yのコストより大きな値となる。制御部10は、輝度成分Yのコストと色差成分Cb,Crのコストとの和を第2のコストとして保持する。
続いて、制御部10は第1のコストと第2のコストを比較し(S9)、コストが最小となる、すなわち、符号化効率が最も高くなる参照フレームを選択する。第1のコストが小さい場合(S9のYES)は、制御部10は参照フレーム選択部4に第1のフレームを最適参照フレームとして選択させる(S10)。一方、第2のコストが小さい場合は(S9のNO)、制御部10は参照フレーム選択部4に最適参照フレームとして第2のフレームを選択させる(S11)。
図3に示す符号化対象MBの例では、図4(a)に示す第1のコストより図4(b)に示す第2のコストの方が小さいため(S9のNO)、参照フレーム選択部4は第2の参照フレームを選択する(S11)。通常の画像では輝度成分Yのみを用いてフレーム間予測画像を生成する場合、第1のコストが第2のコストより小さくなるが、例えば輝度成分Yが一様で色差成分Cb,Crが一様でない画像などでは第2のコストが第1のコストより小さくなることもある。参照フレーム選択部4はコストが小さくなる参照フレームを選択するため、圧縮率を低下させることなく、高画質で入力映像信号を圧縮符号化できる。
次に、選択された最適参照フレームを用いて、以下のS12〜S15の処理によりフレーム間動き予測符号化を行う。
フレーム間予測部5は、選択された最適参照フレーム(図3および図4の例では第2の参照フレーム)および動きベクトルに基づいて、フレーム間予測画像を生成する(S12)。さらに、差分部6は符号化対象MBとフレーム間予測画像との差分を算出し、予測残差画像を生成する(S13)。そして、DCT量子化部7はまず予測残差画像をDCT変換(直交変換)してDCTデータを生成する。これにより、符号化対象MBの冗長な成分を除去できる。続いて、DCT量子化部7はDCTデータを所定の量子化幅で除した値を整数値に丸め、量子化データを生成する(S14)。圧縮率は量子化幅に依存し、記録媒体200の記録容量を考慮して定められる。
符号化部8は量子化データに動きベクトルと選択された参照フレームのインデックスを付加して可変長符号化を行い、圧縮符号化された出力映像信号を生成する(S15)。参照フレームのインデックスとは最適参照フレームとして、「第1」の参照フレームを選択したか、「第2」の参照フレームを選択したか、を示す情報である。また、可変長符号化とは、出現頻度の高い数値ほど短いビットの符号を割り振る手法であり、生成される出力映像信号のデータ量を小さくできる。
以上により符号化対象MBの圧縮符号化が終了する。生成された出力映像信号は記録媒体200に記録される。
なお、符号化部8が出力する出力映像信号の各フレームには、そのフレームが圧縮符号化される際に用いられた第1の参照フレームがどのフレームであるのかを示す情報と上記(1)〜(4)式の情報とがヘッダに付加される。これにより、圧縮符号化された出力映像信号を復号する復号装置(不図示)は、第1の参照フレームに対して上記(1)〜(4)式に示す重み付けを行って、第2の参照フレームを生成できる。そして、MBごとに参照フレームのインデックスが付加されているので、復号装置は第1または第2の参照フレームと動きベクトルとを用いてフレーム間予測画像を生成できる。さらに、復号装置は、フレーム間予測画像と実際の画像との差異を示す量子化データとフレーム間予測画像とを用いて、圧縮符号化された出力映像信号を復号することができる。
一方、逆量子化逆DCT部11はDCT量子化部7が生成する量子化データの逆DCT変換および逆量子化を行い、予測残差復号画像を生成する。さらに、加算部12は予測残差復号画像にフレーム間予測画像を加算し、局所復号画像を生成する(S16)。フレームメモリ1は局所復号画像を記憶する。局所復号画像は後の入力映像信号を圧縮符号化するために用いられる。なお、フレームメモリ1の前にデブロッキングフィルタ(不図示)を設け、ブロックノイズを除去した後にフレームメモリ1に復号画像を記憶してもよい。
このように、第1の実施形態では、輝度成分Yが等しく色差成分Cb,Crが互いに異なる第1および第2の参照フレームを用いて、入力映像信号を圧縮符号化した場合の符号化効率を予め予測する。そして、より効率よく圧縮符号化できる参照フレームを用いてフレーム間予測画像を生成する。そのため、フレーム間予測の精度が向上し、圧縮率を低下させることなく、高画質に動画像の圧縮符号化を行うことができる。また、輝度成分Yのみを用いてブロックマッチングを行うため、演算量を抑制できる。
なお、コスト算出部9は、λを予め定めた定数として、下記(5)式のように、SADに所定値を加算した値をコストCと定義してもよい。
C=SAD+λ*k ・・・(5)
パラメータkは例えば定数とする。参照フレーム選択部4で第1および第2の参照フレームがほぼ50%ずつ選択されると、参照フレームのインデックスの出現頻度が等しくなる。この場合、参照フレームのインデックスを可変長符号化して生成されるデータの量が多くなってしまう。そこで、例えば第1のコストは上記(5)式でk=0に設定し、第2のコストは上記(5)式でkを正の定数に設定する。このように設定すると、各画素の絶対値の総和がほぼ等しい場合、第1の参照フレームが選択されやすくなる。その結果、参照フレームのインデックスに偏りが生じ、出現頻度の高い「第1」の参照フレームに短いビットの符号を割り振り、「第2」の参照フレームに長いビットの符号を割り振ることにより、生成される出力映像信号のデータ量を抑制できる。
また、パラメータkは参照フレームのインデックスを可変長符号化して生成されるデータの量としてもよい。可変長符号化を行う場合、参照フレームのインデックスが「第1」であるか「第2」であるかによって、参照フレームのインデックスを可変長符号化して生成されるデータの量が異なる。そのため、このデータ量を考慮したコストを算出することで、コスト算出部9はより高精度に符号化効率を見積もることができる。
また、コスト算出部9は、下記(6)式のように、画質劣化度Dと発生符号量Rとに基づいてコストCを定義してもよい。
C=D+λ*R ・・・(6)
画質劣化度は、例えば、符号化対象MBと局所復号画像との差分絶対値の総和とする。また、発生符号量は、例えば、量子化データ、動きベクトルおよび参照フレームのインデックスを可変長符号化して生成されるデータの量とする。他の手法に比べて多くの演算量が必要となるが、コスト算出部9はさらに高精度に符号化効率を見積もることができる。
(第2の実施形態)
第1の実施形態は第1の参照フレームまたは重み付けを行って得られた第2の参照フレームを選択してフレーム間動き予測符号化を行うものであった。これに対し、以下に説明する第2の実施形態では、さらにフレーム内予測を行い、フレーム間予測画像またはフレーム内予測画像のいずれかを選択するものである。
図5は、本発明の第2の実施形態に係る画像処理システムの概略ブロック図である。図5では、図1と共通する構成部分には同一の符号を付しており、以下では相違点を中心に説明する。
画像処理装置101は、フレーム内予測部21と、イントラ・インター選択部22とをさらに備えている。フレーム内予測部21はフレームメモリ1に記憶された第1の参照フレームを用いてフレーム内予測を行って、フレーム内予測画像を生成する。イントラ・インター選択部22は、制御部10に応じて、フレーム間予測画像またはフレーム内予測画像を最適予測画像として選択する。
図6は、画像処理装置100の処理動作の一例を示すフローチャートである。S1〜S8までは第1の実施形態と同様であるので、説明を省略する。
フレーム内予測部21は第1の参照フレームに基づいてフレーム内予測を行い、フレーム内予測画像を生成する(S21)。予測手法として、例えば、符号化対象MBの上に位置する画素の値を用いて符号化対象MB内の垂直方向の画素を予測する「垂直予測」、符号化対象MBの左に位置する画素を用いて符号化対象MB内の水平方向の画素を予測する「水平予測」、上および左に位置する画素の平均値で符号化対象MBすべての画素を予測する「平均値予測」、上および左に位置する画素を斜め方向に内挿して画素を予測する「平面予測」のいずれかを行う。フレーム内で映像信号の変化が小さい場合は、高い精度でフレーム内予測画像を生成できる。
図7は、フレーム内予測画像の一例を示す図である。これは、図3(a)に示す符号化対象MBに対し、「平均値予測」を行った例であり、輝度成分Y、色差成分Cb,Crともに一定値である。
次に、差分部6は符号化対象MBとフレーム内予測画像との差分を算出し、第3の予測残差画像を生成する(S22)。図8は、第3の予測残差画像の一例を示す図である。図3(a)に示す符号化対象MBと図7に示すフレーム内予測画像との差分が図8に示す第3の予測残差画像である。
そして、コスト算出部9はフレーム内予測画像を用いて圧縮符号化する際のコストを第3のコストとして算出する(S23)。第3の予測残差画像の絶対値の総和を第3のコストとする。すなわち、第3のコストは図8の斜線部の面積に対応する。フレーム内予測の精度が高いほど、第3のコストは小さくなる。
続いて、以下のS24〜S31により、第1のフレーム間予測画像、第2のフレーム間予測画像およびフレーム内予測画像のうち、最もコストが小さい画像を選択する。まず、制御部10により第1のコストと第2のコストとを比較する(S24)。参照フレーム選択部は、第1のコストが小さい場合(S24のYES)は第1の参照フレームを(S25)、第2のコストが小さい場合(S24のNO)は第2の参照フレームを(S26)それぞれ選択する。
そして、フレーム間予測部5は第1または第2の参照フレームを用いてフレーム間予測画像を生成する(S27)とともに、フレーム内予測部21はフレーム内予測画像を生成する(S28)。さらに、制御部10は第1および第2のコストのうち小さい方と、第3のコストとを比較する(S29)。イントラ・インター選択部22は、前者が小さい場合(S29のYES)はフレーム間予測画像を(S30)、後者が小さい場合(S29のNO)はフレーム内予測画像を(S31)それぞれ選択する。
その後、選択された予測画像を用いて、第1の実施形態と同様のS13〜S16の処理を行って入力映像信号を圧縮符号化する。
このように、第2の実施形態では、動きベクトルと最適参照フレームを用いて生成したフレーム間予測画像と、第1の参照フレームを用いて生成したフレーム内予測画像とのうち、最も効率よく圧縮符号化できる予測画像を用いて圧縮符号化を行う。そのため、圧縮率を低下させることなく、さらに高画質を保って動画像の圧縮符号化を行うことができる。なお、各実施形態では、H.264方式により動画像の圧縮符号化を行う例を示したが、MPEG−2等他の方式によりフレーム間動き予測符号化を行って動画像を圧縮符号化する場合にも各実施形態を適用可能である。
実施形態で説明した画像処理システムの少なくとも一部は、ハードウェアで構成してもよいし、ソフトウェアで構成してもよい。ソフトウェアで構成する場合には、画像処理システムの少なくとも一部の機能を実現するプログラムをフレキシブルディスクやCD−ROM等の記録媒体に収納し、コンピュータに読み込ませて実行させてもよい。記録媒体は、磁気ディスクや光ディスク等の着脱可能なものに限定されず、ハードディスク装置やメモリなどの固定型の記録媒体でもよい。また、画像処理システムの少なくとも一部の機能を実現するプログラムを、インターネット等の通信回線(無線通信も含む)を介して頒布してもよい。さらに、同プログラムを暗号化したり、変調をかけたり、圧縮した状態で、インターネット等の有線回線や無線回線を介して、あるいは記録媒体に収納して頒布してもよい。
上記の記載に基づいて、当業者であれば、本発明の追加の効果や種々の変形を想到できるかもしれないが、本発明の態様は、上述した個々の実施形態には限定されるものではない。特許請求の範囲に規定された内容およびその均等物から導き出される本発明の概念的な思想と趣旨を逸脱しない範囲で種々の追加、変更および部分的削除が可能である。
2 動き検出部
3 重み付け予測部
4 参照フレーム選択部
5 フレーム間予測部
6 差分部
7 DCT量子化部
8 符号化部
9 コスト算出部
10 制御部
100,101 符号化装置
200 記録媒体

Claims (5)

  1. 符号化済のフレームを復号して得られる第1の参照フレームの輝度成分と、入力映像信号における符号化対象マクロブロックの輝度成分とを用いて動きベクトルを生成する動き検出部と、
    前記第1の参照フレームと輝度成分が等しく、色差成分が異なる第2の参照フレームを生成する重み付け予測部と、
    符号化効率がより高くなるように、前記第1および第2の参照フレームのうちいずれか一方を最適参照フレームとして選択する参照フレーム選択部と、
    前記動きベクトルおよび前記選択された最適参照フレームに基づいてフレーム間予測画像を生成するフレーム間予測部と、
    前記符号化対象マクロブロックと前記フレーム間予測画像との予測残差画像を算出する差分部と、
    前記予測残差画像を直交変換および量子化して量子化データを生成する直交変換量子化部と、
    前記量子化データを符号化して前記出力映像信号を生成する符号化部と、を備えることを特徴とする画像処理装置。
  2. 前記第1の参照フレームに基づいてフレーム内予測画像を生成するフレーム内予測部と、
    符号化効率が高くなるように、前記フレーム間予測画像および前記フレーム内予測画像のうちいずれか一方を最適予測画像として選択するイントラ・インター選択部と、を備え、
    前記差分部は、前記符号化対象マクロブロックと前記最適予測画像との予測残差画像を算出することを特徴とする請求項1に記載の画像処理装置。
  3. 符号化済のフレームを復号して得られる第1の参照フレームの輝度成分と、入力映像信号における符号化対象マクロブロックの輝度成分とを用いて動きベクトルを生成する動き検出部と、
    前記第1の参照フレームと輝度成分が等しく、色差成分が異なる第2の参照フレームを生成する重み付け予測部と、
    符号化効率がより高くなるように、前記第1および第2の参照フレームのうちいずれか一方を最適参照フレームとして選択する参照フレーム選択部と、
    前記動きベクトルおよび前記選択された最適参照フレームに基づいてフレーム間予測画像を生成するフレーム間予測部と、
    前記符号化対象マクロブロックと前記フレーム間予測画像との予測残差画像を算出する差分部と、
    前記予測残差画像を直交変換および量子化して量子化データを生成する直交変換量子化部と、
    前記量子化データを符号化して前記出力映像信号を生成する符号化部と、
    前記出力映像信号を記録する記録媒体と、を備えることを特徴とする画像処理システム。
  4. 前記第1の参照フレームに基づいてフレーム内予測画像を生成するフレーム内予測部と、
    符号化効率が高くなるように、前記フレーム間予測画像および前記フレーム内予測画像のうちいずれか一方を最適予測画像として選択するイントラ・インター選択部と、を備え、
    前記差分部は、前記符号化対象マクロブロックと前記最適予測画像との予測残差画像を算出することを特徴とする請求項3に記載の画像処理システム。
  5. 符号化済のフレームを復号して得られる第1の参照フレームの輝度成分と、入力映像信号における符号化対象マクロブロックの輝度成分とを用いて動きベクトルを生成するステップと、
    前記第1の参照フレームと輝度成分が等しく、色差成分が異なる第2の参照フレームを生成するステップと、
    符号化効率がより高くなるように、前記第1および第2の参照フレームのうちいずれか一方を最適参照フレームとして選択するステップと、
    前記動きベクトルおよび前記選択された最適参照フレームに基づいてフレーム間予測画像を生成するステップと、
    前記符号化対象マクロブロックと前記フレーム間予測画像との予測残差画像を算出するステップと、
    前記予測残差画像を直交変換および量子化して量子化データを生成するステップと、
    前記量子化データを符号化して前記出力映像信号を生成するステップと、を備えることを特徴とする画像処理方法。
JP2010172465A 2010-07-30 2010-07-30 画像処理装置、画像処理システムおよび画像処理方法 Withdrawn JP2012034213A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2010172465A JP2012034213A (ja) 2010-07-30 2010-07-30 画像処理装置、画像処理システムおよび画像処理方法
US12/886,707 US20120027092A1 (en) 2010-07-30 2010-09-21 Image processing device, system and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010172465A JP2012034213A (ja) 2010-07-30 2010-07-30 画像処理装置、画像処理システムおよび画像処理方法

Publications (1)

Publication Number Publication Date
JP2012034213A true JP2012034213A (ja) 2012-02-16

Family

ID=45526692

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010172465A Withdrawn JP2012034213A (ja) 2010-07-30 2010-07-30 画像処理装置、画像処理システムおよび画像処理方法

Country Status (2)

Country Link
US (1) US20120027092A1 (ja)
JP (1) JP2012034213A (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8831101B2 (en) * 2008-08-02 2014-09-09 Ecole De Technologie Superieure Method and system for determining a metric for comparing image blocks in motion compensated video coding
US9100656B2 (en) 2009-05-21 2015-08-04 Ecole De Technologie Superieure Method and system for efficient video transcoding using coding modes, motion vectors and residual information
US8755438B2 (en) * 2010-11-29 2014-06-17 Ecole De Technologie Superieure Method and system for selectively performing multiple video transcoding operations
CN105959706B (zh) * 2011-01-12 2021-01-08 三菱电机株式会社 图像编码装置和方法、以及图像译码装置和方法
KR101566366B1 (ko) 2011-03-03 2015-11-16 한국전자통신연구원 색차 성분 양자화 매개 변수 결정 방법 및 이러한 방법을 사용하는 장치
US9451258B2 (en) * 2012-04-03 2016-09-20 Qualcomm Incorporated Chroma slice-level QP offset and deblocking
EP2980756A4 (en) * 2013-03-28 2016-11-16 Nec Corp BIRD DETECTION DEVICE, BIRD DETECTION SYSTEM, BIRD DETECTION METHOD, AND PROGRAM
JP6173199B2 (ja) * 2013-12-09 2017-08-02 オリンパス株式会社 画像処理装置、画像処理方法、および撮像装置
JP6173198B2 (ja) * 2013-12-09 2017-08-02 オリンパス株式会社 画像処理装置、画像処理方法、および撮像装置
WO2016043637A1 (en) * 2014-09-19 2016-03-24 Telefonaktiebolaget L M Ericsson (Publ) Methods, encoders and decoders for coding of video sequences
US10142613B2 (en) * 2015-09-03 2018-11-27 Kabushiki Kaisha Toshiba Image processing apparatus, image processing system, and image processing method
JP6543578B2 (ja) * 2016-01-27 2019-07-10 富士通株式会社 情報処理装置、情報処理方法、およびプログラム
US9990536B2 (en) 2016-08-03 2018-06-05 Microsoft Technology Licensing, Llc Combining images aligned to reference frame
US10819965B2 (en) * 2018-01-26 2020-10-27 Samsung Electronics Co., Ltd. Image processing device and method for operating image processing device
CN112714322B (zh) * 2020-12-28 2023-08-01 福州大学 一种面向游戏视频的帧间参考优化方法
CN114513670B (zh) * 2021-12-30 2023-03-10 浙江大华技术股份有限公司 一种端到端的视频压缩方法、装置和计算机可读存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7466774B2 (en) * 2003-01-07 2008-12-16 Thomson Licensing Mixed inter/intra video coding of macroblock partitions
KR100703770B1 (ko) * 2005-03-25 2007-04-06 삼성전자주식회사 가중 예측을 이용한 비디오 코딩 및 디코딩 방법, 이를위한 장치
US8498336B2 (en) * 2006-02-02 2013-07-30 Thomson Licensing Method and apparatus for adaptive weight selection for motion compensated prediction
EP2286595A1 (en) * 2008-06-16 2011-02-23 Dolby Laboratories Licensing Corporation Rate control model adaptation based on slice dependencies for video coding
US8995526B2 (en) * 2009-07-09 2015-03-31 Qualcomm Incorporated Different weights for uni-directional prediction and bi-directional prediction in video coding

Also Published As

Publication number Publication date
US20120027092A1 (en) 2012-02-02

Similar Documents

Publication Publication Date Title
JP2012034213A (ja) 画像処理装置、画像処理システムおよび画像処理方法
KR100813963B1 (ko) 동영상의 무손실 부호화, 복호화 방법 및 장치
US7792193B2 (en) Image encoding/decoding method and apparatus therefor
JP4495580B2 (ja) 面内予測装置および面内予測方法
US20110176614A1 (en) Image processing device and method, and program
US20080069211A1 (en) Apparatus and method for encoding moving picture
JP5173409B2 (ja) 符号化装置および符号化装置を備えた動画像記録システム
US8675979B2 (en) Transcoder, method of transcoding, and digital recorder
US20090161757A1 (en) Method and Apparatus for Selecting a Coding Mode for a Block
US8165411B2 (en) Method of and apparatus for encoding/decoding data
JP4690966B2 (ja) 動画像符号化装置
WO2006098226A1 (ja) 符号化装置および符号化装置を備えた動画像記録システム
KR20050074286A (ko) 화상 부호화 장치, 화상 부호화 방법 및 화상 부호화프로그램
US20120147960A1 (en) Image Processing Apparatus and Method
JP2007251453A (ja) 動画像符号化装置及びプログラム
US20120218432A1 (en) Recursive adaptive intra smoothing for video coding
US20070133689A1 (en) Low-cost motion estimation apparatus and method thereof
US9106917B2 (en) Video encoding apparatus and video encoding method
US8675726B2 (en) Method and encoder for constrained soft-decision quantization in data compression
JP5441812B2 (ja) 動画像符号化装置、及びその制御方法
US20110310975A1 (en) Method, Device and Computer-Readable Storage Medium for Encoding and Decoding a Video Signal and Recording Medium Storing a Compressed Bitstream
JP5447239B2 (ja) 動画像符号化装置及び動画像符号化方法
CA2732218C (en) Method and encoder for constrained soft-decision quantization in data compression
JP5390794B2 (ja) 動きベクトル探索装置および動きベクトル探索方法
JP2001309384A (ja) 画像圧縮装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20131001