JPWO2010016534A1 - 動画像符号化装置および動画像復号装置 - Google Patents
動画像符号化装置および動画像復号装置 Download PDFInfo
- Publication number
- JPWO2010016534A1 JPWO2010016534A1 JP2010523884A JP2010523884A JPWO2010016534A1 JP WO2010016534 A1 JPWO2010016534 A1 JP WO2010016534A1 JP 2010523884 A JP2010523884 A JP 2010523884A JP 2010523884 A JP2010523884 A JP 2010523884A JP WO2010016534 A1 JPWO2010016534 A1 JP WO2010016534A1
- Authority
- JP
- Japan
- Prior art keywords
- image
- correction
- target block
- encoding target
- pixel value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/14—Coding unit complexity, e.g. amount of activity or edge presence estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
- H04N19/139—Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
符号量を抑えつつ、動画像の局所的な性質に適した方法で動き補償画像を補正する。本発明に係る動画像符号化装置は、補正方法の異なる3つの動き補償画像補正部(11,12,13)を備えており、何れの補正部により補正された動き補償画像(109)を予測画像(106)として利用するかを切替可能に構成されている。
Description
本発明は、動画像を符号化して符号化データを生成する動画像符号化装置と、当該符号化データから動画像を再生する動画像復号装置に関する。
従来のフレーム間予測を行う動画符号化装置は、時間的冗長性を除去して動画像の圧縮率を高めるため、動き補償予測を用いているものが多い。
動き補償予測では、まず、処理対象フレームと参照フレームとの間で物体が移動した距離と方向を表す動きベクトルを算出する。処理対象フレームとは、ある時点で符号化処理または復号処理の対象となっているフレームであり、参照フレームとは、その時点で符号化処理または復号処理を終えたフレームである。参照フレームの局所復号画像(以下「参照画像」とも呼称する)は、フレームメモリに記録される。
つづいて、動き補償画像を生成し、処理対象フレームの入力画像と動き補償画像との差分を符号化する。動き補償画像とは、参照画像の各画素の画素値によって構成された画像のことである。動き補償画像上の各ブロック内の画素には、そのブロックから動きベクトルの示す変位分離れた位置にある、参照画像上のブロック内の画素の画素値が割り当てられている。
入力画像と動き補償画像の各画素値の差分である予測残差の分散や絶対値は、入力画像の画素値の分散や絶対値に較べて小さい。そのため、入力画像を直接符号化する場合に較べ、予測残差を符号化することによって、発生符号量を低減できる。これにより、フレーム間予測において、圧縮率を高めることが可能である。
従来、予測残差の絶対値や分散を低減して動き補償予測の性能を改善する方法がいくつか考案されている。たとえば、非特許文献1の方法では、フレーム間の画素値変化を推定し、推定結果に基づいて動き補償画像を補正する。
ここで、図14と図15を参照して、非特許文献1の方法において、動き補償画像を補正する手順を説明する。
まず、図14について説明する。図14は、処理対象フレームの局所復号画像(以下、「処理対象画像140」とも呼称する)を示した図である。図14に示したように、処理対象フレームは、所定のサイズ(L×M画素)のブロックに分割されており、符号化処理および復号処理はブロック毎に行われる。図14における矢印は、ブロック処理順を示す。すなわち、左上のブロックを起点とするラスタスキャン順に処理される。
斜線で示す領域141は、ある時点で既に符号化または復号処理を終えた処理済領域である。一方、ブロック142は、その時点で符号化または復号対象となっている処理対象ブロックである。
次に、図15について説明する。図15の(a)は、参照画像を示した図であり、特に、動きベクトル151によって符号化対象ブロック142と関連付けられている参照フレーム上の参照ブロック152、及び、その参照ブロック152に隣接する参照ブロック隣接領域153を示している。図15の(b)は、処理対象フレームの局所復号画像を示した図であり、特に、符号化対象ブロック142、及び、その符号化対象ブロック142に隣接する符号化対象ブロック隣接領域154を示している。
非特許文献1の方法において、動き補償画像を補正する手順は次の通りである。
1.符号化対象ブロック隣接領域154における各画素と参照ブロック隣接領域153の上の対応する画素との画素値差分を計算する。
2.上記の画素値差分に基づいて、符号化対象ブロック142の各画素における補正値を計算する。各画素における補正値は、その画素の真上に位置する符号化対象ブロック隣接領域154内の画素の画素値差分と、その位置の真左に位置する符号化対象ブロック隣接領域154内の画素の画素値差分との加重平均とする。
3.符号化対象ブロック142の各画素に対応する動き補償画像に上記の補正値を加える。
上記の手順によると、符号化対象ブロック隣接領域154と参照ブロック隣接領域153とにおける画素値の差分値に基づいて、処理対象画像140と参照画像との間(すなわち、フレーム間)の画素値変化を推定し、動き補償画像を補正する。補正によって、フレーム間の画素値変化を補償できるため、補正された動き補償画像と符号化対象ブロックとの差分である予測残差の分散および絶対値は、補正を行わない動き補償画像を用いる場合に較べて小さい。したがって、予測残差を符号化することにより、発生符号量を低減できる。すなわち、圧縮効率を高めることが可能となる。
特許文献1にも、動き補償画像を補正する別の方法が開示されている。特許文献1の方法は、大局的な輝度変化が生じている動画像の符号化時に、大局的な輝度変化量を補償する方法である。具体的には、特許文献1の方法では、大局的な輝度変化を補償する際に、処理対象画像140プレーンと参照画像プレーン間における大局的な輝度変化量であるゲインの変化分を表すパラメータの他に、コントラストの変化を表すパラメータも用いる方法である。これにより、大局的な輝度変化を生じている動画像の符号化時に、従来よりも更に効率の良い符号化を行うことが可能となる。
"VCEG−AH19:Weighted Prediction using Neighboring Pixels、" ITU−T SG16 Q6 Antalya会合、2008.1
しかしながら、非特許文献1に記載の方法には、符号量が最小化されていないという問題があった。すなわち、符号化対象ブロックにおける動き補償画像の各画素の画素値を、常に、その画素の真上に位置する符号化対象ブロック隣接領域内の画素の画素値差分と、その画素の真左に位置する符号化対象ブロック隣接領域内の画素の画素値差分とを参照することによって補正しているため、符号化対象ブロックでの画素値変化と該符号化対象ブロックに隣接する符号化対象ブロック隣接領域での画素値変化との間の相関が活用されておらず、この点で符号量に減少の余地が残されていた。この問題について、もう少し具体的に説明すれば以下のとおりである。
まず、画素値変化の横方向の相関が、画素値変化の縦方向の相関に較べて高い場合を検討する。この場合、補正対象画素の真左に位置する符号化対象ブロック隣接領域154上の画素を利用して動き補償画像を補正する方が、真上に位置する符号化対象ブロック隣接領域154上の画素を利用するより適している。ここでいう、横方向の相関とは、左右に隣接する二画素における、左の画素のフレーム間の画素値変化と右の画素のフレーム間の画素値変化との相関のことである。
一方、フレーム間の画素値変化の縦方向の相関の方が高い場合には、真上に位置する符号化対象ブロック隣接領域154の画素の画素値変化を動き補償画像の補正に利用する方が適している。縦方向の相関とは、上下に隣接する二画素における、上の画素のフレーム間の画素値変化と下の画素のフレーム間の画素値変化の相関のことである。
このように、動画像の局所的な性質に応じて、複数の補正方法の中から有効な補正方法を選択して動き補償画像を補正することにより、唯一の補正方法を常に適用する場合に較べ、予測残差の分散および絶対値を低減することができる。そのため、動画像の符号化データの符号量を減少できる。すなわち、選択可能な補正方法の候補が多いほど、より適切な方法で補正される可能性が高くなり、符号量はより減少する。一方、非特許文献1に記載の方法においては、一定の方法により動き補償画像を補正しているため、この点で符号量に減少の余地が残されている。
また、特許文献1に記載の方法は、大局的な輝度変化を生じている動画像のみを対象とした方法であるため、動画像の局所的な性質に適した方法で動き補償画像を補正することができないという問題があった。
なお、動画像の局所的な性質に応じて、複数の補正方法の中から有効な補正方法を選択可能にするためのアプローチとして、いずれの補正方法を使用するかを示す付加情報を符号化する方法が考えられる。しかしながら、その場合、付加情報の符号量分だけ動画像の符号化に要する符号量が増加してしまうという新たな問題が生じる。
本発明は上記の課題を解決するためになされたものであり、その目的は、符号量の増加を最低限に抑えつつ、動画像の局所的な性質に適した方法で動き補償画像を補正する動画像符号化装置を提供することにある。さらに、当該動画像符号化装置で符号化されたデータを復号することのできる動画像復号装置を提供することにある。
上記課題を解決するために、本発明に係る動画像符号化装置は、入力画像と予測画像との差分をブロック毎に符号化する動画像符号化装置であって、符号化対象ブロックにおける上記入力画像のフレーム間の画素値変化と、該符号化対象ブロックに隣接する隣接領域における局所復号画像のフレーム間の画素値変化との関連性を示す指標を算出する算出手段と、上記隣接領域に含まれる相異なる領域における上記局所復号画像のフレーム間の画素値変化に基づいて上記動き補償画像を補正する複数の補正手段と、上記複数の補正手段のうち何れの補正手段によって補正された動き補償画像を上記予測画像として利用するかを上記指標に基づいて選択する選択手段と、を備えている、ことを特徴とする。
上記構成によれば、符号化対象ブロックにおける入力画像のフレーム間の画素値変化と、該符号化対象ブロックに隣接する隣接領域における局所復号画像のフレーム間の画素値変化との関連性を示す指標に基づき、複数の動き補償画像補正部から、最適な補正方法を用いるものを選択して動き補償画像を補正する。これにより、常に単一の補正方法を用いて動き補償画像を補正する従来の構成と比べて、動画像の局所的な性質に適した方法で動き補正画像を補正することができる。すなわち、従来の構成より精度の高い予測画像を生成することができる。したがって、予測残差の符号化に要する符号量を低減させることができる。
なお、上記算出手段は、上記符号化対象ブロックを符号化している時点で利用可能である情報であれば、どんな情報を参照して上記指標を算出するものであってもよい。例えば、上記算出手段が上記指標を算出するために参照可能な情報としては、例えば、上記符号化対象ブロックよりも前に復号されている、局所復号画像、動き情報(動きベクトル、参照画像、動き補償制度、パーティション情報)、符号化モード(画面内予測モード、画面間予測モード、スキップモード、ダイレクト予測モード)などが挙げられる。
本発明に係る動画像符号化装置において、上記複数の補正手段は、上記符号化対象ブロックの上辺に隣接する領域における上記局所復号画像のフレーム間の画素値変化に基づいて上記動き補償画像を補正する第1の補正手段と、上記符号化対象ブロックの左辺に隣接する領域における上記局所復号画像のフレーム間の画素値変化に基づいて上記動き補償画像を補正する第2の補正手段と、上記符号化対象ブロックの上辺に隣接する領域、及び、上記符号化対象ブロックの左辺に隣接する領域における上記局所復号画像のフレーム間の画素値変化に基づいて上記動き補償画像を補正する第3の補正手段とのうち、2以上の補正手段を含んでいる、ことが好ましい。
符号化処理を左上から右下へとラスタスキャン順に進めていく場合、符号化対象ブロックの符号化処理を行う時点で、該符号化対象ブロックの上辺に隣接する領域、及び、該符号化対象ブロックの左辺に隣接する領域の符号化が完了している。動画像符号化装置においては、あるブロックの符号化が完了すると、そのブロックの局所復号画像が生成されるので、第1の補正手段、第2の補正手段、及び、第3の補正手段は、局所復号画像のフレーム間変化(処理対象フレームと参照フレームとの間の変化)を参照して動き補償画像を補正することができる。また、第1の補正手段、第2の補正手段、及び、第3の補正手段は、動き補償画像を補正するために参照する領域が異なるので、これら3つの補正手段のうち2以上の補正手段を適宜用いることによって、動画像の局所的な性質に適した方法で動き補正画像を補正することができる。
本発明に係る動画像符号化装置において、上記算出手段は、上記動き補償画像の画素値を参照して上記指標を算出する、ことが好ましい。
動き補償画像は、動画像符号化装置において上記符号化対象ブロックを符号化している時点で利用可能な情報である。また、動画像復号装置においても上記符号化対象ブロックを復号している時点で利用可能な情報である。したがって、上記の構成によれば、動画像符号化装置が生成する符号化データに、どの補正手段を選択したのかを示す新たな情報を付加することなく、動画像復号装置においても動画像符号化装置と同じ補正手段を選択することができる。
なお、上記指標としては、例えば、上記動き補償画像におけるエッジ強度、又は、エッジ方向を示す数値などを用いることができる。
本発明に係る動画像符号化装置において、上記算出手段は、上記隣接領域における上記局所復号画像の画素値を参照して上記指標を算出する、ことが好ましい。
上記隣接領域における上記局所復号画像の画素値は、動画像符号化装置において上記符号化対象ブロックを符号化している時点で利用可能な情報である。また、動画像復号装置においても上記符号化対象ブロックを復号している時点で利用可能な情報である。したがって、上記の構成によれば、動画像符号化装置が生成する符号化データに、どの補正手段を選択したのかを示す新たな情報を付加することなく、動画像復号装置においても動画像符号化装置と同じ補正手段を選択することができる。
なお、上記指標としては、例えば、上記符号化対象ブロックの上辺に隣接する領域における上記局所復号画像の画素値の連続性、及び、上記符号化対象ブロックの左辺に隣接する領域における上記局所復号画像の画素値の連続性を示す数値などを用いることができる。
本発明に係る動画像符号化装置において、上記算出手段は、上記隣接領域における上記局所復号画像の画素値変化を参照して上記指標を算出する、ことが好ましい。
上記隣接領域における上記局所復号画像の画素値変化は、動画像符号化装置において上記符号化対象ブロックを符号化している時点で利用可能な情報である。また、動画像復号装置においても上記符号化対象ブロックを復号している時点で利用可能な情報である。したがって、上記の構成によれば、動画像符号化装置が生成する符号化データに、どの補正手段を選択したのかを示す新たな情報を付加することなく、動画像復号装置においても動画像符号化装置と同じ補正手段を選択することができる。
なお、上記指標としては、例えば、上記符号化対象ブロックの上辺に隣接する領域における上記局所復号画像の画素値変化の大きさ、及び、上記符号化対象ブロックの左辺に隣接する領域における上記局所復号画像の画素値変化の大きさを示す数値などを用いることができる。
本発明に係る動画像符号化装置において、上記算出手段は、上記符号化対象ブロックの動きベクトルと、該符号化対象ブロックに隣接する符号化済ブロックの動きベクトルとを参照して上記指標を算出する、ことが好ましい。
上記符号化対象ブロックの動きベクトルと、該符号化対象ブロックに隣接する符号化済ブロックの動きベクトルとは、動画像符号化装置において上記符号化対象ブロックを符号化している時点で利用可能な情報である。また、動画像復号装置においても上記符号化対象ブロックを復号している時点で利用可能な情報である。したがって、上記の構成によれば、動画像符号化装置が生成する符号化データに、どの補正手段を選択したのかを示す新たな情報を付加することなく、動画像復号装置においても動画像符号化装置と同じ補正手段を選択することができる。
なお、上記指標としては、例えば、上記符号化対象ブロックの動きベクトルと該符号化対象ブロックの上辺に隣接する符号化済ブロックの動きベクトルとの類似性、及び、上記符号化対象ブロックの動きベクトルと該符号化対象ブロックの左辺に隣接する符号化済ブロックの動きベクトルとの類似性を示す数値などを用いることができる。
上記課題を解決するために、本発明に係る動画像復号装置は、入力画像と予測画像との差分をブロック毎に符号化することによって得られた符号化データを復号する動画像復号装置であって、復号対象ブロックにおける上記入力画像のフレーム間の画素値変化と、該復号対象ブロックに隣接する隣接領域における局所復号画像のフレーム間の画素値変化との関連性を示す指標を算出する算出手段と、上記隣接領域に含まれる相異なる領域における上記局所復号画像のフレーム間の画素値変化に基づいて動き補償画像を補正する複数の補正手段と、上記入力画像を再現するために、上記複数の補正手段のうち何れの補正手段によって補正された動き補償画像を上記予測画像として利用するかを上記指標に基づいて選択する選択手段と、を備えている、ことを特徴としている。
上記の構成によれば、上記動画像符号化装置が符号化した符号化データを、復号可能な動画像復号装置を実現することができる。
以上のように、本発明に係る動画像符号化装置は、符号化対象ブロックにおける画素値変化と、該符号化対象ブロックに隣接する隣接領域における画素値変化との関連性に基づいて、複数の動き補償画像補正部から、最適な補正方法を用いるものを選択して動き補償画像を補正する。
これにより、常に単一の補正方法を用いて補正する場合に比べて、動画像の局所的な性質に適した方法で補正することができる。すなわち、補正の精度を高める効果を奏する。したがって、予測残差の符号化に要する符号量を低減させることができる。
〔実施形態1〕
本発明の動画像符号化装置と動画像復号装置の第一の実施形態について、図1〜図7を参照して以下に説明する。
本発明の動画像符号化装置と動画像復号装置の第一の実施形態について、図1〜図7を参照して以下に説明する。
(動画像符号化装置の構成)
まず、本実施形態に係る動画像符号化装置200の要部構成について、図2を参照して説明する。
まず、本実施形態に係る動画像符号化装置200の要部構成について、図2を参照して説明する。
図2は動画像符号化装置200の要部構成と、各部間のデータの流れとを示したブロック図である。図2に示すように、動画像符号化装置200(動画像符号化装置)は、画像入力部20、動き検出部21、予測画像処理部22、予測残差算出部23、直交変換部24、量子化部25、逆量子化部26、逆直交変換部27、局所復号画像生成部28、フレームメモリ29、可変長符号化部201、および符号化データ出力部202を備えている。各部の詳細な処理については後述する。
(予測画像処理部22の構成)
次に、予測画像処理部22の構成について、図3を参照して説明する。図3は、予測画像処理部22の要部構成と、各部間のデータの流れを示したブロック図である。図3に示すように、予測画像処理部22は、予測画像生成部1、予測画像選択部30、画像比較部31、および予測画像候補記録部32を含む。各部の詳細な処理については後述する。
次に、予測画像処理部22の構成について、図3を参照して説明する。図3は、予測画像処理部22の要部構成と、各部間のデータの流れを示したブロック図である。図3に示すように、予測画像処理部22は、予測画像生成部1、予測画像選択部30、画像比較部31、および予測画像候補記録部32を含む。各部の詳細な処理については後述する。
(予測画像生成部1の構成)
つづいて、予測画像生成部1の構成について、図1を参照して説明する。図1は、予測画像生成部1の要部構成と、各部間のデータの流れを示したブロック図である。図1に示すように、予測画像生成部1は、予測画像候補生成部10、補正方法選択部2(算出手段、選択手段)、スイッチ3、およびスイッチ4を含む。予測画像候補生成部10はさらに、動き補償画像補正部11(補正手段)、動き補償画像補正部12(補正手段)、および動き補償画像補正部13(補正手段)を含む。各部の詳細な処理については後述する。
つづいて、予測画像生成部1の構成について、図1を参照して説明する。図1は、予測画像生成部1の要部構成と、各部間のデータの流れを示したブロック図である。図1に示すように、予測画像生成部1は、予測画像候補生成部10、補正方法選択部2(算出手段、選択手段)、スイッチ3、およびスイッチ4を含む。予測画像候補生成部10はさらに、動き補償画像補正部11(補正手段)、動き補償画像補正部12(補正手段)、および動き補償画像補正部13(補正手段)を含む。各部の詳細な処理については後述する。
以降の説明において数式を用いる場合は、次のように表記する。局所復号された処理対象画像(処理対象フレームの局所復号画像)Icにおいて、画像左上に位置する画素を原点として位置(X,Y)にある画素の画素値をIc(X,Y)と表記する。同様に局所復号された参照画像(参照フレームの局所復号画像)Irにおいて、位置(X,Y)にある画素の画素値をIr(X,Y)と表記する。特に断りがなければ、ここでいう画素値は対応する画素の輝度値を表すが、本実施形態で示す方法は、画素値が色差を表す場合にも有効である。また、画素値が、被写体までの距離、被写体熱量等の他の物理量を表す場合にも有効である。
(動画像符号化装置の処理)
動画像符号化装置の処理について、まず、図2を参照して以下に説明する。
動画像符号化装置の処理について、まず、図2を参照して以下に説明する。
まず、画像入力部20は、入力画像100を、動き検出部21、予測画像処理部22、および予測残差算出部23に入力する。入力画像100とは、図14に示すような、これから符号化しようとする符号化対象画像のことである。図14については、すでに説明しているため、ここでは詳細を省略する。
つぎに、動き検出部21は、フレームメモリ29から局所復号画像103を取得し、局所復号画像103と入力画像100との画素値を比較する。これにより、動きベクトル105を導出し、これを予測画像処理部22および可変長符号化部201に出力する。
上述した局所復号画像103については、詳細を後述する。
予測画像処理部22は、動きベクトル105に基づいて動き補償画像を生成する。さらに、局所復号画像103の符号化対象ブロック隣接領域の画素の画素値の変化に基づいて、動き補償画像を補正した画像を生成する。そして、補正前後の動き補償画像のうち入力画像100を良く近似する方の画像を、予測画像106として予測残差算出部23に出力する。また、補正フラグ107を可変長符号化部201に出力する。補正フラグ107とは、予測画像106が動き補償画像を補正して生成されたものか否か(すなわち、補正の有無)を示すものである。予測画像処理部22の内部の詳細な処理は後述する。
予測残差算出部23は、予測画像106と、入力画像100との画素値の差分を算出し、予測残差101(L×M画素)を生成する。そして、生成した予測残差101を直交変換部24に出力する。このとき入力画像100は、図14に示すように、所定の順序でブロック単位に符号化されるもので、各ブロックのブロックサイズはL×M画素である。同様に、予測画像106のサイズもL×M画素である。
直交変換部24は、離散コサイン変換を実行し、入力された予測残差101を周波数変換した際の各周波数成分係数を導出する。そして、各周波数成分係数を量子化部25に出力する。
量子化部25は、各周波数成分係数を所定の量子化ステップで量子化し、変換係数レベル102を導出する。そして、変換係数レベル102を、可変長符号化部201および逆量子化部26に出力する。
逆量子化部26は、変換係数レベル102を逆量子化し、周波数変換係数として復元する。そして復元した周波数変換係数を逆直交変換部27に出力する。
逆直交変換部27は、周波数変換係数に逆離散コサイン変換を適用し、予測残差101(L×M画素)を再構築する。そして、再構築された予測残差101を局所復号画像生成部28に出力する。
局所復号画像生成部28は、再構築された予測残差101を予測画像106に加えて、局所復号画像103(L×M画素)を生成する。つづいて、局所復号画像103をフレームメモリ29に記録する。
なお、局所復号画像生成部28は、ブロック単位で生成した局所復号画像103をフレームメモリ29に順次記録する。したがって、動画像符号化装置200が符号化の処理をしている間は、参照フレームの局所復号画像の全部と、処理対象フレームの局所復号画像の一部(復号済領域)とがフレームメモリ29に記録されている。
可変長符号化部201は、入力された変換係数レベル102、動きベクトル105、および補正フラグ107をそれぞれ符号化し、それらを多重化する。そして、多重化したデータを符号化データ108として符号化データ出力部202に出力する。
符号化データ出力部202は、符号化データ108を必要に応じて、本発明に係る動画像復号装置(詳細は後述する)に出力する。
(予測画像処理部22の処理)
ここで、図3および図4を参照して、予測画像処理部22の全体的な処理の流れを説明する。図4は、予測画像処理部22の処理の流れを示したフローチャートである。
ここで、図3および図4を参照して、予測画像処理部22の全体的な処理の流れを説明する。図4は、予測画像処理部22の処理の流れを示したフローチャートである。
図3に示すように、まず、動きベクトル105が入力されると、予測画像選択部30は補正フラグ107を設定するために保持する変数Kの値を0に設定する。すでに変数Kの値が0に設定されている場合は、1に設定する(ステップS1)。なお、新しい動きベクトル105が予測画像選択部30に入力されると、変数Kは初期化されて未設定の状態となる。
次に、ステップS1において設定した変数Kの値に基づき、予測画像選択部30は補正フラグ107の値を設定する。具体的には、変数Kの値が0の場合、補正フラグ107を「補正なし」に設定し、変数Kの値が1の場合、補正フラグ107を「補正あり」に設定する。そして、予測画像選択部30は、補正フラグ107の値を変える度に、予測画像生成部1および予測画像候補記録部32に補正フラグ107を出力する(ステップS2)。つまり、補正フラグ107を「補正なし」に設定したとき、予測画像選択部30は、「補正なし」に設定された補正フラグ107を、予測画像生成部1および予測画像候補記録部32に出力する。さらに、補正フラグ107を「補正あり」に設定したときも同様に、予測画像選択部30は、「補正あり」に設定された補正フラグ107を、予測画像生成部1および予測画像候補記録部32に出力する。
つづいて、予測画像生成部1は、動きベクトル105、局所復号画像103、および補正フラグ107に基づいて、予測画像106を生成する(ステップS3)。そして、予測画像106を画像比較部31と予測画像候補記録部32とに出力する。なお、予測画像生成部1の内部の詳細な処理については後述する。
つづいて、画像比較部31は、ステップS3において生成された予測画像106(L×M画素)と、入力画像100(L×M画素)とを比較し、評価値R112を計算する。そして、評価値R112を、予測画像候補記録部32に出力する(ステップS4)。
ここで、評価値R112は、予測画像106がどの程度入力画像100を近似しているかを表す差分絶対値和であり、次式(式1)により求められる。
ここで、O(i,j)、P(i,j)はそれぞれ入力画像100と予測画像106のブロック内の位置(i,j)の画素の画素値を表す。なお、評価値R112を式1により求めた場合、評価値R112が小さいほど、予測画像106は入力画像100をより良く近似しているといえる。
つづいて、予測画像候補記録部32は、ステップS2において入力された補正フラグ107と、ステップS3において入力された予測画像106と、ステップS4において入力された評価値R112とを関連付けて、動画像符号化装置200の内部の、フレームメモリとは別のメモリ(図示せず)に記録する(ステップS5)。
つづいて、予測画像選択部30は、変数Kの値が1であるか否かを判定する(ステップS6)。
ステップS6においてNoの場合は、ステップS1に戻る。Noの場合は、すなわち、変数Kの値は0であり、補正フラグは「補正なし」に設定されている。すなわちこの時点では、「補正なし」のパターンで生成された予測画像106が生成されている。ステップS1に戻ることにより、Kの値が1に設定される。したがって、次は、「補正あり」のパターンで予測画像106が生成される。
ステップS6においてYesの場合、予測画像候補記録部32は、ステップS2において生成された予測画像106のうち、評価値R112が最小となる予測画像106を選択する。そして選択した予測画像106に関連する補正フラグ107とともに、図2において示されている、動画像符号化装置200の予測残差算出部23および局所復号画像生成部28に予測画像106を出力する。さらに、予測画像候補記録部32は、補正フラグ107を、図2に示されている、可変長符号化部201に出力する。(ステップS7)。
以上の処理により、予測画像処理部22によって、動き補償画像を補正することなく生成された予測画像106と、動き補償画像を補正して生成された予測画像106とから、入力画像100をより良く近似する予測画像106が選択される。これにより、予測画像106と入力画像100との画素値の差分はより小さくなる。すなわち、予測残差101をより小さくすることが可能である。
(予測画像生成部1の処理)
図1および図6を参照して、動画像符号化装置200の特徴的な構成要素である予測画像生成部1の処理について、説明する。
図1および図6を参照して、動画像符号化装置200の特徴的な構成要素である予測画像生成部1の処理について、説明する。
予測画像生成部1は、複数の動き補償画像補正部のうち、補正方法選択部2が選択した動き補償画像補正部によって補正された動き補償画像に基づいて、上記予測画像106を生成する生成手段である。予測画像生成部1の処理の詳細を以下に説明する。
図6は、予測画像生成部1の処理の流れを示したフローチャートである。
図1に示すように、まず、予測画像候補生成部10の動き補償画像生成部14に、局所復号画像103と動きベクトル105とが入力される。入力された局所復号画像103および動きベクトル105に基づき、動き補償画像生成部14が動き補償画像109(L×M画素)を生成する(ステップS10)。動き補償画像生成部14は、生成した動き補償画像109(L×M画素)を、スイッチ4、補正方法選択部2、および動き補償画像補正部11〜13のそれぞれに出力する(ステップS11)。
動き補償画像109を構成する画素の画素値M(i,j)は次式(式2)により計算される。
上記(xc、yc)は処理対象ブロック内左上に位置する画素の、処理対象画像内の位置とする。また、(dX、dY)は動きベクトル105の示す変位(画素単位)とする。
スイッチ4には、図3に示されている予測画像選択部30が出力した補正フラグ107が入力される。スイッチ4は、入力された補正フラグ107に基づき、動き補償画像109の補正は不要かどうかを判定する(ステップS12)。補正フラグ107が「補正なし」を示しており、補正は不要であると判定した場合、動き補償画像109を予測画像106として、図3に示されている予測画像処理部22の画像比較部31および予測画像候補記録部32に出力する(ステップS21)。
一方、補正フラグ107が「補正あり」を示しており、補正は必要であると判定した場合、予測画像生成部1は以下のステップを実行する。
まず補正方法選択部2は、動き補償画像109の符号化済み領域を参照して、符号化対象ブロックにおける上記入力画像100のフレーム間の画素値変化と、当該符号化対象ブロックに隣接する隣接領域における局所復号画像103のフレーム間の画素値変化との関連性を示す指標を算出する。具体的には、符号化対象ブロックにおける動き補償画像109の画素値変化と、該符号化対象ブロックに隣接する隣接領域における動き補償画像109の画素値変化との関連性を示す指標を算出する。そして、算出した指標に基づいて複数の補正手段の何れかを選択する。つまり、動き補償画像補正部11〜13のうちのどの補正部を用いて補正を行うか選択する。
補正方法選択部2は、符号化対象ブロックにおける動き補償画像109のエッジ強度を計算し(ステップS13)、計算結果に基づいて、最も適切な補正を行う動き補償画像補正部を選択する(ステップS17〜19)。ステップS17〜19の詳細については後述する。ここでいうエッジ強度とは、動き補償画像109において縦横のどちらの方向にエッジが存在している可能性が高いかを示す度合いである。
(エッジの例)
ここで、エッジについて、図5を参照して説明する。図5は、動き補償画像109の符号化対象ブロック51において、エッジ54がある例を示した図である。
ここで、エッジについて、図5を参照して説明する。図5は、動き補償画像109の符号化対象ブロック51において、エッジ54がある例を示した図である。
図5に示すように、符号化対象ブロック51は、エッジ54によって左から順に領域R1と領域R2とに分割されている。このエッジ54を境界として、画素値が不連続に変化している。以降の説明において、このように、符号化対象ブロック51の上辺から下辺に至る境界が存在し、この境界によって画素値が不連続に変化するとき、この境界のことを縦エッジとよぶ。また、このとき、縦方向にエッジが存在するという。
これに対し、仮に、符号化対象ブロック51の左辺から右辺に至る境界が存在し、この境界によって画素値が不連続に変化するとき、この境界のことを横エッジとよぶ。また、このとき、横方向にエッジが存在するという。
さらに、エッジが存在する方向と、符号化対象ブロック51の画素値変化の相関とについて説明する。
図5に示すように、エッジ54は、符号化対象ブロック51の上辺に隣接する領域53の上辺にまで至っている。したがって、符号化対象ブロック51に隣接する領域53にも、エッジ54を境に画素値の不連続な変化が現れ、領域53は左から順に領域RT1と領域RT2に分割されている。一方、符号化対象ブロック51の左辺に隣接する領域52、すなわち領域RL1にはエッジが存在しない。したがって、領域52には画素値の不連続な変化は現れない。
このとき、領域R1と領域RL1との相関、領域R1と領域RT1との相関、および領域R2と領域RT2との相関は高いといえる。
(画素値の相関)
符号化対象ブロックの画素値に対して相関が高い領域を参照したほうが、良い推定結果が得られる。したがって、領域R1における画素値変化を推定する場合、領域R1と相関の高い領域RT1を、領域R2における画素値変化を推定する場合、領域R2と相関の高い領域RT2を参照して推定することが望ましい。
符号化対象ブロックの画素値に対して相関が高い領域を参照したほうが、良い推定結果が得られる。したがって、領域R1における画素値変化を推定する場合、領域R1と相関の高い領域RT1を、領域R2における画素値変化を推定する場合、領域R2と相関の高い領域RT2を参照して推定することが望ましい。
すなわち、符号化対象ブロックに縦エッジが存在する場合、当該符号化対象ブロックの画素と相関の高い、符号化対象ブロックの上辺に隣接する領域の画素を参照して画素値を推定すればよい。一方、符号化対象ブロックに横エッジが存在する場合、当該符号化対象ブロックの画素と相関の高い、符号化対象ブロックの左辺に隣接する領域の画素を参照して画素値を推定すればよい。
(エッジの検出)
次に、補正方法選択部2がエッジの有無をどのように検出するかを、下記式(式3および4)を参照して以下に説明する。
次に、補正方法選択部2がエッジの有無をどのように検出するかを、下記式(式3および4)を参照して以下に説明する。
式3は、動き補償画像109における縦エッジ強度EVを算出するための式であり、式4は、横エッジ強度EHを算出するための式である。
式3によって求められた縦エッジ強度EVが所定の閾値より大きい場合、符号化対象ブロックに縦エッジがあると判定する。逆に、所定の閾値以下の場合、縦エッジがないと判定する。
同様に、式4によって求められた横エッジ強度EHが所定の閾値より大きい場合、符号化対象ブロックに横エッジがあると判定する。逆に、所定の閾値以下の場合、横エッジがないと判定する。
つづいて、動き補償画像109を補正する複数の補正手段である、動き補償画像補正部11〜13について説明する。動き補償画像補正部11〜13は、動き補償画像109を補正する際に参照する領域がそれぞれ異なる補正手段である。以下に、動き補償画像補正部11〜13のそれぞれの詳細を説明する。
(動き補償画像補正部11)
まず、動き補償画像補正部11について説明する。動き補償画像補正部11は、局所復号画像103、動きベクトル105、および動き補償画像109に基づいて、動き補償画像109を補正する。
まず、動き補償画像補正部11について説明する。動き補償画像補正部11は、局所復号画像103、動きベクトル105、および動き補償画像109に基づいて、動き補償画像109を補正する。
具体的には、動き補償画像補正部11は、符号化対象ブロックの上辺および左辺に隣接する画素のフレーム間の画素値変化に基づき動き補償画像109を補正する。補正後の画像の画素値Ma(i,j)は次式(式5および6)により求める。
ここで、ΔST(i,0)は、符号化対象ブロックの上辺に隣接する画素のフレーム間の画素値変化を表す。一方、ΔSL(0,j)は符号化対象ブロックの左辺に隣接する画素のフレーム間の画素値変化を表す。これらは、次式(式7および8)により定義される。
上記の式5で計算されるMa(i,j)を画素値とする画像は、符号化対象ブロックの上辺または左辺に隣接する画素の画素値変化に基づいて、動き補償画像109を補正した画像である。動き補償画像補正部11は、補正後の画像をスイッチ3に出力する。
(動き補償画像補正部12)
次に、動き補償画像補正部12について説明する。
次に、動き補償画像補正部12について説明する。
まず、動き補償画像補正部12に入力されるデータは、動き補償画像補正部11と同じである。しかし動き補償画像補正部12は、動き補償画像補正部11が用いている式とは異なる式を用いて動き補償画像109を補正する。
具体的には、動き補償画像補正部12は、符号化対象ブロックの上辺に隣接する画素の画素値の変化のみに基づいて、動き補償画像109を補正する。補正後の画像の画素値Mb(i,j)は次式(式9および10)により求める。
上記の式9で計算されるMb(i,j)を画素値とする画像は、符号化対象ブロックの上辺に隣接する画素の画素値の変化に基づいて、動き補償画像を補正した画像である。動き補償画像補正部12は、補正後の画像をスイッチ3に出力する。
(動き補償画像補正部13)
つづいて、動き補償画像補正部13について説明する。動き補償画像補正部13の入力データは、動き補償画像補正部11および12と同じであるが、動き補償画像補正部11および12が用いている式とは異なる式を用いて動き補償画像109を補正する。
つづいて、動き補償画像補正部13について説明する。動き補償画像補正部13の入力データは、動き補償画像補正部11および12と同じであるが、動き補償画像補正部11および12が用いている式とは異なる式を用いて動き補償画像109を補正する。
具体的には、動き補償画像補正部13は、符号化対象ブロックの左辺に隣接する画素の画素値の変化のみに基づいて、動き補償画像109を補正する。補正後の画像の画素値Mc(i,j)は次式(式11および12)により求める。
上記の式11で計算されるMc(i,j)を画素値とする画像は、符号化対象ブロックの左辺に隣接する画素の画素値変化に基づいて、動き補償画像を補正した画像である。動き補償画像補正部13は、補正後の画像をスイッチ3に出力する。
ここまでで、スイッチ3には、動き補償画像補正部11〜13のそれぞれが補正した動き補償画像が3つ入力されている。
(動き補償画像補正部の選択)
補正方法選択部2は、ステップS13において求められたエッジ強度に基づいて、縦横の方向のどちらにエッジがあるかを判定し、動き補償画像補正部11〜13のうちいずれか最適なものを次の通り選択する。
補正方法選択部2は、ステップS13において求められたエッジ強度に基づいて、縦横の方向のどちらにエッジがあるかを判定し、動き補償画像補正部11〜13のうちいずれか最適なものを次の通り選択する。
補正方法選択部2は、まず、ステップS13において求められたエッジ強度に基づいて、縦エッジがあるかどうかを判定する(ステップS14)。次に横エッジがあるかどうかを判定する(ステップS15およびS16)。
まず、ステップS14においてYes、ステップS15においてNoである場合を考える。具体的には、符号化対象ブロックに縦エッジが存在し、かつ、横エッジが存在しないと判定された場合である。この場合、補正方法選択部2は、動き補償画像補正部12を選択する(ステップS17)。上述したように、動き補償画像補正部12は、符号化対象ブロックの上辺に隣接する画素の画素値の変化に基づいて補正することから、この場合、最も適切な領域を参照する補正部であると考えられるからである。
次に、ステップS14においてNo、ステップS16においてYesである場合を考える。具体的には、符号化対象ブロックに横エッジが存在し、かつ、縦エッジが存在しないと判定された場合である。この場合、補正方法選択部2は、動き補償画像補正部13を選択する(ステップS19)。上述したように、動き補償画像補正部13は、符号化対象ブロックの左辺に隣接する画素の画素値の変化に基づいて補正することから、この場合、最も適切な領域を参照する補正部であると考えられるからである。
つづいて、ステップS14およびステップS15の両方においてYesの場合、または、ステップS14およびステップS16の両方においてNoの場合について説明する。具体的には、符号化対象ブロックに縦エッジ、横エッジが共に存在すると判定された場合、または、両エッジが共に存在しないと判定された場合である。この場合、補正方法選択部2は、動き補償画像補正部11を選択する(ステップS18)。上述したように、動き補償画像補正部11は、符号化対象ブロックの上辺および左辺に隣接する画素のフレーム間の画素値変化に基づいて補正することから、この場合、最も適切な領域を参照する補正部であると考えられるからである。
つづいて、動き補償画像補正部11〜13のそれぞれが、動き補償画像109を補正する(ステップS20)。
補正方法選択部2は、上記の選択結果111をスイッチ3に出力する。
スイッチ3は、動き補償画像補正部11〜13のうち、選択された動き補償画像補正部につながる入力に切替える。これにより、選択された動き補償画像補正部によって補正された動き補償画像109を補正後動き補償画像110としてスイッチ4に出力する。
スイッチ4は、入力される補正フラグ107に応じて、動き補償画像109と補正後動き補償画像110のいずれかを選択する。具体的には、補正フラグ107が、「補正あり」を示していれば、補正後動き補償画像110を選択し、「補正なし」を示していれば、動き補償画像109を選択する。つづいて、選択した画像を予測画像106として、予測残差算出部23と局所復号画像生成部28とに出力する(ステップS21)。
上記のように、予測画像生成部1は、動き補償画像109のエッジ強度に基づいて、複数の動き補償画像補正部から、最適な補正方法を用いるものを選択し、これを用いて動き補償画像109を補正する。これにより、常に単一の補正方法を用いて補正する場合に比べて、動画像の局所的な性質に適した方法で補正することができる。すなわち、補正の精度を高めることができる。したがって、予測残差の符号化に要する符号量を低減させることができる。さらに、どの動き補償画像補正部を用いて補正したかを示す情報を符号化していないため、符号量は増加しない。すなわち、補正方法が増えたとしても、符号量増加を回避することができる。
(エッジ角度を利用した判定)
なお、上述した補正方法選択部2の説明では、縦横エッジ強度に基づいて補正方法を判定すると説明したが、判定基準はこれに限らない。たとえば、以下に示すように、動き補償画像109のエッジ角度を計算し、当該エッジ角度に応じて補正方法を決定してもよい。ここでいうエッジ角度とは、符号化対象ブロックの上辺または下辺に対する角度のことをいう。つまり、上辺または下辺に対して水平である角度を0度とする。なお、エッジ角度は、エッジ方向を示す数値であるとも換言できる。
なお、上述した補正方法選択部2の説明では、縦横エッジ強度に基づいて補正方法を判定すると説明したが、判定基準はこれに限らない。たとえば、以下に示すように、動き補償画像109のエッジ角度を計算し、当該エッジ角度に応じて補正方法を決定してもよい。ここでいうエッジ角度とは、符号化対象ブロックの上辺または下辺に対する角度のことをいう。つまり、上辺または下辺に対して水平である角度を0度とする。なお、エッジ角度は、エッジ方向を示す数値であるとも換言できる。
動き補償画像109のエッジ角度Dは、たとえば、次式(式13)により計算することができる。
エッジ角度Dが90度または−90度に近い場合(たとえば、|D|>75度の場合)は、動き補償画像が縦方向のエッジを含むと判定することができる。そのため、符号化対象ブロック上辺に隣接する画素の画素値の変化を利用して補正することが望ましい。したがって、動き補償画像補正部12が選択される。
一方、エッジ角度Dが0度に近い場合(たとえば、|D|<15度の場合)は、動き補償画像が横方向のエッジを含むと判定することができる。そのため、符号化対象ブロック左辺に隣接する画素の画素値の変化を利用して補正することが望ましい。したがって、動き補償画像補正部13が選択される。
上記以外の場合(たとえば、15度≦|D|≦75度の場合)は、動き補償画像が横エッジを含むとも、縦エッジを含むとも判定できない。したがって、動き補償画像補正部11が選択される。
上記の判定方法によると、動き補償画像109のエッジ角度に基づいて、最適な補正方法を選択できる。これにより、単一の補正方法を適用する場合に較べて、より正確に動き補償画像109を補正できる。
(動画像復号装置の構成)
次に、本実施形態に係る動画像復号装置700について図7を参照して以下に説明する。
次に、本実施形態に係る動画像復号装置700について図7を参照して以下に説明する。
図7は動画像復号装置700の要部構成と、各部間のデータの流れを示した図である。図7に示すように、動画像復号装置700は、符号化データ入力部70、可変長符号復号部71、逆量子化部26、逆直交変換部27、局所復号画像生成部74、局所復号画像出力部75、予測画像生成部1、およびフレームメモリ29を備えている。なお、本発明における動画像符号化装置200と共通する部材には同じ番号を付し、詳細な説明を省略する。その他の部材の詳細な処理については後述する。
(動画像復号装置700の処理)
つづいて、動画像復号装置700の処理について図7を参照して以下に説明する。
つづいて、動画像復号装置700の処理について図7を参照して以下に説明する。
図7に示すように、まず、符号化データ入力部70は、符号化データ108を符号化対象ブロック単位で、可変長符号復号部71に順次入力する。以下、符号化対象ブロック毎に実行される処理について説明する。
可変長符号復号部71は、符号化データ108から動きベクトル105と補正フラグ107と変換係数レベル102とを復号する。つづいて、動きベクトル105と補正フラグ107とを予測画像生成部1に出力する。さらに、変換係数レベル102を逆量子化部26に出力する。
逆量子化部26は、変換係数レベル102に逆量子化を施し、周波数変換係数として復元する。つづいて、これを逆直交変換部27に出力する。
逆直交変換部27は、入力された周波数変換係数に逆離散コサイン変換を適用し、予測残差101を再構築する。そして、予測残差101を局所復号画像生成部74に出力する。
次に予測画像生成部1の処理について以下に説明する。ただし、動画像復号装置700の予測画像生成部1の処理は、本発明に係る符号化装置の予測画像生成部1の処理と同一であるため、ここでは詳細な説明を省略する。
予測画像生成部1は、入力された動きベクトル105と、補正フラグ107と、フレームメモリ29から取得した参照画像(局所復号画像103)とに基づいて動き補償画像109を生成する。このとき、補正フラグ107に基づいて補正の有無を判定し、必要に応じて動き補償画像109を補正した補正後動き補償画像110を生成する。
補正後動き補償画像110の生成においては、動き補償画像109の特性に応じて最適な補正方法が選択される。そして、動き補償画像109または、補正後動き補償画像110のいずれかを予測画像106として、局所復号画像生成部74に出力する。
局所復号画像生成部74は、予測画像生成部1から入力された予測画像106を逆直交変換部27から入力された予測残差101に加算し、局所復号画像103を生成する。つづいて、局所復号画像103をフレームメモリ29に記録し、さらに、局所復号画像出力部75に出力する。
局所復号画像出力部75は、局所復号画像103を再生画像として、必要に応じて外部の再生装置など(図示せず)に出力する。
上記のように、本実施形態に係る動画像復号装置は、本実施形態に係る動画像符号化装置に備えられている予測画像生成部と同一のものを備えている。これにより、動きベクトル、補正フラグ、および局所復号画像に基づいて、予測画像を生成することが可能である。したがって、どの動き補償画像補正部を用いて補正したかを示す情報は復号データに含まれている必要はなく、復号量を減少させることができる。さらに、単一の補正方法を適用して動き補償画像を補正する場合に比べ、原画像(動画像符号化装置への入力画像)をより忠実に表現する予測画像を生成できる。したがって、この予測画像に予測残差を加えて生成される再生画像は、原画像をより忠実に再現できる。
〔実施形態2〕
(動画像符号化装置の構成)
本発明に係る動画像符号化装置の第二の実施形態について説明する。
(動画像符号化装置の構成)
本発明に係る動画像符号化装置の第二の実施形態について説明する。
まず、本実施形態に係る動画像符号化装置の構成について、以下に説明する。本実施形態における動画像符号化装置の構成は、実施形態1に係る動画像符号化装置200において、図1に示した予測画像生成部1を、異なる機能を有する予測画像生成部1aに置き換えた構成となっている。以下、実施形態1との相違点である、予測画像生成部1aの詳細を説明する。
(予測画像生成部1aの構成)
予測画像生成部1aの構成について、図8を参照して説明する。図8は、本発明の実施形態に係る予測画像生成部1aの要部構成と、各部間のデータの流れを示したブロック図である。
予測画像生成部1aの構成について、図8を参照して説明する。図8は、本発明の実施形態に係る予測画像生成部1aの要部構成と、各部間のデータの流れを示したブロック図である。
図8に示すように、補正方法選択部2a(算出手段、補正手段)以外の部材は、図1を参照して説明した予測画像生成部1が備える部材と共通するため、同一の符号を付与して、詳細な説明を省略する。
(予測画像生成部1aの処理)
図8および図9を参照して、本発明の実施形態に係る予測画像生成部1aの処理について、以下に説明する。
図8および図9を参照して、本発明の実施形態に係る予測画像生成部1aの処理について、以下に説明する。
図9は、本発明の実施形態に係る予測画像生成部1aの処理の流れを示したフローチャートである。
図8に示すように、まず、予測画像候補生成部10に、局所復号画像103と動きベクトル105とが入力される。これらに基づき、動き補償画像生成部14は動き補償画像109を生成(ステップS30)する。つづいて、動き補償画像生成部14は動き補償画像109を、スイッチ4、および動き補償画像補正部11〜13のそれぞれに出力する(ステップS31)。
ここで、実施形態1と異なる点は、動き補償画像109が補正方法選択部2aに入力されておらず、代わりに、局所復号画像103が補正方法選択部2aに入力されている点である。したがって、本実施形態では、補正方法選択部2aは、局所復号画像103を参照して、動き補償画像109を補正する最適な補正方法を選択する。選択基準の詳細は後述する。
なお、動き補償画像109を構成する画素の算出方法については、実施形態1と同様であるため、ここでは説明を省略する。
(スイッチ4)
一方、スイッチ4には、補正フラグ107が入力される。スイッチ4は、入力された補正フラグ107に基づき、動き補償画像109の補正は不要かどうかを判定する(ステップS32)。補正フラグ107が「補正なし」を示しており、補正は不要であると判定した場合、動き補償画像109を予測画像106として、図3に示されている予測画像処理部22の画像比較部31および予測画像候補記録部32に出力する(ステップS41)。
一方、スイッチ4には、補正フラグ107が入力される。スイッチ4は、入力された補正フラグ107に基づき、動き補償画像109の補正は不要かどうかを判定する(ステップS32)。補正フラグ107が「補正なし」を示しており、補正は不要であると判定した場合、動き補償画像109を予測画像106として、図3に示されている予測画像処理部22の画像比較部31および予測画像候補記録部32に出力する(ステップS41)。
一方、補正フラグ107が「補正あり」を示しており、補正は必要であると判定した場合、予測画像生成部1aは以下のステップを実行する。
まず補正方法選択部2aは、局所復号画像103を参照して、符号化対象ブロックにおける上記入力画像100のフレーム間の画素値変化と、当該符号化対象ブロックに隣接する隣接領域における局所復号画像103のフレーム間の画素値変化との関連性を示す指標を算出する。そして、算出した指標に基づいて複数の補正手段の何れかを選択する。つまり、動き補償画像補正部11〜13のうちのどの補正部を用いて補正を行うか選択する。
具体的には、補正方法選択部2aは、符号化対象ブロックに相当する、局所復号画像103上のブロックの上辺または左辺に隣接する領域において、画素値の不連続性を計算し(ステップS33)、計算結果に基づいて、最も適切な補正を行う動き補償画像補正部を選択する(ステップS37〜39)。ステップS37〜39の詳細については後述する。ここでいう不連続性とは、隣接する画素の画素値が極端に変化する、つまり画素値変化の度合いを示すものである。
(不連続性の検出)
次に、補正方法選択部2aが不連続性をどのように検出するかを、下記式(式14および15)を参照して以下に説明する。
次に、補正方法選択部2aが不連続性をどのように検出するかを、下記式(式14および15)を参照して以下に説明する。
補正方法選択部2aは、まず、局所復号画像103において符号化対象ブロックの上辺に隣接する領域において、画素値の横方向の不連続性DHを式14によって求める。
次に、局所復号画像103において符号化対象ブロックの左辺に隣接する領域において、画素値の縦方向の不連続性DVを式15によって求める。
式14によって求められた不連続性DHが所定の閾値より大きい場合は、局所復号画像103の符号化対象ブロック上辺に隣接する領域が不連続であると判定する。一方、所定の閾値以下の場合は、不連続ではないと判定する。
同様に、式15によって求められた不連続性DVが所定の閾値より大きい場合、局所復号画像103の符号化対象ブロックの左辺に隣接する領域が不連続であると判定する。一方、所定の閾値以下の場合、不連続ではないと判定する。
(動き補償画像補正部の選択)
補正方法選択部2aは、ステップS33において求められた不連続性に基づいて、動き補償画像補正部11〜13のうちいずれか最適なものを次の通り選択する。
補正方法選択部2aは、ステップS33において求められた不連続性に基づいて、動き補償画像補正部11〜13のうちいずれか最適なものを次の通り選択する。
補正方法選択部2aは、まず、ステップS33において求められた不連続性に基づいて、符号化対象ブロック上辺の隣接領域が不連続であるかどうかを判定する(ステップS34)。次に同ブロック左辺の隣接領域が不連続であるかどうかを判定する(ステップS35およびS36)。
まず、ステップS34においてYes、ステップS35においてNoである場合を考える。具体的には、符号化対象ブロック上辺の隣接領域が不連続であり、かつ、同ブロック左辺の隣接領域は不連続ではないと判定された場合である。この場合、符号化対象ブロックには縦エッジが存在すると推定できる。
実施形態1で説明した場合と同様に、符号化対象ブロックに縦エッジが存在すると推定される場合、補正方法選択部2aは、動き補償画像補正部12を選択する(ステップS37)。
次に、ステップS34においてNo、ステップS36においてYesである場合を考える。具体的には、符号化対象ブロック上辺に隣接する領域が連続であり、かつ同ブロック左辺に隣接する領域が不連続である場合である。この場合、符号化対象ブロックには横エッジが存在すると推定できる。
実施形態1で説明した場合と同様に、符号化対象ブロックに縦エッジが存在すると推定される場合は、補正方法選択部2aは、動き補償画像補正部13を選択する(ステップS19)。
つづいて、ステップS34およびステップS35の両方においてYesの場合、または、ステップS34およびステップS36の両方においてNoの場合について説明する。具体的には、符号化対象ブロック上辺に隣接する領域と同ブロック左辺に隣接する領域が、共に連続もしくは共に不連続である場合である。この場合、符号化対象ブロックには、縦エッジ、横エッジが共に存在する、または、両エッジが共に存在しないと推定できる。
実施形態1で説明した場合と同様に、符号化対象ブロックに、縦エッジおよび横エッジが存在するともしないとも判定できない場合は、補正方法選択部2aは、動き補償画像補正部11を選択する(ステップS38)。
つづいて、動き補償画像補正部11〜13のそれぞれが、動き補償画像109を補正する(ステップS40)。
補正方法選択部2aは、上記の選択結果111をスイッチ3に出力する。
スイッチ3は、動き補償画像補正部11〜13のうち、選択された動き補償画像補正部につながる入力に切替える。これにより、選択された動き補償画像補正部によって補正された動き補償画像109を補正後動き補償画像110としてスイッチ4に出力する。
スイッチ4は、入力される補正フラグ107に応じて、動き補償画像109および補正後動き補償画像110のいずれかを選択する。具体的には、補正フラグ107が、「補正あり」を示していれば、補正後動き補償画像110を選択し、「補正なし」を示していれば、動き補償画像109を選択する。つづいて、選択した画像を予測画像106として、図3に示されている予測画像処理部22の画像比較部31および予測画像候補記録部32に出力する(ステップS41)。
上記のように、予測画像生成部1aは、符号化対象ブロックに相当する局所復号画像103上のブロックの、上辺または左辺に隣接する領域における画素値の不連続性に基づいて、複数の動き補償画像補正部から、最適な補正方法を用いるものを選択し、これを用いて動き補償画像109を補正する。これにより、実施形態1と同様の効果を得ることができる。
〔実施形態3〕
(動画像符号化装置の構成)
本発明に係る動画像符号化装置の第三の実施形態について説明する。
(動画像符号化装置の構成)
本発明に係る動画像符号化装置の第三の実施形態について説明する。
まず、本実施形態に係る動画像符号化装置の構成について、以下に説明する。本実施形態における動画像符号化装置の構成は、実施形態1に係る動画像符号化装置200において、図1に示した予測画像生成部1を、異なる機能を有する予測画像生成部1bに置き換えた構成となっている。以下、実施形態1との相違点である、予測画像生成部1bの詳細を説明する。
(予測画像生成部1bの構成)
予測画像生成部1bの構成について、図10を参照して説明する。図10は、本発明の実施形態に係る予測画像生成部1bの要部構成と、各部間のデータの流れを示したブロック図である。
予測画像生成部1bの構成について、図10を参照して説明する。図10は、本発明の実施形態に係る予測画像生成部1bの要部構成と、各部間のデータの流れを示したブロック図である。
図10に示すように、補正方法選択部2b(算出手段、補正手段)以外の部材は、図1を参照して説明した予測画像生成部1が備える部材と共通するため、同一の符号を付与して、詳細な説明を省略する。
(予測画像生成部1bの処理)
図10および図11を参照して、本発明の実施形態に係る予測画像生成部1bの処理について、以下に説明する。
図10および図11を参照して、本発明の実施形態に係る予測画像生成部1bの処理について、以下に説明する。
図11は、本発明の実施形態に係る予測画像生成部1bの処理の流れを示したフローチャートである。
図10に示すように、まず、予測画像候補生成部10に、局所復号画像103と動きベクトル105とが入力される。これらに基づき、動き補償画像生成部14は動き補償画像109を生成する(ステップS50)。つづいて、動き補償画像生成部14は動き補償画像109を、スイッチ4、および動き補償画像補正部11〜13のそれぞれに出力する(ステップS51)。
ここで、実施形態1と異なる点は、動き補償画像109が補正方法選択部2bに入力されておらず、代わりに、動きベクトル105と局所復号画像103とが補正方法選択部2bに入力されている点である。したがって、本実施形態では、補正方法選択部2bは、動きベクトル105と局所復号画像103とを参照して、動き補償画像109を補正する最適な補正方法を選択する。選択基準の詳細は後述する。
なお、動き補償画像109を構成する画素の算出方法については、実施形態1と同様であるため、ここでは説明を省略する。
(スイッチ4)
一方、スイッチ4には、補正フラグ107が入力される。スイッチ4は、入力された補正フラグ107に基づき、動き補償画像109の補正は不要かどうかを判定する(ステップS52)。補正フラグ107が「補正なし」を示しており、補正は不要であると判定した場合、動き補償画像109を予測画像106として、図3に示されている予測画像処理部22の画像比較部31および予測画像候補記録部32に出力する(ステップS61)。
一方、スイッチ4には、補正フラグ107が入力される。スイッチ4は、入力された補正フラグ107に基づき、動き補償画像109の補正は不要かどうかを判定する(ステップS52)。補正フラグ107が「補正なし」を示しており、補正は不要であると判定した場合、動き補償画像109を予測画像106として、図3に示されている予測画像処理部22の画像比較部31および予測画像候補記録部32に出力する(ステップS61)。
一方、補正フラグ107が「補正あり」を示しており、補正は必要であると判定した場合、予測画像生成部1bは以下のステップを実行する。
まず補正方法選択部2bは、動きベクトル105と局所復号画像103とを参照して、符号化対象ブロックにおける上記入力画像100のフレーム間の画素値変化と、当該符号化対象ブロックに隣接する隣接領域における局所復号画像103のフレーム間の画素値変化との関連性を示す指標を算出する。具体的には、処理対象ブロックにおけるフレーム間(すなわち、符号化対象フレームと参照フレームとの間)の画素値変化と、符号化対象ブロックに相当する局所復号画像103上のブロック上辺または左辺に隣接する領域における画素値変化の関連性を数値化した指標を算出する。そして、算出した指標に基づいて複数の補正手段の何れかを選択する。つまり、動き補償画像補正部11〜13のうちのどの補正部を用いて補正を行うか選択する。
補正方法選択部2bは、局所復号画像103の符号化対象ブロックの上辺または左辺に隣接する領域において、フレーム間の画素値変化を計算し(ステップS53)、計算結果に基づいて、最も適切な補正を行う動き補償画像補正部を選択する(ステップS57〜59)。ステップS57〜59の詳細については後述する。ここでいう画素値変化とは、フレーム間で対応する画素の画素値の差分である。
(画素値変化の検出)
補正方法選択部2bが画素値変化をどのように検出するかを、説明する。
補正方法選択部2bが画素値変化をどのように検出するかを、説明する。
補正方法選択部2bは、まず、符号化対象ブロックの上辺と左辺とにそれぞれ隣接する各画素の画素値変化を表すΔSTとΔSLを計算する(ΔSTとΔSLの算出は、実施形態1における動き補償画像補正部11の説明中の式7および式8を参照)。
次に、補正方法選択部2bは、符号化対象ブロック上辺に隣接する領域における画素値変化の大きさATおよび、同ブロック左辺に隣接する領域における画素値変化の大きさALをそれぞれ次の式(式16および17)によって求める。
式16によって求められた画素値変化の大きさATが所定の閾値より大きい場合は、局所復号画像103の符号化対象ブロック上辺に隣接する領域における画素値変化は大きいと判定する。一方、所定の閾値以下の場合は、画素値変化は小さいと判定する。
同様に、式17によって求められた画素値変化の大きさALが所定の閾値より大きい場合、局所復号画像103の符号化対象ブロックの左辺に隣接する領域における画素値変化は小さいと判定する。一方、所定の閾値以下の場合、画素値変化は小さいと判定する。
(動き補償画像補正部の選択)
補正方法選択部2bは、ステップS53において求められた画素値変化の大きさに基づいて、動き補償画像補正部11〜13のうちいずれか最適なものを次の通り選択する。
補正方法選択部2bは、ステップS53において求められた画素値変化の大きさに基づいて、動き補償画像補正部11〜13のうちいずれか最適なものを次の通り選択する。
補正方法選択部2bは、まず、ステップS53において求められた画素値変化の大きさに基づいて、符号化対象ブロック上辺の隣接領域における画素値の変化が大きいかどうかを判定する(ステップS54)。次に同ブロック左辺の隣接領域における画素値の変化が大きいかどうかを判定する(ステップS55およびS56)。
まず、ステップS54においてYes、ステップS55においてNoである場合を考える。具体的には、符号化対象ブロック上辺の隣接領域における画素値の変化が大きく、かつ、同ブロック左辺の隣接領域は画素値の変化が小さいと判定された場合である。
この場合、補正方法選択部2bは、動き補償画像補正部12を選択する(ステップS57)。実施形態1で説明したように、動き補償画像補正部12は、符号化対象ブロックの上辺に隣接する画素の画素値の変化に基づいて補正するので、この場合、最適な動き補償画像補正部であると考えられる。
次に、ステップS54においてNo、ステップS56においてYesである場合を考える。具体的には、符号化対象ブロック上辺に隣接する領域における画素値変化が小さく、かつ、同ブロック左辺に隣接する領域における画素値変化が大きいと判定された場合である。
この場合、補正方法選択部2bは、動き補償画像補正部13を選択する(ステップS59)。実施形態1で説明したように、動き補償画像補正部13は、符号化対象ブロックの左辺に隣接する画素の画素値の変化に基づいて補正するので、この場合、最適な動き補償画像補正部であると考えられる。
つづいて、ステップS54およびステップS55の両方においてYesの場合、または、ステップS54およびステップS56の両方においてNoの場合について説明する。具体的には、符号化対象ブロック上辺に隣接する領域と同ブロック左辺に隣接する領域における画素値変化が、共に大きいか、または、共に小さい場合である。
この場合、補正方法選択部2bは、動き補償画像補正部11を選択する(ステップS58)。実施形態1で説明したように、動き補償画像補正部11は、符号化対象ブロックの上辺および左辺に隣接する画素の画素値の変化に基づいて補正するので、この場合、最適な動き補償画像補正部であると考えられる。
つづいて、動き補償画像補正部11〜13のそれぞれが、動き補償画像109を補正する(ステップS60)。
補正方法選択部2bは、上記の選択結果111をスイッチ3に出力する。
スイッチ3は、動き補償画像補正部11〜13のうち、選択された動き補償画像補正部につながる入力に切替える。これにより、選択された動き補償画像補正部によって補正された動き補償画像109を補正後動き補償画像110としてスイッチ4に出力する。
スイッチ4は、入力される補正フラグ107に応じて、動き補償画像109および補正後動き補償画像110のいずれかを選択する。具体的には、補正フラグ107が、「補正あり」を示していれば、補正後動き補償画像110を選択し、「補正なし」を示していれば、動き補償画像109を選択する。つづいて、選択した画像を予測画像106として、図3に示されている予測画像処理部22の画像比較部31および予測画像候補記録部32に出力する(ステップS61)。
上記のように、予測画像生成部1bは、符号化対象ブロックに相当する局所復号画像103上のブロックの、上辺または左辺に隣接する復号済現画像上の領域における、フレーム間の画素値変化の大きさに基づいて、複数の動き補償画像補正部から、最適な補正方法を用いるものを選択し、これを用いて動き補償画像109を補正する。これにより、実施形態1と同様の効果を得ることができる。
〔実施形態4〕
(動画像符号化装置の構成)
本発明に係る動画像符号化装置の第四の実施形態について説明する。
(動画像符号化装置の構成)
本発明に係る動画像符号化装置の第四の実施形態について説明する。
まず、本実施形態に係る動画像符号化装置の構成について、以下に説明する。本実施形態における動画像符号化装置の構成は、実施形態1に係る動画像符号化装置200において、図1に示した予測画像生成部1を、異なる機能を有する予測画像生成部1cに置き換えた構成となっている。以下、実施形態1との相違点である、予測画像生成部1cの詳細を説明する。
(予測画像生成部1cの構成)
予測画像生成部1cの構成について、図12を参照して説明する。図12は、本発明の実施形態に係る予測画像生成部1cの要部構成と、各部間のデータの流れを示したブロック図である。
予測画像生成部1cの構成について、図12を参照して説明する。図12は、本発明の実施形態に係る予測画像生成部1cの要部構成と、各部間のデータの流れを示したブロック図である。
図12に示すように、補正方法選択部2c(算出手段、補正手段)以外の部材は、図1を参照して説明した予測画像生成部1が備える部材と共通するため、同一の符号を付与して、詳細な説明を省略する。
(予測画像生成部1cの処理)
図12および図13を参照して、本発明の実施形態に係る予測画像生成部1cの処理について、以下に説明する。
図12および図13を参照して、本発明の実施形態に係る予測画像生成部1cの処理について、以下に説明する。
図13は、本発明の実施形態に係る予測画像生成部1cの処理の流れを示したフローチャートである。
図12に示すように、まず、予測画像候補生成部10に、動きベクトル105と局所復号画像103とが入力される。これらに基づき、動き補償画像生成部14は動き補償画像109を生成する(ステップS70)。つづいて、動き補償画像生成部14は動き補償画像109を、スイッチ4、および動き補償画像補正部11〜13のそれぞれに出力する(ステップS71)。
ここで、実施形態1と異なる点は、動き補償画像109が補正方法選択部2cに入力されておらず、代わりに、動きベクトル105が補正方法選択部2cに入力されている点である。したがって、本実施形態では、補正方法選択部2cは、動きベクトル105を参照して、動き補償画像109を補正する最適な補正方法を選択する。選択基準の詳細は後述する。
なお、動き補償画像109を構成する画素の算出方法については、実施形態1と同様であるため、ここでは説明を省略する。
(スイッチ4)
一方、スイッチ4には、補正フラグ107が入力される。スイッチ4は、入力された補正フラグ107に基づき、動き補償画像109の補正は不要かどうかを判定する(ステップS72)。補正フラグ107が「補正なし」を示しており、補正は不要であると判定した場合、動き補償画像109を予測画像106として、図3に示されている予測画像処理部22の画像比較部31および予測画像候補記録部32に出力する(ステップS81)。
一方、スイッチ4には、補正フラグ107が入力される。スイッチ4は、入力された補正フラグ107に基づき、動き補償画像109の補正は不要かどうかを判定する(ステップS72)。補正フラグ107が「補正なし」を示しており、補正は不要であると判定した場合、動き補償画像109を予測画像106として、図3に示されている予測画像処理部22の画像比較部31および予測画像候補記録部32に出力する(ステップS81)。
一方、補正フラグ107が「補正あり」を示しており、補正は必要であると判定した場合、予測画像生成部1cは以下のステップを実行する。
まず補正方法選択部2cは、動きベクトル105を参照して、符号化対象ブロックにおける上記入力画像100のフレーム間の画素値変化と、当該符号化対象ブロックに隣接する隣接領域における局所復号画像103のフレーム間の画素値変化との関連性を示す指標を算出する。具体的には、符号化対象ブロックの動きベクトル105と、同ブロックに隣接する符号化済みブロックの動きベクトル105との類似度(類似性)を数値化した指標を算出する。そして、算出した指標に基づいて複数の補正手段の何れかを選択する。つまり、動き補償画像補正部11〜13のうちのどの補正部を用いて補正を行うかを選択する。
補正方法選択部2cは、符号化対象ブロックの動きベクトル105と、同ブロックの上辺または左辺に隣接する符号化済みブロックの動きベクトルと105の類似度を計算し(ステップS73)、計算結果に基づいて、最も適切な補正を行う動き補償画像補正部を選択する(ステップS77〜79)。ステップS77〜79の詳細については後述する。
(画素値変化の検出)
補正方法選択部2cが画素値変化をどのように検出するかを、説明する。
補正方法選択部2cが画素値変化をどのように検出するかを、説明する。
補正方法選択部2cは、まず、符号化対象ブロックの動きベクトルMCと、同ブロック上辺に隣接する符号化済みブロックの動きベクトルMTとの非類似度SVを求める。非類似度SVの値は次式(式18)によって求められる。
補正方法選択部2cは、さらに、符号化対象ブロックの動きベクトルMCと、同ブロック左辺に隣接する符号化済みブロックの動きベクトルMLとの非類似度SLを求める。非類似度SHの値は次式(式19)によって求められる。
式18によって求められた非類似度SVが所定の閾値より小さい場合は、符号化対象ブロックの動きベクトルと、同ブロック上辺に隣接する符号化済みブロックとの間の動きベクトルは類似していると判定する。一方、所定の閾値以上の場合は、符号化対象ブロックの動きベクトルと、同ブロック上辺に隣接する符号化済みブロックとの間の動きベクトルは類似していないと判定する。
同様に、式19によって求められた非類似度SHが所定の閾値より小さい場合は、符号化対象ブロックの動きベクトルと、同ブロック左辺に隣接する符号化済みブロックとの間の動きベクトルは類似していると判定する。一方、所定の閾値以上の場合は、符号化対象ブロックの動きベクトルと、同ブロック左辺に隣接する符号化済みブロックとの間の動きベクトルは類似していないと判定する。
(動き補償画像補正部の選択)
補正方法選択部2cは、ステップS73において求められた動きベクトルの類似度に基づいて、動き補償画像補正部11〜13のうちいずれか最適なものを次の通り選択する。
補正方法選択部2cは、ステップS73において求められた動きベクトルの類似度に基づいて、動き補償画像補正部11〜13のうちいずれか最適なものを次の通り選択する。
補正方法選択部2cは、まず、ステップS73において求められた動きベクトルの類似度に基づいて、符号化対象ブロックとその上辺に隣接する符号化済みブロックとにおける動きベクトルが類似しているかどうかを判定する(ステップS74)。次に符号化対象ブロックと同ブロック左辺に隣接する符号化済みブロックとにおける動きベクトルが類似しているかどうかを判定する(ステップS75およびS76)。
まず、ステップS74においてYes、ステップS75においてNoである場合を考える。具体的には、符号化対象ブロックにおける動きベクトルと同ブロック上辺に隣接する符号化済みブロックにおける動きベクトルとが類似しており、かつ、符号化対象ブロックにおける動きベクトルと同ブロック左辺に隣接する符号化済みブロックにおける動きベクトルとが類似していないと判定された場合である。
この場合、補正方法選択部2cは、動き補償画像補正部12を選択する(ステップS77)。これは、次のことが言えるからである。符号化対象ブロックにおける動きベクトルとその上辺に隣接する符号化済みブロックにおける動きベクトルとが類似している場合は、符号化対象ブロックと同ブロック上辺に隣接するブロックとが同一オブジェクトに属する可能性が高い。そして、両ブロックが同一オブジェクトに属する場合には、両ブロック間での画素値変化の相関は高い。実施形態1で説明したように、動き補償画像補正部12は、符号化対象ブロックの上辺に隣接する画素の画素値の変化に基づいて補正するので、この場合、最適な動き補償画像補正部であると考えられる。
次に、ステップS74においてNo、ステップS76においてYesである場合を考える。具体的には、符号化対象ブロックにおける動きベクトルと同ブロック上辺に隣接する符号化済みブロックにおける動きベクトルとが類似しておらず、かつ、符号化対象ブロックにおける動きベクトルと同ブロック左辺に隣接する符号化済みブロックにおける動きベクトルとが類似していると判定された場合である。
この場合、補正方法選択部2cは、動き補償画像補正部13を選択する(ステップS79)。これは、次のことが言えるからである。符号化対象ブロックにおける動きベクトルと同ブロック左辺に隣接する符号化済みブロックにおける動きベクトルとが類似している場合は、符号化対象ブロックと同ブロック左辺に隣接するブロックとが同一オブジェクトに属する可能性が高い。そして、両ブロックが同一オブジェクトに属する場合には、両ブロック間での画素値変化の相関は高い。実施形態1で説明したように、動き補償画像補正部13は、符号化対象ブロックの左辺に隣接する画素の画素値の変化に基づいて補正するので、この場合、最適な動き補償画像補正部であると考えられる。
つづいて、ステップS74およびステップS75の両方においてYesの場合、または、ステップS74およびステップS76の両方においてNoの場合について説明する。具体的には、符号化対象ブロックにおける動きベクトルとその上辺に隣接する符号化済みブロックにおける動きベクトルとが類似しており、かつ符号化対象ブロックにおける動きベクトルとその左辺に隣接する符号化済みブロックにおける動きベクトルとが類似している場合、または両方とも類似していない場合である。
この場合、補正方法選択部2cは、動き補償画像補正部11を選択する(ステップS78)。これは、次のことが言えるからである。符号化対象ブロックにおける動きベクトルとその上辺に隣接する符号化済みブロックにおける動きベクトルとが類似しており、かつ符号化対象ブロックにおける動きベクトルとその左辺に隣接する符号化済みブロックにおける動きベクトルとが類似している場合には、符号化対象ブロックと、同ブロックの上辺に隣接する符号化済みブロックおよび左辺に隣接する符号化済みブロックとが同一オブジェクトに属する可能性が高い。実施形態1で説明したように、動き補償画像補正部11は、符号化対象ブロックの上辺および左辺に隣接する画素の画素値の変化に基づいて補正するので、この場合、最適な動き補償画像補正部であると考えられる。一方、符号化対象ブロックにおける動きベクトルとその上辺に隣接する符号化済みブロックにおける動きベクトルとが類似しておらず、かつ符号化対象ブロックにおける動きベクトルとその左辺に隣接する符号化済みブロックにおける動きベクトルとが類似していない場合には、符号化対象ブロックと、同ブロックの上辺または左辺に隣接する符号化済みブロックとが、同一オブジェクトに存在するかどうかを推測できない。すなわち、両ブロック間の画素値変化の相関が測れない。しかしながら、実施形態1で説明したように、動き補償画像補正部11は、符号化対象ブロックの上辺および左辺に隣接する画素の画素値の変化に基づいて補正するので、この場合にも、動き補償画像補正部11は、最適な動き補償画像補正部であると考えられる。
つづいて、動き補償画像補正部11〜13のそれぞれが、動き補償画像109を補正する(ステップS80)。
補正方法選択部2cは、上記の選択結果111をスイッチ3に出力する。
スイッチ3は、動き補償画像補正部11〜13のうち、選択された動き補償画像補正部につながる入力に切替える。これにより、選択された動き補償画像補正部によって補正された動き補償画像109を補正後動き補償画像110としてスイッチ4に出力する。
スイッチ4は、入力される補正フラグ107に応じて、動き補償画像109と補正後動き補償画像110のいずれかを選択する。具体的には、補正フラグ107が、「補正あり」を示していれば、補正後動き補償画像110を選択し、「補正なし」を示していれば、動き補償画像109を選択する。つづいて、選択した画像を予測画像106として、予測残差算出部23と局所復号画像生成部28とに出力する(ステップS81)。
上記のように、予測画像生成部1cは、符号化対象ブロックの上辺または左辺に隣接する復号済現画像上の領域における、フレーム間の動きベクトルの類似度に基づいて、複数の動き補償画像補正部から、最適な補正方法を用いるものを選択し、これを用いて動き補償画像109を補正する。これにより、実施形態1と同様の効果を得ることができる。
本発明は、動画像符号化装置として、映像機器全般に搭載されて幅広く利用できる。たとえば、HDDレコーダ、携帯電話装置の端末などに搭載して実現できる。
1、1a、1b、1c 予測画像生成部
2、2a、2b、2c 補正方法選択部(算出手段)(選択手段)
3 スイッチ
4 スイッチ
10 予測画像候補生成部
11、12、13 動き補償画像補正部(補正手段)
14 動き補償画像生成部
20 画像入力部
21 動き検出部
22 予測画像処理部
23 予測残差算出部
24 直交変換部
25 量子化部
26 逆量子化部
27 逆直交変換部
28 局所復号画像生成部
29 フレームメモリ
200 動画像符号化装置(動画像符号化装置)
201 可変長符号化部
202 符号化データ出力部
30 予測画像選択部
31 画像比較部
32 予測画像候補記録部
51、142 符号化対象ブロック
52、53、141 領域
54 エッジ
700 動画像復号装置(動画像復号装置)
70 符号化データ入力部
71 可変長符号復号部
74 局所復号画像生成部
75 局所復号画像出力部
100 入力画像
101 予測残差
102 変換係数レベル
103 局所復号画像
105、151 動きベクトル
106 予測画像(予測画像)
107 補正フラグ
108 符号化データ
109 動き補償画像(動き補償画像)
110 補正後動き補償画像
111 選択結果
112 評価値R
140 処理対象画像
152 参照ブロック
153 参照ブロック隣接領域
154 符号化対象ブロック隣接領域
2、2a、2b、2c 補正方法選択部(算出手段)(選択手段)
3 スイッチ
4 スイッチ
10 予測画像候補生成部
11、12、13 動き補償画像補正部(補正手段)
14 動き補償画像生成部
20 画像入力部
21 動き検出部
22 予測画像処理部
23 予測残差算出部
24 直交変換部
25 量子化部
26 逆量子化部
27 逆直交変換部
28 局所復号画像生成部
29 フレームメモリ
200 動画像符号化装置(動画像符号化装置)
201 可変長符号化部
202 符号化データ出力部
30 予測画像選択部
31 画像比較部
32 予測画像候補記録部
51、142 符号化対象ブロック
52、53、141 領域
54 エッジ
700 動画像復号装置(動画像復号装置)
70 符号化データ入力部
71 可変長符号復号部
74 局所復号画像生成部
75 局所復号画像出力部
100 入力画像
101 予測残差
102 変換係数レベル
103 局所復号画像
105、151 動きベクトル
106 予測画像(予測画像)
107 補正フラグ
108 符号化データ
109 動き補償画像(動き補償画像)
110 補正後動き補償画像
111 選択結果
112 評価値R
140 処理対象画像
152 参照ブロック
153 参照ブロック隣接領域
154 符号化対象ブロック隣接領域
Claims (11)
- 入力画像と予測画像との差分をブロック毎に符号化する動画像符号化装置であって、
符号化対象ブロックにおける上記入力画像のフレーム間の画素値変化と、該符号化対象ブロックに隣接する隣接領域における局所復号画像のフレーム間の画素値変化との関連性を示す指標を算出する算出手段と、
上記隣接領域に含まれる相異なる領域における上記局所復号画像のフレーム間の画素値変化に基づいて動き補償画像を補正する複数の補正手段と、
上記複数の補正手段のうち何れの補正手段によって補正された動き補償画像を上記予測画像として利用するかを上記指標に基づいて選択する選択手段と、を備えている、ことを特徴とする動画像符号化装置。 - 上記複数の補正手段は、
上記符号化対象ブロックの上辺に隣接する領域における上記局所復号画像のフレーム間の画素値変化に基づいて上記動き補償画像を補正する第1の補正手段と、
上記符号化対象ブロックの左辺に隣接する領域における上記局所復号画像のフレーム間の画素値変化に基づいて上記動き補償画像を補正する第2の補正手段と、
上記符号化対象ブロックの上辺に隣接する領域、及び、上記符号化対象ブロックの左辺に隣接する領域における上記局所復号画像のフレーム間の画素値変化に基づいて上記動き補償画像を補正する第3の補正手段とのうち、2以上の補正手段を含んでいる、ことを特徴とする請求項1に記載の動画像符号化装置。 - 上記算出手段は、上記動き補償画像の画素値を参照して上記指標を算出する、ことを特徴とする請求項1または2に記載の動画像符号化装置。
- 上記指標は、上記動き補償画像におけるエッジ強度、又は、エッジ方向を示す数値である、ことを特徴とする請求項3に記載の動画像符号化装置。
- 上記算出手段は、上記隣接領域における上記局所復号画像の画素値を参照して上記指標を算出する、ことを特徴とする請求項1または2に記載の動画像符号化装置。
- 上記指標は、上記符号化対象ブロックの上辺に隣接する領域における上記局所復号画像の画素値の連続性、及び、上記符号化対象ブロックの左辺に隣接する領域における上記局所復号画像の画素値の連続性を示す数値である、ことを特徴とする請求項5に記載の動画像符号化装置。
- 上記算出手段は、上記隣接領域における上記局所復号画像の画素値変化を参照して上記指標を算出する、ことを特徴とする請求項1または2に記載の動画像符号化装置。
- 上記指標は、上記符号化対象ブロックの上辺に隣接する領域における上記局所復号画像の画素値変化の大きさ、及び、上記符号化対象ブロックの左辺に隣接する領域における上記局所復号画像の画素値変化の大きさを示す数値である、ことを特徴とする請求項7に記載の動画像符号化装置。
- 上記算出手段は、上記符号化対象ブロックの動きベクトルと、該符号化対象ブロックに隣接する符号化済ブロックの動きベクトルとを参照して上記指標を算出する、ことを特徴とする請求項1または2に記載の動画像符号化装置。
- 上記指標は、上記符号化対象ブロックの動きベクトルと該符号化対象ブロックの上辺に隣接する符号化済ブロックの動きベクトルとの類似性、及び、上記符号化対象ブロックの動きベクトルと該符号化対象ブロックの左辺に隣接する符号化済ブロックの動きベクトルとの類似性を示す数値である、ことを特徴とする請求項9に記載の動画像符号化装置。
- 入力画像と予測画像との差分をブロック毎に符号化することによって得られた符号化データを復号する動画像復号装置であって、
復号対象ブロックにおける上記入力画像のフレーム間の画素値変化と、該復号対象ブロックに隣接する隣接領域における局所復号画像のフレーム間の画素値変化との関連性を示す指標を算出する算出手段と、
上記隣接領域に含まれる相異なる領域における上記局所復号画像のフレーム間の画素値変化に基づいて動き補償画像を補正する複数の補正手段と、
上記入力画像を再現するために、上記複数の補正手段のうち何れの補正手段によって補正された動き補償画像を上記予測画像として利用するかを上記指標に基づいて選択する選択手段と、を備えている、ことを特徴とする動画像復号装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008206206 | 2008-08-08 | ||
JP2008206206 | 2008-08-08 | ||
PCT/JP2009/063916 WO2010016534A1 (ja) | 2008-08-08 | 2009-08-06 | 動画像符号化装置および動画像復号装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPWO2010016534A1 true JPWO2010016534A1 (ja) | 2012-01-26 |
Family
ID=41663751
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010523884A Withdrawn JPWO2010016534A1 (ja) | 2008-08-08 | 2009-08-06 | 動画像符号化装置および動画像復号装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20110135006A1 (ja) |
EP (1) | EP2315446A4 (ja) |
JP (1) | JPWO2010016534A1 (ja) |
CN (1) | CN102106149A (ja) |
WO (1) | WO2010016534A1 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8126046B2 (en) * | 2006-06-30 | 2012-02-28 | Intel Corporation | Flexible macroblock ordering and arbitrary slice ordering apparatus, system, and method |
US20090225867A1 (en) * | 2008-03-06 | 2009-09-10 | Lee Kun-Bin | Methods and apparatus for picture access |
CN102823248B (zh) | 2010-04-08 | 2015-06-24 | 株式会社东芝 | 图像编码方法以及图像编码装置 |
CN107454420B (zh) * | 2010-12-13 | 2020-08-07 | 韩国电子通信研究院 | 基于帧间预测对视频信号进行解码的方法 |
JP2012169762A (ja) | 2011-02-10 | 2012-09-06 | Sony Corp | 画像符号化装置と画像復号化装置およびその方法とプログラム |
US8259161B1 (en) * | 2012-02-06 | 2012-09-04 | Google Inc. | Method and system for automatic 3-D image creation |
CN109905710B (zh) * | 2012-06-12 | 2021-12-21 | 太阳专利托管公司 | 动态图像编码方法及装置、动态图像解码方法及装置 |
JP5972687B2 (ja) * | 2012-07-02 | 2016-08-17 | 株式会社Nttドコモ | 動画像予測符号化装置、動画像予測符号化方法、動画像予測符号化プログラム、動画像予測復号装置、動画像予測復号方法及び動画像予測復号プログラム |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2938412B2 (ja) | 1996-09-03 | 1999-08-23 | 日本電信電話株式会社 | 動画像の輝度変化補償方法、動画像符号化装置、動画像復号装置、動画像符号化もしくは復号プログラムを記録した記録媒体および動画像の符号化データを記録した記録媒体 |
US6266370B1 (en) * | 1996-09-03 | 2001-07-24 | Nippon Telegraph And Telephone Corporation | Brightness-variation compensation method and coding/decoding apparatus for moving pictures |
JP2001231045A (ja) * | 2000-02-15 | 2001-08-24 | Nec Corp | 動画像符号化および復号化装置 |
KR100579542B1 (ko) * | 2003-07-29 | 2006-05-15 | 삼성전자주식회사 | 블럭 간의 상관성을 고려한 움직임 추정 장치 및 방법 |
JP4257789B2 (ja) * | 2004-02-27 | 2009-04-22 | Kddi株式会社 | 動画像符号化装置 |
CN100409689C (zh) * | 2004-08-05 | 2008-08-06 | 中兴通讯股份有限公司 | 用于提高视频质量的错误掩蔽方法 |
EP1874059A4 (en) * | 2005-03-22 | 2011-05-04 | Panasonic Corp | CODING DEVICE AND DYNAMIC IMAGE RECORDING SYSTEM WITH THE CODING DEVICE |
CN101218829A (zh) * | 2005-07-05 | 2008-07-09 | 株式会社Ntt都科摩 | 动态图像编码装置、动态图像编码方法、动态图像编码程序、动态图像解码装置、动态图像解码方法以及动态图像解码程序 |
JP2007043651A (ja) * | 2005-07-05 | 2007-02-15 | Ntt Docomo Inc | 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、動画像復号装置、動画像復号方法及び動画像復号プログラム |
JP5061179B2 (ja) * | 2006-03-22 | 2012-10-31 | 韓國電子通信研究院 | 照明変化補償動き予測符号化および復号化方法とその装置 |
US9456223B2 (en) * | 2006-10-18 | 2016-09-27 | Thomson Licensing | Local illumination and color compensation without explicit signaling |
CN101529918B (zh) * | 2006-10-30 | 2011-08-03 | 日本电信电话株式会社 | 预测参照信息生成方法、活动图像的编码及解码方法及其装置 |
-
2009
- 2009-08-06 WO PCT/JP2009/063916 patent/WO2010016534A1/ja active Application Filing
- 2009-08-06 US US13/057,644 patent/US20110135006A1/en not_active Abandoned
- 2009-08-06 CN CN2009801296166A patent/CN102106149A/zh active Pending
- 2009-08-06 JP JP2010523884A patent/JPWO2010016534A1/ja not_active Withdrawn
- 2009-08-06 EP EP09805017A patent/EP2315446A4/en not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
EP2315446A1 (en) | 2011-04-27 |
US20110135006A1 (en) | 2011-06-09 |
EP2315446A4 (en) | 2011-12-28 |
WO2010016534A1 (ja) | 2010-02-11 |
CN102106149A (zh) | 2011-06-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2770185C2 (ru) | Множество кандидатов предсказателя для компенсации движения | |
US11677973B2 (en) | Merge with MVD for affine | |
CN113709465B (zh) | 一种编解码方法、装置及其设备 | |
US10110918B2 (en) | Video prediction encoding device, video prediction encoding method, video prediction decoding device and video prediction decoding method | |
US8503532B2 (en) | Method and apparatus for inter prediction encoding/decoding an image using sub-pixel motion estimation | |
US8204127B2 (en) | Method and apparatus for encoding and decoding image by using multiple reference-based motion prediction | |
JP5321426B2 (ja) | 画像符号化装置、画像復号化装置、画像符号化方法、及び画像復号化方法 | |
WO2010016534A1 (ja) | 動画像符号化装置および動画像復号装置 | |
WO2020073937A1 (en) | Intra prediction for multi-hypothesis | |
US8229233B2 (en) | Method and apparatus for estimating and compensating spatiotemporal motion of image | |
US11818383B2 (en) | Methods and apparatuses of combining multiple predictors for block prediction in video coding systems | |
JP2008278091A (ja) | 動画像記録方法及びその装置 | |
KR20120027145A (ko) | 화상 처리 장치 및 방법 | |
JP5230798B2 (ja) | 符号化及び復号化方法、コーダ及びデコーダ | |
WO2014073173A1 (ja) | 映像符号化方法、映像符号化装置および映像符号化プログラム | |
US11785242B2 (en) | Video processing methods and apparatuses of determining motion vectors for storage in video coding systems | |
WO2022196133A1 (ja) | 符号化装置及び方法 | |
JP2022145499A (ja) | 符号化装置及び方法 | |
CN111247804B (zh) | 图像处理的方法与装置 | |
JPH10145795A (ja) | 動画像符号化方法、復号方法、動画像符号化装置および動画像復号装置 | |
JP2008283302A (ja) | 動画像処理装置及び動画像処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120803 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20120913 |