JP4875007B2 - 動画像符号化装置、動画像符号化方法、及び、動画像復号化装置 - Google Patents

動画像符号化装置、動画像符号化方法、及び、動画像復号化装置 Download PDF

Info

Publication number
JP4875007B2
JP4875007B2 JP2008024212A JP2008024212A JP4875007B2 JP 4875007 B2 JP4875007 B2 JP 4875007B2 JP 2008024212 A JP2008024212 A JP 2008024212A JP 2008024212 A JP2008024212 A JP 2008024212A JP 4875007 B2 JP4875007 B2 JP 4875007B2
Authority
JP
Japan
Prior art keywords
correlation
block
threshold
picture
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008024212A
Other languages
English (en)
Other versions
JP2008219876A (ja
Inventor
チョンソン リム
ワハダニア ビクター
ハン ブーン テオ
陽司 柴原
孝啓 西
敏康 杉尾
一也 高木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2008024212A priority Critical patent/JP4875007B2/ja
Publication of JP2008219876A publication Critical patent/JP2008219876A/ja
Application granted granted Critical
Publication of JP4875007B2 publication Critical patent/JP4875007B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/16Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter for a given display mode, e.g. for interlaced or progressive display mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/19Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/567Motion estimation based on rate distortion criteria

Description

本発明はあらゆるマルチメディアデータの符号化の際、特に、画面内ピクチャ符号化を用いる動画像の符号化の際に生じるパルシング歪みを削減するための動画像符号化装置、動画像符号化方法、及び、動画像復号化装置に関する。
一般に、ISO/IEC14496‐2パート10国際標準規格のような動画像符号化アルゴリズムの多くは、連続した画面間予測ピクチャからなるグループの始点で、キーピクチャとしても知られる画面内ピクチャを符号化するものである。画面内符号化ピクチャは、隣接するピクチャに依存して復号化されるのではない自己完結型のピクチャである。これは、動画像デコーダが、圧縮動画像ストリームにおけるある画面内符号化ピクチャに先行するピクチャを復号化することなく、当該画面内ピクチャを含む特定のピクチャグループ(GOP)および当該画面内ピクチャに続く画面間予測ピクチャを独立的に復号化するためのアクセスポイントとして時折用いられる。符号化動画像シーケンスは、ランダムアクセスや符号化動画像シーケンスの一部の復号化を容易にする数個のピクチャグループからなることがある。
「パルシング」の影響とは、ある画面内ピクチャの符号化画質が当該画面内ピクチャ以前の画面間ピクチャの画質とは異なる場合に発生する歪みである。言い換えると、パルシング歪みは、あるピクチャグループから別のピクチャグループへの移行部分に発生する。複数のピクチャグループからなる符号化動画像シーケンスにおいて、パルシング歪みは、画面内ピクチャの画質が異なることによりピクチャグループの周期ごとに発生する「パルス」状に見えるものである。パルシングの影響は、特に動画像シーケンスが非常に高い圧縮率で符号化された場合に、ピクチャ内の動きが小さい領域でより目立つ。図1は、動画像シーケンスにおいて、パルシング歪みが発生するであろう場所の例を示す。同図に示されるように、パルシング歪みは、ふたつの異なるGOP間のGOP境界に発生する。
パルシングの影響を軽減するために、ある従来技術においては、画面内ピクチャの画質を制御するためのレート制御アルゴリズムが用いられている。通常、パルシングの影響は、画面内ピクチャが過度に圧縮された場合に生じる。そのため、パルシングの影響を軽減する方法のひとつとして、画面間ピクチャの圧縮率を上げつつ、画面内ピクチャの圧縮率を下げる方法がある。
また、特許文献1には、符号化処理によりパルシングなどの符号化歪みを含んだ画像を復号化した後に、時間方向のフィルタ処理を実行することで、歪みを削減させる技術が示されている。
特開平9−130648号公報
しかしながら、上記従来技術において、圧縮率を上げて画面間ピクチャの画質を低下させると、ブロッキングやリンギングなどの別の歪みが増加する結果になる。すなわち、上記従来技術では、パルシング歪みを削減したとしても、他の歪みが増加してしまい、結果として、視覚的な画質を向上させることはできないという課題がある。
パルシングの影響は、特にISO/IEC14496‐2パート10国際標準規格のような動画像符号化アルゴリズムを用いて高い圧縮率で圧縮された動画像において目立つ歪みである。当該圧縮動画像の画質を改善するためには、当該動画像を符号化する前か復号化した後に、歪みを削減する必要がある。パルシングの影響を軽減するために画面内ピクチャの圧縮率を下げる当該従来技術においては、ピクチャグループとしてある圧縮率を維持するために、高い圧縮率を用いた画面間ピクチャの画質を低下させることになるという問題がある。それゆえ、当該従来技術は、ピクチャグループ間の境界におけるパルシングの影響を軽減するものの、ピクチャグループ内の画面間ピクチャにより多くの歪みを発生させている。
また、特許文献1に記載の技術では、復号化処理を行わないとパルシング歪みを削減することができない。符号化された画像データはパルシング歪みを含んだままであるため、特許文献1に記載された技術の搭載されていない他の復号化装置などで該画像データを復号化する場合、歪みを削減することができないという課題がある。
そこで、本発明は、他の歪みを増加させることなく、ピクチャグループ間の、特に移行部分で発生するパルシング歪みを削減し、視覚的な画質を向上させる動画像符号化装置及び方法を提供することを目的とする。さらに、符号化処理においてパルシング歪みを削減することのできる動画像符号化装置及び方法を提供することを目的とする。
上記課題を解決するため、本発明は、パルシング歪みを削減するための動画像符号化装置であって、複数の原画像からなる原画像シーケンス内の第1原画像に含まれる1画素以上の画素からなる第1ブロックと、前記第1原画像に先行する第2原画像に含まれる1画素以上の画素からなる第2ブロック又は前記第2ブロックを符号化及び再構成することで得られる第3ブロックとの相関を算出する相関算出手段と、前記相関が予め定められた第1閾値を超えるか否かを判定し、前記第1閾値を超えた場合に前記相関が高いと判定する相関判定手段と、前記相関判定手段において前記相関が高いと判定された場合に、前記第1ブロックと前記第3ブロックとを合成することで、前記パルシング歪みを削減する合成手段とを備える。
これにより、他の歪みを増加させることなく、2つのピクチャグループ間の、特に移行部分で発生するパルシング歪みを削減することができる。また、符号化及び復号化のいずれの処理においてもパルシング歪みを削減することができる。よって、視覚的な画質を向上させることができる。
また、本発明は、動画像符号化装置として実現できるだけでなく、動画像復号化装置としても実現できる。本発明の動画像復号化装置は、パルシング歪みを削減するための動画像復号化装置であって、符号化された複数のピクチャを復号化することで得られる複数の復号化ピクチャからなる復号化動画像シーケンスを出力する復号化手段と、前記復号化動画像シーケンス内の第1復号化ピクチャに含まれる1画素以上の画素からなる第1ブロックと、前記第1復号化ピクチャに先行する第2復号化ピクチャに含まれる1画素以上の画素からなる第2ブロックとの相関を算出する相関算出手段と、前記相関が予め定められた第1閾値を超えるか否かを判定し、前記第1閾値を超えた場合に前記相関が高いと判定する相関判定手段と、前記相関判定手段において前記相関が高いと判定された場合に、前記第1ブロックと前記第2ブロックとを合成することで、前記パルシング歪みを削減する合成手段とを備える。
なお、本発明は、装置として実現できるだけでなく、その装置を構成する処理手段をステップとする方法としても実現できる。また、各処理ステップをコンピュータに実行させるプログラムとして実現することができる。
本発明の効果は、ふたつの独立したピクチャグループ間の、特に移行部分で、圧縮動画像シーケンスのパルシング歪みを削減することである。当該効果は、視覚的な画質の向上という形で現れる。
(第1の実施の形態)
本発明の第1の実施の形態は、動画像シーケンスを符号化する前の前処理モジュールとして用いることができる。パルシング歪み削減処理には3つのステップがある。第1のステップでは、符号化対象原画像と、該符号化対象原画像に時間的に先行する先行原画像との相関を算出する。第2のステップでは、第1のステップで算出された相関が高いか否かを判定する。第3のステップでは、第2のステップで相関が高いと判定された場合に、先行原画像を符号化し再構成することで得られる先行再構成ピクチャと対象原画像とを合成する。以上の3つのステップは、全て1画素以上の画素の集まりであるブロック単位で実行される。なお、以上の処理は、1画素単位で処理を実行してもよく、1枚のピクチャ単位、スライス単位、マクロブロック単位などで実行してもよい。
図2は、本発明の第1の実施の形態におけるパルシング歪み削減処理を説明するための図である。
本実施の形態では、画面内予測符号化の対象となる対象原画像に時間的に先行する先行原画像を参照ピクチャとして選択し、対象原画像と先行原画像との相関を算出する。そして、対象原画像と先行原画像との相関が高いと判定された場合に、対象原画像と先行再構成ピクチャとを合成する。そして、合成されたピクチャを画面内予測符号化し、対象GOPの先頭ピクチャとする。つまり、図2に示すように、相関算出処理は、原画像を対象にして実行される。合成処理は、原画像と再構成ピクチャとを対象にして実行される。
図3は、本発明の第1の実施の形態における動画像符号化処理のフローチャートである。同図に示されるように、N×Mの非圧縮原画サンプルブロックは、モジュール200において符号化対象の非圧縮原画ピクチャから得られる。この原画サンプルブロックが、上述の符号化対象原画像のサンプルブロックである。ここで、Nは幅におけるピクセル数を表し、Mは高さにおけるピクセル数を表す。NおよびMの値の例は、それぞれ16である。
モジュール200で得られるN×Mの非圧縮原画サンプルブロックは、画面内予測符号化の対象となる原画像である(原画像を画面内予測符号化することで得られるピクチャをIピクチャと称する)。本実施の形態では、Iピクチャは、15枚に1枚の割合で形成される。すなわち、GOPは、Iピクチャを先頭ピクチャとする15枚のピクチャから構成される。したがって、本実施の形態では、15枚に1枚の割合で原画像を選択することで、パルシング歪みが生じやすい画面内予測符号化されるピクチャに対して、相関算出及びピクチャ合成処理を実行することができる。
なお、Iピクチャの出現する割合などは、応用例(テレビ放送、DVDレコーダ、携帯電話向けコンテンツ)などによって柔軟に変更される。そのため、本実施の形態の相関算出及びピクチャ合成処理を行う対象となる原画像の選択方法も、Iピクチャの出現する割合に応じて柔軟に変更してよい。以下、異なる実施の形態においても同様である。
次に、モジュール202において、参照ピクチャは、モジュール204に示されるようにピクチャメモリに格納された原画のピクチャグループから選択される。この参照ピクチャが、上述の先行原画像である。この場合のピクチャは、フレームピクチャまたはフィールドピクチャとすることができる。本実施の形態の一例として、符号化対象ピクチャがフレームピクチャである場合、参照フレームは、当該符号化対象ピクチャに対し時間的に直近の参照フレームピクチャであるという基準に基づいて選択される。符号化対象ピクチャがフィールドピクチャである場合、当該符号化対象フィールドピクチャと同じフィールドパリティを有する直近の参照フィールドピクチャが選択される。
モジュール206において、N×Mの非圧縮原画サンプルブロックの動きベクトルセットを導き出すために、選択された参照ピクチャに対し動き検出ステップがおこなわれる。モジュール208において、N×Mの予測サンプルブロックを導き出すために、導き出された動きベクトルに基づいて動き補償ステップがおこなわれる。
モジュール210において、導き出されたN×Mの予測サンプルブロックのサンプル値とN×Mの原画サンプルブロックのサンプル値との差分絶対値和によって変化する式に基づいて、コスト値が求められる。コスト値は、対象原画像と先行原画像との相関の程度を示す値の一例である。コスト値を求める式の一例は、
Figure 0004875007
ここで、SADとは予測サンプルと原画サンプルとの差分絶対値和であり、Lambdaは固定値であり、MVCostは、導き出された動きベクトルに左右される要素Costを表す。Lambdaの値は0になることがあり、その場合、要素MVCostは、無視してもよい。
以上のモジュール200〜210に示す処理が実行されることで、対象原画像と先行原画像との相関が算出される。数1に示すように、コスト値が小さいほど、相関が高いことを示す。
モジュール212において、モジュール206から導き出された動きベクトルの絶対値は、予め定められた第1閾値と比較される。例えば、所定の第1閾値はある整数である。次に、モジュール214において、モジュール210から求められたコストは、予め定められた第2閾値と比較される。例えば、所定の第2閾値はある整数である。
モジュール216に示されるように、動きベクトルの全要素の絶対値が所定の第1閾値より小さく、かつ、求められたコストが所定の第2閾値より小さい場合、モジュール218に示されるように、N×Mの原画サンプルブロックに対し、ピクチャ合成処理がおこなわれる。
動きベクトルのいずれかの要素の絶対値が所定の第1閾値より大きい、若しくは求められたコストが所定の第2閾値より大きい場合、モジュール222に示されるように、求められたコストは予め定められた第3閾値と比較される。例えば、所定の第3閾値はある整数である。
ここで、モジュール212、214及び216における処理は、動きベクトルの絶対値に応じて、コストの閾値を変更するための処理である。すなわち、本発明の第1の実施の形態では、先行原画像と対象原画像との間の動きの大小に応じて、相関が高いと判定するための閾値を変更する。
動きが大きい箇所については、ピクチャを合成することで画像ぼけなどが生じ、かえって画質を劣化させてしまう恐れがある。したがって、動きが大きい箇所では、相関が高いと判断するための閾値を大きく設定する(コストの閾値を小さく設定する)ことで、ピクチャの合成処理を行うための相関の判断基準を厳格にすることができる。
これに対して、動きが小さい箇所については、ピクチャを合成することによる画像ぼけの発生は少ない。したがって、動きが小さい箇所では、相関が高いと判断するための閾値を小さく(コストの閾値を大きく設定する)することで、ピクチャの合成処理を行うための相関の判断基準を和らげることができる。
以上のことから、対象原画像のサンプルブロックの動きが大きい場合、すなわち、動きベクトルの絶対値が第1閾値より大きい場合、コストの閾値を第2閾値に設定する。これに対して、対象原画像のサンプルブロックの動きが小さい場合、すなわち、動きベクトルの絶対値が第1閾値より小さい場合、コストの閾値を第2閾値より大きい第3閾値に設定する。
これにより、動きが小さい箇所で合成処理が行われるように相関を算出することができる。
以上のモジュール212〜216及び222が示す処理が実行されることで、対象原画像と先行原画像との相関が高いか否かが判定される。すなわち、本実施の形態では、数1で示されるコスト値が閾値より小さいか否かが判定される。
求められたコストがモジュール224における所定の第3閾値より小さい場合、モジュール218においてN×Mの符号化対象ブロックに対しピクチャ合成処理がおこなわれる。さもなくば、N×Mの原画サンプルブロックに対し当該ピクチャ合成処理はおこなわれず、当該N×Mの原画サンプルブロックは、モジュール220において、画像符号化ツールを用いて符号化される。そのようなツールの例としては、空間予測ツール、直交変換ツール、量子化ツールおよびエントロピー符号化ツールなどがある。
当該ピクチャ合成処理は、下記の式に基づき、N×Mの予測サンプルブロックとN×Mの原画サンプルブロックとを合体させるステップに関する。
Figure 0004875007
ここで、O[N,M]はN×Mの原画サンプルブロックを表し、P[N,M]はN×Mの予測サンプルブロックを表し、Mod[N,M]はN×Mの修正サンプルブロックを表す。W1およびW2は、原画サンプルブロックおよび予測サンプルブロックをどの程度の割合で加算するかを決定する重み係数である。Kは、オフセット値であり、Sは、2進数表現で表されるMod[N,M]を右へシフトさせる数を示す。W1、W2、KおよびSの値は、全て整数である。W1、W2、KおよびSの値の例は、それぞれ1である。
当該ピクチャ合成処理において用いられるN×Mの予測サンプルブロックは、モジュール208の出力であってもよいし、モジュール208とは異なる動きベクトルセットと参照ピクチャとを用いた、別の動き補償ステップの結果であってもよい。
当該ピクチャ合成処理からのN×Mの修正サンプルブロックは、その後、モジュール220において、画像符号化ツールを用いて符号化される。そのようなツールの例としては、空間予測ツール、直交変換ツール、量子化ツールおよびエントロピー符号化ツールなどがある。
図4は、本発明の第1の実施の形態における装置を示す。当該装置は、ピクチャメモリ300、参照ピクチャ選択部302、動き検出部304、動き補償部306、動きベクトル比較部308、コスト演算部310、ふたつのコスト比較部312および314、ふたつのスイッチ部316および318、ピクチャ合成部320、画像符号化部322およびエントロピー符号化部324を備える。
参照ピクチャ選択部302は、符号化対象ピクチャ情報D2および参照ピクチャ情報D4を受信し、直近の時間距離に基づいて適切な参照ピクチャを選択し、参照インデックスD5を動き検出部304に出力する。N×Mの原画サンプルブロックD1は、入力Vinとして受信される。動き検出部304は、N×Mの原画サンプルブロックD1、参照インデックスD5および参照ピクチャD3を受信する。これは、動きベクトルセットD6を出力する。NおよびMの値の例は、それぞれ16である。
動きベクトル比較部308は、動きベクトルセットD6を取り、これを予め定められた第1閾値と比較し、信号D9を出力する。動きベクトルの全要素の絶対値が当該所定の第1閾値より全て小さい場合、信号D9は1に設定される。さもなければ、信号D9は0に設定される。
動き補償部306は、その後、参照インデックスD5、動きベクトルセットD6および参照ピクチャD3を取る。これは、N×Mの予測サンプルブロックD7を出力する。コスト演算部310は、N×Mの予測サンプルブロックD7、N×Mの原画サンプルブロックD1および動きベクトルセットD6を取る。これは、コスト値D8をコスト比較部312に出力する。コスト比較部312は、コスト値D8を取り、これを所定の第2閾値と比較し、信号D10をスイッチ部316に出力する。求められたコストが当該所定の第2閾値より全て小さい場合、信号D10は1に設定される。さもなければ、信号D10は0に設定される。
スイッチ部316は、信号D10およびD9次第で、入力D1へ出力D12か出力D13を接続する。信号D10およびD9の両方が1であれば、D12がD1に接続され、1でなければ、D13がD1に接続される。
コスト比較部314は、コスト値D8を取り、これを所定の第3閾値と比較し、信号D11を第2スイッチ部318に出力する。求められたコストが当該所定の第3閾値より小さい場合、信号D11は1に設定される。小さくなければ、信号D11は0に設定される。
スイッチ部318は、信号D11次第で、入力D13へ出力D14か出力D15を接続する。信号D11が1であれば、D14がD13に接続され、1でなければ、D15がD13に接続される。
ピクチャ合成部320は、次の入力のうちいずれかを取る。すなわち、それはN×Mの予測サンプルブロックD7および信号D14またはD12として示されたN×Mの原画サンプルブロックである。ピクチャ合成部320は、ピクチャ合成処理をおこなう。ピクチャ合成部は、その後、N×Mの修正サンプルブロックD16を画像符号化部322に出力する。画像符号化部は、信号D16またはD15として示されたN×Mのサンプルブロックを取り、N×Mの量子化残差ブロックD17をエントロピー符号化部324に出力する。最後に、エントロピー符号化部324は、N×Mの量子化残差ブロックを符号化し、圧縮ビットストリームVoutを出力する。
以上のように、本発明の第1の実施の形態によれば、画面内予測符号化の対象となる対象原画像と先行原画像との相関が高いと判定された場合に、対象原画像と先行再構成ピクチャとの合成処理を実行する。これにより、先行するGOPの符号化の特徴を対象GOPに引き継ぐことが可能となり、2つのGOP間で生じるパルシング歪みを削減することができる。よって、視覚的な画質を向上させることができる。
(第2の実施の形態)
本発明の第2の実施の形態は、動画像シーケンスを符号化する前の前処理モジュールとして用いることができる。パルシング歪み削減処理には3つのステップがある。第1のステップでは、符号化対象原画像と、該符号化対象原画像に時間的に先行する先行原画像を符号化し再構成することで得られる先行再構成ピクチャとの相関を算出する。第2のステップでは、第1のステップで算出された相関が高いか否かを判定する。第3のステップでは、第2のステップで相関が高いと判定された場合に、対象原画像と先行再構成ピクチャとを合成する。以上の3つのステップは、第1の実施の形態と同様、全て1画素以上の画素の集まりであるブロック単位で実行される。
図5は、本発明の第2の実施の形態におけるパルシング歪み削減処理を説明するための図である。
本実施の形態では、画面内予測符号化の対象となる対象原画像に時間的に先行する先行原画像を符号化し再構成することで得られる先行再構成ピクチャを、参照ピクチャとして選択し、対象原画像と先行再構成ピクチャとの相関を算出する。そして、対象原画像と先行再構成ピクチャとの相関が高いと判定された場合に、対象原画像と先行再構成ピクチャとを合成する。そして、合成されたピクチャを画面内予測符号化し、対象GOPの先頭ピクチャとする。つまり、図5に示すように、相関算出処理及び合成処理は、原画像と再構成ピクチャとを対象にして実行される。
図6は、本発明の第2の実施の形態における動画像符号化処理のフローチャートである。同図に示されるように、N×Mの非圧縮原画サンプルブロックは、モジュール400において符号化対象の非圧縮原画ピクチャから得られる。この原画サンプルブロックが、上述の符号化対象原画像のサンプルブロックである。ここで、Nは幅におけるピクセル数を表し、Mは高さにおけるピクセル数を表す。NおよびMの値の例は、それぞれ16である。
本発明の第2の実施の形態は、モジュール402において、原画のピクチャグループから参照ピクチャを選択する代わりに再構成ピクチャグループから参照ピクチャを選択するという点を除いて、第1の実施の形態と同様である。すなわち、第1の実施の形態では、原画像同士の相関を算出したのに対して、第2の実施の形態では、原画像と再構成ピクチャとの相関を算出する点が異なる。
モジュール402において、参照ピクチャは、モジュール404に示されるようにピクチャメモリに格納された再構成ピクチャグループから選択される。この参照ピクチャが、上述の先行再構成ピクチャである。この場合のピクチャは、フレームピクチャまたはフィールドピクチャとすることができる。本実施の形態の一例として、符号化対象ピクチャがフレームピクチャである場合、参照フレームは、当該符号化対象ピクチャに対し時間的に直近の参照フレームピクチャであるという基準に基づいて選択される。符号化対象ピクチャがフィールドピクチャである場合、当該符号化対象フィールドピクチャと同じフィールドパリティを有する直近の参照フィールドピクチャが選択される。
モジュール406において、N×Mの非圧縮原画サンプルブロックの動きベクトルセットを導き出すために、選択された参照ピクチャに対し動き検出ステップがおこなわれる。モジュール408において、N×Mの予測サンプルブロックを導き出すために、導き出された動きベクトルに基づいて動き補償ステップがおこなわれる。
モジュール410において、導き出されたN×Mの予測サンプルブロックのサンプル値とN×Mの原画サンプルブロックのサンプル値との差分絶対値和によって変化する式に基づいて、コスト値が求められる。コスト値は、対象原画像と先行再構成ピクチャとの相関の程度を示す値の一例である。コスト値を求める式の一例は、
Figure 0004875007
ここで、SADとは予測サンプルと原画サンプルとの差分絶対値和であり、Lambdaは固定値であり、MVCostは、導き出された動きベクトルに左右される要素Costを表す。Lambdaの値は0になることがあり、その場合、要素MVCostは、無視してもよい。
以上のモジュール400〜410に示す処理が実行されることで、対象原画像と先行再構成ピクチャとの相関が算出される。数3に示すように、コスト値が小さいほど、相関が高いことを示す。
モジュール412において、モジュール406から導き出された動きベクトルの絶対値は、予め定められた第1閾値と比較される。例えば、所定の第1閾値はある整数である。次に、モジュール414において、モジュール410から求められたコストは、予め定められた第2閾値と比較される。例えば、所定の第2閾値はある整数である。
モジュール416に示されるように、動きベクトルの全要素の絶対値が所定の第1閾値より小さく、かつ、求められたコストが所定の第2閾値より小さい場合、モジュール418に示されるように、N×Mの原画サンプルブロックに対し、ピクチャ合成処理がおこなわれる。
動きベクトルのいずれかの要素の絶対値が所定の第1閾値より大きい、若しくは求められたコストが所定の第2閾値より大きい場合、モジュール422に示されるように、求められたコストは予め定められた第3閾値と比較される。例えば、所定の第3閾値はある整数である。
ここで、モジュール412、414及び416における処理は、動きベクトルの絶対値に応じて、コストの閾値を変更するための処理である。すなわち、本発明の第2の実施の形態では、先行再構成ピクチャと対象原画像との間の動きの大小に応じて、相関が高いと判定するための閾値を変更する。
第1の実施の形態と同様に、対象原画像のサンプルブロックの動きが大きい場合、すなわち、動きベクトルの絶対値が第1閾値より大きい場合、コストの閾値を第2閾値に設定する。これに対して、対象原画像のサンプルブロックの動きが小さい場合、すなわち、動きベクトルの絶対値が第1閾値より小さい場合、コストの閾値を第2閾値より大きい第3閾値に設定する。これにより、動きが小さい箇所で合成処理が行われるように相関を算出することができる。
以上のモジュール412〜416及び422が示す処理が実行されることで、対象原画像と先行再構成ピクチャとの相関が高いか否かが判定される。すなわち、本実施の形態では、数3で示されるコスト値が閾値より小さいか否かが判定される。
求められたコストがモジュール424における所定の第3閾値よりも小さい場合、モジュール418においてN×Mの原画サンプルブロックに対しピクチャ合成処理がおこなわれる。さもなくば、N×Mの原画サンプルブロックに対し当該ピクチャ合成処理はおこなわれず、当該N×Mの原画サンプルブロックは、モジュール420において、画像符号化ツールを用いて符号化される。そのようなツールの例としては、空間予測ツール、時間予測ツール、直交変換ツール、量子化ツールおよびエントロピー符号化ツールなどがある。
当該ピクチャ合成処理は、下記の式に基づき、N×Mの予測サンプルブロックとN×Mの原画サンプルブロックとを合体させるステップに関する。
Figure 0004875007
ここで、O[N,M]はN×Mの原画サンプルブロックを表し、P[N,M]はN×Mの予測サンプルブロックを表し、Mod[N,M]はN×Mの修正サンプルブロックを表す。W1およびW2は、原画サンプルブロックおよび予測サンプルブロックをどの程度の割合で加算するかを決定する重み係数である。Kは、オフセット値であり、Sは、2進数表現で表されるMod[N,M]を右へシフトさせる数を示す。W1、W2、KおよびSの値は、全て整数である。W1、W2、KおよびSの値の例は、それぞれ1である。
当該ピクチャ合成処理において用いられるN×Mの予測サンプルブロックは、モジュール408の出力であってもよいし、モジュール208とは異なる動きベクトルセットと参照ピクチャとを用いた、別の動き補償ステップの結果であってもよい。
当該ピクチャ合成処理からのN×Mの修正サンプルブロックは、その後、モジュール420において、画像符号化ツールを用いて符号化される。そのようなツールの例としては、空間予測ツール、時間予測ツール、直交変換ツール、量子化ツールおよびエントロピー符号化ツールなどがある。
モジュール426において、N×Mの符号化サンプルブロックは、画像復号化ツールを用いて再構成され、モジュール428において再構成ピクチャメモリに格納される。そのような画像復号化ツールの例としては、空間予測ツール、時間予測ツール、逆直交変換ツール、逆量子化ツールおよびエントロピー復号化ツールなどがある。
図7は、本発明の第2の実施の形態における装置を示す。当該装置は、ピクチャメモリ500、参照ピクチャ選択部502、動き検出部504、動き補償部506、動きベクトル比較部508、コスト演算部510、ふたつのコスト比較部512および514、ふたつのスイッチ部516および518、ピクチャ合成部520、画像符号化部522およびエントロピー符号化部524、および画像復号化部526を備える。
参照ピクチャ選択部502は、符号化対象ピクチャ情報D2および参照ピクチャ情報D4を受信し、直近の時間距離に基づいて適切な参照ピクチャを選択し、参照インデックスD5を動き検出部504に出力する。ピクチャメモリ500は、1つ以上の再構成ピクチャを含む。
N×Mの原画サンプルブロックD1は、入力Vinとして受信される。動き検出部504は、N×Mの原画サンプルブロックD1、参照インデックスD5および参照ピクチャD3を受信する。これは、動きベクトルセットD6を出力する。NおよびMの値の例は、それぞれ16である。
動きベクトル比較部508は、動きベクトルセットD6を取り、これを予め定められた第1閾値と比較し、信号D9を出力する。動きベクトルの全要素の絶対値が当該所定の第1閾値より全て小さい場合、信号D9は1に設定される。さもなければ、信号D9は0に設定される。
動き補償部506は、その後、参照インデックスD5、動きベクトルセットD6および参照ピクチャD3を取る。これは、N×Mの予測サンプルブロックD7を出力する。コスト演算部510は、N×Mの予測サンプルブロックD7、N×Mの原画サンプルブロックD1および動きベクトルセットD6を取る。これは、コスト値D8をコスト比較部512に出力する。コスト比較部512は、コスト値D8を取り、これを所定の第2閾値と比較し、信号D10をスイッチ部516に出力する。求められたコストが当該所定の第2閾値より小さい場合、信号D10は1に設定される。小さくなければ、信号D10は0に設定される。
スイッチ部516は、信号D10およびD9次第で、入力D1へ出力D12か出力D13を接続する。信号D10およびD9の両方が1であれば、D12がD1に接続され、1でなければ、D13がD1に接続される。
コスト比較部514は、コスト値D8を取り、これを所定の第3閾値と比較し、信号D11を第2スイッチ部518に出力する。求められたコストが当該所定の第3閾値より小さい場合、信号D11は1に設定される。小さくなければ、信号D11は0に設定される。
スイッチ部518は、信号D11次第で、入力D13へ出力D14か出力D15を接続する。信号D11が1であれば、D14がD13に接続され、1でなければ、D15がD13に接続される。
ピクチャ合成部520は、次の入力のうちいずれかを取る。すなわち、それはN×Mの予測サンプルブロックD7および信号D14またはD12として示されたN×Mの原画サンプルブロックである。これは、ピクチャ合成処理をおこなう。ピクチャ合成部は、その後、N×Mの修正サンプルブロックD16を画像符号化部522に出力する。
画像符号化部522は、信号D16またはD15として示されたN×Mのサンプルブロックを取る。本発明のいくつかの実施態様において、画像符号化部522は、N×Mのサンプルブロックを符号化するために用いられる追加入力として、動き補償部506からN×Mの予測サンプルブロックD7を受け取ることになる。画像符号化部522は、その後、N×Mの量子化残差ブロックD17をエントロピー符号化部524および画像復号化部526に出力する。
エントロピー符号化部524は、N×Mの量子化残差ブロックを符号化し、圧縮ビットストリームVoutを出力する。画像復号化部526は、N×Mの量子化残差ブロックを復号化して再構成する。本実施の形態のいくつかの実施態様においては、画像復号化部526は、N×Mのサンプルブロックを再構成するために、動き補償部506からN×Mの予測サンプルブロックD7を取ることになる。画像復号化部526は、最終的に、N×Mの再構成サンプルブロックD18を出力し、再構成サンプルをピクチャメモリ500に格納する。
以上のように、本発明の第2の実施の形態によれば、画面内予測符号化の対象となる対象原画像と先行再構成ピクチャとの相関が高いと判定された場合に、対象原画像と先行再構成ピクチャとの合成処理を実行する。これにより、先行するGOPの符号化の特徴を対象GOPに引き継ぐことが可能となり、2つのGOP間で生じるパルシング歪みを削減することができる。よって、視覚的な画質を向上させることができる。
(第3の実施の形態)
本発明の第3の実施の形態は、動画像シーケンスを復号化した後の後処理モジュールとして用いることができる。パルシング歪み削減処理には3つのステップがある。第1のステップでは、対象復号化ピクチャと、該対象復号化ピクチャに時間的に先行する先行復号化ピクチャとの相関を算出する。第2のステップでは、第1のステップで算出された相関が高いか否かを判定する。第3のステップでは、第2のステップで相関が高いと判定された場合に、対象復号化ピクチャと先行復号化ピクチャとを合成する。以上の3つのステップは、第1及び第2の実施の形態と同様、全て1画素以上の画素の集まりであるブロック単位で実行される。
図8は、本発明の第3の実施の形態におけるパルシング歪み削減処理を説明するための図である。
本実施の形態では、画面内予測符号化された符号化ピクチャを復号化した対象復号化ピクチャに時間的に先行する先行復号化ピクチャを、参照ピクチャとして選択し、対象復号化ピクチャと先行復号化ピクチャとの相関を算出する。そして、対象復号化ピクチャと先行復号化ピクチャとの相関が高いと判定された場合に、対象復号化ピクチャと先行復号化ピクチャとを合成する。そして、合成されたピクチャを出力ストリームに含まれるピクチャとして出力する。つまり、図8に示すように、相関算出処理及び合成処理は、復号化ピクチャを対象にして実行される。
図9は、本発明の第3の実施の形態における動画像復号化処理のフローチャートである。同図に示されるように、N×Mの復号化サンプルブロックは、モジュール600における復号化対象ピクチャから得られる。該復号化サンプルブロックが、上述の対象復号化ピクチャのサンプルブロックである。ここで、Nは幅におけるピクセル数を表し、Mは高さにおけるピクセル数を表す。NおよびMの値の例は、それぞれ16である。
モジュール602において、参照ピクチャは、モジュール604に示されるようにピクチャメモリに格納された復号化ピクチャグループから選択される。該参照ピクチャが、上述の先行復号化ピクチャである。この場合のピクチャは、フレームピクチャまたはフィールドピクチャとすることができる。本実施の形態の一例として、復号化対象ピクチャがフレームピクチャである場合、参照フレームは、当該復号化対象ピクチャに対し時間的に直近の参照フレームピクチャであるという基準に基づいて選択される。復号化対象ピクチャがフィールドピクチャである場合、当該復号化対象フィールドピクチャと同じフィールドパリティを有する直近の参照フィールドピクチャが選択される。
モジュール606において、N×Mの非圧縮原画サンプルブロックの動きベクトルセットを導き出すために、選択された参照ピクチャに対し動き検出ステップがおこなわれる。モジュール608において、N×Mの予測サンプルブロックを導き出すために、導き出された動きベクトルに基づいて動き補償ステップがおこなわれる。
モジュール610において、導き出されたN×Mの予測サンプルブロックのサンプル値とN×Mの復号化サンプルブロックのサンプル値との差分絶対値和によって変化する式に基づいて、コスト値が求められる。コスト値は、対象復号化ピクチャと先行復号化ピクチャとの相関の程度を示す値の一例である。コスト値を求める式の一例は、
Figure 0004875007
ここで、SADとは予測サンプルと原画サンプルとの差分絶対値和であり、Lambdaは固定値であり、MVCostは、導き出された動きベクトルに左右される要素Costを表す。Lambdaの値は0になることがあり、その場合、要素MVCostは、無視してもよい。
以上のモジュール600〜610に示す処理が実行されることで、対象復号化ピクチャと先行復号化ピクチャとの相関が算出される。数5に示すように、コスト値が小さいほど、相関が高いことを示す。
モジュール612において、モジュール606から導き出された動きベクトルの絶対値は、予め定められた第1閾値と比較される。例えば、所定の第1閾値はある整数である。次に、モジュール614において、モジュール610から求められたコストは、予め定められた第2閾値と比較される。例えば、所定の第2閾値はある整数である。
モジュール616に示されるように、動きベクトルの全要素の絶対値が所定の第1閾値より小さく、かつ、求められたコストが所定の第2閾値より小さい場合、モジュール618に示されるように、N×Mの原画サンプルブロックに対し、ピクチャ合成処理がおこなわれる。
動きベクトルのいずれかの要素の絶対値が所定の第1閾値より大きい、若しくは求められたコストが所定の第2閾値より大きい場合、モジュール622に示すように、求められたコストは予め定められた第3閾値と比較される。例えば、所定の第3閾値はある整数である。
ここで、モジュール612、614及び616における処理は、動きベクトルの絶対値に応じて、コストの閾値を変更するための処理である。すなわち、本発明の第3の実施の形態では、先行復号化ピクチャと対象復号化ピクチャとの間の動きの大小に応じて、相関が高いと判定するための閾値を変更する。
第1及び第2の実施の形態と同様に、対象復号化ピクチャのサンプルブロックの動きが大きい場合、すなわち、動きベクトルの絶対値が第1閾値より大きい場合、コストの閾値を第2閾値に設定する。これに対して、対象復号化ピクチャのサンプルブロックの動きが小さい場合、すなわち、動きベクトルの絶対値が第1閾値より小さい場合、コストの閾値を第2閾値より大きい第3閾値に設定する。これにより、動きが小さい箇所で合成処理が行われるように相関を算出することができる。
以上のモジュール612〜616及び622が示す処理が実行されることで、対象復号化ピクチャと先行復号化ピクチャとの相関が高いか否かが判定される。すなわち、本実施の形態では、数5で示されるコスト値が閾値より小さいか否かが判定される。
求められたコストがモジュール624における所定の第3閾値よりも小さい場合、モジュール618においてN×Mの原画サンプルブロックに対しピクチャ合成処理がおこなわれる。さもなくば、N×Mの復号化サンプルブロックに対し当該ピクチャ合成処理はおこなわれず、当該N×Mの復号化サンプルブロックは表示される。
当該ピクチャ合成処理は、下記の式に基づき、N×Mの予測サンプルブロックとN×Mの復号化サンプルブロックとを合体させるステップに関する。
Figure 0004875007
ここで、O[N,M]はN×Mの復号化サンプルブロックを表し、P[N,M]はN×Mの予測サンプルブロックを表し、Mod[N,M]はN×Mの修正サンプルブロックを表す。W1およびW2は、原画サンプルブロックおよび予測サンプルブロックをどの程度の割合で加算するかを決定する重み係数である。Kは、オフセット値であり、Sは、2進数表現で表されるMod[N,M]を右へシフトさせる数を示す。W1、W2、KおよびSの値は、全て整数である。W1、W2、KおよびSの値の例は、それぞれ1である。当該ピクチャ合成処理後のN×Mの修正サンプルブロックは表示される。
当該ピクチャ合成処理において用いられるN×Mの予測サンプルブロックは、モジュール408の出力であってもよいし、モジュール408とは異なる動きベクトルセットと参照ピクチャとを用いた、別の動き補償ステップの結果であってもよい。
図10は、本発明の第3の実施の形態における装置を示す。当該装置は、ピクチャメモリ700、参照ピクチャ選択部702、動き検出部704、動き補償部706、動きベクトル比較部708、コスト演算部710、ふたつのコスト比較部712および714、ふたつのスイッチ部716および718、ピクチャ合成部720、およびORゲート部722を備える。
参照ピクチャ選択部702は、復号化対象ピクチャ情報D2および参照ピクチャ情報D4を受信し、直近の時間距離に基づいて適切な参照ピクチャを選択し、参照インデックスD5を動き検出部704に出力する。ピクチャメモリ700は、1つ以上の復号化ピクチャを含む。
N×Mの復号化原画サンプルブロックD1は、入力Vinとして受信される。動き検出部704は、N×Mの復号化サンプルブロックD1、参照インデックスD5および参照ピクチャD3を受信する。これは、動きベクトルセットD6を出力する。NおよびMの値の例は、それぞれ16である。
動きベクトル比較部708は、動きベクトルセットD6を取り、これを予め定められた第1閾値と比較し、信号D9を出力する。動きベクトルの全要素の絶対値が当該所定の第1閾値より全て小さい場合、信号D9は1に設定される。さもなければ、信号D9は0に設定される。
動き補償部706は、その後、参照インデックスD5、動きベクトルセットD6および参照ピクチャD3を取る。これは、N×Mの予測サンプルブロックD7を出力する。コスト演算部710は、N×Mの予測サンプルブロックD7、N×Mの復号化サンプルブロックD1および動きベクトルセットD6を取る。これは、コスト値D8をコスト比較部512に出力する。コスト比較部712は、コスト値D8を取り、これを所定の第2閾値と比較し、信号D10をスイッチ部716に出力する。求められたコストが当該所定の第2閾値より小さい場合、信号D10は1に設定される。小さくなければ、信号D10は0に設定される。
スイッチ部716は、信号D10およびD9次第で、入力D1へ出力D12か出力D13を接続する。信号D10およびD9の両方が1であれば、D12がD1に接続され、1でなければ、D13がD1に接続される。
コスト比較部714は、コスト値D8を取り、これを所定の第3閾値と比較し、信号D11を第2スイッチ部718に出力する。求められたコストが当該所定の第3閾値より小さい場合、信号D11は1に設定される。小さくなければ、信号D11は0に設定される。
スイッチ部718は、信号D11次第で、入力D13へ出力D14か出力D15を接続する。信号D11が1であれば、D14がD13に接続され、1でなければ、D15がD13に接続される。
ピクチャ合成部720は、次の入力のうちいずれかを取る。すなわち、それはN×Mの予測サンプルブロックD7および信号D14またはD12として示されたN×Mの復号化サンプルブロックである。これは、ピクチャ合成処理をおこなう。ピクチャ合成部は、その後、N×Mの修正サンプルブロックD16をORゲート部に出力する。ORゲート部722は、どちらの信号が利用可能であるかによって、N×Mの修正サンプルブロックD16とN×Mの復号化サンプルブロックD15のいずれかを選択し、選択したN×Mのサンプルブロックを表示Voutに出力する。
以上のように、本発明の第3の実施の形態によれば、画面内予測符号化された符号化ピクチャを復号化した対象復号化ピクチャと先行復号化ピクチャとの相関が高いと判定された場合に、対象復号化ピクチャと先行復号化ピクチャとの合成処理を実行する。これにより、先行するGOPの符号化の特徴を対象GOPに引き継ぐことが可能となり、2つのGOP間で生じるパルシング歪みを削減することができる。よって、視覚的な画質を向上させることができる。
以上、本発明の動画像符号化装置、動画像符号化方法及び動画像復号化装置について、実施の形態に基づいて説明したが、本発明は、この実施の形態に限定されるものではない。本発明の趣旨を逸脱しない限り、当業者が思いつく各種変形を本実施の形態に施したものや、異なる実施の形態における構成要素を組み合わせて構築される形態も、本発明の範囲内に含まれる。
また、本発明では、画面内予測符号化の対象となる対象ピクチャとその直前の1枚の先行ピクチャとの間で、相関の判定処理及び合成処理を行う構成とした。これに対して、先行ピクチャは、2枚以上であってもよい。この場合、相関の判定処理及び合成処理において、重み付け加算する際に、2枚の重み係数を設定すればよい。例えば、ピクチャ合成は、以下の数7に基づいて実行される。
Figure 0004875007
O[N,M]はN×Mの原画サンプルブロックを表し、P1[N,M]およびP2[N,M]はN×Mの予測サンプルブロックを表し、Mod[N,M]はN×Mの修正サンプルブロックを表す。P1[N,M]がO[N,M]の直前のサンプルブロックであり、P2がP1[N,M]の直前のサンプルブロックであるとする。ここで、例えば、重み係数W2とW3とを、W2の方が大きい値となるように設定することで、原画サンプルブロックに時間的により近い予測サンプルブロックを重視し、かつ、それ以前の予測サンプルブロックの傾向も取り入れた合成処理を実行することができる。これにより、より視覚的に画質を向上させることができる。
また、ピクチャの合成に用いられる重み係数を、相関算出処理で得られるコスト値に応じて変更してもよい。例えば、数2において、コスト値が小さいほど、原画サンプルブロックに乗ぜられる重み係数W1を大きく、又は、小さく設定してもよい。
また、本発明では、相関の判定処理及び合成処理を16×16のブロック単位で行うとしたが、これに限らず、8×8又は4×4のブロック単位でもよい。さらには、1画素単位で相関の判定処理及び合成処理を行ってもよい。これにより、高い精度で各処理を実行することができ、より視覚的に画質を向上させることができる。
また、符号化などの処理は、ブロック単位やピクチャ単位に限られず、様々な単位で処理が実行される。例えば、図11に示すようなスライス単位で画面内予測符号化が実行される場合もある。図11は、画面内予測符号化されるスライスを時間的にずらしながら符号化する例を示す図である。同図に示すようなスライス単位でも、本発明の動画像符号化方法を適用することができる。
なお、本発明は、各実施の形態で示した装置を構成する処理手段をステップとする方法をコンピュータに実行させるプログラムとしてもよい。また、該プログラムを記録したコンピュータ読み取り可能なCD−ROMなどの記録媒体として、及び、そのプログラムを示す情報、データ又は信号として実現することもできる。さらに、それらプログラム、情報、データ及び信号は、インターネット等の通信ネットワークを介して配信してもよい。
本発明は、パルシング歪みを削減し、視覚的な画質を向上させる装置に適用でき、例えば、デジタルテレビなどに適用できる。
図1は、符号化動画像シーケンスにおけるパルシング歪みの例を説明する図である。 図2は、本発明の第1の実施の形態におけるパルシング歪み削減処理を説明するための図である。 図3は、本発明の第1の実施の形態における動画像符号化処理を示すフローチャートである。 図4は、本発明の第1の実施の形態における動画像符号化装置の例を示すブロック図である。 図5は、本発明の第2の実施の形態におけるパルシング歪み削減処理を説明するための図である。 図6は、本発明の第2の実施の形態における動画像符号化処理を示すフローチャートである。 図7は、本発明の第2の実施の形態における動画像符号化装置の例を示すブロック図である。 図8は、本発明の第3の実施の形態におけるパルシング歪み削減処理を説明するための図である。 図9は、本発明の第3の実施の形態における動画像復号化処理を示すフローチャートである。 図10は、本発明の第3の実施の形態における動画像復号化装置の例を示すブロック図である。 図11は、動画像シーケンスがスライス単位で符号化される場合の例を示す図である。
符号の説明
300、500、700 ピクチャメモリ
302、502、702 参照ピクチャ選択部
304、504、704 動き検出部
306、506、706 動き補償部
308、508、708 動きベクトル比較部
310、510、710 コスト演算部
312、314、512、514、712、714 コスト比較部
316、318、516、518、716、718 スイッチ部
320、520、720 ピクチャ合成部
322、522 画像符号化部
324、524 エントロピー符号化部
526 画像復号化部
722 ORゲート部

Claims (14)

  1. パルシング歪みを削減するための動画像符号化装置であって、
    複数の原画像からなる原画像シーケンス内の第1原画像に含まれる1画素以上の画素からなる第1ブロックと、前記第1原画像に先行する第2原画像に含まれる1画素以上の画素からなる第2ブロック又は前記第2ブロックを符号化及び再構成することで得られる第3ブロックとの相関を算出する相関算出手段と、
    前記相関が予め定められた第1閾値を超えるか否かを判定し、前記第1閾値を超えた場合に前記相関が高いと判定する相関判定手段と、
    前記相関判定手段において前記相関が高いと判定された場合に、前記第1ブロックと前記第3ブロックとを合成する合成手段とを備える
    ことを特徴とする動画像符号化装置。
  2. 前記動画像符号化装置は、さらに、
    前記合成手段において合成されたブロックを画面内予測符号化する符号化手段を備える
    ことを特徴とする請求項1記載の動画像符号化装置。
  3. 前記相関算出手段は、
    前記第1ブロックと前記第2ブロック又は前記第3ブロックとの画素値の差分を算出することで前記相関を算出し、
    前記相関判定手段は、
    前記差分が、予め定められた第2閾値より小さい場合に、前記相関が高いと判定する
    ことを特徴とする請求項1記載の動画像符号化装置。
  4. 前記動画像符号化装置は、さらに、
    前記第2ブロック又は前記第3ブロックの動きベクトルを検出する動き検出手段と、
    前記動きベクトルの絶対値が予め定められた第3閾値以上である場合に、前記第2閾値を第1の値に設定し、前記絶対値が前記第3閾値より小さい場合に、前記第2閾値を前記第1の値より大きい第2の値に設定する閾値設定手段とを備え、
    前記相関判定手段は、
    前記差分が、前記閾値設定手段で設定された第2閾値より小さい場合に、前記相関が高いと判定する
    ことを特徴とする請求項3記載の動画像符号化装置。
  5. 前記相関算出手段は、
    前記第1ブロックと、前記第2ブロック又は前記第3ブロックとの差分絶対値和を求める差分算出部と、
    前記第2ブロック又は前記第3ブロックの動きベクトルに依存する第3の値を算出する動き算出部と、
    前記差分絶対値和と前記第3の値とを重み付け加算することで、前記相関の程度を示す相関値を算出する重み加算部とを備え、
    前記相関判定手段は、
    前記重み加算部において算出された前記相関値が、予め定められた第4閾値より小さい場合に、前記相関が高いと判定する
    ことを特徴とする請求項1記載の動画像符号化装置。
  6. 前記合成手段は、
    前記第1ブロックの各画素値と前記第3ブロックの各画素値とを重み付け加算する
    ことを特徴とする請求項1記載の動画像符号化装置。
  7. パルシング歪みを削減するための動画像符号化方法であって、
    複数の原画像からなる原画像シーケンス内の第1原画像に含まれる1画素以上の画素からなる第1ブロックと、前記第1原画像に先行する第2原画像に含まれる1画素以上の画素からなる第2ブロック又は前記第2ブロックを符号化及び再構成することで得られる第3ブロックとの相関を算出する相関算出ステップと、
    前記相関が予め定められた第1閾値を超えるか否かを判定し、前記第1閾値を超えた場合に前記相関が高いと判定する相関判定ステップと、
    前記相関判定ステップにおいて前記相関が高いと判定された場合に、前記第1ブロックと前記第3ブロックとを合成する合成ステップとを含む
    ことを特徴とする動画像符号化方法。
  8. 前記動画像符号化方法は、さらに、
    前記合成ステップにおいて合成されたブロックを画面内予測符号化する符号化ステップを含む
    ことを特徴とする請求項7記載の動画像符号化方法。
  9. 前記相関算出ステップでは、
    前記第1ブロックと前記第2ブロック又は前記第3ブロックとの画素値の差分を算出することで前記相関を算出し、
    前記相関判定ステップでは、
    前記差分が、予め定められた第2閾値より小さい場合に、前記相関が高いと判定する
    ことを特徴とする請求項7記載の動画像符号化方法。
  10. 前記動画像符号化方法は、さらに、
    前記第2ブロック又は前記第3ブロックの動きベクトルを検出する動き検出ステップと、
    前記動きベクトルの絶対値が予め定められた第3閾値以上である場合に、前記第2閾値を第1の値に設定し、前記絶対値が前記第3閾値より小さい場合に、前記第2閾値を前記第1の値より大きい第2の値に設定する閾値設定ステップとを含み、
    前記相関判定ステップでは、
    前記差分が、前記閾値設定ステップで設定された第2閾値より小さい場合に、前記相関が高いと判定する
    ことを特徴とする請求項9記載の動画像符号化方法。
  11. 前記相関算出ステップは、
    前記第1ブロックと、前記第2ブロック又は前記第3ブロックとの差分絶対値和を求める差分算出ステップと、
    前記第2ブロック又は前記第3ブロックの動きベクトルに依存する第3の値を算出する動き算出ステップと、
    前記差分絶対値和と前記第3の値とを重み付け加算することで、前記相関の程度を示す相関値を算出する重み加算ステップとを含み、
    前記相関判定ステップでは、
    前記重み加算ステップにおいて算出された前記相関値が、予め定められた第4閾値より小さい場合に、前記相関が高いと判定する
    ことを特徴とする請求項7記載の動画像符号化方法。
  12. 前記合成ステップは、
    前記第1ブロックの各画素値と前記第3ブロックの各画素値とを重み付け加算する
    ことを特徴とする請求項7記載の動画像符号化方法。
  13. パルシング歪みを削減するための動画像符号化プログラムであって、
    複数の原画像からなる原画像シーケンス内の第1原画像に含まれる1画素以上の画素からなる第1ブロックと、前記第1原画像に先行する第2原画像に含まれる1画素以上の画素からなる第2ブロック又は前記第2ブロックを符号化及び再構成することで得られる第3ブロックとの相関を算出する相関算出ステップと、
    前記相関が予め定められた閾値を超えるか否かを判定し、前記閾値を超えた場合に前記相関が高いと判定する相関判定ステップと、
    前記相関判定ステップにおいて前記相関が高いと判定された場合に、前記第1ブロックと前記第3ブロックとを合成する合成ステップとを
    コンピュータに実行させるプログラム。
  14. パルシング歪みを削減するための動画像復号化装置であって、
    符号化された複数のピクチャを復号化することで得られる複数の復号化ピクチャからなる復号化動画像シーケンスを出力する復号化手段と、
    前記復号化動画像シーケンス内の第1復号化ピクチャに含まれる1画素以上の画素からなる第1ブロックと、前記第1復号化ピクチャに先行する第2復号化ピクチャに含まれる1画素以上の画素からなる第2ブロックとの相関を算出する相関算出手段と、
    前記相関が予め定められた第1閾値を超えるか否かを判定し、前記第1閾値を超えた場合に前記相関が高いと判定する相関判定手段と、
    前記相関判定手段において前記相関が高いと判定された場合に、前記第1ブロックと前記第2ブロックとを合成する合成手段とを備え、
    前記相関算出手段は、
    前記第1ブロックと前記第2ブロックとの画素値の差分を算出することで前記相関を算出し、
    前記相関判定手段は、
    前記差分が、予め定められた第2閾値より小さい場合に、前記相関が高いと判定し、
    前記動画像復号化装置は、さらに、
    前記第2ブロックの動きベクトルを検出する動き検出手段と、
    前記動きベクトルの絶対値が予め定められた第3閾値以上である場合に、前記第2閾値を第1の値に設定し、前記絶対値が前記第3閾値より小さい場合に、前記第2閾値を前記第1の値より大きい第2の値に設定する閾値設定手段とを備え、
    前記相関判定手段は、
    前記差分が、前記閾値設定手段で設定された第2閾値より小さい場合に、前記相関が高いと判定する
    ことを特徴とする動画像復号化装置。
JP2008024212A 2007-02-09 2008-02-04 動画像符号化装置、動画像符号化方法、及び、動画像復号化装置 Expired - Fee Related JP4875007B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008024212A JP4875007B2 (ja) 2007-02-09 2008-02-04 動画像符号化装置、動画像符号化方法、及び、動画像復号化装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2007031154 2007-02-09
JP2007031154 2007-02-09
JP2008024212A JP4875007B2 (ja) 2007-02-09 2008-02-04 動画像符号化装置、動画像符号化方法、及び、動画像復号化装置

Publications (2)

Publication Number Publication Date
JP2008219876A JP2008219876A (ja) 2008-09-18
JP4875007B2 true JP4875007B2 (ja) 2012-02-15

Family

ID=39839295

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008024212A Expired - Fee Related JP4875007B2 (ja) 2007-02-09 2008-02-04 動画像符号化装置、動画像符号化方法、及び、動画像復号化装置

Country Status (2)

Country Link
US (1) US8526498B2 (ja)
JP (1) JP4875007B2 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4506875B2 (ja) * 2008-05-19 2010-07-21 ソニー株式会社 画像処理装置および画像処理方法
US9185429B1 (en) 2012-04-30 2015-11-10 Google Inc. Video encoding and decoding using un-equal error protection
US9113164B1 (en) 2012-05-15 2015-08-18 Google Inc. Constant bit rate control using implicit quantization values
US9510019B2 (en) 2012-08-09 2016-11-29 Google Inc. Two-step quantization and coding method and apparatus
US9826229B2 (en) 2012-09-29 2017-11-21 Google Technology Holdings LLC Scan pattern determination from base layer pixel information for scalable extension
US9407915B2 (en) 2012-10-08 2016-08-02 Google Inc. Lossless video coding with sub-frame level optimal quantization values
US9350988B1 (en) 2012-11-20 2016-05-24 Google Inc. Prediction mode-based block ordering in video coding
US10080017B2 (en) * 2012-12-26 2018-09-18 Avago Technologies General Ip (Singapore) Pte. Ltd. Reduction of I-pulsing artifacts
US9681128B1 (en) 2013-01-31 2017-06-13 Google Inc. Adaptive pre-transform scanning patterns for video and image compression
US9247251B1 (en) 2013-07-26 2016-01-26 Google Inc. Right-edge extension for quad-tree intra-prediction
US10735745B1 (en) * 2019-06-06 2020-08-04 Tencent America LLC Method and apparatus for video coding

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2313514B (en) 1993-08-03 1998-02-25 Sony Uk Ltd Motion compensated video signal processing
US6064776A (en) * 1995-10-27 2000-05-16 Kabushiki Kaisha Toshiba Image processing apparatus
JP3800435B2 (ja) 1995-10-27 2006-07-26 株式会社東芝 動画像信号処理装置
US6037988A (en) * 1996-03-22 2000-03-14 Microsoft Corp Method for generating sprites for object-based coding sytems using masks and rounding average
US6535558B1 (en) * 1997-01-24 2003-03-18 Sony Corporation Picture signal encoding method and apparatus, picture signal decoding method and apparatus and recording medium
CN1217852A (zh) * 1997-02-13 1999-05-26 三菱电机株式会社 动态图象预测方式
JPH10341436A (ja) * 1997-06-06 1998-12-22 Matsushita Electric Ind Co Ltd 高能率符号化装置
US6215822B1 (en) * 1997-12-30 2001-04-10 Sony Corporation Motion compensated digital video decoding and buffer memory addressing therefor
US6438165B2 (en) * 1998-03-09 2002-08-20 Lg Electronics Method and apparatus for advanced encoder system
US7346217B1 (en) * 2001-04-25 2008-03-18 Lockheed Martin Corporation Digital image enhancement using successive zoom images
JP2004180344A (ja) * 2004-02-06 2004-06-24 Toshiba Corp 動画像信号処理装置
KR20050112445A (ko) * 2004-05-25 2005-11-30 경희대학교 산학협력단 예측 부호화/복호화 장치, 예측 부호화/복호화 방법 및 그방법을 수행하는 프로그램이 기록된 컴퓨터 판독가능한기록매체
KR20070117660A (ko) * 2005-03-10 2007-12-12 콸콤 인코포레이티드 컨텐트 적응적 멀티미디어 처리
JP2006254232A (ja) * 2005-03-11 2006-09-21 Toshiba Corp 情報処理装置およびプログラム
JP2006254320A (ja) * 2005-03-14 2006-09-21 Toshiba Corp 情報処理装置および同装置で用いられるプログラム
JP2006270435A (ja) * 2005-03-23 2006-10-05 Toshiba Corp 動画像符号化装置
US7982777B2 (en) * 2005-04-07 2011-07-19 Axis Engineering Technologies, Inc. Stereoscopic wide field of view imaging system

Also Published As

Publication number Publication date
JP2008219876A (ja) 2008-09-18
US8526498B2 (en) 2013-09-03
US20080291998A1 (en) 2008-11-27

Similar Documents

Publication Publication Date Title
JP4875007B2 (ja) 動画像符号化装置、動画像符号化方法、及び、動画像復号化装置
KR101769937B1 (ko) 영상 부호화 및 복호화 장치 및 그 방법
JP5362831B2 (ja) 構成参照フレームを用いた動画符号化システムおよび方法
JP4901772B2 (ja) 動画像符号化方法及び動画像符号化装置
US8630347B2 (en) Video decoding apparatus and video decoding method
US20090190660A1 (en) Image encoding method
KR20060109249A (ko) 영상신호의 엔코딩/디코딩시에 베이스 레이어 픽처의모션벡터를 사용하여 영상블록을 위한 모션벡터를 예측하는방법 및 장치
US20140247890A1 (en) Encoding device, encoding method, decoding device, and decoding method
JPH0818977A (ja) 動画像符号化/復号化装置
JP3778960B2 (ja) 動画像符号化方法及び装置
US8681877B2 (en) Decoding apparatus, decoding control apparatus, decoding method, and program
JP5137687B2 (ja) 復号装置及び復号方法、プログラム
JP4774315B2 (ja) 画像復号化装置及び画像復号化方法
JP2006279917A (ja) 動画像符号化装置、動画像復号装置及び動画像伝送システム
JP2011250400A (ja) 動画像符号化装置及び動画像符号化方法
JP4165752B2 (ja) 画像データへの秘匿データ挿入方式および秘匿データ検出方式
JP2009218965A (ja) 画像処理装置、それを搭載した撮像装置、および画像再生装置
EP2320663A1 (en) Image display device, image recording and reproduction device, and image processing method
JP4909592B2 (ja) 動画像再生方法及び装置並びにプログラム
JP2011129979A (ja) 画像処理装置
JP2007020216A (ja) 符号化装置、符号化方法、フィルタ処理装置およびフィルタ処理方法
JP3289695B2 (ja) 動画符号化方法および装置
WO2013073422A1 (ja) 動画像符号化装置
JP2001112002A (ja) 画像サイズ変換可能なデジタル動画像復号装置
JPH07236146A (ja) 画像信号符号化装置及び量子化パラメータ設定方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101125

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110905

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110913

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111012

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111101

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111124

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141202

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees