JP4824708B2 - 動画像符号化方法,装置,プログラムおよびコンピュータ読み取り可能な記録媒体 - Google Patents

動画像符号化方法,装置,プログラムおよびコンピュータ読み取り可能な記録媒体 Download PDF

Info

Publication number
JP4824708B2
JP4824708B2 JP2008020420A JP2008020420A JP4824708B2 JP 4824708 B2 JP4824708 B2 JP 4824708B2 JP 2008020420 A JP2008020420 A JP 2008020420A JP 2008020420 A JP2008020420 A JP 2008020420A JP 4824708 B2 JP4824708 B2 JP 4824708B2
Authority
JP
Japan
Prior art keywords
value
image quality
quality degradation
prediction
prediction method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008020420A
Other languages
English (en)
Other versions
JP2009182768A (ja
Inventor
和也 早瀬
幸浩 坂東
誠之 高村
一人 上倉
由幸 八島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2008020420A priority Critical patent/JP4824708B2/ja
Publication of JP2009182768A publication Critical patent/JP2009182768A/ja
Application granted granted Critical
Publication of JP4824708B2 publication Critical patent/JP4824708B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は,主観画質を劣化させずに符号化による発生符号量を削減する動画像符号化方法に関する。
従来より,映像符号化において,人間の視覚特性を利用することによって符号化性能を向上させる研究がなされている。この研究では,まず,人間の視覚特性を用いて画質劣化が目立ちにくい領域を選定する。そして,符号化もしくはその前段の処理において,画質劣化が目立ちにくい領域に割り当てる情報量を少なくし,主観画質を損なわずに情報量の削減を実現する。
特許文献1に記載された高能率動画像符号化方式では,入力映像の動きベクトルのノルムから動き量を算出し,動き量の値に応じて低域通過フィルタを施す。空間高周波成分は画質劣化が目立ちにくい。この成分を取り除くことで,画質劣化を最小限に抑えながら情報量を削減している。
一般に動画像符号化では,画面内予測や画面間予測を行うことで符号化性能を向上させる。スケーラブル符号化では,これらにさらにレイヤ間予測が追加される。これらの各予測方法は,予測モードとして扱われる。H.264/AVCを例にとると,画面内予測については,4×4,8×8,16×16画素単位の画面内予測モードが挙げられる。一方,画面間予測については,Skip,Direct,16×16,16×8,8×16,8×8,8×4,4×8,4×4画素単位の画面間予測モードが例に挙げられる。H.264/AVCのスケーラブル拡張方式SVCでは,レイヤ間予測として,レイヤ間で動きベクトルを流用するといった動き情報の予測モードや,下位レイヤのアップサンプル信号を上位レイヤ予測信号とするテクスチャ予測モードなどが例に挙げられる。
H.264/AVCの参照エンコーダJMやSVCの参照エンコーダJSVMでは,最適な予測モードを選択する方法としてラグランジュ乗数法を用いたレート歪み関数を導入している。当関数が出力する符号化コストが最小となるモードを,最適な予測モードとして決定する。歪み量をD,符号量をRとすると,符号化コストJは,以下のように表現される。
J=D+λR (1)
ここで,λはラグランジュ乗数である。参照エンコーダJMやJSVMでは,歪み量Dに画素値の二乗誤差を適用している。ただし,二乗誤差の値は,主観画質と乖離する場合があることが良く知られている。
非特許文献1では,このような動画像符号化において,人間の視覚系が持つコントラスト感度特性に着目し,主観画質を反映した歪み量を用いることにより,最適な予測モードを選択し,効率的に符号量を削減することが図られている。
すなわち,一般的に符号化歪みの評価尺度として用いられている画素値の二乗誤差の値は,主観評価と必ずしも整合しないことから,非特許文献1では,コントラスト感度特性を考慮した視覚的歪みモデルを構築し,それをH.264/AVCのモード選択におけるレート歪み最適化内の歪み尺度として活用している。この視覚的歪みモデルは,二乗誤差よりも主観画質に近い定量的指標を与えることができる。同モデルも二乗誤差の算出モデルをベースとしているが,コントラスト感度特性を考慮した分,通常の二乗誤差よりも小さい値を出力する。したがって,これをレート歪み最適化に適用すると,二乗誤差を使用した場合よりも符号量が少ないモードが積極的に選ばれる。主観画質は,以前のものとほぼ同様のものが得られる。
非特許文献2には,本発明を実施する際に用いることができる視覚特性を定める空間コントラスト感度関数の一例が記載されている。
特開平6−62392号公報 坂東幸浩,高村誠之,上倉一人,八島由幸:"主観画質を考慮したH.264/AVCにおけるモード選択方法の検討",オーディオビジュアル複合処理研究会(AVM),Sep. 2006. N.B.Nill: "A visual model weighted cosine transform for image compression and quality assessment ",IEEE Trans. Commun. ,Vol. COM-33 ,No. 12,pp.551-557,June 1985.
特許文献1に記されるプレフィルタは,後段の符号化処理の影響を考慮に入れずに高周波成分の除去を実施するため,符号化に最適なフィルタ処理を実行できない。フィルタ後映像では検知されなかった画質劣化が,符号化を通すことによって検知される可能性がある。
非特許文献1に記される動画像符号化方法では,視覚感度に基づき定められる感度係数を用いて符号化のコスト関数を設定しているため,主観画質の劣化が少ない予測モードの選択が実現されている。しかし,視覚的歪み量が小さい範囲において,符号量の削減に関し,なお改善の余地が残されている。また,符号化演算の高速性についての考慮はないため,その点においても改善の余地がある。
本発明はかかる事情に鑑みてなされたものであって,コントラスト感度に基づく視覚的歪みモデルが算出する視覚的歪み量を用いて符号化コストを算出し,予測モードを決定する動画像符号化処理において,主観画質を劣化させずに発生符号量を削減すること,また,符号化処理を高速化することが可能な動画像符号化器の設計法を確立することを目的とする。
本発明は,上記課題を解決するため,動画像符号化処理において,コントラスト感度に基づく視覚的歪みモデルが算出する視覚的歪み量を,実際に画質劣化が検知される視覚的歪み量の臨界点を示す第1の閾値(以下,画質劣化検知臨界値という)との値の大小に応じて補正し,その補正済み視覚的歪み量を予測モード選択に利用し,さらに同様の判定基準に基づいて予測残差信号の補正も行い,補正された視覚的歪み量と予測残差信号を用いて最適な予測モードを選択する。さらに,本発明は,動き推定を要しない予測モードにおける前記補正済み視覚的歪み量が視覚的歪み量の第2の閾値(以下,高速化閾値)より小さい場合には,動き推定を要する予測モードの探索を実行せずに動き推定を要しない予測モードの中で最適な予測モードを選択する。
具体的には,第1の本発明は,画素値の予測方法の選定において,発生符号量と画質劣化値との重み和からなる符号化コストを最小にする予測方法を選定し,選定された予測方法を用いて生成した予測値と原信号との差分信号を符号化する動画像符号化方法において,符号化対象の画像領域の差分信号に対して直交変換を施し,生成された各周波数成分にコントラスト感度関数値を乗算し,乗算された各周波数帯のエネルギーの画像領域内総和を画質劣化値として定めるステップと,前記画質劣化値が予め定められた画質劣化検知臨界値以下の場合には,前記画質劣化値を0に更新し,そうでない場合には,前記画質劣化検知臨界値を前記画質劣化値から減算したものを更新後の画質劣化値とするステップと,予測残差信号に対する更新後の画質劣化値が0の場合には,前記予測残差信号をすべて0に更新するステップと,更新後の画質劣化値を用いて予測方法の選定を行うステップと,更新後の予測残差信号を符号化するステップと,を有することを特徴とする。
また,第2の本発明は,画素値の予測方法の選定において,発生符号量と画質劣化値との重み和からなる符号化コストを最小にする予測方法を選定し,選定された予測方法を用いて生成した予測値と原信号との差分信号を符号化する動画像符号化方法において,符号化対象の画像領域の差分信号に対して直交変換を施し,生成された各周波数成分にコントラスト感度関数値を乗算し,乗算された各周波数帯のエネルギーの画像領域内総和を画質劣化値として定めるステップと,動き推定を実行しない予測方法の画質劣化値のデータ群の中に,予め定められた高速化閾値以下のものがある場合には,前記高速化閾値より小さい画質劣化値を与える予測方法の中で最も小さい符号化コストを与える予測方法を選別し,そうでない場合には,動き推定を実行する予測方法の符号化コストを前記画質劣化値を用いて算出し,すべての予測方法の符号化コストの中で最も小さい符号化コストを与える予測方法を選別するステップと,を有することを特徴とする。
また,第3の本発明は,画素値の予測方法の選定において,発生符号量と画質劣化値との重み和からなる符号化コストを最小にする予測方法を選定し,選定された予測方法を用いて生成した予測値と原信号との差分信号を符号化する動画像符号化方法において,符号化対象の画像領域の差分信号に対して直交変換を施し,生成された各周波数成分にコントラスト感度関数値を乗算し,乗算された各周波数帯のエネルギーの画像領域内総和を画質劣化値として定めるステップと,前記画質劣化値が予め定められた画質劣化検知臨界値以下の場合には,前記画質劣化値を0に更新し,そうでない場合には,前記画質劣化検知臨界値を前記画質劣化値から減算したものを更新後の画質劣化値とするステップと,予測残差信号に対する更新後の画質劣化値が0の場合には,前記予測残差信号をすべて0に更新するステップと,更新後の画質劣化値を用いて予測方法の選定を行うステップと,更新後の予測残差信号を符号化するステップと,動き推定を実行しない予測方法の更新後の画質劣化値のデータ群の中に,予め定められた高速化閾値以下のものがある場合には,前記高速化閾値より小さい更新後の画質劣化値を与える予測方法の中で最も小さい符号化コストを与える予測方法を選別し,そうでない場合には,動き推定を実行する予測方法の符号化コストを更新後の画質劣化値を用いて算出し,すべての予測方法の符号化コストの中で最も小さい符号化コストを与える予測方法を選別するステップと,を有することを特徴とする。
なお,上記発明においてさらに,外部より与えられる前記各ステップを適用する画像領域と適用しない画像領域の指定情報に基づき,適用すると指定された画像領域にのみ前記各ステップを実行することを特徴とする。
本発明によれば,従来の方法と比較して,主観画質を劣化させずに符号化による発生符号量を削減することができるようになる。また,主観画質を保持し,発生符号量を極力抑えつつ,符号化処理を高速化することができるようになる。
[本発明の関連技術]
本発明者は,下記の文献により,本発明に関連する技術として視覚感度を考慮した高能率動画像符号化技術を開示した。
・〔関連技術文献1〕早瀬和也,坂東幸浩,高村誠之,上倉一人,八島由幸:“視覚感度関数を用いたJSVCにおけるプレフィルタ設計方法”映像情報メディア学会年次大会,2007.
・〔関連技術文献2〕坂東幸浩,早瀬和也,高村誠之,上倉一人,八島由幸:“視覚感度を考慮したH.264符号化器の高能率化の検討”画像符号化シンポジウム,2007.
関連技術文献1のスケーラブル符号化向けのプレフィルタでは,コントラスト感度関数に基づいた視覚的歪みモデルを導入している。上位レイヤにおいて,原信号と下位レイヤからの補間信号との間の視覚的歪み量を計算し,その値に応じて原信号を補間信号で置き換えている。これにより,適切な閾値設定により主観画質を保持しつつ,レイヤ間予測の予測残差低減による符号量削減が実現される。
この関連技術文献1に記したプレフィルタはスケーラブル符号化向けに設計されたものであるが,前述した特許文献1と同様の課題を持つ。後段の符号化を含めた最適な置き換え処理でないため,符号量削減の余地を残す。
関連技術文献2では,H.264/AVCのモード選択のレート歪み最適化に視覚的歪みモデルを導入している。視覚的歪み量を歪みの尺度とすることで,通常の二乗誤差を歪み尺度とした場合よりも符号量が少ないモードが積極的に選ばれる。しかも,主観画質は歪み尺度に二乗誤差を使用した場合と同等のものが得られる。
この関連技術文献2により開示した技術は,人間のコントラスト感度特性を考慮した視覚的歪みモデルをH.264/AVCのモード選択の枠組みに導入しているため,符号化も含めた最適化が行われている。しかし,本文献で導出されている視覚的歪みモデルでは,視覚的歪み量が小さい範囲においては,実際には画質劣化の知覚がないにもかかわらず,非零の値を算出する。したがって,ここで導入している視覚的歪みモデルは,主観画質との整合という面において改善の余地を残しており,これは符号量削減の面においても改善の余地を残していると解釈できる。また,当文献は符号化演算の高速性を考慮に入れていない。すべてのモードを探索しているため,動き予測の実行に多大な時間を費やしてしまう。
[視覚的歪み量の算出]
本発明による発生符号量の削減方法について説明する。
従来のH.264/AVCの参照エンコーダJMやSVCの参照エンコーダJSVMでは,前述した式(1)のレート歪み関数を導入し,当関数が出力する符号化コストJが最小となるモードを,最適な予測モードとして決定している。当関数では,歪み量Dに画素値の二乗誤差を適用しているため,主観画質と乖離する場合がある。
そこで,上記関連技術文献2では,歪み量Dに人間の視覚が持つコントラスト感度を考慮した視覚的歪み量D′を適用し,以下のようにして符号化コストJを算出する。
J=D′+λR (2)
この視覚的歪み量D′は,以降に示す算出手順により必ずD′≦Dを満たす。したがって,符号量の少ないモードが積極的に選ばれるようになる。また,本モデルは,通常の二乗誤差よりも主観画質に近い定量的指標を与えるため,Dを使った場合と比較しても主観画質において差が見られない。
人間の視覚系は,空間高周波成分の変化に伴うコントラスト変化は,空間低周波成分の変化に伴うものより小さいことが知られている。つまり,空間高周波成分に内在する歪みは,空間低周波成分に内在する歪みより劣化として知覚されにくいと解釈できる。各空間周波成分に対するコントラスト感度は,コントラスト感度関数として導出されている。この特性に基づき,予測残差信号の各空間周波成分に対してコントラスト感度に応じた重み付けを行い,重み付けされた信号の平均二乗誤差を視覚的歪み量D′として定義する。
M×Nブロックの視覚的歪み量D′は,以下のようにして算出する。
Figure 0004824708
ここで,F(u,v)は,当該ブロックの予測残差信号に対する空間周波数(u,v)のフーリエ係数である。w(u,v)は,そのフーリエ係数に対する重み係数であり,空間周波数に対するコントラスト感度を指す。w(u,v)は,最大のコントラスト感度で正規化された関数であり,w(u,v)≦1を満たしている。したがって,D′≦Dが満たされる。
コントラスト感度関数としては,非特許文献2に記載された次式が一例に挙げられる。なお,これは一例であり,関数系の形はこれに限らない。
w(η)=(0.2+0.45η)exp(−0.18η) (4)
ここで,ηと(u,v)は,
η=(u2 +v2 1/2 /θ[cycle/degree]
の関係にある。このθは,次のように与えられる。
Figure 0004824708
これは,縦幅hの画像を視距離ahで観測する場合のM×Nブロックの視野角である。
[視覚的歪み量の更新]
しかし,上記視覚的歪み量D′も,その値が小さいときには主観画質との乖離が残る。本来,二つの画像の主観画質において差がない場合には,視覚的歪み量として0を出力しなければならない。しかし,式(3)によって算出される視覚的歪み量は,主観画質に差がない場合においても0より大きい値を出力してしまう。
そこで,本実施形態では,式(3)によって算出される視覚的歪み量D′は,ある臨界点まで実際には主観画質に差がないと仮定し,この臨界点までのD′は,すべて強制的に0に設定する。また,その臨界点を超えるD′は,その臨界値分だけオフセット補正する。差が生じはじめる臨界点を示す視覚的歪み量の閾値をDcr′とする。更新後の視覚的歪み量D″を,
D″=0 if D′≦Dcr′ (6)
D″=D′−Dcr′ otherwise (7)
として定義し,これを次に記す予測信号のゼロ埋め処理の適用判定,および次式のモード選択におけるレート歪み関数にて使用する。
J=D″+λR (8)
[予測残差信号ゼロ埋め処理の追加]
ある予測モードの予測信号と原信号との間の予測残差信号の視覚的歪み量D0 ″を,式(6)に従って算出したとき,D0 ″=0を満たしていると仮定する。このとき,臨界点閾値Dcr′が持つ意味に基づくと,当該マクロブロックは予測残差を伝送しなくても主観画質において差が見られないということになる。そこで,予測残差信号を直交変換する前に,すべて予測残差信号をゼロとした場合の視覚的歪み量D0 ″を算出し,それがD0 ″=0を満たす場合には,当該マクロブロックの予測残差信号を強制的に0にする。
ただし,予測残差信号をゼロに設定したことにより,動き予測参照先が劣化してしまい,その結果,符号化性能が低下する可能性もある。そこで,あらかじめ本発明による視覚的歪み量の補正および予測残差信号ゼロ埋め処理を適用するフレーム(またはスライス;以下同様)と適用しないフレームとに分類しておいてもよい。一例として,被予測参照フレームとならないフレームにのみ,本発明による上記の処理を適用する方法が考えられる。
[高速化アルゴリズム]
動画像の符号化処理において,最も時間を費やしている処理は,動き推定である。したがって,動き推定の実行を避けることが高速化に大きな寄与をもたらすが,その分,符号量の増加を招いてしまう。できるだけ符号量の増加を抑制しつつ,動き推定を実行せずに符号化処理を進めるかが,取り組むべき課題として重要である。
本発明では,視覚的歪みモデルを利用して,できるだけ動き推定を実行しない非動き推定予測モードが多く選ばれるようにする。ただし,非動き推定予測モードのみでは,符号量が著しく増加してしまう場合には,動き推定を実行する。具体的な手順は,以下のとおりである。
〔手順1〕:非動き推定予測モードの符号化コスト算出
非動き推定予測モードの予測残差信号を取得し,その視覚的歪み量D0 ″を求める。非動き推定予測モードには,レイヤ間予測,Skip,Direct,動きベクトルが(0,0)の16×16サイズ画面間予測,画面内予測が挙げられる。この視覚的歪み量D0 ″が,D0 ″=0であれば,予測残差信号をすべてゼロ埋めする。そして,このときの符号化コスト(符号量と同値)を計算し,手順2に移る。D0 ″=0でなければ,予測残差信号を符号化し,原信号と復号信号との間の視覚的歪み量D1 ″を計算する。その符号化コストを計算し,手順2に移る。
〔手順2〕:非動き推定予測モードにおける視覚的歪み量の高速化閾値比較
視覚的歪み量の高速化閾値Dth″を設ける。この高速化閾値Dth″との大小によってモードの探索の実行を決定する。各非動き推定予測モードにおいて算出された視覚的歪み量D0 ″もしくはD1 ″の中に,D0 ″≦Dth″またはD1 ″≦Dth″となる予測モードが一つでもあれば,非動き推定予測モードの中で符号化コストが最小となる予測モードを,そのマクロブロックの最適予測モードとして決定する。D0 ″≦Dth″またはD1 ″≦Dth″となる予測モードが一つもなければ,手順3に移る。
〔手順3〕:動き推定予測モードの符号化コスト算出
動き推定を要する動き推定予測モードの符号化コストを,手順1と同様の手順で計算する。
〔手順4〕:最適予測モードの出力
非動き推定予測モードおよび動き推定予測モードの両方を含めたすべての予測モードの中で,最も符号化コストが小さくなる予測モードを,そのマクロブロックの最適予測モードとして決定する。
以上の手順1〜4を,PおよびBスライスにおけるマクロブロックにおいて実行する。Iスライスでは,上記の高速化アルゴリズムは適用しない。
本発明では,視覚的歪み量に対して臨界的閾値Dcr′と高速化閾値Dth″の二つの閾値を設定する。これらの値は,例えば視覚実験により適当に定めることができ,外部より与えることができる。両者の値は独立に設定することができる。
th″≦Dcr′として,両者の値を与えた場合には,D″≦Dth″を満たす予測モードでは,画質劣化が知覚されないことが担保される。したがって,手順2に示した判定処理によって非動き推定予測モードが選定されたとしても,画質が保障される画質重視の処理となる。反対に,Dth″>Dcr′として設定した場合には,画質劣化が知覚される可能性があるが,積極的に非動き推定予測モードを選択する高速性重視の処理となる。これは,本手法を適用するアプリケーションの要求性能に合わせて調節すればよい。
[処理の流れ]
本発明の実施形態の処理について,図1を参照して説明する。
ステップS11:当該フレームに対して本発明による高速化アルゴリズムを適用するか否かのフラグ情報を読み込み,当該フレームに対して高速化アルゴリズムを適用するか否かの判定処理を行い,真の場合には,ステップS12の処理に移り,偽の場合には,ステップS13の処理に移る。
ステップS12:原映像信号を読み込み,視覚的歪み量の値に基づいた高速化アルゴリズムを用いて符号化を実行し,当該フレームの符号化データを出力し,ステップS14の処理に移る。本処理の詳細については,図2を参照して後述する。
ステップS13:原映像信号を読み込み,視覚的歪み量の値に基づいた高速化アルゴリズムを用いない符号化を実行し,当該フレームの符号化データを出力し,ステップS14の処理に移る。本処理の一例としては,H.264/AVCの参照エンコーダJMや,SVCの参照エンコーダJSVM,また非特許文献1や関連技術文献2の符号化方法などが挙げられる。
ステップS14:すべての符号化対象フレームの符号化が完了しているか否かの判定処理を行い,真の場合には,符号化処理を終了して各フレームの符号化データを統合し,最終的な映像の符号化データを構成して出力する。偽の場合には,ステップS15の処理に移る。
ステップS15:次の符号化対象フレームに移り,ステップS11に戻って同様に処理を繰り返す。
図2は,図1に示すステップS12の処理の流れを示す図である。以下,ステップS12の処理の詳細を,図2を用いて説明する。
ステップS21:当該マクロブロックにおいて,原信号を読み込み,動き推定を実行しない非動き推定予測モードにおける動き情報を出力する。
ステップS22:ステップS21の処理によって得られた動き情報を読み込み,非動き推定予測モードにおける符号化コスト算出処理を行い,視覚的歪み量D0 ″,D1 ″,非動き推定予測モードにおける符号化コストを出力する。本処理の詳細については,図3を参照して後述する。
ステップS23:ステップS22の処理において得られた視覚的歪み量D0 ″もしくはD1 ″が,外部より与えられる視覚的歪み量の高速化閾値Dth″以下であるか否かの判定処理を行い,真の場合には,ステップS26の処理に移り,偽の場合には,ステップS24の処理に移る。
ステップS24:当該マクロブロックにおいて,原信号を読み込み,動き推定を実行し,動き推定予測モードにおける動き情報を出力する。
ステップS25:ステップS24の処理によって得られた動き情報を読み込み,動き推定予測モードにおける符号化コスト算出処理を行い,視覚的歪み量D0 ″,D1 ″,動き推定予測モードにおける符号化コストを出力する。本処理の詳細については,図4を参照して後述する。
ステップS26:符号化コストを最小にする最適予測モードを決定し,出力する。
ステップS27:すべての符号化対象マクロブロックの符号化が完了しているか否かの判定処理を行い,真の場合には,符号化処理を終了して各マクロブロックの符号化データを統合し,最終的な当該フレームの符号化データを構成して出力する。偽の場合には,ステップS28の処理に移る。
ステップS28:次の符号化対象マクロブロックに移り,ステップS21に戻って同様に処理を繰り返す。
図3は,図2に示すステップS22の処理の流れを示す図である。以下,ステップS22の処理の詳細を,図3を用いて説明する。
ステップS220:図2のステップS21の処理によって得られた動き情報を読み込み,動き補償により予測信号を生成し,原信号との予測残差信号を出力する。
ステップS221:ステップS220の処理によって得られた予測残差信号を読み込み,予測残差信号の持つ視覚的歪み量D0 ′を算出し,その値を出力する。本処理は,式(3)に従う。
ステップS222:ステップS221の処理によって得られた視覚的歪み量D0 ′を読み込み,外部より与えられる視覚的歪み量の臨界点閾値Dcr′との大小関係から,視覚的歪み量D0 ′を視覚的歪み量D0 ″に更新し,その更新値を出力する。本処理の詳細は,図5を参照して後述する。
ステップS223:ステップS222の処理によって得られた更新された視覚的歪み量D0 ″を読み込み,その値がゼロであるかどうかの判定処理を行い,真の場合には,ステップS224の処理に移り,偽の場合には,ステップS225の処理に移る。
ステップS224:ステップS220の処理によって得られた予測残差信号を読み込み,その値をすべてゼロに設定し出力する。その後,ステップS229に移る。
ステップS225:ステップS220の処理によって得られた予測残差信号を読み込み,その予測残差信号を符号化し,符号化データを出力する。
ステップS226:ステップS225の処理によって得られた予測残差信号の符号化データを読み込み,復号処理を行って復号信号を再構成し,それと原信号との差分信号を生成し出力する。
ステップS227:ステップS226の処理によって得られた差分信号を読み込み,式(3)に従って差分信号の持つ視覚的歪み量D1 ′を算出し,その値を出力する。
ステップS228:ステップS227の処理によって得られた視覚的歪み量D1 ′を読み込み,外部より与えられる視覚的歪み量の臨界点閾値Dcr′との大小関係から,視覚的歪み量D1 ′を視覚的歪み量D1 ″に更新し,その更新値を出力する。本処理の詳細については,図5を参照して後述する。
ステップS229:当該マクロブロックにおける各非動き推定予測モードの符号化コストを算出し,出力する。本処理は,式(8)に従う。
図4は,図2に示すステップS25の処理の流れを示す図である。以下,ステップS25の処理の詳細を,図4を用いて説明する。
ステップS250:図2のステップS21の処理によって得られた動き情報を読み込み,動き補償により予測信号を生成し,原信号との予測残差信号を出力する。
ステップS251:ステップS250の処理によって得られた予測残差信号を読み込み,予測残差信号の持つ視覚的歪み量D0 ′を算出し,その値を出力する。本処理は,式(3)に従う。
ステップS252:ステップS251の処理によって得られた視覚的歪み量D0 ′を読み込み,外部より与えられる視覚的歪み量の臨界点閾値Dcr′との大小関係から,視覚的歪み量D0 ′を視覚的歪み量D0 ″に更新し,その更新値を出力する。本処理の詳細は,図5を参照して後述する。
ステップS253:ステップS252の処理によって得られた更新された視覚的歪み量D0 ″を読み込み,その値がゼロであるかどうかの判定処理を行い,真の場合には,ステップS254の処理に移り,偽の場合には,ステップS255の処理に移る。
ステップS254:ステップS250の処理によって得られた予測残差信号を読み込み,その値をすべてゼロに設定し出力する。その後,ステップS259に移る。
ステップS255:ステップS250の処理によって得られた予測残差信号を読み込み,その予測残差信号を符号化し,符号化データを出力する。
ステップS256:ステップS255の処理によって得られた予測残差信号の符号化データを読み込み,復号処理を行って復号信号を再構成し,それと原信号との差分信号を生成し出力する。
ステップS257:ステップS256の処理によって得られた差分信号を読み込み,式(3)に従って差分信号の持つ視覚的歪み量D1 ′を算出し,その値を出力する。
ステップS258:ステップS257の処理によって得られた視覚的歪み量D1 ′を読み込み,外部より与えられる視覚的歪み量の臨界点閾値Dcr′との大小関係から,視覚的歪み量D1 ′を視覚的歪み量D1 ″に更新し,その更新値を出力する。本処理の詳細については,図5を参照して後述する。
ステップS259:当該マクロブロックにおける各動き推定予測モードの符号化コストを算出し,出力する。本処理は,式(8)に従う。
図5は,図3に示すステップS222,S228および図4に示すステップS252,S258の処理の流れを示す図である。以下,視覚的歪み量の更新処理の詳細を,図5を用いて説明する。
ステップS31:視覚的歪み量の臨界点閾値Dcr′を読み込み,出力する。
ステップS32:視覚的歪み量D′(D0 ′またはD1 ′)および視覚的歪み量の臨界点閾値Dcr′を読み込み,視覚的歪み量D′が臨界点閾値Dcr′以下であるか否かの判定処理を行い,真の場合には,ステップS33の処理に移り,偽の場合には,ステップS34の処理に移る。
ステップS33:視覚的歪み量D′をゼロにし,更新された視覚的歪み量D″(D0 ″またはD1 ″)の値として出力する。
ステップS34:視覚的歪み量D′から視覚的歪み量の臨界点閾値Dcr′を減算し,その減算された値を,更新された視覚的歪み量D″として出力する。
[処理装置]
本発明の実施形態による符号化装置の構成を,図6に示す。符号化装置10は,次のような処理部から構成される。
高速化アルゴリズム適用/非適用フレーム判定部11:当該フレームに対して本発明の高速化アルゴリズムを適用するか否かのフラグ情報を読み込み,当該フレームに対して高速化アルゴリズムを適用するか否かの判定処理を行い,真の場合には,高速化アルゴリズム適用符号化部12の処理に移り,偽の場合には,高速化アルゴリズム非適用符号化部13の処理に移る。本フラグ情報は,外部より与えられる。
高速化アルゴリズム適用符号化部12:原映像信号を読み込み,視覚的歪み量の値に基づいた高速化アルゴリズムを用いて符号化を実行し,当該フレームの符号化データを出力し,全フレーム処理完了判定部14の処理に移る。高速化アルゴリズム適用符号化部12の詳細は,図7を参照して後述する。
高速化アルゴリズム非適用符号化部13:原映像信号を読み込み,視覚的歪み量の値に基づいた高速化アルゴリズムを用いない符号化を実行し,当該フレームの符号化データを出力し,全フレーム処理完了判定部14の処理に移る。高速化アルゴリズム非適用符号化部13の一例としては,H.264/AVCの参照エンコーダJMや,SVCの参照エンコーダJSVM,また非特許文献1や関連技術文献2の符号化方法などが挙げられる。
全フレーム処理完了判定部14:すべての符号化対象フレームの符号化が完了しているか否かの判定処理を行い,真の場合には,符号化処理を終了して各フレームの符号化データを統合し,最終的な映像の符号化データを構成して出力する。偽の場合には,符号化対象フレーム更新部15の処理に移る。
符号化対象フレーム更新部15:次の符号化対象フレームに移り,高速化アルゴリズム適用/非適用フレーム判定部11に戻って同様に処理を繰り返す。
次に,図6に示す高速化アルゴリズム適用符号化部12の詳細を,図7を用いて説明する。
非動き推定予測モードにおける符号化コスト算出処理部20:当該マクロブロックにおいて,原信号を読み込み,動き推定を実行しない非動き推定予測モードにおける動き情報から非動き推定予測モードにおける符号化コスト算出処理を行い,視覚的歪み量D0 ″,D1 ″,非動き推定予測モードにおける符号化コストを出力する。本処理部の詳細については,図8を参照して後述する。
視覚的歪み量臨界点閾値記憶部21:外部より視覚的歪み量の臨界点閾値Dcr′を読み込み,その値を書き込む。
視覚的歪み量高速化閾値記憶部22:外部より視覚的歪み量の高速化閾値Dth″を読み込み,その値を書き込む。
視覚的歪み量高速化閾値比較部23:非動き推定予測モードにおける符号化コスト算出処理部20から更新された視覚的歪み量D0 ″,D1 ″を入力し,それらが視覚的歪み量高速化閾値記憶部22に記憶された視覚的歪み量の高速化閾値Dth″以下であるか否かの判定処理を行い,真の場合には,最適予測モード決定部26の処理に移り,偽の場合には,動き推定予測モードにおける符号化コスト算出処理部25の処理に移る。
動き推定予測モードにおける符号化コスト算出処理部25:当該マクロブロックにおいて,原信号を読み込み,動き推定を実行し,動き推定予測モードにおける動き情報から動き推定予測モードにおける符号化コスト算出処理を行い,視覚的歪み量D0 ″,D1 ″,非動き推定予測モードにおける符号化コストを出力する。本処理部の詳細については,図9を参照して後述する。
最適予測モード決定部26:符号化コストを最小にする最適予測モードを決定し,出力する。
全マクロブロック符号化完了判定部27:すべての符号化対象マクロブロックの符号化が完了しているか否かの判定処理を行い,真の場合には,符号化処理を終了して各マクロブロックの符号化データを統合し,最終的な当該フレームの符号化データを構成して出力する。偽の場合には,符号化対象マクロブロック更新部28の処理に移る。
符号化対象マクロブロック更新部28:次の符号化対象マクロブロックに移り,非動き推定予測モードにおける符号化コスト算出処理部20以降の処理を同様に繰り返す。
次に,図7に示す非動き推定予測モードにおける符号化コスト算出処理部20の詳細を,図8を用いて説明する。
非動き推定予測モード動き情報生成部201:当該マクロブロックにおいて,原信号を読み込み,動き推定を実行しない非動き推定予測モードにおける動き情報をレジスタに出力する。
予測残差信号生成部202:レジスタより動き情報を読み込み,動き補償により予測信号を生成し,原信号との予測残差信号をバッファに出力する。
予測残差信号視覚的歪み量算出部203:バッファより予測残差信号を読み込み,予測残差信号の持つ視覚的歪み量D0 ′を算出し,その値を予測残差信号視覚的歪み量記憶部204に書き込む。本処理は,式(3)に従う。
予測残差信号視覚的歪み量更新部205:予測残差信号視覚的歪み量記憶部204より視覚的歪み量D0 ′を読み込み,視覚的歪み量臨界点閾値記憶部21より視覚的歪み量の臨界点閾値Dcr′を読み込み,両者の値の大小関係から視覚的歪み量D0 ′を視覚的歪み量D0 ″に更新し,その更新値を更新予測残差信号視覚的歪み量記憶部206に出力する。本処理部の詳細は,図10を参照して後述する。
更新予測残差信号視覚的歪み量ゼロ判定部207:更新予測残差信号視覚的歪み量記憶部206より更新された視覚的歪み量D0 ″を読み込み,その値がゼロであるかどうかの判定処理を行い,真の場合には,予測残差信号ゼロ埋め部208の処理に移り,偽の場合には,予測残差信号符号化部209の処理に移る。
予測残差信号ゼロ埋め部208:バッファより予測残差信号を読み込み,その値をすべてゼロに設定し,バッファに出力する。
予測残差信号符号化部209:バッファより予測残差信号を読み込み,その予測残差信号を符号化し,符号化データをバッファに出力する。
差分信号生成部210:バッファより予測残差信号の符号化データを読み込み,復号処理を行って復号信号を再構成し,それと原信号との差分信号を生成し,バッファに出力する。
差分信号視覚的歪み量算出部211:バッファより差分信号を読み込み,式(3)に従って差分信号の持つ視覚的歪み量D1 ′を算出し,その値を差分信号視覚的歪み量記憶部212に出力する。
差分信号視覚的歪み量更新部213:差分信号視覚的歪み量記憶部212より視覚的歪み量D1 ′を読み込み,視覚的歪み量臨界点閾値記憶部21より視覚的歪み量の臨界点閾値Dcr′を読み込み,両者の値の大小関係から視覚的歪み量D1 ′を視覚的歪み量D1 ″に更新し,その更新値を更新差分信号視覚的歪み量記憶部214に出力する。本処理部の詳細は,図10を参照して後述する。
非動き推定予測モード符号化コスト算出部215:当該マクロブロックにおける各非動き推定予測モードの符号化コストを算出し,レジスタに出力する。本処理は,式(8)に従う。
次に,図7に示す動き推定予測モードにおける符号化コスト算出処理部25の詳細を,図9を用いて説明する。
動き推定部251:当該マクロブロックにおいて,原信号を読み込み,動き推定を実行し,動き推定予測モードにおける動き情報をレジスタに出力する。
予測残差信号生成部252:レジスタより動き情報を読み込み,動き補償により予測信号を生成し,原信号との予測残差信号をバッファに出力する。
予測残差信号視覚的歪み量算出部253:バッファより予測残差信号を読み込み,予測残差信号の持つ視覚的歪み量D0 ′を算出し,その値を予測残差信号視覚的歪み量記憶部254に書き込む。本処理は,式(3)に従う。
予測残差信号視覚的歪み量更新部255:予測残差信号視覚的歪み量記憶部254より視覚的歪み量D0 ′を読み込み,視覚的歪み量臨界点閾値記憶部21より視覚的歪み量の臨界点閾値Dcr′を読み込み,両者の値の大小関係から視覚的歪み量D0 ′を視覚的歪み量D0 ″に更新し,その更新値を更新予測残差信号視覚的歪み量記憶部256に出力する。本処理部の詳細は,図10を参照して後述する。
更新予測残差信号視覚的歪み量ゼロ判定部257:更新予測残差信号視覚的歪み量記憶部256より更新された視覚的歪み量D0 ″を読み込み,その値がゼロであるかどうかの判定処理を行い,真の場合には,予測残差信号ゼロ埋め部258の処理に移り,偽の場合には,予測残差信号符号化部259の処理に移る。
予測残差信号ゼロ埋め部258:バッファより予測残差信号を読み込み,その値をすべてゼロに設定し,バッファに出力する。
予測残差信号符号化部259:バッファより予測残差信号を読み込み,その予測残差信号を符号化し,符号化データをバッファに出力する。
差分信号生成部260:バッファより予測残差信号の符号化データを読み込み,復号処理を行って復号信号を再構成し,それと原信号との差分信号を生成し,バッファに出力する。
差分信号視覚的歪み量算出部261:バッファより差分信号を読み込み,式(3)に従って差分信号の持つ視覚的歪み量D1 ′を算出し,その値を差分信号視覚的歪み量記憶部262に出力する。
差分信号視覚的歪み量更新部263:差分信号視覚的歪み量記憶部262より視覚的歪み量D1 ′を読み込み,視覚的歪み量臨界点閾値記憶部21より視覚的歪み量の臨界点閾値Dcr′を読み込み,両者の値の大小関係から視覚的歪み量D1 ′を視覚的歪み量D1 ″に更新し,その更新値を更新差分信号視覚的歪み量記憶部264に出力する。本処理部の詳細は,図10を参照して後述する。
動き推定予測モード符号化コスト算出部265:当該マクロブロックにおける各動き推定予測モードの符号化コストを算出し,レジスタに出力して最適予測モード決定部26に通知する。本処理は,式(8)に従う。
次に,図8に示す予測残差信号視覚的歪み量更新部205,差分信号視覚的歪み量更新部213,および図9に示す予測残差信号視覚的歪み量更新部255,差分信号視覚的歪み量更新部263の詳細を,図10を用いて説明する。
視覚的歪み量臨界点閾値比較部31:視覚的歪み量D′(D0 ′またはD1 ′)および視覚的歪み量の臨界点閾値Dcr′を読み込み,視覚的歪み量D′が臨界点閾値Dcr′以下であるか否かの判定処理を行い,真の場合には,視覚的歪み量ゼロ値設定部32の処理に移り,偽の場合には,視覚的歪み量減算部33の処理に移る。
視覚的歪み量ゼロ値設定部32:視覚的歪み量D′をゼロにし,更新された視覚的歪み量D″(D0 ″またはD1 ″)の値として出力する。
視覚的歪み量減算部33:視覚的歪み量D′から視覚的歪み量の臨界点閾値Dcr′を減算し,その減算された値を,更新された視覚的歪み量D″として出力する。
〔効果検証実験〕
本発明の実施形態による効果を検証するため,本発明による手法をSVCの参照エンコーダJSVM8.0に実装し,実験を行った。実験は,JSVM,非特許文献1による手法,本発明による手法の三つに対して行い,それぞれの発生符号量,符号化時間を比較した。実験条件は,以下のとおりである。
・エンコーダ:JSVM8.0
・シーケンス:Soccer,Foreman
・解像度:基本〔QCIF〕,拡張〔CIF〕
・フレームレート:30[frames/sec]
・フレーム数:300[frames]
・GOP:IBPBPBPBI
・QP:22,28
・探索範囲:64
・視距離:3
・臨界点閾値(Dcr′):1〜12[per pixel ]
・高速化閾値(Dth″):Dcr′と同じ
テスト映像として,SVCテスト映像のSoccer,Foremanを実験に用いた。基本レイヤにQCIF(176×144),拡張レイヤにCIF(352×288)を入力した。ピクチャ構造はIBPBPBPBIとした。量子化パラメータ(QP)は,22,28の2パターンを試した。基本レイヤと拡張レイヤとで同じQPを適用した。画質劣化検知の臨界点閾値Dcr′と高速化閾値Dth″は同じ値に設定し,1画素あたりの視覚的歪み量の値に換算して1から12までの値を試した。探索範囲は64に定めた。
符号量の結果を図11に,符号化時間の削減結果を図12に示す。図11および図12の横軸の数字は,1画素あたりの視覚的歪み量の臨界点閾値Dcr′および高速化閾値Dth″の値を示している。非特許文献1の手法は,JSVMと比較して2〜3%程度の符号量削減を達成しているが,その反面5%程度の符号化時間の増大を招いている。本発明を適用した手法は,その閾値の値によって符号量削減および符号化時間を調整することができる。閾値を大きくすると,より非動き推定予測モードが選ばれやすくなるため,符号化時間が短縮し,その反面,符号量は非特許文献1より若干増加することが見て取れる。しかし,視覚的歪み量の改良と予測残差信号のゼロ埋め効果により,符号量の増大分は小さく抑えられている。本発明による手法をJSVMと比較すると,適切な閾値の設定により符号量の削減と符号化時間の削減の両方を達成できることが確認できる。
例えば,ForemanのQP28の場合では,図11(d)および図12(d)に示されるように,1.2%の符号量の削減と,9.0%の符号化時間の削減が同時に達成されている。もちろん,以上の手法による主観画質に差がないことは確認済みである。
閾値がある箇所より大きくなると急激に符号量が増大するのは,予測残差信号をゼロにした影響によるものである。予測残差信号をゼロにするとそのフレームでは削減効果がある。しかし,そのフレームが予測参照フレームである場合,参照先を劣化させてしまうことになり,動き予測の性能を劣化させる可能性がある。この問題は,閾値が小さいと顕在化されないが,閾値が大きくなると,予測残差信号に要する符号量分を省くことができるゲインよりも動き予測の性能劣化によるロスが上回るようになってしまい,結果的に符号化性能の低下を招いているからであると考えられる。このことから,本発明を適用するフレームと適用しないフレームとを,例えば他のフレームから参照される予測参照フレームであるか否かなどにより決定して,それを指定情報として与え,特定のフレームに対してだけ本発明を適用する方法は好適であると考えられる。
以上の動画像符号化の処理は,コンピュータとソフトウェアプログラムとによって実現することができ,そのプログラムをコンピュータ読み取り可能な記録媒体に記録して提供することも,ネットワークを通して提供することも可能である。
本発明の実施形態の処理フローチャートである。 高速化アルゴリズムを適用した符号化処理(S12)の詳細を示すフローチャートである。 非動き推定予測モードにおける符号化コスト算出処理(S22)の詳細を示すフローチャートである。 動き推定予測モードにおける符号化コスト算出処理(S25)の詳細を示すフローチャートである。 視覚的歪み量の更新処理(S222,S228,S252,S258)の詳細を示すフローチャートである。 本発明の実施形態による符号化装置の構成図である。 高速化アルゴリズム適用符号化部の構成図である。 非動き推定予測モードにおける符号化コスト算出処理部の構成図である。 動き推定予測モードにおける符号化コスト算出処理部の構成図である。 視覚的歪み量更新部の構成図である。 本発明の効果検証実験における臨界点閾値および高速化閾値と発生符号量の関係を示す図である。 本発明の効果検証実験における臨界点閾値および高速化閾値と符号化時間の関係を示す図である。
符号の説明
10 符号化装置
11 高速化アルゴリズム適用/非適用フレーム判定部
12 高速化アルゴリズム適用符号化部
13 高速化アルゴリズム非適用符号化部
14 全フレーム処理完了判定部
15 符号化対象フレーム更新部
20 非動き推定予測モードにおける符号化コスト算出処理部
21 視覚的歪み量臨界点閾値記憶部
22 視覚的歪み量高速化閾値記憶部
23 視覚的歪み量高速化閾値比較部
25 動き推定予測モードにおける符号化コスト算出処理部
26 最適予測モード決定部
27 全マクロブロック符号化完了判定部
28 符号化対象マクロブロック更新部

Claims (8)

  1. 画素値の予測方法の選定において,発生符号量と画質劣化値との重み和からなる符号化コストを最小にする予測方法を選定し,選定された予測方法を用いて生成した予測値と原信号との差分信号を符号化する動画像符号化方法において,
    符号化対象の画像領域の差分信号に対して直交変換を施し,生成された各周波数成分にコントラスト感度関数値を乗算し,乗算された各周波数帯のエネルギーの画像領域内総和を画質劣化値として定めるステップと,
    前記画質劣化値が予め定められた画質劣化検知臨界値以下の場合には,前記画質劣化値を0に更新し,そうでない場合には,前記画質劣化検知臨界値を前記画質劣化値から減算したものを更新後の画質劣化値とするステップと,
    予測残差信号に対する更新後の画質劣化値が0の場合には,前記予測残差信号をすべて0に更新するステップと,
    更新後の画質劣化値を用いて予測方法の選定を行うステップと,
    更新後の予測残差信号を符号化するステップと,
    を有することを特徴とする動画像符号化方法。
  2. 画素値の予測方法の選定において,発生符号量と画質劣化値との重み和からなる符号化コストを最小にする予測方法を選定し,選定された予測方法を用いて生成した予測値と原信号との差分信号を符号化する動画像符号化方法において,
    符号化対象の画像領域の差分信号に対して直交変換を施し,生成された各周波数成分にコントラスト感度関数値を乗算し,乗算された各周波数帯のエネルギーの画像領域内総和を画質劣化値として定めるステップと,
    動き推定を実行しない予測方法の画質劣化値のデータ群の中に,予め定められた高速化閾値以下のものがある場合には,前記高速化閾値より小さい画質劣化値を与える予測方法の中で最も小さい符号化コストを与える予測方法を選別し,そうでない場合には,動き推定を実行する予測方法の符号化コストを前記画質劣化値を用いて算出し,すべての予測方法の符号化コストの中で最も小さい符号化コストを与える予測方法を選別するステップと,
    を有することを特徴とする動画像符号化方法。
  3. 画素値の予測方法の選定において,発生符号量と画質劣化値との重み和からなる符号化コストを最小にする予測方法を選定し,選定された予測方法を用いて生成した予測値と原信号との差分信号を符号化する動画像符号化方法において,
    符号化対象の画像領域の差分信号に対して直交変換を施し,生成された各周波数成分にコントラスト感度関数値を乗算し,乗算された各周波数帯のエネルギーの画像領域内総和を画質劣化値として定めるステップと,
    前記画質劣化値が予め定められた画質劣化検知臨界値以下の場合には,前記画質劣化値を0に更新し,そうでない場合には,前記画質劣化検知臨界値を前記画質劣化値から減算したものを更新後の画質劣化値とするステップと,
    予測残差信号に対する更新後の画質劣化値が0の場合には,前記予測残差信号をすべて0に更新するステップと,
    更新後の画質劣化値を用いて予測方法の選定を行うステップと,
    更新後の予測残差信号を符号化するステップと,
    動き推定を実行しない予測方法の更新後の画質劣化値のデータ群の中に,予め定められた高速化閾値以下のものがある場合には,前記高速化閾値より小さい更新後の画質劣化値を与える予測方法の中で最も小さい符号化コストを与える予測方法を選別し,そうでない場合には,動き推定を実行する予測方法の符号化コストを更新後の画質劣化値を用いて算出し,すべての予測方法の符号化コストの中で最も小さい符号化コストを与える予測方法を選別するステップと,
    を有することを特徴とする動画像符号化方法。
  4. 画素値の予測方法の選定において,発生符号量と画質劣化値との重み和からなる符号化コストを最小にする予測方法を選定し,選定された予測方法を用いて生成した予測値と原信号との差分信号を符号化する動画像符号化装置において,
    符号化対象の画像領域の差分信号に対して直交変換を施し,生成された各周波数成分にコントラスト感度関数値を乗算し,乗算された各周波数帯のエネルギーの画像領域内総和を画質劣化値として定める手段と,
    前記画質劣化値が予め定められた画質劣化検知臨界値以下の場合には,前記画質劣化値を0に更新し,そうでない場合には,前記画質劣化検知臨界値を前記画質劣化値から減算したものを更新後の画質劣化値とする手段と,
    予測残差信号に対する更新後の画質劣化値が0の場合には,前記予測残差信号をすべて0に更新する手段と,
    更新後の画質劣化値を用いて予測方法の選定を行う手段と,
    更新後の予測残差信号を符号化する手段と,
    を備えることを特徴とする動画像符号化装置。
  5. 画素値の予測方法の選定において,発生符号量と画質劣化値との重み和からなる符号化コストを最小にする予測方法を選定し,選定された予測方法を用いて生成した予測値と原信号との差分信号を符号化する動画像符号化装置において,
    符号化対象の画像領域の差分信号に対して直交変換を施し,生成された各周波数成分にコントラスト感度関数値を乗算し,乗算された各周波数帯のエネルギーの画像領域内総和を画質劣化値として定める手段と,
    動き推定を実行しない予測方法の画質劣化値のデータ群の中に,予め定められた高速化閾値以下のものがある場合には,前記高速化閾値より小さい画質劣化値を与える予測方法の中で最も小さい符号化コストを与える予測方法を選別し,そうでない場合には,動き推定を実行する予測方法の符号化コストを前記画質劣化値を用いて算出し,すべての予測方法の符号化コストの中で最も小さい符号化コストを与える予測方法を選別する手段と,
    を備えることを特徴とする動画像符号化装置。
  6. 画素値の予測方法の選定において,発生符号量と画質劣化値との重み和からなる符号化コストを最小にする予測方法を選定し,選定された予測方法を用いて生成した予測値と原信号との差分信号を符号化する動画像符号化装置において,
    符号化対象の画像領域の差分信号に対して直交変換を施し,生成された各周波数成分にコントラスト感度関数値を乗算し,乗算された各周波数帯のエネルギーの画像領域内総和を画質劣化値として定める手段と,
    前記画質劣化値が予め定められた画質劣化検知臨界値以下の場合には,前記画質劣化値を0に更新し,そうでない場合には,前記画質劣化検知臨界値を前記画質劣化値から減算したものを更新後の画質劣化値とする手段と,
    予測残差信号に対する更新後の画質劣化値が0の場合には,前記予測残差信号をすべて0に更新する手段と,
    更新後の画質劣化値を用いて予測方法の選定を行う手段と,
    更新後の予測残差信号を符号化する手段と,
    動き推定を実行しない予測方法の更新後の画質劣化値のデータ群の中に,予め定められた高速化閾値以下のものがある場合には,前記高速化閾値より小さい更新後の画質劣化値を与える予測方法の中で最も小さい符号化コストを与える予測方法を選別し,そうでない場合には,動き推定を実行する予測方法の符号化コストを更新後の画質劣化値を用いて算出し,すべての予測方法の符号化コストの中で最も小さい符号化コストを与える予測方法を選別する手段と,
    を備えることを特徴とする動画像符号化装置。
  7. 請求項1から請求項までのいずれか1項に記載の動画像符号化方法を,コンピュータに実行させるための動画像符号化プログラム。
  8. 請求項記載の動画像符号化プログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2008020420A 2008-01-31 2008-01-31 動画像符号化方法,装置,プログラムおよびコンピュータ読み取り可能な記録媒体 Expired - Fee Related JP4824708B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008020420A JP4824708B2 (ja) 2008-01-31 2008-01-31 動画像符号化方法,装置,プログラムおよびコンピュータ読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008020420A JP4824708B2 (ja) 2008-01-31 2008-01-31 動画像符号化方法,装置,プログラムおよびコンピュータ読み取り可能な記録媒体

Publications (2)

Publication Number Publication Date
JP2009182768A JP2009182768A (ja) 2009-08-13
JP4824708B2 true JP4824708B2 (ja) 2011-11-30

Family

ID=41036373

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008020420A Expired - Fee Related JP4824708B2 (ja) 2008-01-31 2008-01-31 動画像符号化方法,装置,プログラムおよびコンピュータ読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JP4824708B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4819855B2 (ja) * 2008-08-18 2011-11-24 日本電信電話株式会社 動画像量子化方法、動画像量子化装置、動画像量子化プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4819856B2 (ja) * 2008-08-18 2011-11-24 日本電信電話株式会社 動画像符号化方法、動画像符号化装置、動画像符号化プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体
US20120039389A1 (en) * 2009-04-28 2012-02-16 Telefonaktiebolaget L M Ericsson Distortion weighing

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4709074B2 (ja) * 2006-06-09 2011-06-22 日本電信電話株式会社 動画像符号化方法,装置,そのプログラムおよびそのプログラムを記録した記録媒体

Also Published As

Publication number Publication date
JP2009182768A (ja) 2009-08-13

Similar Documents

Publication Publication Date Title
US7805016B2 (en) Decoding apparatus and decoding method
JP6698077B2 (ja) モデルベースの映像符号化用の知覚的最適化
KR100989296B1 (ko) 아티팩트 평가를 통한 향상된 이미지/비디오 품질
JP4717136B2 (ja) 画像符号化装置および画像符号化方法
US20110200100A1 (en) Motion picture encoding/decoding apparatus, adaptive deblocking filtering apparatus and filtering method for same, and recording medium
US20110069752A1 (en) Moving image encoding/decoding method and apparatus with filtering function considering edges
JP5594841B2 (ja) 画像符号化装置及び画像復号装置
JP2009224854A (ja) 画像符号化装置及び方法
KR101529754B1 (ko) 암 노이즈 아티팩트를 검출하기 위한 방법 및 장치
JP4824708B2 (ja) 動画像符号化方法,装置,プログラムおよびコンピュータ読み取り可能な記録媒体
US11202082B2 (en) Image processing apparatus and method
TWI782853B (zh) 圖像編碼裝置、圖像編碼方法、圖像解碼裝置、圖像解碼方法
JP4528255B2 (ja) 映像復号装置および映像復号プログラム
JP5180550B2 (ja) 画像処理装置及び画像処理方法
JP4449430B2 (ja) 画像処理装置および画像処理方法、プログラム、並びに記録媒体
JP4719108B2 (ja) 映像符号化方法、映像符号化装置、映像符号化プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP6012307B2 (ja) 動画像符号化装置及びその制御方法、並びに、プログラム
JP5715533B2 (ja) 動画像画質復元装置、動画像画質復元方法、およびプログラム
JP2022158242A (ja) 符号化装置及び方法
JP2009027610A (ja) 動画像符号化方法,スケーラブル動画像符号化方法,動画像符号化装置,スケーラブル動画像符号化装置,およびそれらのプログラムとそれを記録したコンピュータ読み取り可能な記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100114

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100331

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110202

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110215

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110415

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110906

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110908

R150 Certificate of patent or registration of utility model

Ref document number: 4824708

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140916

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees