JP5971010B2 - 動画像復号装置及びプログラム、並びに、動画像符号化システム - Google Patents

動画像復号装置及びプログラム、並びに、動画像符号化システム Download PDF

Info

Publication number
JP5971010B2
JP5971010B2 JP2012168411A JP2012168411A JP5971010B2 JP 5971010 B2 JP5971010 B2 JP 5971010B2 JP 2012168411 A JP2012168411 A JP 2012168411A JP 2012168411 A JP2012168411 A JP 2012168411A JP 5971010 B2 JP5971010 B2 JP 5971010B2
Authority
JP
Japan
Prior art keywords
image
predicted image
predicted
decoding
key frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012168411A
Other languages
English (en)
Other versions
JP2014027600A (ja
Inventor
和仁 迫水
和仁 迫水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2012168411A priority Critical patent/JP5971010B2/ja
Priority to US13/940,637 priority patent/US9729871B2/en
Publication of JP2014027600A publication Critical patent/JP2014027600A/ja
Application granted granted Critical
Publication of JP5971010B2 publication Critical patent/JP5971010B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/31Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/395Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability involving distributed video coding [DVC], e.g. Wyner-Ziv video coding or Slepian-Wolf video coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/587Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/436Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、動画像復号装置及びプログラム、並びに、動画像符号化システムに関し、例えば、Slepian−Wolf理論及びWyner−Ziv理論に基づいた分散映像符号化方式(Distributed Video Coding:DVC方式)を用いたものに適用し得るものである。
非特許文献1は、Slepian−Wolf理論及びWyner−Ziv理論に基づき動画像の符号化及び復号を行う動画像符号化装置及び動画像復号装置について説明している代表的な論文である。
非特許文献1に記載の動画像復号装置は、キーストリームを入力とし、復号されたキーフレーム(復号キーフレームと呼ぶ)を出力するキーフレームデコーダと、WZストリーム(WZは、Wyner−Zivを省略したものである)を入力とし、復号されたWZフレーム(復号WZフレームと呼ぶ)を出力するWZフレームデコーダとを有する。WZフレームデコーダにおいては、予測画像生成部が復号キーフレームを入力としが予測画像を生成し、WZ復号部が、入力された予測画像をサイド情報(補助情報;Side Information)として利用しながら、WZストリームに対するWZ復号を行い、復号WZフレームを得る。
予測画像生成部は、フレームバッファを有し、例えば、非特許文献1で採用されている双方向動き補償補間方法(Bidirectional Motion Compensated Interpolation)を利用して、予測画像を生成する。双方向動き補償補間方法は、映像内の物体は等速直線運動するという仮定のもとで、予測したい時刻の前後に撮像されたフレームから、動き推定と動き補償を行って予測画像を生成する方法である。
非特許文献2は、Slepian−Wolf理論及びWyner−Ziv理論に基づき動画像の符号化及び復号を行う動画像符号化装置及び動画像復号装置に、ハッシュ(細切れ情報)という概念を追加した論文である。
非特許文献2に記載の動画像復号装置も、キーフレームデコーダと、WZフレームデコーダとを有する。非特許文献2の記載技術のWZフレームデコーダにおいて、予測画像生成部は、入力されたハッシュ及び復号キーフレームから予測画像を生成し、WZ復号部は、生成された予測画像と符号化装置側から与えられたWZストリ−ムを入力とし、入力された予測画像をサイド情報として利用しながら、WZストリームに対するWZ復号を行い、復号WZフレームを得る。
ここで、ハッシュは、予測画像の生成を補助するための情報である。非特許文献2では、画像をN×N画素毎にDCT変換(離散コサイン変換)したときのDC(直流)成分とAC(交流)成分の一部をハッシュとして採用している。予測画像生成部は、フレームバッファを有し、例えば、入力されたハッシュに最も近いハッシュを生成する領域を参照画像(フレームバッファ内の画像)の中から探し(動き推定)、その領域で補償することで(動き補償)、予測画像を生成する。
非特許文献2の記載方法は、ハッシュに含まれるDC成分とAC成分の一部で、動き推定を行えるという仮定のもとで予測画像を生成している。
X.Artigas, J.Ascenso, M.Dalai, S.Klomp, D.Kubasov and M.Ouaret,"The Discover Codec:Architecture, Techniques and Evaluation",in Picture Coding Symposium, 2007, vol.2007, pp.6−9 J.Ascenso and F.Pereira,"Adaptive Hash−Based Side Information Exploitation for Efficient Wyner−Ziv Video Coding",Image Processing 2007. ICIP 2007, 2007
キーフレームデコーダとWZフレームデコーダを備える動画像復号装置では、予測画像生成部の予測画像生成方法に応じて、予測画像の画質は劣化することも生じる。
例えば、非特許文献1の記載技術のように、復号キーフレームのみから予測画像を生成する際に、物体が等速直線運動しているという仮定が成立しない場合には、予測画像の画質は劣化する。また例えば、非特許文献2の記載技術のように、復号キーフレームとハッシュを組み合わせて予測画像を生成する際に、ハッシュに含まない情報(例えば、高周波成分(高周波のAC成分))が動き推定に重要となる場合には、予測画像の画質は劣化する。
予測画像の画質が劣化すれば、当然に、復号WZフレームの品質を悪化させる。
そのため、原画像の性質等に拘らず、復号画像の品質を向上できる動画像復号装置及びプログラム、並びに、動画像符号化システムが望まれている。
第1の本発明は、生成された予測画像をサイド情報として用いて復号手段が符号化画像を復号する動画像復号装置において、(1)それぞれ異なる方法で予測画像を生成する複数の予測画像生成手段と、(2)上記各予測画像生成手段で生成された複数の予測画像を合成し、上記復号手段に与える予測画像を得る予測画像合成手段と、(3)キーフレームが符号化されたキーフレーム符号化画像を復号するキーフレーム復号手段とを備え、(4)上記復号手段は、上記サイド情報と、対向する動画像符号化装置から与えられた符号化データとから、Slepian−Wolf復号を行って、非キーフレームが符号化された非キーフレーム符号化画像を復号するものであり、(5)上記各予測画像生成手段は、復号されたキーフレームを少なくとも用いて予測画像を生成するものあって、(6)上記各予測画像生成手段は、復号されたキーフレーム及び非キーフレームの動きベクトルの評価値を計算し、当該評価値を生成した予測画像の画質と推定し、画質情報として予測画像と共に出力し、(7)上記予測画像合成手段は、当該画質情報に基づき、画素毎に、それぞれの予測画像の画素値の中から最も画質の高い画素値を求め、求めた画素値を、合成された予測画像の画素値として設定することを特徴とする。
第2の本発明の動画像復号プログラムは、符号化画像を復号する動画像復号装置に用いられるコンピュータを、(1)それぞれ異なる方法で予測画像を生成する複数の予測画像生成手段と、(2)上記各予測画像生成手段で生成された複数の予測画像を合成し、合成予測画像を得る予測画像合成手段と、(3)生成された合成予測画像をサイド情報として用いて符号化画像を復号する復号手段と、(4)キーフレームが符号化されたキーフレーム符号化画像を復号するキーフレーム復号手段として機能させ、(5)上記復号手段は、上記サイド情報と、対向する動画像符号化装置から与えられた符号化データとから、Slepian−Wolf復号を行って、非キーフレームが符号化された非キーフレーム符号化画像を復号するものであり、(6)上記各予測画像生成手段は、復号されたキーフレームを少なくとも用いて予測画像を生成するものあって、(7)上記各予測画像生成手段は、復号されたキーフレーム及び非キーフレームの動きベクトルの評価値を計算し、当該評価値を生成した予測画像の画質と推定し、画質情報として予測画像と共に出力し、(8)上記予測画像合成手段は、当該画質情報に基づき、画素毎に、それぞれの予測画像の画素値の中から最も画質の高い画素値を求め、求めた画素値を、合成された予測画像の画素値として設定することを特徴とする。
第3の本発明は、動画像符号化装置と動画像復号装置とが対向する動画像符号化システムにおいて、上記動画像復号装置として、第1の本発明の動画像復号装置を適用したことを特徴とする。
本発明によれば、原画像の性質等に拘らず、復号画像の品質を向上させることができる。
第1の実施形態に係る動画像復号装置の構成を示すブロック図である。 第1の実施形態に係る動画像復号装置の動作を示すフローチャートである。 第2の実施形態に係る動画像復号装置の構成を示すブロック図である。 第2の実施形態における第1の予測画像生成部及び第2の予測画像生成部の第1の詳細構成例を示すブロック図である。 第2の実施形態における第1の予測画像生成部及び第2の予測画像生成部の第2の詳細構成例を示すブロック図である。 第2の実施形態に係る動画像復号装置の動作を示すフローチャートである。 第2の実施形態の効果の説明図(その1)である。 第2の実施形態の効果の説明図(その2)である。
(A)第1の実施形態
以下、本発明による動画像復号装置及びプログラム、並びに、動画像符号化システムの第1の実施形態を、図面を参照しながら詳述する。
(A−1)第1の実施形態の構成
図1は、第1の実施形態に係る動画像復号装置の構成を示すブロック図である。第1の実施形態の動画像符号化装置は、ハードウェア的に各種回路を接続して構築されても良く、また、CPU、ROM、RAMなどを有する汎用的な装置が動画像復号プログラムを実行することで動画像復号装置としての機能を実現するように構築されても良い。いずれの構築方法を適用した場合であっても、第1の実施形態の動画像復号装置の機能的構成は、図1で表すことができる。
なお、第1の実施形態の動画像復号装置と、図示しない対向する動画像符号化装置とで、第1の実施形態の動画像符号化システムが構成されている。例えば、動画像符号化装置として、キーストリームとWZストリームとハッシュとを生成して出力する非特許文献2に記載されている装置を適用できる。また例えば、動画像符号化装置として、キーストリームとWZストリームとを生成して出力する非特許文献1に記載されている装置の構成に、ハッシュの生成、出力構成を追加した装置を適用できる。
図1において、第1の実施形態の動画像復号装置100は、キーフレームデコーダ101及びWZフレームデコーダ102を有する。WZフレームデコーダ102は、第1の予測画像生成部103、第2の予測画像生成部104、予測画像合成部105及びWZ復号部106を有する。
図示しない動画像符号化装置は、数フレームおき(一定間隔でなくても良い)のキーとなるいくつかのフレームの画像(キーフレーム)に対して、動画像符号化を適用して圧縮してキーストリームKSTを生成して送出する。一方、その他のフレーム(若しくは全てのフレーム)が該当するWZフレーム(非キーフレーム)については、Slepian−Wolf理論及びWyner−Ziv理論に基づいた符号化を行い、得られたWZストリームWZSTを送出する。この第1の実施形態の場合、動画像符号化装置は、WZストリームの生成処理の中で、上述したハッシュHSを生成し、生成したハッシュHSも送出する。
キーフレームデコーダ101には、対向する動画像符号化装置から送出されたキーストリームKSTが入力される。キーフレームデコーダ101は、キーストリームKSTに対する復号処理を行い、復号キーフレームDKFLを得るものである。復号キーフレームDKFLは、次段の装置(若しくは次のプログラム部分)に与えられると共に、WZフレームデコーダ102内の第1の予測画像生成部103に与えられる。
キーフレームデコーダ101は、キーフレームの符号化方式に対応した復号を行うものである。キーフレームの符号化方式は任意であって良い。そのため、例えば、キーフレームデコーダ101がハイブリッド符号化方式に基づくデコーダで実現されていても良い。また例えば、キーフレームデコーダ101が、Slepian−Wolf理論及びWyner−Ziv理論に基づくものであっても良い。
WZフレームデコーダ102には、対向する動画像符号化装置から送出されたWZストリームWZST及びハッシュHSと、キーフレームデコーダ101から出力された復号キーフレームDKFLとが入力される。WZフレームデコーダ102は、これら入力信号を処理して、WZフレームを得る(復号する)ものであり、得られた復号WZフレームDWZFLは、次段の装置(若しくは次のプログラム部分)に与えられる。
第1の予測画像生成部103は、復号キーフレームDKFLのみから予測画像(以下、第1の予測画像と呼ぶ)PR1を生成するものである。
第2の予測画像生成部104は、ハッシュHSと復号キーフレームDKFLとから予測画像(以下、第2の予測画像と呼ぶ)PR2を生成するものである。
予測画像合成部105は、第1の予測画像PR1と第2の予測画像PR2とを合成した予測画像(以下、合成予測画像と呼ぶ)PRを生成するものである。
WZ復号部106は、合成予測画像PRとWZストリームWZSTを入力とし、合成予測画像PRをサイド情報として利用しながらWZ復号し、得られた復号WZフレームDWZFLを出力するものである。
(A−2)第1の実施形態の動作
次に、第1の実施形態に係る動画像復号装置100の動作を、図2のフローチャートを参照しながら説明する。
キーフレームデコーダ101において、キーストリームKSTを復号し、復号キーフレームDKFLを生成する(ステップS101)。
ここで、キーストリームKSTは、H.264/AVCのような既知のハイブリッド符号化方式で圧縮されたデータを適用できるが、それに限定されるものではない。例えば、キーストリームKST自体が、Slepian−Wolf理論及びWyner−Ziv理論に基づき動画像の符号化を行う動画像符号化装置によって圧縮されたデータであっても良い。
第1の予測画像生成部103において、復号キーフレームDKFLから所定の方法を用いて第1の予測画像PR1を生成する(ステップS102)。例えば、非特許文献1に記載の前後の復号キーフレームDKFLを利用する双方向動き補償補間方法を適用して、第1の予測画像PR1を生成する。
第2の予測画像生成部104において、ハッシュHSと復号キーフレームDKFLから所定の方法を用いて第2の予測画像PR2を生成する(ステップS103)。例えば、非特許文献2の記載方法を適用して第2の予測画像PR2を生成する。すなわち、入力されたハッシュHSに最も近いハッシュを生成する領域を参照画像(内蔵するフレームバッファ内に保存されている復号キーフレームDKFL)の中から探し(動き推定)、その領域で補償することで(動き補償)、第2の予測画像PR2を生成する。ここで、参照画像として用いる復号キーフレームDKFLは、現時刻より過去(後)のものであっても良く、現時刻より将来(前)のものであっても良く、現時刻より過去(後)及び将来(前)のものの双方であっても良い。
予測画像合成部105において、第1の予測画像生成部103で生成された第1の予測画像PR1と、第2の予測画像生成部104で生成された第2の予測画像PR2とを合成した予測画像PRを生成する(ステップS104)。2つの予測画像の合成方法は任意であって良い。例えば、画素毎に、第1の予測画像PR1における画素値と第2の予測画像PR2における画素値との平均値(単純平均でも、重みが固定の加重平均でも良い)を計算し、平均値を合成予測画像PRの画素値とする。
WZ復号部106で、合成予測画像をサイド情報として利用し、WZ復号し、復号WZフレームDWZFLを生成する(ステップS105)。
仮に、原画像の画素値が50、第1の予測画像PR1の画素値が40、第2の予測画像PR2の画素値が70であったとする。この場合、合成予測画像PRの画素値は(40+70)/2=55となる。第1の予測画像PR1の画素値と原画像の画素値の相違(差の絶対値)は10(=|40−50|)であり、第2の予測画像PR2の画素値と原画像の画素値の相違(差の絶対値)は20(=|70−50|)であるのに対し、合成予測画像PRの画素値と原画像の画素値の相違(差の絶対値)は5(=|55−50|)となり、合成予測画像PRと原画像の差が最も小さい。
以上のように、概ね、合成予測画像PRの品質が第1の予測画像PR1や第2の予測画像PR2の品質より良好となる。
(A−3)第1の実施形態の効果
第1の実施形態によれば、第1及び第2の予測画像生成部で生成された、劣化の性質が異なる第1及び第2の予測画像を合成して得た予測画像をWZ復号部に入力するようにしたので、WZ復号部に入力されるサイド情報の品質が向上し、その結果として復号画像の品質を向上させることができる。
上述した効果は、キーフレームの符号化方式を問わずに奏することができる。
(B)第2の実施形態
次に、本発明による動画像復号装置及びプログラム、並びに、動画像符号化システムの第2の実施形態を、図面を参照しながら詳述する。
(B−1)第2の実施形態の構成
図3は、第2の実施形態に係る動画像復号装置の構成を示すブロック図であり、第1の実施形態に係る図1との同一、対応部分には同一、対応符号を付して示している。
図3において、第2の実施形態に係る動画像復号装置100Aも、キーフレームデコーダ101及びWZフレームデコーダ102Aを備え、WZフレームデコーダ102Aが、第1の予測画像生成部103A、第2の予測画像生成部104A、予測画像合成部105A及びWZ復号部106を有するが、第1の予測画像生成部103A、第2の予測画像生成部104A及び予測画像合成部105Aが、第1の実施形態のものとは異なっている。
第2の実施形態の第1の予測画像生成部103Aは、入力されたハッシュHSと復号キーフレームDKFLとから、第1の予測画像PR1を生成するだけでなく、第1の予測画像PR1に関する画質情報(以下、第1の画質情報と呼ぶ)QU1を生成するものである。第1の予測画像生成部103Aによる第1の予測画像PR1の生成方法は、第1の実施形態と同様である。
第2の実施形態の第2の予測画像生成部104Aは、入力されたハッシュHSと復号キーフレームDKFLとから、第2の予測画像PR2を生成するだけでなく、第2の予測画像PR2に関する画質情報(以下、第2の画質情報と呼ぶ)QU2を生成するものである。第2の予測画像生成部104Aによる第2の予測画像PR2の生成方法は、第1の実施形態と同様である。
予測画像合成部105Aは、第1及び第2の画質情報QU1及びQU2に基づいた、第1及び第2の予測画像PR1及びPR2に対する重みを反映させるように、第1及び第2の予測画像PR1及びPR2を合成し、得られた合成予測画像PRをWZ復号部106に出力するものである。予測画像合成部105Aによる合成方法として、例えば、第1及び第2の画質情報QU1及びQU2に基づいた重みを適用した加重平均を挙げることができる。
図4は、第1の予測画像生成部103A及び第2の予測画像生成部104Aの第1の詳細構成例を示すブロック図である。
図4において、第1の予測画像生成部103Aは、動きベクトル推定部200、動き補償部201及び画質推定部202を有する。
動きベクトル推定部200は、復号キーフレームDKFLから動きベクトルMB1を推定するものである。動き補償部201は、動きベクトルMB1と復号キーフレームDKFLから第1の予測画像PR1を生成するものである。画質推定部202は、ハッシュHSと第1の予測画像PR1から第1の画質情報QU1を求めるものである。動きベクトル推定部200及び動き補償部201としては、非特許文献1に記載の予測画像の生成構成を適用できる。
図4において、第2の予測画像生成部104Aは、動きベクトル推定部300、動き補償部301及び画質推定部302を有する。
動きベクトル推定部300は、ハッシュHSと復号キーフレームDKFLから動きベクトルMB2を推定するものである。動き補償部301は、動きベクトルMB2と復号キーフレームDKFLから第2の予測画像PR2を生成するものである。画質推定部302は、ハッシュHSと第2の予測画像PR2から第2の画質情報QU2を求めるものである。動きベクトル推定部300及び動き補償部301としては、非特許文献2に記載の予測画像の生成構成を適用できる。
画質推定部202及び302は、同様な方法により、画質情報QU1、QU2を形成する。以下、画質推定部202を例にして、画質情報(第1の画質情報QU1)の形成方法を説明する。ここでの画質情報は、画質の推定値である。
画質推定部202は、生成された第1の予測画像PR1からハッシュHSPR1を生成し、生成したハッシュHSPR1と入力されたハッシュHSの大きさの差を画質の推定値((第1の画質情報QU1)とする。
図5は、第1の予測画像生成部103A及び第2の予測画像生成部104Aの第2の詳細構成例を示すブロック図であり、図4との同一、対応部分には同一符号を付して示している。
図5において、第1の予測画像生成部103Aは、動きベクトル推定部200、動き補償部201及び画質推定部202を有し、画質推定部202が図4の詳細構成例のものと異なっている。画質推定部202は、入力されたハッシュHSと動きベクトルMB1から第1の画質情報QU1を求めるものである。
第2の予測画像生成部104Aは、動きベクトル推定部300、動き補償部301及び画質推定部302を有し、画質推定部302が図4の詳細構成例のものと異なっている。画質推定部302は、入力されたハッシュHSと動きベクトルMB2から第2の画質情報QU2を求めるものである。
図5における画質推定部202及び302は、同様な方法により、ハッシュHSと動きベクトルMB1、MB2から画質情報QU1、QU2を形成する。以下、画質推定部202を例にして、画質情報(第1の画質情報QU1)の形成方法を説明する。ここでの画質情報は画質の推定値である。
ハッシュHSが、非特許文献2に記載のもののように、DC成分とAC成分の一部であるとする。ハッシュHSから画像PRHSを生成し、加えて、動きベクトルの推定に利用した参照画像と同時刻のハッシュHS2から画像PRHS2を生成し、第1の予測画像PR1を生成するのに利用した動きベクトルMB1の評価値を、ハッシュHSから生成された画像PRHSとハッシュHS2から生成された画像PRHS2との間で求め、この評価値を画質の推定値(第1の画質情報QU1)とする。なお、上記の方法より一部の性能が低下するが、上記の方法に代え、動きベクトルの推定に利用した時刻のハッシュHSから画像PRHSを生成し、第1の予測画像PR1を生成するのに利用した動きベクトルMB1の評価値を、ハッシュHSから生成された画像PRHSと第1の予測画像PR1との間で求め、この評価値を画質の推定値(第1の画質情報QU1)とするようにしても良い。
非特許文献2の記載技術の場合、逆離散コサイン変換(IDCT;Inverse DCT)することで、ハッシュHSから画像PRHSを生成することができる。動きベクトルの評価値として、例えば、画素毎の画素値の差分絶対値の総和(SAD;Sum of Absolute Differences)や、画素毎の画素値の差分絶対値の平均(MAD;Mean Absolute Difference)を適用できる。
動きベクトルの推定単位(例えば、MxM画素ブロック単位で動きベクトルを求めるとする)が、DCT変換ブロック(例えば、NxN画素ブロック単位でDCT変換するとする)よりも小さい場合、すなわち、M<Nの場合、動きベクトルの評価値を画質情報として利用することで、NxN画素ブロック単位で、画素の画質を推定することができる。
(B−2)第2の実施形態の動作
次に、第2の実施形態に係る動画像復号装置100Aの動作を、図6のフローチャートを参照しながら説明する。図6において、第1の実施形態に係る図2との同一、対応ステップには同一、対応符号を付して示している。
キーフレームデコーダ101において、キーストリームKSTを復号し、復号キーフレームDKFLを生成する(ステップS101)。
第1の予測画像生成部103Aにおいて、ハッシュHSと復号キーフレームDKFLから所定の方法を用いて第1の予測画像PR1と第1の画質情報QU1を生成する(ステップS102A)。
第2の予測画像生成部104Aにおいて、ハッシュHSと復号キーフレームDKFLから所定の方法を用いて第2の予測画像PR2と第2の画質情報QU2を生成する(ステップS103A)。
ここで、画質情報QU1、QU2の生成方法は、図4又は図5を用いて説明した方法である。
予測画像合成部105において、第1の予測画像生成部103と第2の予測画像生成部104で生成された画質情報QU1、QU2を合成用のパラメータとして利用して、第1の予測画像生成部103と第2の予測画像生成部104で生成された予測画像PR1及びPR2を合成し、合成後の予測画像PRを得る(ステップS104A)。
画質情報QU1、QU2を合成用のパラメータとして、予測画像PR1及びPR2を合成する方法として、例えば、以下のような加重平均を適用できる。
第1の予測画像PR1のある1画素の画素値がP1で画質がQ1、第2の予測画像PR2の同一箇所の画素の画素値がP2で画質がQ2であったとする。
画質情報Q1、Q2が、例えば、生成した予測画像からハッシュを生成し、生成したハッシュとハッシュHSの大きさの差で与えられている場合、(1)式に従う加重平均により、合成予測画像PRの画素値Pを得る。画質情報は、値が小さい方が画質が良いことを表すコストとなっている。そのため、画質情報(コスト)が小さい場合に他方の予測画像の重みを小さくし、当該画質情報に対応する予測画像の選択度合いを高めるようにすることとした。この考え方を式で表現したものが(1)式である。
P=[Q2/(Q1+Q2)]*P1+[Q1/(Q1+Q2)]*P2
…(1)
また、画質情報QU1、QU2を合成用のパラメータとして、予測画像PR1及びPR2を合成する他の方法として、例えば、以下のような高画質選択を適用できる。2つの予測画像の画素値の中から、画質の高い方の画素値を選び、その選択した画素値を合成予測画像の画素値として設定する。
最後に、WZ復号部106で、合成予測画像をサイド情報として利用し、WZ復号し、復号WZフレームDWZFLを生成する(ステップS105)。
(B−3)第2の実施形態の効果
第2の実施形態によっても、第1及び第2の予測画像生成部で生成された、劣化の性質が異なる第1及び第2の予測画像を合成して得た予測画像をWZ復号部に入力するようにしたので、WZ復号部に入力されるサイド情報の品質が向上し、その結果として復号画像の品質を向上させることができる。
ここで、第2の実施形態においては、第1及び第2の予測画像の画質情報をも得て、各画質情報の良否を反映させて、第1及び第2の予測画像を合成するようにしたので、第1の実施形態以上に、高画質な合成予測画像を期待することができる。
以下、第1及び第2の予測画像を単純平均して合成予測画像を形成するより、第1及び第2の予測画像の画質情報を適用し、第1及び第2の予測画像を加重平均して合成予測画像を形成する方が、合成予測画像の画質が向上する場合が多くなることを、図7及び図8を参照しながら説明する。
図7は、第1及び第2の予測画像を単純平均して合成予測画像を形成する場合を示している。図8は、第1及び第2の予測画像の画質情報を適用し、第1及び第2の予測画像を加重平均して合成予測画像を形成する場合を示している。図7及び図8は、説明を簡単にするために、4×4画素の計16画素の画像の例を示している。図7及び図8のそれぞれにおける4つの画像のうち、左上の画像が原画像を示し、右上の画像が第1の予測画像PR1を示し、左下の画像が第2の予測画像PR2を示し、右下の画像が合成予測画像PRを示している。
この例の場合、第1の予測画像PR1は、原画像と比べて右上の4画素と左下の4画素が劣化しており(原画像と異なる値を取っている)、第2の予測画像PR2は、原画像と比べて左下の4画素が劣化している。この例では、2×2画素ブロック単位で劣化を発生させているが、これは説明を簡略化するためである。
それぞれの予測画像の誤差の総和を計算すると、第1の予測画像PR1は「22」で、第2の予測画像PR2は「16」である。
図7の合成予測画像PRは、画素毎に、第1の予測画像PR1と第2の予測画像PR2の平均値を求めることで生成したものである。例えば、左下の画素の場合、第1の予測画像PR1の画素値が「21」で、第2の予測画像PR2の画素値が「19」であるから、その平均値の「20」を合成予測画像PRの左下の画素の値に設定している。合成予測画像PRの誤差の総和を計算すると、「24」となる。この誤差の総和は、第1の予測画像PR1や第2の予測画像PR2の誤差の総和よりも大きい。
以上のように、ある領域では、第1の予測画像PR1よりも第2の予測画像PR2の方が高品質で、別の領域では、第2の予測画像PR2よりも第1の予測画像PR1の方が高品質な場合に、第1の予測画像PR1と第2の予測画像PR2の単純平均処理によって生成される合成予測画像PRの品質が、第1の予測画像PR1や第2の予測画像PR2よりも悪化する場合がある。
図8は、図4を用いて説明した画質情報の形成方法を適用した第2の実施形態の場合である。
この例では、ハッシュは、画素ブロック毎のDC成分であるとする。すなわち、2×2画素ブロック毎にDC成分を求め、ハッシュとする。
第2の実施形態では、原画像のハッシュと予測画像のハッシュを用いて予測画像の画質を推定し、画質に基づき画素値の加重平均を求めることで、合成予測画像PRを生成する。ここで、原画像のハッシュHSは、対向する動画像符号化装置から与えられるデータである。予測画像PR1、PR2が劣化していた場合、予測画像PR1、PR2のハッシュは、原画像のハッシュと異なる可能性が高い。図8の場合、予測画像の劣化している領域では、予測画像のハッシュも原画像のハッシュとは異なる値となっている。ここでは、予測画像のハッシュと原画像のハッシュの差を予測画像の画質に用いる。
加重平均は、画素単位で計算するので、画質は画素単位で必要になる。この例のように、ハッシュが2×2画素ブロック毎に与えられる場合、画質(ハッシュの差)も2×2画素ブロック毎に与えられる。このような場合は、2×2画素ブロック内に含まれる4画素全てに2×2画素ブロックの画質を与える。
例えば、合成予測画像PRの左下の画素の画素値を求める場合、第1の予測画像PR1の左下の画素の画質は|21−23|=2であり、第2の予測画像PR2の左下の画素の画質は|19−23|=4である。この画質情報を用いて、左下の画素の画素値の加重平均を求めると、[4/(2+4)]*21+[2/(2+4)]*19=20.3333…が得られる。画素値は整数であるとすると、合成予測画像PRの画素値は20となる(四捨五入)。
同様の手順で、全ての画素の画素値を求めたものが、図8の合成予測画像PRとなっている。その結果、得られる合成予測画像の誤差の総和は「12」である。第1の予測画像PR1の誤差の総和は「22」であり、第2の予測画像PR2の誤差の総和は「16」であるから、合成予測画像PRは、最も低い誤差の総和を実現できている。
(C)他の実施形態
上記各実施形態では、WZフレームデコーダが、第1及び第2の予測画像生成部を備え、得られた第1及び第2の予測画像を予測画像合成部が合成すものを示したが、予測画像生成部の個数が2個に限定されず、3個以上の予測画像生成部を有するものであっても良い。但し、各予測画像生成部における予測画像の生成方法が異なっていることを要する。
上記各実施形態では、複数の予測画像の合成方法として、複数の画素値の単純平均、複数の画素値の加重平均、複数の画素値からの画質情報に応じた選択などを説明したが、合成方法は、これらに限定されるものではない。例えば、3個以上の予測画像生成部を有する場合、複数の画素値からの中央値の選択や、多数決選択などを挙げることができる。
上記各実施形態では、予測画像生成部における生成方法として、非特許文献1や非特許文献2に記載の生成方法を挙げたが、予測画像生成部における生成方法がこれらに限定されないことは勿論である。例えば、内挿補間で予測画像を生成する方法に加え、外挿補間で予測画像を生成する方法を適用するようにしても良い。また、復号で得られたWZフレームを利用して予測画像を生成するようにしても良い。
上記第2の実施形態においては、ハッシュから生成された画像間で、画質情報として、動きベクトルの評価値(コスト)を計算しているが、画質情報として適用できる動きベクトルの評価値(コスト)を、他の2画像間で求めるようにしても良い。例えば、下記の参考文献の記載技術のように、一度WZ復号された画像がある場合、当該WZ復号された画像と復号キーフレームDKFL(参照フレーム)との間で動きベクトルの評価値(コスト)を計算することもできる。WZ復号された画像と復号キーフレームDKFLは共に、ハッシュに比べて多くの情報を有しており、このような多く情報を用いて動きベクトルの評価値を計算すると、さらに高い精度で画質情報を取得することができる。
参考文献:X.Artigas and L.Torres,“Iterative Generation of Motion−Compensated Side Information for Distributed Video Coding”,IEEE International Conference on Image Processing 2005,p.I−833, 2005
上記各実施形態では、合成予測画像をWZ復号部に入力するものを示したが、他の処理部にも与えて処理させるようにしても良い。
上記各実施形態では、非キーフレームの符号化方式が、Slepian−Wolf理論及びWyner−Ziv理論に基づいた符号化方式であるものを示したが、復号側で予測画像を生成して利用する符号化方式であれば良く、Slepian−Wolf理論及びWyner−Ziv理論に基づいた符号化方式に限定されるものではない。
100、100A…動画像復号装置、101…キーフレームデコーダ、102、102A…WZフレームデコーダ、103、103A…第1の予測画像生成部、104、104A…第2の予測画像生成部、105、105A…予測画像合成部、106…WZ復号部。

Claims (6)

  1. 生成された予測画像をサイド情報として用いて復号手段が符号化画像を復号する動画像復号装置において、
    それぞれ異なる方法で予測画像を生成する複数の予測画像生成手段と、
    上記各予測画像生成手段で生成された複数の予測画像を合成し、上記復号手段に与える予測画像を得る予測画像合成手段と
    キーフレームが符号化されたキーフレーム符号化画像を復号するキーフレーム復号手段とを備え、
    上記復号手段は、上記サイド情報と、対向する動画像符号化装置から与えられた符号化データとから、Slepian−Wolf復号を行って、非キーフレームが符号化された非キーフレーム符号化画像を復号するものであり、
    上記各予測画像生成手段は、復号されたキーフレームを少なくとも用いて予測画像を生成するものあって、
    上記各予測画像生成手段は、復号されたキーフレーム及び非キーフレームの動きベクトルの評価値を計算し、当該評価値を生成した予測画像の画質と推定し、画質情報として予測画像と共に出力し、
    上記予測画像合成手段は、当該画質情報に基づき、画素毎に、それぞれの予測画像の画素値の中から最も画質の高い画素値を求め、求めた画素値を、合成された予測画像の画素値として設定する
    ことを特徴とする動画像復号装置。
  2. 少なくとも一つの上記予測画像生成手段は、対向する動画像符号化装置から与えられたハッシュと、復号されたキーフレームとを用いて、動き推定及び補償を行うことにより、予測画像を生成するものであって、
    上記ハッシュは、予測画像の生成を補助するための情報あって、上記予測画像の原画像を画素毎に離散コサイン変換したときの直流成分と交流成分の一部である
    ことを特徴とする請求項に記載の動画像復号装置。
  3. 少なくとも一つの上記予測画像生成手段は、前後の時刻の復号キーフレームから予測画像を生成し、
    少なくとも一つの他の上記予測画像生成手段は、上記ハッシュと、前の時刻、後の時刻、あるいは、前後の時刻の復号キーフレームから予測画像を生成する
    ことを特徴とする請求項に記載の動画像復号装置。
  4. 上記各予測画像生成手段は、予測画像の画質を画素毎に推定し、画質情報として出力することを特徴とする請求項1〜3のいずれかに記載の動画像復号装置。
  5. 符号化画像を復号する動画像復号装置に用いられるコンピュータを、
    それぞれ異なる方法で予測画像を生成する複数の予測画像生成手段と、
    上記各予測画像生成手段で生成された複数の予測画像を合成し、合成予測画像を得る予測画像合成手段と、
    生成された合成予測画像をサイド情報として用いて符号化画像を復号する復号手段と
    キーフレームが符号化されたキーフレーム符号化画像を復号するキーフレーム復号手段として機能させ、
    上記復号手段は、上記サイド情報と、対向する動画像符号化装置から与えられた符号化データとから、Slepian−Wolf復号を行って、非キーフレームが符号化された非キーフレーム符号化画像を復号するものであり、
    上記各予測画像生成手段は、復号されたキーフレームを少なくとも用いて予測画像を生成するものあって、
    上記各予測画像生成手段は、復号されたキーフレーム及び非キーフレームの動きベクトルの評価値を計算し、当該評価値を生成した予測画像の画質と推定し、画質情報として予測画像と共に出力し、
    上記予測画像合成手段は、当該画質情報に基づき、画素毎に、それぞれの予測画像の画素値の中から最も画質の高い画素値を求め、求めた画素値を、合成された予測画像の画素値として設定する
    ことを特徴とする動画像復号プログラム。
  6. 動画像符号化装置と動画像復号装置とが対向する動画像符号化システムにおいて、
    上記動画像復号装置として、請求項1に記載の動画像復号装置を適用したことを特徴とする動画像符号化システム。
JP2012168411A 2012-07-30 2012-07-30 動画像復号装置及びプログラム、並びに、動画像符号化システム Active JP5971010B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2012168411A JP5971010B2 (ja) 2012-07-30 2012-07-30 動画像復号装置及びプログラム、並びに、動画像符号化システム
US13/940,637 US9729871B2 (en) 2012-07-30 2013-07-12 Video image decoding apparatus and video image encoding system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012168411A JP5971010B2 (ja) 2012-07-30 2012-07-30 動画像復号装置及びプログラム、並びに、動画像符号化システム

Publications (2)

Publication Number Publication Date
JP2014027600A JP2014027600A (ja) 2014-02-06
JP5971010B2 true JP5971010B2 (ja) 2016-08-17

Family

ID=49994886

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012168411A Active JP5971010B2 (ja) 2012-07-30 2012-07-30 動画像復号装置及びプログラム、並びに、動画像符号化システム

Country Status (2)

Country Link
US (1) US9729871B2 (ja)
JP (1) JP5971010B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104093030B (zh) * 2014-07-09 2017-12-12 天津大学 分布式视频编码边信息生成方法
CN106534873B (zh) * 2016-11-29 2019-05-03 四川大学 基于小波域的分布式视频编码关键帧丢失错误保护方法
CN108875525A (zh) * 2018-01-04 2018-11-23 北京旷视科技有限公司 行为预测方法、装置、系统和存储介质
JP2019203997A (ja) * 2018-05-24 2019-11-28 コニカミノルタ株式会社 画像形成装置及びプログラム
CN108712653B (zh) * 2018-05-25 2019-12-10 西安电子科技大学 基于迭代相关性噪声细化的单向分布式视频解码方法
US11469881B2 (en) * 2018-12-26 2022-10-11 Korea Institute Of Science And Technology Apparatus and method for forgery prevention of digital information
WO2020140954A1 (en) * 2019-01-02 2020-07-09 Beijing Bytedance Network Technology Co., Ltd Simplification of hash-based motion searching
CN114222124B (zh) * 2021-11-29 2022-09-23 广州波视信息科技股份有限公司 一种编解码方法及设备

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006279917A (ja) * 2005-03-04 2006-10-12 Mitsubishi Electric Corp 動画像符号化装置、動画像復号装置及び動画像伝送システム
JP5016561B2 (ja) * 2008-06-25 2012-09-05 シャープ株式会社 動画像符号化装置、動画像復号装置、動画像符号化方法、及び動画像復号方法
JP2010166145A (ja) * 2009-01-13 2010-07-29 Osaka Univ 動画像復号装置
JP5131224B2 (ja) * 2009-02-19 2013-01-30 沖電気工業株式会社 動画像復号装置、方法及びプログラム、動画像符号化装置、方法及びプログラム、並びに、動画像符号化システム
KR101623062B1 (ko) * 2010-02-23 2016-05-20 니폰덴신뎅와 가부시키가이샤 움직임 벡터 추정 방법, 다시점 영상 부호화 방법, 다시점 영상 복호 방법, 움직임 벡터 추정 장치, 다시점 영상 부호화 장치, 다시점 영상 복호 장치, 움직임 벡터 추정 프로그램, 다시점 영상 부호화 프로그램 및 다시점 영상 복호 프로그램
US20130266078A1 (en) * 2010-12-01 2013-10-10 Vrije Universiteit Brussel Method and device for correlation channel estimation
JP2012120108A (ja) * 2010-12-03 2012-06-21 Oki Electric Ind Co Ltd 補間画像生成装置及びプログラム、並びに、動画像復号装置及びプログラム

Also Published As

Publication number Publication date
JP2014027600A (ja) 2014-02-06
US9729871B2 (en) 2017-08-08
US20140029666A1 (en) 2014-01-30

Similar Documents

Publication Publication Date Title
JP5971010B2 (ja) 動画像復号装置及びプログラム、並びに、動画像符号化システム
TWI669953B (zh) 用於視訊編解碼的基於模型的運動向量推導
CA2863170C (en) Video decoder, video encoder, video decoding method, and video encoding method
JP5620109B2 (ja) 動きベクトル推定方法、動きベクトル推定装置、ビデオエンコーダ、ビデオデコーダ及びデコーディング方法
AU2011240486B2 (en) Method for performing localized multihypothesis prediction during video coding of a coding unit, and associated apparatus
JP5612214B2 (ja) 階層的映像符号化及び復号化のための方法及び装置
KR101442608B1 (ko) 영상을 효율적으로 부호화/복호화하는 방법 및 장치
KR100694137B1 (ko) 동영상 부호화 장치, 동영상 복호화 장치, 및 그 방법과,이를 구현하기 위한 프로그램이 기록된 기록 매체
JP2006279573A (ja) 符号化装置と方法、ならびに復号装置と方法
CA2788954A1 (en) Motion vector predictive encoding method, motion vector predictive decoding method, moving picture encoding apparatus, moving picture decoding apparatus, and programs thereof
WO2011099440A1 (ja) 動きベクトル予測符号化方法、動きベクトル予測復号方法、動画像符号化装置、動画像復号装置およびそれらのプログラム
JP2006080925A (ja) 動画符号化装置、動画符号化方法および動画符号化プログラム
JP4626608B2 (ja) 動画像階層符号化装置、動画像階層符号化プログラム、動画像階層復号化装置及び動画像階層復号化プログラム
JP5802786B2 (ja) 符号化装置、復号装置及びプログラム
JP5512502B2 (ja) 符号化装置、復号装置及びプログラム
Badem et al. An iterative side information refinement technique for transform domain distributed video coding
JP5281597B2 (ja) 動きベクトル予測方法,動きベクトル予測装置および動きベクトル予測プログラム
Taieb et al. Progressive Coding and Side Information Updating for Distributed Video Coding.
Abou-Elailah et al. Fusion of global and local side information using support vector machine in transform-domain DVC
WO2011099242A1 (ja) 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法
Abou-Elailah et al. Successive refinement of side information using adaptive search area for long duration GOPs in distributed video coding
JP6004852B2 (ja) ピクセルブロックを符号化及び再構成する方法と装置
KR101615507B1 (ko) 움직임 정보를 이용한 해상도 변환 방법 및 그 장치
JP2012120108A (ja) 補間画像生成装置及びプログラム、並びに、動画像復号装置及びプログラム
Li et al. Fast motion estimation algorithm by finite-state side match for H. 264 video coding standard

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150515

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160315

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160511

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160614

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160627

R150 Certificate of patent or registration of utility model

Ref document number: 5971010

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150