JP2010206395A - 動画像符号化装置、方法及びプログラム、並びに、動画像符号化システム - Google Patents

動画像符号化装置、方法及びプログラム、並びに、動画像符号化システム Download PDF

Info

Publication number
JP2010206395A
JP2010206395A JP2009048263A JP2009048263A JP2010206395A JP 2010206395 A JP2010206395 A JP 2010206395A JP 2009048263 A JP2009048263 A JP 2009048263A JP 2009048263 A JP2009048263 A JP 2009048263A JP 2010206395 A JP2010206395 A JP 2010206395A
Authority
JP
Japan
Prior art keywords
frame
motion information
motion
key
key frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009048263A
Other languages
English (en)
Other versions
JP5071413B2 (ja
Inventor
Takahiro Yamazaki
貴宏 山崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2009048263A priority Critical patent/JP5071413B2/ja
Priority to US12/654,408 priority patent/US20100220787A1/en
Publication of JP2010206395A publication Critical patent/JP2010206395A/ja
Application granted granted Critical
Publication of JP5071413B2 publication Critical patent/JP5071413B2/ja
Priority to US14/048,677 priority patent/US9667961B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/395Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability involving distributed video coding [DVC], e.g. Wyner-Ziv video coding or Slepian-Wolf video coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】 キーフレームについて復号器から符号化器へ情報をフィードバックしない動画像符号化装置を提供する。
【解決手段】 本発明の動画像符号化装置は、キーフレームについては、フレーム内符号化又はフレーム間符号化するキーフレーム符号化器と、非キーフレームについては、時間方向が異なるキーフレームから形成した予測画像と、非キーフレームの原画像との差である予測誤差信号に対する誤り訂正符号の情報を得る非キーフレーム符号化器とを有する。
キーフレーム符号化器は、参照用キーフレームの動き補償をする際に必要となる動き情報を、予測画像の生成時に利用する、非キーフレーム符号化器が生成した動き情報を補正して形成する。又は、非キーフレーム符号化器は、予測画像の生成時に利用する動き情報を、参照用キーフレームの動き補償をする際に必要となる、キーフレーム符号化器が生成した動き情報を補正して形成する。
【選択図】 図1

Description

本発明は、動画像符号化装置、方法及びプログラム、並びに、動画像符号化システムに関し、例えば、分散映像符号化方式(Distributed Video Coding:以下、DVC方式と呼ぶ)を用いたものに適用し得るものである。
近年、非特許文献1に記載されるようなDVC方式という新しい符号化方式が注目されている。
このDVC方式は、動画像の符号化において、いくつかのフレーム(以下、キーフレームと呼ぶ)についてはフレーム内符号化を適用し(なお、キーフレームに対して、フレーム間符号化方式を適用していることもある)、一方、その他のフレーム(若しくは全て)のフレーム(Wyner−Zivフレーム(非キーフレーム))については、時間方向の予測誤差信号の誤り訂正符号(パリティビット)のみを符号化して伝送するものである。
今日のDVC方式は、Slepian−Wolf定理及びWyner−Ziv定理という2つのキーとなる情報理論に基づいた新しい圧縮方式である。DVC方式は、Wyner−Zivフレーム符号化器で符号化するべき原画像(Wyner−Zivフレーム:以下、WZフレームと呼ぶ)に対してSlepian−Wolf符号化処理を行い、その符号化データとWyner−Zivフレーム復号器側で得たWyner−Zivフレーム符号化器側の原画像の予測画像とを基にSlepian−Wolf復号を行う、新しい符号化方式である。
非特許文献1に記載されるようなDVC方式は、キーフレームの符号化、復号には特徴がないので、以下、非特許文献1の図1を参照しながら、WZフレームの符号化、復号の面から説明する。
Wyner−Zivフレーム符号化器で、符号化するべきWZフレームを変換係数領域に変換(DCT)した後、帯域毎に、量子化(2MK level Quantizer)し、その量子化値(q)を2値で表し、各ビットの情報を、例えば、1フレーム分集めた情報(Extract bit−planes)毎にSlepian−Wolf符号化(Turbo Encoder)を行い、その結果のうち、パリティピットのみを一時保存(Buffer)し、情報ピットは捨てられる(非特許文献1の図1には明確に図示されていない)。
Wyner−Zivフレーム復号器では、予測画像を生成し(Interpolation/Extrapolation)、その予測画像を変換係数領域に変換(DCT)し、帯域毎に、サイドインフォメーション(サイドインフォメーション;副次情報)としてSlepian−Wolf復号部(Turbo Decoder)に入力する。
Slepian−Wolf復号部は、Wyner−Zivフレーム符号化器に対して、一時保存しているパリティピットのうち一部に対して送信要求(Request bits)を行う。受信したパリティビットと、上述したサイドインフォメーションからSlepian−Wolf復号を行う。十分な復号が行えなかった場合には、再度、Wyner−Zivフレーム符号化器側にパリティビットの一部の追加送信要求(Request bits)を行い、受信したパリティビットと上述したサイドインフォメーションからSlepian−Wolf復号を行う。この処理を、十分な復号が行えるまで続ける。
その後、Slepian−Wolf復号の復号値と、サイドインフォメーションから変換係数を再構築し、逆変換(IDCT)することで復号画像を得る。
非特許文献1の記載技術では、キーフレームをイントラ(フレーム内)符号化しているため、キーフレームの符号化効率が上がらないとう問題点がある。
この問題に対し、非特許文献2の記載技術は、キーフレームをインター(フレーム間)符号化することで符号化効率を向上させている。非特許文献2の記載技術におけるインター符号化の手法は、キーフレーム符号化器が既に復号したキーフレームから動き推定を行い、得られた動き情報をキーフレーム符号化器にフィードバックすることによってインター符号化を実現している。
一方、非特許文献1に記載されているような一般のDVC方式では、パンクチャー(puncture)された誤り訂正符号の一部をWyner−Zivフレーム復号器へ送信し、Wyner−Zivフレーム復号器で誤り訂正符号を受け取り、誤り訂正を行う。このとき、Wyner−Zivフレーム復号器が十分に誤り訂正できない場合は、Wyner−Zivフレーム符号化器へ追加の誤り訂正符号の送信を要求し、十分に誤り訂正が可能になるまでこれを繰り返す。そのため、再送要求というフィードバックを行うために、遅延が生じることや、Wyner−Zivフレーム符号化器とWyner−Zivフレーム復号器が単独で動作できないという問題がある。
非特許文献3の記載技術では、この再送要求を避けるために、誤り訂正に必要な誤り訂正符号の量をWyner−Zivフレーム符号化器で計算している。非特許文献3の記載技術では、Wyner−Zivフレーム復号器の作る予測画像を想定し、Wyner−Zivフレーム符号化器側で探索範囲を絞った簡易的な動き推定を行うことで予測画像を生成し、原画像と比較することにより、訂正を行う対象(Wyner−Zivフレーム復号器の作る予測画像)が原画像に対してのどれほど誤りがあるかを推定し、それを訂正するための必要なパリティ量を計算するものであり、これにより、フィードバックを必要としないようになされている。
Anne Aaron, Shantanu Rane, Eric Setton, and Bernd Girod:Transform−domain Wyner−Ziv Codec for Video. In:Proc, SPIE Visual Communications and Image Processing, San Jose, CA(2004) L.Liu Z.Li and E.J.Delp,"Backward channel aware Wyner−Ziv video coding" in Proceedings of the IEEE International Conference on Image Processing, Atlanta, GA, October 2006. C.Brites, F.Pereira,"Encoder Rate Control for Transform Domain Wyner−Ziv Video Coding" (ICIP2007)
DVC方式は、(1)符号化器側の処理が少ない、(2)通常は(非特許文献1、2の記載技術)、Wyner−Zivフレームの復号には符号化側へのフィードバック(誤り訂正信号の再送要求)が必要、という特徴を有する。
符号化器の処理の少なさを生かすために、非特許文献1ではキーフレームに画面内(イントラ)符号化方式を使用している。非特許文献2では、キーフレームの符号化効率を向上するため、キーフレームをフレーム間符号化方式で符号化している。このとき、符号化器での処理量の増加を抑えるために、動き推定は復号器側で行っている。非特許文献2の記載技術によって、符号化効率の向上と符号化器の処理量の増加を抑える、ということが実現できるが、復号器からのフィードバックがあることによる問題(遅延が生じる、蓄積型のアプリケーションに利用できない、など)は解決できていない。非特許文献3の記載技術によってWyner−Zivフレームの復号におけるフィードバックは解消できるが、キーフレームの処理におけるフィードバック(動き情報を符号化器側へ送る)は解消していない。
また、非特許文献2の記載技術と非特許文献3の記載技術とを組み合わせることにより、キーフレームをインター符号化し、符号化効率を上げ、さらに、Wyner−Zivフレーム符号化器で送信する誤り訂正符号の量を見積もることにより、WZフレームの符号化にフィードバックを必要としない構成が期待できる。
しかしながら、キーフレームのインター符号化において、キーフレーム復号器側で動き推定を行うため、符号化器と復号器とのキーフレームをできるだけ合わせるため、フィードバックが必要となるという課題がある。
そのため、キーフレームについても、復号器から符号化器へのフィードバックをなくすことが可能な動画像符号化装置、方法及びプログラム、並びに、動画像符号化システムが望まれている。
第1の本発明は、フレーム系列を分離したキーフレームについては、フレーム内符号化又はフレーム間符号化を適用して符号化するキーフレーム符号化器と、フレーム系列を分離した非キーフレームについては、時間方向が異なるキーフレームから形成した予測画像と、非キーフレームの原画像との差である予測誤差信号に対する誤り訂正符号の情報を得る非キーフレーム符号化器とを有する動画像符号化装置において、(1)上記キーフレーム符号化器は、(1−1)参照用キーフレームを格納している参照用キーフレーム格納手段と、(1−2)上記参照用キーフレーム格納手段から出力された参照用キーフレームに対して、与えられた動き情報を適用して動き補償する動き補償手段と、(1−3)上記動き補償手段に与えるキーフレーム間の動き情報を形成する第1の動き情報形成手段とを備え、(2)上記非キーフレーム符号化器は、(2−1)上記予測画像を生成する予測画像生成手段と、(2−2)上記予測画像生成手段が上記予測画像の生成時に利用する非キーフレームに係る動き情報を形成する第2の動き情報形成手段とを備え、(3)上記第1の動き情報形成手段及び上記第2の動き情報形成手段の一方が、接近したキーフレームや非キーフレームの複数のフレームから動き推定によって動き情報を生成するものであり、(4)上記第1の動き情報形成手段及び上記第2の動き情報形成手段の他方が、上記第1の動き情報形成手段及び上記第2の動き情報形成手段の一方が生成した動き情報を取り込み、その動き情報に対する補正によって動き情報を形成するものであることを特徴とする。
第2の本発明は、フレーム系列を分離したキーフレームについては、フレーム内符号化又はフレーム間符号化を適用して符号化するキーフレーム符号化器と、フレーム系列を分離した非キーフレームについては、時間方向が異なるキーフレームから形成した予測画像と、非キーフレームの原画像との差である予測誤差信号に対する誤り訂正符号の情報を得る非キーフレーム符号化器とを有する動画像符号化装置と、キーフレーム復号器と非キーフレーム復号器とを有する動画像復号装置とを対向している動画像符号化システムにおいて、(1)上記動画像符号化装置のキーフレーム符号化器は、(1−1)参照用キーフレームを格納している参照用キーフレーム格納手段と、(1−2)上記参照用キーフレーム格納手段から出力された参照用キーフレームに対して、与えられた動き情報を適用して動き補償する動き補償手段と、(1−3)接近した複数のキーフレームから動き推定によって、上記動き補償手段に与えるキーフレーム間の動き情報を生成する第1の動き情報形成手段とを備え、(2)上記動画像符号化装置の上記非キーフレーム符号化器は、(2−1)上記予測画像を生成する予測画像生成手段と、(2−2)上記予測画像生成手段が上記予測画像の生成時に利用する非キーフレームに係る動き情報を、上記第1の動き情報形成手段が生成したキーフレーム間の動き情報を取り込んでその動き情報に対する内挿によって形成する第2の動き情報形成手段とを備え、(3)上記動画像復号装置が、(3−1)参照用キーフレームを格納している復号側参照用キーフレーム格納手段と、(3−2)上記参照用キーフレーム格納手段から出力された参照用キーフレームに対して、与えられた動き情報を適用して動き補償する復号側動き補償手段と、(3−3)上記第1の動き情報形成手段と同じ動き情報の生成方法で、上記復号側動き補償手段に与えるキーフレーム間の動き情報を形成する第3の動き情報形成手段とを備えたキーフレーム復号器を有することを特徴とする。
第3の本発明は、フレーム系列を分離したキーフレームについては、フレーム内符号化又はフレーム間符号化を適用して符号化するキーフレーム符号化器と、フレーム系列を分離した非キーフレームについては、時間方向が異なるキーフレームから形成した予測画像と、非キーフレームの原画像との差である予測誤差信号に対する誤り訂正符号の情報を得る非キーフレーム符号化器とを有する動画像符号化装置が実行する動画像符号化方法において、(1)上記キーフレーム符号化器において、(1−1)参照用キーフレーム格納手段は、参照用キーフレームを格納し、(1−2)動き補償手段は、上記参照用キーフレーム格納手段から出力された参照用キーフレームに対して、与えられた動き情報を適用して動き補償し、(1−3)第1の動き情報形成手段は、上記動き補償手段に与えるキーフレーム間の動き情報を形成し、(2)上記非キーフレーム符号化器において、(2−1)予測画像生成手段は、上記予測画像を生成し、(2−2)第2の動き情報形成手段は、上記予測画像生成手段が上記予測画像の生成時に利用する非キーフレームに係る動き情報を形成し、(3)上記第1の動き情報形成手段及び上記第2の動き情報形成手段の一方が、接近したキーフレームや非キーフレームの複数のフレームから動き推定によって動き情報を生成し、(4)上記第1の動き情報形成手段及び上記第2の動き情報形成手段の他方が、上記第1の動き情報形成手段及び上記第2の動き情報形成手段の一方が生成した動き情報を取り込み、その動き情報に対する補正によって動き情報を形成することを特徴とする。
第4の本発明の動画像符号化プログラムは、フレーム系列を分離したキーフレームについては、フレーム内符号化又はフレーム間符号化を適用して符号化するキーフレーム符号化器と、フレーム系列を分離した非キーフレームについては、時間方向が異なるキーフレームから形成した予測画像と、非キーフレームの原画像との差である予測誤差信号に対する誤り訂正符号の情報を得る非キーフレーム符号化器とを有する動画像符号化装置を構成するコンピュータを、(1)参照用キーフレームを格納している参照用キーフレーム格納手段と、上記参照用キーフレーム格納手段から出力された参照用キーフレームに対して、与えられた動き情報を適用して動き補償する動き補償手段と、上記動き補償手段に与えるキーフレーム間の動き情報を形成する第1の動き情報形成手段とを備えた上記キーフレーム符号化器と、(2)上記予測画像を生成する予測画像生成手段と、上記予測画像生成手段が上記予測画像の生成時に利用する非キーフレームに係る動き情報を形成する第2の動き情報形成手段とを備えた上記非キーフレーム符号化器として機能させるものであり、(3)機能させる上記第1の動き情報形成手段及び上記第2の動き情報形成手段の一方が、接近したキーフレームや非キーフレームの複数のフレームから動き推定によって動き情報を生成するものであり、(4)機能させる上記第1の動き情報形成手段及び上記第2の動き情報形成手段の他方が、上記第1の動き情報形成手段及び上記第2の動き情報形成手段の一方が生成した動き情報を取り込み、その動き情報に対する補正によって動き情報を形成するものであることを特徴とする。
本発明によれば、キーフレームについて、復号器から符号化器へのフィードバックをなくすことができる。
第1の実施形態の動画像符号化システムの構成を示すブロック図である。 第1の実施形態におけるキーフレームに対するイントラ符号化処理を示すフローチャートである。 第1の実施形態におけるWZフレームの符号化処理を示すフローチャートである。 第1の実施形態におけるキーフレームに対するインター符号化処理を示すフローチャートである。 第1の実施形態におけるキーフレームに対するイントラ復号処理を示すフローチャートである。 第1の実施形態におけるWZフレームの復号処理を示すフローチャートである。 第1の実施形態におけるキーフレームに対するインター復号処理を示すフローチャートである。 第2の実施形態の動画像符号化システムの構成を示すブロック図である。 第2の実施形態におけるキーフレームに対するインター符号化処理を示すフローチャートである。 第2の実施形態におけるWZフレームの符号化処理を示すフローチャートである。 第2の実施形態におけるキーフレーム間の動き情報を、WZフレームに係る動き情報に補正する方法の説明図である。 第3の実施形態の動画像符号化システムの構成を示すブロック図である。 第3の実施形態におけるキーフレームに対するインター符号化処理を示すフローチャートである。 第3の実施形態におけるWZフレームの符号化処理を示すフローチャート(その1)である。 第3の実施形態におけるWZフレームの符号化処理を示すフローチャート(その2)である。 第3の実施形態におけるキーフレームに対するインター復号処理を示すフローチャートである。
(A)第1の実施形態
以下、本発明による動画像符号化装置、方法及びプログラム、並びに、動画像符号化システムの第1の実施形態を、図面を参照しながら詳述する。第1の実施形態に係る動画像符号化方式は上述したDVC方式である。
(A−1)第1の実施形態の構成
図1は、第1の実施形態の動画像符号化システムの構成を示すブロック図である。
図1において、第1の実施形態の動画像符号化システム100は、動画像符号化装置101と、それに対向する動画像復号装置102とから構成される。
動画像符号化装置101は、ハードウェア的に各種回路を接続して構築されても良く、また、CPU、ROM、RAMなどを有する汎用的な装置が動画像符号化プログラムを実行することで動画像符号化装置101としての機能を実現するように構築されても良い。同様に、動画像復号装置102も、ハードウェア的に各種回路を接続して構築されても良く、また、CPU、ROM、RAMなどを有する汎用的な装置が動画像復号プログラムを実行することで動画像復号装置102としての機能を実現するように構築されても良い。いずれの構築方法を適用した場合であっても、動画像符号化装置101及び動画像復号装置102の機能的構成は、図1で表すことができる。
動画像符号化装置101は、Wyner−Zivフレーム符号化器103とキーフレーム符号化器104とを有する。動画像復号装置102は、Wyner−Zivフレーム復号器105とキーフレーム復号器106とを有する。
Wyner−Zivフレーム符号化器103は、Wyner−Ziv符号化部109と、動き推定部110と、予測画像生成部111と、送信符号量計算部112とを有し、Wyner−Ziv符号化部109は、変換・量子化部107と、Slepian−Wolf符号化部108とを内蔵し、Wyner−Zivフレーム符号化器103は、WZフレームを符号化するものである。
一方、キーフレーム符号化器104は、減算部124と、変換・量子化部113と、逆量子化・逆変換部114と、加算部125と、フレームバッファ115と、動き補正部117と、動き補償部116とを有し、キーフレームをイントラ符号化又はインター符号化するものである。
変換・量子化部107は、入力シーケンス(フレーム系列)からWZフレーム画像(以下、適宜、WZフレームと呼ぶ)を得、係数領域への係数変換と量子化を行い、ビットプレーン単位へ分割するものである。
Slepian−Wolf符号化部108は、分割されたビットプレーン単位でSlepian−Wolf符号化を行い、送信符号量計算部112の結果に従った量の誤り訂正符号をWyner−Zivフレーム復号器105に送信するものである。
動き推定部110は、フレームバッファ115から入力された、符号化対象のWZフレームの前にあるキーフレーム(局部復号されたキーフレーム画像)と、入力シーケンスから分離した符号化対象のWZフレームと、符号化対象のWZフレームの後の入力シーケンスから分離したキーフレームとを入力し、動き推定を行うものである。
予測画像生成部111は、動き推定部110で推定された動き情報と、符号化対象のWZフレームの前のキーフレーム、後のキーフレーム、又は、前後のキーフレームを用いて、符号化対象のWZフレームの予測画像を生成するものである。
送信符号量計算部112は、WZフレームの原画像と、予測画像生成部111で生成されたその予測画像を比較し、送信する誤り訂正符号の量を計算するものである。
キーフレーム符号化器104における減算部124は、インター符号化する際に、符号化対象のキーフレームと、動き補償された過去のキーフレームとの差分を求めるものである。なお、イントラ符号化する際には、減算部124は、符号化対象のキーフレームをそのまま通過させるものである。
変換・量子化部113は、減算部124から出力を変換・量子化し、キーフレーム復号器106へ送信するものである。減算部124から出力は、インター符号化する際には、符号化対象のキーフレームと動き補償した過去のキーフレームとの差分になっており、イントラ符号化する際には、符号化対象のキーフレームそのままとなっている。
逆量子化・逆変換部114は、変換・量子化部113の出力に対して、変換・量子化部113の逆処理である逆量子化・逆変換を行うものである。この逆量子化・逆変換部114の逆量子化・逆変換処理は、局部復号処理に相当する処理である。インター符号化では、符号化対象のキーフレームと動き補償した過去のキーフレームとの差分に対応する値が逆量子化・逆変換部114から出力され、イントラ符号化では、符号化対象のキーフレームに対応する値が逆量子化・逆変換部114から出力される。
加算部125は、インター符号化の場合には、動き補償された過去のキーフレームと、局部復号された差分とを加算し、符号化対象のキーフレームの局部復号結果を得るものである。なお、イントラ符号化する際には、加算部125は、逆量子化・逆変換部114から出力された局部復号された符号化対象のキーフレームをそのまま通過させるものである。
フレームバッファ115は、キーフレームを参照するために、局部復号されたキーフレームを保存しておくものである。
動き補正部117は、キーフレームと、フレームバッファ115に保存されている参照キーフレームと、動き推定部110で推定されたWZフレームの動き情報を用いて、キーフレームの動き情報を補正するものである。
動き補償部116は、動き補正部117で得られた動き情報と、フレームバッファ115に保存された参照フレームを用いて動き補償を行うものである。
動画像復号装置102の一方の構成要素であるWyner−Zivフレーム復号器105は、サイドインフォメーション生成部118と、Slepian−Wolf復号部119と、復号画像生成部120とを有し、WZフレームについての復号を行うものである。
動画像復号装置102の他方の構成要素であるキーフレーム復号器106は、逆量子化・逆変換部121と、加算部126と、フレームバッファ122と、動き補償部123とを有し、受信した符号化キーフレームをイントラ復号又はインター復号するものである。
逆量子化・逆変換部121は、キーフレーム符号化器104からの符号化されたキーフレームを受信し、変換・量子化部113の逆処理である逆量子化・逆変換を行うものである。受信した符号化キーフレームがインター符号化されている場合には、処理対象のキーフレームと動き補償した過去のキーフレームとの差分に対応する値が逆量子化・逆変換部121から出力され、受信した符号化キーフレームがイントラ符号化されている場合には、処理対象のキーフレームに対応する値が逆量子化・逆変換部121から出力される。
加算部126は、インター符号化の場合には、動き補償された過去のキーフレームと、逆量子化・逆変換で得られた差分とを加算し、処理対象のキーフレームの復号結果を得るものである。なお、イントラ符号化の場合には、加算部126は、逆量子化・逆変換部121から出力された処理対象のキーフレームをそのまま通過させるものである。
フレームバッファ122は、復号されたキーフレームを、参照するために、また、予測画像の生成に利用するために保存しておくものである。
動き補償部123は、キーフレーム符号化器104から与えられたキーフレーム動き情報と、フレームバッファ122から得た参照キーフレームを用いて動き補償を行うものである。
Wyner−Zivフレーム復号器105におけるサイドインフォメーション生成部118は、フレームバッファ122に保存されている復号されたキーフレームを用いて、WZフレームの予測画像を生成した後、予測画像を変換・量子化し、ビットプレーン単位へ分割するものである。
Slepian−Wolf復号部119は、Wyner−Zivフレーム符号化器103から与えられた誤り訂正符号と、サイドインフォメーション生成部118の出力を用いて、ビットプレーン単位でSlepian−Wolf復号を行うものである。
復号画像生成部120は、ビットプレーン単位でSlepian−Wolf復号された結果をフレーム単位へ再構成し、逆量子化・逆変換を行い、復号画像を得るものである。
(A−2)第1の実施形態の動作
次に、第1の実施形態に係る動画像符号化システム100の動作を、図1に加えて、図2〜図7のフローチャートをも参照しながら説明する。
入力シーケンス(フレーム系列)は、キーフレームとWZフレームに分けられ、それぞれが符号化、復号処理される。以下では、キーフレームとWZフレームが交互である場合を例に説明する。
(A−2−1)キーフレームのイントラ符号化処理
まず、1フレーム目の符号化処理を図1及び図2を参照して説明する。1フレーム目はキーフレームであり、しかも、参照し得る過去のキーフレームが存在しないので、キーフレーム符号化器104においてイントラ符号化が実行される。
まず、入力シーケンスからキーフレーム(1フレーム目)を得、変換・量子化部113へ入力し(ステップS201)、変換・量子化部113は、入力画像をDCTなどの方法で変換係数領域へ変換し、変換係数の量子化を行う(ステップS202)。
次に、変換されたフレームの情報を、インター符号化の際の参照フレームに用いたり、予測画像の生成に用いたりするために局部復号を行う。すなわち、量子化された変換係数を逆量子化・逆変換部114へ入力し(ステップS203)、逆量子化・逆変換部114によって、量子化された変換係数が逆量子化・逆変換され、1フレーム目の局部復号画像(ローカルデコード画像)が得られ(ステップS204)、1フレーム目の局部復号画像がフレームバッファ115へ格納される(ステップS205)。
また、変換・量子化部113の処理結果(符号化キーフレーム)はキーフレーム復号器106へ送信される(ステップS206)。
(A−2−2)WZフレームの符号化処理
次に、2フレーム目の符号化処理を図1及び図3を参照して説明する。2フレーム目はWZフレームであるので、Wyner−Zivフレーム符号化器103において符号化される。
まず、入力シーケンスから、WZフレーム(2フレーム目)の原画像と、そのWZフレームの後(3フレーム目)のキーフレームの原画像を得て、動き推定部110へ入力すると共に(ステップS301)、フレームバッファ115から、保存されているWZフレームの前のキーフレーム(1フレーム目)の局部復号画像を取り出して動き推定部110へ入力する(ステップS302)。
動き推定部110は、入力されたWZフレームと、前後のキーフレームを用いて動き推定を行い(ステップS303)、得られた動き情報と、前後のキーフレームと、WZフレームとを予測画像生成部111へ入力する(ステップS304)。ここで、動き推定方法として任意の方法を適用可能である。例えば、処理量を抑えた動き推定方法としては、非特許文献2に記載されているような探索範囲を絞った動き推定方法がある。
予測画像生成部111は、入力された動き情報と、前後のキーフレームと、WZフレームとを用いて予測画像を生成し(ステップS305)、得られた予測画像と、WZフレームの原画像とを送信符号量計算部112へ入力する(ステップS306)。
送信符号量計算部112は、予測画像生成部111で生成された予測画像と、原画像とを比較し、Wyner−Zivフレーム復号器105で生成される予測画像の誤りを推定し、各ビットプレーンの誤りを訂正できるだけの誤り訂正符号の量を推定する(ステップS307)。誤り訂正符号の量を推定する方法は、既存の任意の方法を適用することができる。例えば、非特許文献3に記載の方法を適用することができる。
また、入力シーケンスから分離したWZフレーム(2フレーム目)の原画像を変換・量子化部107へ入力し(ステップS308)、変換・量子化部107は、この入力画像を、DCTなどで係数領域の情報に変換し、その結果を量子化し、ビットプレーンへ分割する(ステップS309)。
次に、ビットプレーンを1つSlepian−Wolf符号化部108へ入力し(ステップS310)、Slepian−Wolf符号化部108は、入力されたビットプレーンをSlepian−Wolf符号化する(ステップS311)。また、送信符号量計算部112での推定結果をSlepian−Wolf符号化部108へ入力する(ステップS312)。Slepian−Wolf符号化部108は、送信符号量計算部112の推定結果に従った量の誤り訂正符号を、Wyner−Zivフレーム復号器105へ送信する(ステップS313)。
上述したビットプレーンの入力、Slepian−Wolf符号化、誤り訂正符号の量の推定結果の入力、及び、誤り訂正符号の送信を全てのビットプレーンについて繰り返す(ステップS314)。
(A−2−3)キーフレームのインター符号化処理
次に、3フレーム目の符号化処理を図1及び図4を参照して説明する。3フレーム目はキーフレームであり、しかも、参照し得る過去のキーフレーム(1フレーム目)が存在するので、キーフレーム符号化器104においてインター符号化が実行される。
まず、入力シーケンスから3フレーム目を得て、動き補正部117へ入力する(ステップS401)。また、動き推定部110で推定した2フレーム目と3フレーム目間の動き情報を動き補正部117へ入力する(ステップS402)。さらに、フレームバッファ115から、前のキーフレーム(1フレーム目)の局部復号画像を動き補正部117へ入力する(ステップS403)。動き補正部117は、2フレーム目と3フレーム目間の動き情報を用い、その動き情報を補正して、キーフレーム間(1フレーム目及び3フレーム目間)の動き情報を得る(ステップS404)。例えば、2フレーム目と3フレーム目間の動き情報を外挿して、キーフレーム間の動き情報を得るようにしても良い(後述する第2の実施形態では内挿について説明しており、同様にして外挿を実行すれば良い)。また例えば、2フレーム目と3フレーム目間の動き情報を外挿して、キーフレーム間の動き情報を一旦得た後、外挿の動き情報で定まる位置を中心とした狭い探索範囲(例えば縦横3×3画素程度)を設定し、その探索範囲で相関が最も大きい位置を探索して最終的にキーフレーム間の動き情報を得るようにしても良い。
その後、動き補正部117で得られたキーフレーム間の動き情報を動き補償部116へ入力する(ステップS405)。また、フレームバッファ115から参照フレーム(ここでは1フレーム目)の画像を動き補償部116へ入力する(ステップS406)。動き補償部116は、参照フレームと動き情報を用いて動き補償を行う(ステップS407)。動き補償方法は、MPEGシリーズなどの一般の動画像符号化方式で用いられている方法を適用することができる。
次に、動き補償部116の出力結果と、入力シーケンスから得られた3フレーム目の原画像との差分を得て、変換・量子化部113へ入力し(ステップS408)、変換・量子化部113にて、その差分に対し、変換・量子化を行う(ステップS409)。
次に、変換した画像を参照フレームとして利用したり、予想画像の生成に用いたりするために、復号してフレームバッファ115へ格納する。すなわち、逆量子化・逆変換部114に、変換・量子化部113の出力結果を入力し(ステップS410)、逆量子化・逆変換部114で、逆量子化・逆変換を行い、3フレーム目の原画像と動き補償結果との差分の変換係数を得て(ステップS411)、加算部25で、逆量子化・逆変換部114の出力結果と、動き補償部116の出力結果を足し合わせて3フレーム目の局部復号画像(ローカルデコード画像)を得、フレームバッファ115へ保存する(ステップS412)。
最後に、変換・量子化部113の出力結果(3フレーム目の原画像と動き補償結果との差分に対し、変換・量子化した結果)と、動き補正部117から得た動き情報とをキーフレーム復号器106へ送信する(ステップS413)。
(A−2−4)キーフレームのイントラ復号処理
次に、動画像復号装置102の動作を、キーフレームのイントラ復号処理、WZフレームの復号処理、キーフレームのインター復号処理の順に説明する。
まず、1フレーム目の復号処理を図1及び図5を参照して説明する。1フレーム目はキーフレームであり、しかも、参照し得る過去のキーフレームが存在しないので、キーフレーム復号器106においてイントラ復号が実行される。
受信した符号化済みのキーフレームは、キーフレーム復号器106の逆量子化・逆変換部121へ入力され(ステップS501、S502)、逆量子化・逆変換部121は、逆変換、量子化を行う(ステップS503)。1フレーム目はイントラ符号化されているので、逆変換、量子化処理により復号画像が得られる。
復号画像は、キーフレームのインター復号の際の参照フレームとして、また、WZフレームの予測画像生成に利用するためにフレームバッファ122に格納されると共に(ステップS504)、出力される(ステップS505)。
(A−2−5)WZフレームの復号処理
次に、2フレーム目の復号処理を図1及び図6を参照して説明する。2フレーム目はWZフレームであるので、Wyner−Zivフレーム復号器105において復号される。
まず、フレームバッファ122に格納されている処理対象のWZフレーム(2フレーム目)の前後のキーフレーム(この場合は1フレーム目及び3フレーム目)の画像をサイドインフォメーション生成部118へ入力し(ステップS601)、サイドインフォメーション生成部118は、WZフレームの予測画像を生成する(ステップS602)。前後のキーフレームを用いた予測画像の生成方法として、既存の任意の方法を適用することができる。例えば、参照文献1に記載されているような動き推定・動き補償を行う予測画像の生成方法を適用できる。また、キーフレームがインター符号化されているものであれば、キーフレームから得られる動き情報を利用して、予測画像を生成しても良い。
参照文献1:Joao Ascenso, Catarina Brites, and Fernando Pereira,“Improving frame interpolation with spatial motion smoothing for pixel domain distributed video coding,” 5th EURASIP Conference on Speech and Image Processing, Multimedia Communications and Services, July 2005.
次に、サイドインフォメーション生成部118で、生成された予測画像を変換・量子化し、2値化した後、ビットプレーンへ分割する(ステップS603)。
サイドインフォメーション生成部118から1つのビットプレーンをSlepian−Wolf復号部119へ入力し(ステップS604)、また、Slepian−Wolf復号部119へWyner−Zivフレーム符号化器103から送信した誤り訂正符号を入力し(ステップS605)、この誤り訂正符号を用いて、Slepian−Wolf復号を行い、結果を復号画像生成部120へ入力する(ステップS606)。
上述したビットプレーンの入力、誤り訂正符号の入力、及び、Slepian−Wolf復号を全てのビットプレーンについて繰り返す(ステップS607)
そして、復号画像生成部120で、Slepian−Wolf復号結果のビットプレーンをフレーム単位へ再構成し、逆量子化・逆変換を行うことで復号画像を得て、次段の図示しない装置に出力する(ステップS608)。
(A−2−6)キーフレームのインター復号処理
次に、3フレーム目の復号処理を図1及び図7を参照して説明する。3フレーム目はキーフレームであり、しかも、参照し得る過去のキーフレーム(1フレーム目)が存在するので、キーフレーム復号器106においてインター復号が実行される。
まず、キーフレーム符号化器104から送信された符号化されたキーフレームを受信し、逆量子化・逆変換部121へ入力し(ステップS701)、逆変換・逆量子化部121で、逆量子化・逆変換を行い、参照フレームとの差分が得られる(ステップS702)。
また、受信した符号化されたキーフレームを得た際に利用した受信した動き情報(動き補正部117から出力された動き情報)を動き補償部123へ入力し(ステップS703)、また、フレームバッファ122から参照フレームを動き補償部123へ入力し(ステップS704)、動き補償部123において、参照フレームと動き情報を用い、動き補償を行う(ステップS705)。この動き補償方法として、MPEGシリーズなどの一般の動画像符号化方式で用いられている方法を適用することができる。
次に、加算部126で、動き補償部123の出力結果と逆変換された差分情報を足し合わせ、キーフレームの復号画像を得る(ステップS706)。
得られた復号画像は、参照フレームとして適用するため、また、WZフレームの予測画像の生成のために、フレームバッファ122へ保存されると共に(ステップS707)、次段の図示しない装置に出力される(ステップS708)。
以上、3フレーム目までの処理を示したが、4フレーム目以降の偶数番目のフレーム(WZフレーム)の処理は、上述した2フレーム目の処理と同様であり、5フレーム目以降の奇数番目のフレーム(キーフレーム)の処理は、上述した3フレーム目の処理と同様である。但し、シーンチェンジなどを図示しない監視部で監視した場合においては、新しい入力シーケンスとして、上述した1フレーム目からの処理が実行される。
(A−3)第1の実施形態の効果
第1の実施形態によれば、キーフレームの符号化方式にフィードバックを必要としないインター符号化を基本的に用いることにより、WZフレーム、キーフレーム共にフィードバックが必要ではなくなり、フィードバックを仮定しないアプリケーションでも利用可能となる。
また、キーフレームのインター動き情報は、WZフレームの予測画像の生成の際に推定した動き情報を用いるため、動画像符号化装置の負荷の増大を抑えることができる。
(B)第2の実施形態
次に、本発明による動画像符号化装置、方法及びプログラム、並びに、動画像符号化システムの第2の実施形態を、図面を参照しながら、第1の実施形態との相違点を中心に説明する。
(B−1)第2の実施形態の構成
図8は、第2の実施形態の動画像符号化システムの構成を示すブロック図であり、上述した第1の実施形態に係る図1との同一、対応部分には同一符号を付して示している。
図8において、第2の実施形態の動画像符号化システム800は、動画像符号化装置801と、それに対向する動画像復号装置102とから構成される。ここで、動画像復号装置102は、第1の実施形態のものと同一である。
動画像符号化装置801は、Wyner−Zivフレーム符号化器803とキーフレーム符号化器804とを備える。
Wyner−Zivフレーム符号化器803は、変換・量子化部107と、Slepian−Wolf符号化部108と、Wyner−Ziv符号化部109と、動き補正部810と、予測画像生成部111と、送信符号量計算部112とを有する。動き補正部810以外の構成要素は第1の実施形態のものと同様である。
一方、キーフレーム符号化器804は、減算部124と、変換・量子化部113と、逆量子化・逆変換部114と、加算部125と、フレームバッファ115と、動き推定部817と、動き補償部116とを有する。動き推定部817以外の構成要素は第1の実施形態のものと同様である。
第1の実施形態では、Wyner−Zivフレーム符号化器103が動き推定部110を備え、キーフレーム符号化器104が動き補正部117を備えていたが、この第2の実施形態では、キーフレーム符号化器804が動き推定部817を備え、Wyner−Zivフレーム符号化器803が動き補正部810を備えている。
動き推定部817は、入力キーフレームと、フレームバッファ115に保存されているキーフレームの参照フレームから、動き探索を行うなどして、キーフレーム間の動き推定を実行するものである。
動き補正部810は、キーフレーム間の動き情報を動き推定部817から受け取り、WZフレームの動き情報へ補正するものである。
(B−2)第2の実施形態の動作
次に、第2の実施形態に係る動画像符号化システム800の動作を、図8に加えて、図9〜図11をも参照しながら説明する。
入力シーケンス(フレーム系列)は、キーフレームとWZフレームに分けられ、それぞれが符号化、復号処理される。以下では、キーフレームとWZフレームが交互である場合を例に説明する。
なお、動画像復号装置102の動作は、第1の実施形態と同一であるので、その説明は省略する。また、1フレーム目のキーフレームの符号化処理(イントラ符号化処理)は、第1の実施形態と同様であり、その説明は省略する。
(B−2−1)キーフレームのインター符号化処理
まず、3フレーム目のキーフレームの符号化処理(インター符号化処理)を、図8及び図9を参照して説明する。図9は、第2の実施形態におけるキーフレームに対するインター符号化処理を示すフローチャートであり、第1の実施形態に係る図4との同一、対応ステップには同一符号を付して示している。
まず、3フレーム目の画像を入力シーケンスから得て、動き推定部817へ入力すると共に(ステップS901)、1フレーム目のキーフレーム画像をフレームバッファ115から参照フレームとして動き推定部817へ入力し(ステップS902)、動き推定部817は、1フレーム目と3フレーム目のキーフレーム画像からキーフレーム間の動き情報を推定する(ステップS903)。これ以降の処理は、第1の実施形態と同様である。
動き推定部817(なお、第1の実施形態では動き補正部117)で得られたキーフレーム間の動き情報を動き補償部116へ入力し(ステップS405)、フレームバッファ115から参照フレーム(ここでは1フレーム目)の画像を動き補償部116へ入力し(ステップS406)、動き補償部116は、参照フレームと動き情報を用いて動き補償を行う(ステップS407)。
次に、動き補償部116の出力結果と、入力シーケンスから得られた3フレーム目の原画像との差分を得て、変換・量子化部113へ入力し(ステップS408)、変換・量子化部113にて、その差分に対し、変換・量子化を行う(ステップS409)。また、逆量子化・逆変換部114に、変換・量子化部113の出力結果を入力し(ステップS410)、逆量子化・逆変換部114で、逆量子化・逆変換を行い、3フレーム目の原画像と動き補償結果との差分の変換係数を得て(ステップS411)、加算部25で、逆量子化・逆変換部114の出力結果と、動き補償部116の出力結果を足し合わせて3フレーム目の局部復号画像(ローカルデコード画像)を得、フレームバッファ115へ保存する(ステップS412)。最後に、変換・量子化部113の出力結果(3フレーム目の原画像と動き補償結果との差分に対し、変換・量子化した結果)と、動き推定部817(なお、第1の実施形態では動き補正部117)から得た動き情報とをキーフレーム復号器106へ送信する(ステップS413)。
(B−2−2)WZフレームの符号化処理
次に、2フレーム目(WZフレーム)の符号化処理を図8及び図10を参照して説明する。図10は、第2の実施形態におけるWZフレームに対する符号化処理を示すフローチャートであり、第1の実施形態に係る図3との同一、対応ステップには同一符号を付して示している。
まず、入力シーケンスより2フレーム目のWZフレーム画像を動き補正部810へ入力し(ステップ1001)、また、フレームバッファ115から1フレーム目及び3フレーム目の局部復号画像(ローカルデコード画像)を動き補正部810へ入力し(ステップ1002)、さらに、動き推定部817から、キーフレーム間(1フレーム及び3フレーム間)の動き情報を動き補正部810へ入力する(ステップ1003)。動き補正部810は、キーフレーム間の動き情報を用いて、2フレーム目の動き情報を内挿などの方法で補正する(ステップ1004)。
1フレーム及び3フレーム間の動き情報を用い、2フレーム目のWZフレームに関する動き情報に補正する方法の一例を、図11を使って説明する。
WZフレームの前のキーフレームB(この例では1フレーム目)のある点をB(x,y)とし、その点Bの、WZフレームの後のキーフレームF(この例では3フレーム目)への動きを(dx,dy)とする。WZフレームの後のキーフレームBにあるB(x,y)と同じ位置の点をF(x,y)と表すとする。このとき、WZフレーム目の同じ位置にある点(x,y)の前後のフレーム方向の動きを以下のように算出する。
キーフレームB及びF間のフレームの隔たりをm、WZフレームと後のキーフレームFとのフレームの隔たりをnとする。キーフレームとWZフレームが交互の場合には、m=2、n=1である。
WZフレーム上の点(x,y)から前のキーフレーム(1フレーム目)Bへの動き(dxB,dyB)は(1)式で表すことができる。また、WZフレーム上の点(x,y)から後のキーフレーム(3フレーム目)Fへの動き(dxF,dyF)は(2)式で表すことができる。すなわち、動き情報(dx,dy)が入力されると、(1)式や(2)式を適用して、WZフレーム上の点を基準とした動き情報(dxB,dyB)、(dxF,dyF)を得るようにすれば良い。なお、(1)式や(2)式を適用して動き情報を一旦得た後、得られた動き情報で定まる移動先の位置を中心とした狭い探索範囲(例えば縦横3×3画素程度)を設定し、その探索範囲で相関が最も大きい位置を探索して最終的な補正した動き情報を得るようにしても良い。
Figure 2010206395
これ以降の処理は、第1の実施形態と同様である。
動き補正部810(なお、第1の実施形態の場合は動き推定部110)で得られた動き情報と、前後のキーフレームと、WZフレームとを予測画像生成部111へ入力する(ステップS304)。予測画像生成部111は、入力された動き情報と、前後のキーフレームと、WZフレームとを用いて予測画像を生成し(ステップS305)、得られた予測画像と、WZフレームの原画像とを送信符号量計算部112へ入力する(ステップS306)。送信符号量計算部112は、予測画像生成部111で生成された予測画像と、原画像とを比較し、Wyner−Zivフレーム復号器105で生成される予測画像の誤りを推定し、各ビットプレーンの誤りを訂正できるだけの誤り訂正符号の量を推定する(ステップS307)。
また、入力シーケンスから分離したWZフレーム(2フレーム目)の原画像を変換・量子化部107へ入力し(ステップS308)、変換・量子化部107は、この入力画像を、DCTなどで係数領域の情報に変換し、その結果を量子化し、ビットプレーンへ分割する(ステップS309)。次に、ビットプレーンを1つSlepian−Wolf符号化部108へ入力し(ステップS310)、Slepian−Wolf符号化部108は、入力されたビットプレーンをSlepian−Wolf符号化する(ステップS311)。また、送信符号量計算部112での推定結果をSlepian−Wolf符号化部108へ入力し(ステップS312)、Slepian−Wolf符号化部108は、送信符号量計算部112の推定結果に従った量の誤り訂正符号を、Wyner−Zivフレーム復号器105へ送信する(ステップS313)。上述したビットプレーンの入力、Slepian−Wolf符号化、誤り訂正符号の量の推定結果の入力、及び、誤り訂正符号の送信を全てのビットプレーンについて繰り返す(ステップS314)。
(B−3)第2の実施形態の効果
第2の実施形態によれば、キーフレーム同士で動き推定を行うため、第1の実施形態のキーフレームのインター符号化に比べて、精度の良い動き推定を行え、キーフレームの符号化効率が上がる。また、キーフレームの動き情報を用いてWZフレームの予測画像を生成するため、WZフレームの予測画像の生成を低負荷で行うことができる。
(C)第3の実施形態
次に、本発明による動画像符号化装置、方法及びプログラム、並びに、動画像符号化システムの第3の実施形態を、図面を参照しながら、第1の実施形態との相違点を中心に説明する。
(C−1)第3の実施形態の構成
図12は、第3の実施形態の動画像符号化システムの構成を示すブロック図であり、上述した第1の実施形態に係る図1との同一、対応部分には同一符号を付して示している。
図12において、第3の実施形態の動画像符号化システム1200は、動画像符号化装置1201と、それに対向する動画像復号装置1202とから構成される。
動画像符号化装置1201は、Wyner−Zivフレーム符号化器1203とキーフレーム符号化器1204とを備える。
Wyner−Zivフレーム符号化器1203は、変換・量子化部107及びSlepian−Wolf符号化部108を有するWyner−Ziv符号化部109と、動き推定・補正部1210と、予測画像生成部111と、送信符号量計算部112とを有する。動き推定・補正部1210以外の構成要素は第1の実施形態のものと同様である。
一方、キーフレーム符号化器804は、減算部124と、変換・量子化部113と、逆量子化・逆変換部114と、加算部125と、フレームバッファ115と、動き推定部1217と、動き補償部116とを有する。動き推定部1217以外の構成要素は第1の実施形態のものと同様である。
第1の実施形態では、Wyner−Zivフレーム符号化器103が動き推定部110を備え、キーフレーム符号化器104が動き補正部117を備えていたが、この第3の実施形態では、キーフレーム符号化器1204が動き推定部1217を備え、Wyner−Zivフレーム符号化器1203が動き推定・補正部1210を備えている。
動画像復号装置1202は、Wyner−Zivフレーム復号器105とキーフレーム復号器1206とを備える。Wyner−Zivフレーム復号器105は、第1の実施形態と同一であり、その説明は省略する。
キーフレーム復号器1206は、逆量子化・逆変換部121と、加算部126と、フレームバッファ122と、動き補償部123と、動き推定部1225とを有し、第1の実施形態より、動き推定部1225が増えており、これ以外の構成要素は第1の実施形態のものと同様である。
動き推定部1217は、以前に符号化したキーフレームを用いてキーフレーム間の動き情報を推定するものである。
動き推定・補正部1210は、動き推定部1217からキーフレーム間の動き情報を得てWZフレームの動き情報へ補正し、又は、フレームバッファ115から、前のキーフレーム、後のキーフレーム、若しくは、前後のキーフレームを得て、動き情報を推定するものである。
動き推定部1225は、以前に復号されたキーフレームを用いてキーフレーム間の動き情報を推定するものである。
(C−2)第3の実施形態の動作
次に、第3の実施形態に係る動画像符号化システム1200の動作を、図12に加えて、図13〜図16をも参照しながら説明する。
第1や第2の実施形態と同様に、キーフレームとWZフレームを交互に処理する例で説明する。第3の実施形態の場合、キーフレームのインター符号化は、2フレーム分のキーフレームを符号化した以降のキーフレームで行うこととする。つまり、1クレーム目及び3フレーム目はイントラ符号化を行い、5フレーム目以降のキーフレームをインター符号化するものとする。
なお、1フレーム目及び3フレーム目のキーフレームに対するイントラ符号化処理は、第1の実施形態と同様であり、その説明は省略する。また、動画像復号装置1202のWyner−Zivフレーム復号器105の動作は、第1の実施形態と同一であるので、その説明は省略する。
(C−2−1)キーフレームのインター符号化処理
まず、5フレーム目のキーフレームに対するインター符号化処理を、図12及び図13を参照して説明する。図13は、第3の実施形態におけるキーフレームに対するインター符号化処理を示すフローチャートであり、第1の実施形態に係る図4との同一、対応ステップには同一符号を付して示している。
まず、フレームバッファ115から、1フレーム目及び3フレーム目の局部復号画像(ローカルデコード)を動き推定部1217へ入力し(ステップ1301)、動き推定部1217では1フレーム目及び3フレーム目の画像を用いて3フレーム目及び5フレーム目間の動き情報を推定する(ステップ1302)。この際の推定方法として、既存の任意の方法を適用できる。例えば、非特許文献2の2.1節(Motion Estimation)に記載されている方法を適用することができる。
これ以降の処理は、第1の実施形態とほぼ同様である。但し、ステップS143の処理が、ステップS1303の処理に置き換わっている。
動き推定部1217(なお、第1の実施形態では動き補正部117)で得られたキーフレーム間の動き情報を動き補償部116へ入力し(ステップS405)、フレームバッファ115から参照フレーム(ここでは3フレーム目)の画像を動き補償部116へ入力し(ステップS406)、動き補償部116は、参照フレームと動き情報を用いて動き補償を行う(ステップS407)。
次に、動き補償部116の出力結果と、入力シーケンスから得られた5フレーム目の原画像との差分を得て、変換・量子化部113へ入力し(ステップS408)、変換・量子化部113にて、その差分に対し、変換・量子化を行う(ステップS409)。また、逆量子化・逆変換部114に、変換・量子化部113の出力結果を入力し(ステップS410)、逆量子化・逆変換部114で、逆量子化・逆変換を行い、5フレーム目の原画像と動き補償結果との差分の変換係数を得て(ステップS411)、加算部25で、逆量子化・逆変換部114の出力結果と、動き補償部116の出力結果を足し合わせて5フレーム目の局部復号画像(ローカルデコード画像)を得、フレームバッファ115へ保存する(ステップS412)。最後に、変換・量子化部113の出力結果(5フレーム目の原画像と動き補償結果との差分に対し、変換・量子化した結果)をキーフレーム復号器106へ送信する(ステップS1303)。
(C−2−2)WZフレームの符号化処理
次に、2フレーム目又は4フレーム目(WZフレーム)の符号化処理を図12、並びに、図14及び図15を参照して説明する。図14及び図15は、第3の実施形態におけるWZフレームに対する符号化処理を示すフローチャートであり、第1の実施形態に係る図3との同一、対応ステップには同一符号を付して示している。
まず、入力シーケンスからWZフレームの原画像(例えば2フレーム目)を得、動き推定・補正部1210へ入力する(ステップS1401)。フレームバッファ115から、WZフレームの前後の保存されているキーフレームの局部復号画像を動き推定・補正部1210へ入力する(ステップS1402)。次に、前後のキーフレーム間の動き情報が利用可能であるか否かを判断する(ステップS1403)。
処理対象のWZフレームが2フレーム目の場合には、前後のキーフレームがイントラ符号化されているため、キーフレームからの動き情報を得ることができない。そのため、前後のキーフレームから動き情報を推定することとした。すなわち、キーフレーム間の動き情報を得ることができない場合は、動き推定・補正部1210は、入力されたWZフレームと、前後のキーフレームを用いて動き推定を行う(ステップS1406)。この動き推定方法として、既存の任意の動き推定方法を適用することができる。例えば、非特許文献3の3.1.2”Fast Motion Compensated Interpolation(FMCI)”に記載されているような探索範囲を絞り、処理量を抑えた動き推定方法を適用することができる。
一方、処理対象のWZフレームが4フレーム目のように、前後のキーフレームの動き情報が利用できる場合には、動き推定部1217から3フレーム目及び5フレーム目間の動き情報を動き推定・補正部1210へ入力し(ステップS1404)、動き推定・補正部1210は、3フレーム目及び5フレーム目間の動き情報を用いて、4フレーム目の動き情報を、内挿などの方法で得る(ステップS1405)。
これ以降の処理は、第1の実施形態と同様である。
動き推定・補正部1210(なお、第1の実施形態の場合は動き推定部110)で得られた動き情報と、前後のキーフレームと、WZフレームとを予測画像生成部111へ入力する(ステップS304)。予測画像生成部111は、入力された動き情報と、前後のキーフレームと、WZフレームとを用いて予測画像を生成し(ステップS305)、得られた予測画像と、WZフレームの原画像とを送信符号量計算部112へ入力する(ステップS306)。送信符号量計算部112は、予測画像生成部111で生成された予測画像と、原画像とを比較し、Wyner−Zivフレーム復号器105で生成される予測画像の誤りを推定し、各ビットプレーンの誤りを訂正できるだけの誤り訂正符号の量を推定する(ステップS307)。
また、入力シーケンスから分離したWZフレームの原画像を変換・量子化部107へ入力し(ステップS308)、変換・量子化部107は、この入力画像を、DCTなどで係数領域の情報に変換し、その結果を量子化し、ビットプレーンへ分割する(ステップS309)。次に、ビットプレーンを1つSlepian−Wolf符号化部108へ入力し(ステップS310)、Slepian−Wolf符号化部108は、入力されたビットプレーンをSlepian−Wolf符号化する(ステップS311)。また、送信符号量計算部112での推定結果をSlepian−Wolf符号化部108へ入力し(ステップS312)、Slepian−Wolf符号化部108は、送信符号量計算部112の推定結果に従った量の誤り訂正符号を、Wyner−Zivフレーム復号器105へ送信する(ステップS313)。上述したビットプレーンの入力、Slepian−Wolf符号化、誤り訂正符号の量の推定結果の入力、及び、誤り訂正符号の送信を全てのビットプレーンについて繰り返す(ステップS314)。
(C−2−3)キーフレームのインター復号処理
次に、5フレーム目のインター復号処理を図12及び図17を参照して説明する。図16は、第3の実施形態におけるキーフレームに対するインター符号化処理を示すフローチャートであり、第1の実施形態に係る図7との同一、対応ステップには同一符号を付して示している。
なお、1フレーム目及び3フレーム目の符号化されているキーフレームのイントラ復号動作は、第1の実施形態のイントラ復号動作と同一であり、その説明は省略する。
まず、フレームバッファ122から1フレーム目及び3フレーム目の復号画像を動き推定部1225へ入力し(ステップS1601)、動き推定部1225は、3フレーム目及び5フレーム目間の動き情報を推定する(ステップS1602)。動き推定部1225の推定方法と、キーフレーム符号化器1204の動き推定部1217の推定方法とに、同じ方法を適用する。
以上のようなキーフレーム復号器1206で動き情報を推定する処理が、第1の実施形態の処理に追加されており、これ以降、第1の実施形態の処理とほぼ同様な処理が実行される。
キーフレーム符号化器1204から送信された符号化されたキーフレームを受信し、逆量子化・逆変換部121へ入力し(ステップS701)、逆変換・逆量子化部121で、逆量子化・逆変換を行い、参照フレームとの差分が得られる(ステップS702)。
また、動き推定部1225が推定した動き情報を動き補償部123へ入力し(ステップS703)、また、フレームバッファ122から参照フレームを動き補償部123へ入力し(ステップS704)、動き補償部123において、参照フレームと動き情報を用い、動き補償を行う(ステップS705)。なお、第1の実施形態の場合、ステップS703で動き補償部123へ入力する動き情報は、キーフレーム符号化器1204から送信されてきたものである。
次に、加算部126で、動き補償部123の出力結果と逆変換された差分情報を足し合わせ、キーフレームの復号画像を得る(ステップS706)。得られた復号画像は、参照フレームとして適用するため、また、WZフレームの予測画像の生成のために、フレームバッファ122へ保存されると共に(ステップS707)、次段の図示しない装置に出力される(ステップS708)。
(C−3)第3の実施形態の効果
第3の実施形態によれば、キーフレームの動き推定をキーフレーム符号化器及びキーフレーム復号器双方で行うため、動き情報をキーフレーム符号化器からキーフレーム復号器へ送信する必要がないため、キーフレームの符号化効率を向上させることができる。
(D)他の実施形態
上記各実施形態の説明においても、種々変形実施形態に言及したが、さらに、以下に例示するような変形実施形態を挙げることができる。
上記各実施形態の動画像符号化装置及び動画像復号装置間の通信路は、狭義の通信路に限定されるものではなく、広義の通信路であって良い。すなわち、リアルタイムの通信だけでなく、動画像符号化装置が符号化したデータを記録媒体に記録し、動画像復号装置が記録媒体から読み出したデータを処理するものであっても良い。
予測画像の生成に用いるキーフレーム若しくはその範囲は、上記各実施形態のものに限定されるものではない。例えば、WZフレームの前側にも後側にも2つずつのキーフレームを利用するようにしても良い。この場合であれば、動き情報もそれに応じた数だけ形成することを要する。
第1や第3の実施形態において、動き推定部110や動き推定・補正部1210は前後のキーフレームの動き推定を行っているが、動き推定に用いるキーフレームは必ず前後に限定されるものではなく、前方又は後方のみのキーフレームを用いて動き推定を行っても良い。
第1や第3の実施形態において、動き補正部117や動き推定・補正部1217では、フレームバッファ115に蓄えられたキーフレームと、入力されたキーフレームの原画像を用いて動き情報を補正しているが、キーフレームの原画像のみを用いても良く、フレームバッファ115に蓄えられている画像のみを使っても良い。
上記各実施形態では、DCTなどの変換をすることを前提としているが、画素領域での処理を行っても良い。また、量子化後の信号をそのままの形で受信側に送信している例を示したが、エントロピー符号化するなど圧縮率を高める機能を追加しても良い。
上記各実施形態では、入力シーケンス(フレーム系列)から、キーフレーム及びWZフレームを交互に取り出すものを示したが、キーフレーム及びWZフレームの比率はこれに限定されるものではない。例えば、キーフレームを2フレーム連続させた次の1フレームをWZフレームとし、キーフレーム及びWZフレームの比率を2:1とするようにしても良い。この場合、入力されたキーフレームの時間軸の変化が一律ではないことに応じて、動き情報の生成や内挿、外挿などを実行するようにすれば良い。
100、800、1200…動画像符号化システム、
101、801、1201…動画像符号化装置、
103、803、1203…Wyner−Zivフレーム符号化器、
109…Wyner−Ziv符号化部、
107…変換・量子化部、
108…Slepian−Wolf符号化部、
110…動き推定部、
810…動き補正部、
1210…動き推定・補正部、
111…予測画像生成部、
112…送信符号量計算部、
104、804、1204…キーフレーム符号化器、
124…減算部、
113…変換・量子化部、
114…逆量子化・逆変換部、
125…加算部、
115…フレームバッファ、
117…動き補正部、
817…動き推定部、
1217…動き推定部、
116…動き補償部、
102、1202…動画像復号装置、
105…Wyner−Zivフレーム復号器、
118…サイドインフォメーション生成部、
119…Slepian−Wolf復号部、
120…復号画像生成部、
106、1206…キーフレーム復号器、
121…逆量子化・逆変換部、
126…加算部、
122…フレームバッファ、
123…動き補償部、
1225…動き推定部。

Claims (7)

  1. フレーム系列を分離したキーフレームについては、フレーム内符号化又はフレーム間符号化を適用して符号化するキーフレーム符号化器と、フレーム系列を分離した非キーフレームについては、時間方向が異なるキーフレームから形成した予測画像と、非キーフレームの原画像との差である予測誤差信号に対する誤り訂正符号の情報を得る非キーフレーム符号化器とを有する動画像符号化装置において、
    上記キーフレーム符号化器は、
    参照用キーフレームを格納している参照用キーフレーム格納手段と、
    上記参照用キーフレーム格納手段から出力された参照用キーフレームに対して、与えられた動き情報を適用して動き補償する動き補償手段と、
    上記動き補償手段に与えるキーフレーム間の動き情報を形成する第1の動き情報形成手段とを備え、
    上記非キーフレーム符号化器は、
    上記予測画像を生成する予測画像生成手段と、
    上記予測画像生成手段が上記予測画像の生成時に利用する非キーフレームに係る動き情報を形成する第2の動き情報形成手段とを備え、
    上記第1の動き情報形成手段及び上記第2の動き情報形成手段の一方が、接近したキーフレームや非キーフレームの複数のフレームから動き推定によって動き情報を生成するものであり、
    上記第1の動き情報形成手段及び上記第2の動き情報形成手段の他方が、上記第1の動き情報形成手段及び上記第2の動き情報形成手段の一方が生成した動き情報を取り込み、その動き情報に対する補正によって動き情報を形成するものである
    ことを特徴とする動画像符号化装置。
  2. 上記第2の動き情報形成手段が、接近したキーフレームや非キーフレームの複数のフレームから動き推定によって非キーフレームに係る動き情報を生成するものであり、
    上記第1の動き情報形成手段が、上記第2の動き情報形成手段が生成した非キーフレームに係る動き情報を取り込み、その動き情報に対する外挿によってキーフレーム間の動き情報を形成するものである
    ことを特徴とする請求項1に記載の動画像符号化装置。
  3. 上記第1の動き情報形成手段が、接近した複数のキーフレームから動き推定によってキーフレーム間の動き情報を生成するものであり、
    上記第2の動き情報形成手段が、上記第1の動き情報形成手段が生成したキーフレーム間の動き情報を取り込み、その動き情報に対する内挿によって非キーフレームに係る動き情報を形成するものである
    ことを特徴とする請求項1に記載の動画像符号化装置。
  4. 上記第2の動き情報形成手段は、上記第1の動き情報形成手段がキーフレーム間の動き情報を生成できない初期側の非キーフレームについては、接近したキーフレームや非キーフレームの複数のフレームから動き推定によって非キーフレームに係る動き情報を生成することを特徴とする請求項3に記載の動画像符号化装置。
  5. フレーム系列を分離したキーフレームについては、フレーム内符号化又はフレーム間符号化を適用して符号化するキーフレーム符号化器と、フレーム系列を分離した非キーフレームについては、時間方向が異なるキーフレームから形成した予測画像と、非キーフレームの原画像との差である予測誤差信号に対する誤り訂正符号の情報を得る非キーフレーム符号化器とを有する動画像符号化装置と、キーフレーム復号器と非キーフレーム復号器とを有する動画像復号装置とを対向している動画像符号化システムにおいて、
    上記動画像符号化装置として、請求項3に記載の動画像符号化装置を適用していると共に、
    上記動画像復号装置が、
    参照用キーフレームを格納している復号側参照用キーフレーム格納手段と、
    上記参照用キーフレーム格納手段から出力された参照用キーフレームに対して、与えられた動き情報を適用して動き補償する復号側動き補償手段と、
    上記第1の動き情報形成手段と同じ動き情報の生成方法で、上記復号側動き補償手段に与えるキーフレーム間の動き情報を形成する第3の動き情報形成手段とを備えたキーフレーム復号器を有する
    ことを特徴とする動画像符号化システム。
  6. フレーム系列を分離したキーフレームについては、フレーム内符号化又はフレーム間符号化を適用して符号化するキーフレーム符号化器と、フレーム系列を分離した非キーフレームについては、時間方向が異なるキーフレームから形成した予測画像と、非キーフレームの原画像との差である予測誤差信号に対する誤り訂正符号の情報を得る非キーフレーム符号化器とを有する動画像符号化装置が実行する動画像符号化方法において、
    上記キーフレーム符号化器において、
    参照用キーフレーム格納手段は、参照用キーフレームを格納し、
    動き補償手段は、上記参照用キーフレーム格納手段から出力された参照用キーフレームに対して、与えられた動き情報を適用して動き補償し、
    第1の動き情報形成手段は、上記動き補償手段に与えるキーフレーム間の動き情報を形成し、
    上記非キーフレーム符号化器において、
    予測画像生成手段は、上記予測画像を生成し、
    第2の動き情報形成手段は、上記予測画像生成手段が上記予測画像の生成時に利用する非キーフレームに係る動き情報を形成し、
    上記第1の動き情報形成手段及び上記第2の動き情報形成手段の一方が、接近したキーフレームや非キーフレームの複数のフレームから動き推定によって動き情報を生成し、
    上記第1の動き情報形成手段及び上記第2の動き情報形成手段の他方が、上記第1の動き情報形成手段及び上記第2の動き情報形成手段の一方が生成した動き情報を取り込み、その動き情報に対する補正によって動き情報を形成する
    ことを特徴とする動画像符号化方法。
  7. フレーム系列を分離したキーフレームについては、フレーム内符号化又はフレーム間符号化を適用して符号化するキーフレーム符号化器と、フレーム系列を分離した非キーフレームについては、時間方向が異なるキーフレームから形成した予測画像と、非キーフレームの原画像との差である予測誤差信号に対する誤り訂正符号の情報を得る非キーフレーム符号化器とを有する動画像符号化装置を構成するコンピュータを、
    参照用キーフレームを格納している参照用キーフレーム格納手段と、上記参照用キーフレーム格納手段から出力された参照用キーフレームに対して、与えられた動き情報を適用して動き補償する動き補償手段と、上記動き補償手段に与えるキーフレーム間の動き情報を形成する第1の動き情報形成手段とを備えた上記キーフレーム符号化器と、
    上記予測画像を生成する予測画像生成手段と、上記予測画像生成手段が上記予測画像の生成時に利用する非キーフレームに係る動き情報を形成する第2の動き情報形成手段とを備えた上記非キーフレーム符号化器として機能させるものであり、
    機能させる上記第1の動き情報形成手段及び上記第2の動き情報形成手段の一方が、接近したキーフレームや非キーフレームの複数のフレームから動き推定によって動き情報を生成するものであり、
    機能させる上記第1の動き情報形成手段及び上記第2の動き情報形成手段の他方が、上記第1の動き情報形成手段及び上記第2の動き情報形成手段の一方が生成した動き情報を取り込み、その動き情報に対する補正によって動き情報を形成するものである
    ことを特徴とする動画像符号化プログラム。
JP2009048263A 2009-03-02 2009-03-02 動画像符号化装置、方法及びプログラム、並びに、動画像符号化システム Expired - Fee Related JP5071413B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2009048263A JP5071413B2 (ja) 2009-03-02 2009-03-02 動画像符号化装置、方法及びプログラム、並びに、動画像符号化システム
US12/654,408 US20100220787A1 (en) 2009-03-02 2009-12-18 Video encoding and decoding apparatus, method, and system
US14/048,677 US9667961B2 (en) 2009-03-02 2013-10-08 Video encoding and decoding apparatus, method, and system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009048263A JP5071413B2 (ja) 2009-03-02 2009-03-02 動画像符号化装置、方法及びプログラム、並びに、動画像符号化システム

Publications (2)

Publication Number Publication Date
JP2010206395A true JP2010206395A (ja) 2010-09-16
JP5071413B2 JP5071413B2 (ja) 2012-11-14

Family

ID=42667069

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009048263A Expired - Fee Related JP5071413B2 (ja) 2009-03-02 2009-03-02 動画像符号化装置、方法及びプログラム、並びに、動画像符号化システム

Country Status (2)

Country Link
US (2) US20100220787A1 (ja)
JP (1) JP5071413B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012119877A (ja) * 2010-11-30 2012-06-21 Oki Electric Ind Co Ltd 符号量制御装置及びプログラム、動画像符号化装置及びプログラム、並びに、整数/ビット列変換装置
JP2013062613A (ja) * 2011-09-12 2013-04-04 Oki Electric Ind Co Ltd 画像符号化システム、画像符号化装置及び画像符号化プログラム
JP2013123192A (ja) * 2011-12-12 2013-06-20 Oki Electric Ind Co Ltd 動画像符号化装置、システム及びプログラム
JP2015065645A (ja) * 2013-09-25 2015-04-09 三菱電機株式会社 画像推定方法
JP2015065644A (ja) * 2013-09-25 2015-04-09 三菱電機株式会社 画像推定方法
JP2016134847A (ja) * 2015-01-21 2016-07-25 沖電気工業株式会社 動画像符号化装置、動画像復号装置、動画像符号化プログラム、動画像復号プログラム及び動画像符号化システム
WO2023202177A1 (zh) * 2022-04-19 2023-10-26 华为技术有限公司 图像编码方法和装置

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2007214319A1 (en) * 2007-08-30 2009-03-19 Canon Kabushiki Kaisha Improvements for Spatial Wyner Ziv Coding
AU2007237313A1 (en) * 2007-12-03 2009-06-18 Canon Kabushiki Kaisha Improvement for error correction in distributed vdeo coding
AU2007242924A1 (en) * 2007-12-12 2009-07-02 Canon Kabushiki Kaisha Improvement for error correction in distributed video coding
US9288506B2 (en) * 2012-01-05 2016-03-15 Qualcomm Incorporated Signaling view synthesis prediction support in 3D video coding
JP5900024B2 (ja) * 2012-03-02 2016-04-06 沖電気工業株式会社 動画像符号化装置及びプログラム、動画像復号装置及びプログラム、並びに、動画像配信システム
US10085017B2 (en) 2012-11-29 2018-09-25 Advanced Micro Devices, Inc. Bandwidth saving architecture for scalable video coding spatial mode
KR102476204B1 (ko) * 2017-10-19 2022-12-08 삼성전자주식회사 멀티 코덱 인코더 및 이를 포함하는 멀티 코덱 인코딩 시스템
CN112584134B (zh) * 2020-12-07 2022-10-21 深圳市捷视飞通科技股份有限公司 视频会议码流的测试方法、装置、计算机设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004086631A2 (en) * 2003-03-24 2004-10-07 Qualcomm Incorporated Method, apparatus and system for encoding and decoding side information for multimedia transmission
WO2005120079A2 (en) * 2004-06-01 2005-12-15 Qualcomm Incorporated Method, apparatus, and system for enhancing robustness of predictive video codecs using a side-channel based on distributed source coding techniques
WO2006022400A1 (en) * 2004-08-27 2006-03-02 Mitsubishi Denki Kabushiki Kaisha Method and system for representing correlated set of images
JP2007274035A (ja) * 2006-03-30 2007-10-18 Kddi Corp 画像圧縮符号化装置、画像復号装置、プログラム及び方法
US20090074077A1 (en) * 2006-10-19 2009-03-19 Canon Kabushiki Kaisha Video source coding with decoder side information

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0679032B1 (en) * 1994-04-20 2010-06-23 Oki Electric Industry Co., Ltd. Image encoding and decoding method and apparatus using edge systhesis and inverse wavelet transform
US6134270A (en) * 1997-06-13 2000-10-17 Sun Microsystems, Inc. Scaled forward and inverse discrete cosine transform and video compression/decompression systems employing the same
EP2603001A1 (en) * 2002-10-01 2013-06-12 Thomson Licensing Implicit weighting of reference pictures in a video encoder
EP1558039A1 (en) * 2004-01-21 2005-07-27 Deutsche Thomson-Brandt Gmbh Method and apparatus for generating/evaluating prediction information in picture signal encoding/decoding
KR100664930B1 (ko) * 2004-10-21 2007-01-04 삼성전자주식회사 시간적 스케일러빌리티를 지원하는 비디오 코딩 방법 및장치
US8036281B2 (en) * 2005-06-01 2011-10-11 Canon Kabushiki Kaisha Image coding apparatus and image coding method
US20070171981A1 (en) * 2006-01-25 2007-07-26 Yingyong Qi Projection based techniques and apparatus that generate motion vectors used for video stabilization and encoding
WO2008028333A1 (en) * 2006-09-01 2008-03-13 Thomson Licensing Method and apparatus for encoding a flash picture occurring in a viedo sequence, and for decoding corresponding data for a flash picture
US20080205508A1 (en) * 2007-02-22 2008-08-28 Streaming Networks (Pvt.) Ltd. Method and apparatus for low complexity video encoding and decoding

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004086631A2 (en) * 2003-03-24 2004-10-07 Qualcomm Incorporated Method, apparatus and system for encoding and decoding side information for multimedia transmission
WO2005120079A2 (en) * 2004-06-01 2005-12-15 Qualcomm Incorporated Method, apparatus, and system for enhancing robustness of predictive video codecs using a side-channel based on distributed source coding techniques
WO2006022400A1 (en) * 2004-08-27 2006-03-02 Mitsubishi Denki Kabushiki Kaisha Method and system for representing correlated set of images
JP2007274035A (ja) * 2006-03-30 2007-10-18 Kddi Corp 画像圧縮符号化装置、画像復号装置、プログラム及び方法
US20090074077A1 (en) * 2006-10-19 2009-03-19 Canon Kabushiki Kaisha Video source coding with decoder side information

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012119877A (ja) * 2010-11-30 2012-06-21 Oki Electric Ind Co Ltd 符号量制御装置及びプログラム、動画像符号化装置及びプログラム、並びに、整数/ビット列変換装置
JP2013062613A (ja) * 2011-09-12 2013-04-04 Oki Electric Ind Co Ltd 画像符号化システム、画像符号化装置及び画像符号化プログラム
JP2013123192A (ja) * 2011-12-12 2013-06-20 Oki Electric Ind Co Ltd 動画像符号化装置、システム及びプログラム
JP2015065645A (ja) * 2013-09-25 2015-04-09 三菱電機株式会社 画像推定方法
JP2015065644A (ja) * 2013-09-25 2015-04-09 三菱電機株式会社 画像推定方法
JP2016134847A (ja) * 2015-01-21 2016-07-25 沖電気工業株式会社 動画像符号化装置、動画像復号装置、動画像符号化プログラム、動画像復号プログラム及び動画像符号化システム
WO2023202177A1 (zh) * 2022-04-19 2023-10-26 华为技术有限公司 图像编码方法和装置

Also Published As

Publication number Publication date
US20140037010A1 (en) 2014-02-06
US9667961B2 (en) 2017-05-30
JP5071413B2 (ja) 2012-11-14
US20100220787A1 (en) 2010-09-02

Similar Documents

Publication Publication Date Title
JP5071413B2 (ja) 動画像符号化装置、方法及びプログラム、並びに、動画像符号化システム
JP5131224B2 (ja) 動画像復号装置、方法及びプログラム、動画像符号化装置、方法及びプログラム、並びに、動画像符号化システム
JP5524625B2 (ja) インター予測符号化/復号化方法及び装置
US8582904B2 (en) Method of second order prediction and video encoder and decoder using the same
JP6457483B2 (ja) 平滑性の制約を用いてモーションが補償されるフレーム補間
JP4373702B2 (ja) 動画像符号化装置、動画像復号化装置、動画像符号化方法、動画像復号化方法、動画像符号化プログラム及び動画像復号化プログラム
JP5612214B2 (ja) 階層的映像符号化及び復号化のための方法及び装置
CN112055968B (zh) 视频解码方法、装置、存储介质以及电子设备
TW201715891A (zh) 用於視訊寫碼之改良雙向光流
CN111010579B (zh) 基于成对平均运动矢量预测的视频解码方法和装置
Adikari et al. Sequential motion estimation using luminance and chrominance information for distributed video coding of Wyner-Ziv frames
JP2006279573A (ja) 符号化装置と方法、ならびに復号装置と方法
JP5971010B2 (ja) 動画像復号装置及びプログラム、並びに、動画像符号化システム
JP2022513791A (ja) アフィン履歴ベース動きベクトル予測子バッファにアクセスする方法及び装置並びにコンピュータプログラム
CN113545084B (zh) 视频编解码的方法、装置以及存储介质
JP2009188990A (ja) 画像を効率的に符号化/復号化する方法及び装置
CN113661703A (zh) 视频编解码的方法和装置
JP2009141688A (ja) 画像符号化・復号化方法及びシステム及び画像符号化プログラム及び画像復号化プログラム
JP2022507423A (ja) ビデオ復号方法、ビデオ復号装置、コンピュータプログラム、およびビデオ符号化方法
JP2023521609A (ja) ビデオコーディングのための方法、コンピュータプログラム及び装置
Borchert et al. On extrapolating side information in distributed video coding
CN112333450B (zh) 一种视频编解码的方法和装置
CN114466199A (zh) 一种可适用于vvc编码标准的参考帧生成方法与系统
Badem et al. An iterative side information refinement technique for transform domain distributed video coding
JP2023522704A (ja) ビデオコーディングのための方法および装置、およびコンピュータプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111115

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120711

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120724

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120806

R150 Certificate of patent or registration of utility model

Ref document number: 5071413

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150831

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees