JP2014116786A - 動画像符号化装置及びプログラム - Google Patents

動画像符号化装置及びプログラム Download PDF

Info

Publication number
JP2014116786A
JP2014116786A JP2012269495A JP2012269495A JP2014116786A JP 2014116786 A JP2014116786 A JP 2014116786A JP 2012269495 A JP2012269495 A JP 2012269495A JP 2012269495 A JP2012269495 A JP 2012269495A JP 2014116786 A JP2014116786 A JP 2014116786A
Authority
JP
Japan
Prior art keywords
region
image
translational motion
encoding
rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012269495A
Other languages
English (en)
Other versions
JP6127487B2 (ja
Inventor
Kazuhito Sakomizu
和仁 迫水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2012269495A priority Critical patent/JP6127487B2/ja
Publication of JP2014116786A publication Critical patent/JP2014116786A/ja
Application granted granted Critical
Publication of JP6127487B2 publication Critical patent/JP6127487B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】動画像のWyner−Ziv符号化に際して、復号画像を生成するのに必要なWyner−Ziv符号のレートの推定を、より高精度で行う。
【解決手段】動画像符号化装置は、符号化対象画像をWyner−Ziv符号化してビットストリームを生成する手段と、符号化対象画像と参照画像から並進運動領域を求める手段と、符号化対象画像と予測画像との間で、並進運動領域と非並進運動領域とで異なる重みづけに基づく評価を行い、その評価結果に基づいて、復号画像を生成するのに必要なビットストリームのレートを推定し、生成するビットストリームのレートを制御する手段とを有する。
【選択図】図1

Description

この発明は、動画像符号化装置及びプログラムに関し、Slepian‐Wolf理論およびWyner−Ziv理論に基づき動画像の符号化および復号を行う動画像符号化装置に適用し得る。
従来のDVC(Distributed Video Coding)方式を採用したシステムは、Slepian‐Wolf理論およびWyner−Ziv理論に基づき動画像の符号化および復号をおこなうシステムである。
DVC方式は、デコーダで生成される符号化対象画像の予測画像(以下、「デコーダ予測画像」と呼ぶ)から符号化対象画像を再構成する符号(以下、「Wyner−Ziv符号」と呼ぶ)を、デコーダ予測画像を直接参照することなく生成することを特徴とする。この特徴より、DVC方式を採用した動画像符号化装置は複雑な予測画像生成部を備える必要がなく、符号化にかかる演算量の削減が可能になる。DVC方式の間題は、デコーダ予測画像自体を保持して、復号画像を生成するのに必要十分なWyner−Ziv符号のレートを求めることが困難であることである。例えば、DVC方式を採用した動画像符号化装置では、Wyner−Ziv符号が多すぎると圧縮効果が得られず、Wyner−Ziv符号が少なすぎるとデコーダ予測画像から復号画像を生成できない。
このようなDVC方式の課題を解決する従来技術として、非特許文献1の記載技術がある。非特許文献1では、デコーダ予測画像から復号画像が生成されるまで追加のWyner−Ziv符号を要求し続ける(フィードバックし続ける)ことで必要十分なレートを探る方式(以下、「デコーダレート制御方式」と呼ぶ)を実現している。
しかし、従来のデコーダレート制御方式には、ネットワークを介した復号処理の存在なしに符号化することができないため、用途が限定されるという短所がある。そして、この短所を改善するための従来技術として非特許文献2、3の記載技術がある。
この短所を解消するため、非特許文献2や非特許文献3では、エンコーダ予測画像(デコーダ予測画像ほど複雑な演算を必要とせずに生成が可能な予測画像)を動画像符号化装置側で生成し、符号化対象画像とエンコーダ予測画像を比較することで、レートを制御する方式(以下、「エンコーダレート制御方式」と呼ぶ)が提案されている。
非特許文献2、3のエンコーダレート制御方式を採用した動画像符号化装置では、レート制御を行うことで、初回に送られるWyer−Ziv符号のレートを、必要十分なレートに近づけ、フィードバック回数を少なくしている。
B.Girod,aM.Aaron,S.Rane,and D.Rebollo−Monedero,"Distributed Video Coding,"Proceedings of the IEEE,VOl.93,Jan.2005,pp.71−83. C.Brites and F.Pereira,"Encoder rate control for transform domain Wyner−Ziv Video coding,"Image Processing,2007.ICIP 2007.IEEE International Conference on,IEEE,2007,pp.4−7. K.Sakomizu,T.Yamasaki,S.Nakagawa and T.Nishi,"A Real‐time System of Distributed Video Coding,"Proc.of Picture Coding Symposiun(PCS’10),pp.538−541,Nagoya,Japan,Nov.2010. M.Tagliasacchi.A.Majumdar,and K.Ramchandran,"A distributed‐source‐coding based robust spatio−temporal scalable video codec,"Proc.Picture Coding Symposium,Citeseer.2004.
しかしながら、非特許文献2、3に記載されたエンコーダレート制御方式を採用した動画像符号化装置では、デコーダ予測画像を用いずに、復号側で復号するのに必要十分なレートを推定することは困難である。デコーダ予測画像を用いずに、復号側で必要となるレートを推定する方法としては、例えば、符号化対象画像とエンコーダ予測画像間の差に関する情報を計算し、差に関する情報からレートを推定する方法がある。
しかし、符号化対象画像とエンコーダ予測画像間の差に関する情報と、符号化対象画像とデコーダ予測画像間の差に関する情報は、等しくはなく、さらに、相関関係があるとは限らない。逆に、従来の動画像符号化装置にでは、符号化対象画像とエンコーダ予測画像間の差に関する情報をもちいてレート推定を行ったために生じる誤差により、レートの推定精度に悪影響を与え、結果として、符号化効率の悪化を招くおそれがあった。
そのため、動画像のWyner−Ziv符号化に際して、復号画像を生成するのに必要なWyner−Ziv符号のレートの推定を、より高精度で行うことができる動画像符号化装置及びプログラムが望まれている。
第1の本発明は、(1)符号化対象画像をWyner−Ziv符号化して、符号化データのビットストリームを生成するWyner−Ziv符号化手段と、(2)符号化対象画像と参照画像から、符号化対象画像内の並進運動領域を求める並進運動領域認識手段と、(3)符号化対象画像と予測画像との間で、上記並進運動領域認識手段が求めた並進運動領域と非並進運動領域とで異なる重みづけに基づく評価を行い、その評価結果に基づいて、復号画像を生成するのに必要なビットストリームのレートを推定し、上記Wyner−Ziv符号化手段に推定した推定レートで、符号化データのビットストリームを生成するように制御するレート制御手段とを有することを特徴とする。
第2の本発明の動画像符号化プログラムは、コンピュータを、(1)符号化対象画像をWyner−Ziv符号化して、符号化データのビットストリームを生成するWyner−Ziv符号化手段と、(2)符号化対象画像と参照画像から、符号化対象画像内の並進運動領域を求める並進運動領域認識手段と、(3)符号化対象画像と予測画像との間で、上記並進運動領域認識手段が求めた並進運動領域と非並進運動領域とで異なる重みづけに基づく評価を行い、その評価結果に基づいて、復号画像を生成するのに必要なビットストリームのレートを推定し、上記Wyner−Ziv符号化手段に推定した推定レートで、符号化データのビットストリームを生成するように制御するレート制御手段として機能させることを特徴とする。
本発明によれば、動画像のWyner−Ziv符号化に際して、復号画像を生成するのに必要なWyner−Ziv符号のレート推定を、より高精度で行うことができる。
第1の実施形態に係る動画像符号化装置の機能的構成について示したブロック図である。 第1の実施形態に係る動画像符号化装置の動作について示したフローチャートである。 第1の実施形態に係る動画像符号化装置で処理される参照画像及び符号化対象画像の例について示した説明図である。 第1の実施形態に係る動画像符号化装置で生成される、動き情報及領域識別情報(領域識別信号)の内容例について示した説明図である。 第2の実施形態に係る動画像符号化装置の機能的構成について示したブロック図である。 第2の実施形態に係る動画像符号化装置の動作について示したフローチャートである。
(A)第1の実施形態
以下、本発明による動画像符号化装置及びプログラムの第1の実施形態を、図面を参照しながら詳述する。
(A−1)第1の実施形態の構成
図1に、エンコーダレート制御方式を利用した、第1の実施形態の動画像符号化装置10の構成を示す。
動画像符号化装置10は、動画像データ(符号化対象画像F10及び参照画像F20)を入力とし、Wyner−ZivストリームSTを出力するものである。
動画像符号化装置10が、動画像データ(符号化対象画像F10及び参照画像F20)を、取得する方式については限定されないものである。動画像符号化装置10は、例えば、図示しない動画像を撮影可能なカメラ(例えば、CCDカメラ等)で撮影された動画像の信号をフレームごとに動画像データとして取得するようにしてもよいし、図示しないデータ記録媒体から動画像の信号やデータ(符号化されていないデータ)を取得するようにしてもよい。
次に、動画像符号化装置10の内部構成について説明する。
動画像符号化装置10は、レート制御部11、Wyner−Ziv符号化部12及び並進運動領域認識部13を有している。
動画像符号化装置10は、例えば、プロセッサ及びメモリを有するコンピュータに、実施形態の動画像符号化プログラムをインストールすることにより、ソフトウェア的に実現してもよい。その場合でも、動画像符号化装置10の機能的構成は、図1のように示すことができる。
レート制御部11は、符号化対象画像F10と参照画像F20に基づいて、復号側(デコード側)で、復号画像を得るのに必要十分なレート(Wyner−ZivストリームSTのビットレート)を推定し、推定したレートの情報を含むレート情報S1を生成してWyner−Ziv符号化部12に供給する。
参照画像F20は、たとえば直前時刻や直後時刻に撮影されたキーフレームの原画像や復号画像、それらを画像処理した画像などである。参照画像F20(キーフレーム)は、多くの場合、H.264/AVCなど既存の符号化技術で圧縮される。ただし、第1の実施形態では、参照画像F20(キーフレーム)の符号化方式については限定されないものである。なお、この実施形態では、動画像符号化装置10に、参照画像F20を符号化する構成要素を図示していないが、所定の符号化方式で参照画像F20を符号化して出力する構成要素を追加するようにしてもよいことは当然である。
Wyner−Ziv符号化部12は、符号化対象画像F10をWyner−Ziv符号化し、レート情報S1に基づくレートでWyner−ZivストリームSTを出力する。Wyner−Ziv符号化部12がWyner−ZivストリームSTを出力する方式については限定されないものであり、所定のパケット化周期ごとにパケット化して、通信により復号側(受信側)に送出するようにしてもよいし、符号化データとしてデータ記録媒体(例えば、HDDやフラッシュメモリ等の各種メモリ)に記憶させるようにしてもよい。
並進運動領域認識部13は、符号化対象画像F10と参照画像F20とから、符号化対象画像F10内で画像が並進運動している領域(以下、「並進運動領域」と呼ぶ)を求め、領域識別信号S2として、レート制御部11に供給するものである。
並進運動領域認識部13は、動き情報検出部131、平均動き情報計算部132、及び領域識別信号生成部133を有している。
動き情報検出部131は、符号化対象画像F10と参照画像F20とから、たとえばブロックマッチングによる動きベクトル探索により、動き情報D1を算出するものである。そして、動き情報検出部131は、算出した動き情報D1を、平均動き情報計算部132及び領域識別信号生成部133に供給する。
平均動き情報計算部132は、動き情報D1から、動きのフレーム内平均値を求め、平均動き情報D2として生成するものである。そして、平均動き情報計算部132は、平均動き情報D2を領域識別信号生成部133に供給する。
領域識別信号生成部133は、動き情報D1と平均動き情報D2とから、符号化対象画像F10の並進運動領域と、通常領域(非並進運動領域)とを識別し、各領域の範囲を示す領域識別情報D3を生成する。そして、領域識別信号生成部133は、領域識別情報D3を示す信号である領域識別信号S2を生成して、レート制御部11に供給する。
この実施形態では、領域識別信号生成部133は、例えば、動き情報D1と平均動き情報D2の差分の大きさを予め設定された閾値(以下、「Th1」と表す)と比較することで、領域識別情報D3を生成するものとする。
レート制御部11では、復号側(デコード側)で復号画像を得るのに必要十分なレート(ビットレート)を推定し、レート情報S1として生成する処理を行う。具体的には、レート制御部11は、領域識別信号S2に基づき、符号化対象画像F10と参照画像F20間で、並進運動領域と通常領域とで異なる重みづけで評価(比較)し、その評価(比較)結果に基づいて、レート情報S1を生成する。
(A−2)第1の実施形態の動作
次に、以上のような構成を有する第1の実施形態の動画像符号化装置10の動作を説明する。
図2は、動画像符号化装置10の動作について示したフローチャートである。
まず、動き情報検出部104により、符号化対象画像F10と参照画像F20とに基づいて、動き情報D1が生成さる(S101)。
動き情報D1としては、たとえば動きベクトルを適用することができる。動きベクトルは、例えば、ブロックマッチングを用いた動きベクトル探索によって求めることができる。DVC方式を適用した動画像符号化装置では、演算量を削減できることが主な特徴である。したがって、この実施形態の動き情報検出部104では、動き情報D1を検出するために、膨大な演算を実施することは望ましくない。そこで、この実施形態では、動き情報検出部104は、符号化対象画像F10と参照画像F20をそれぞれ縮小処理(より少ない画素数で表現した画像に変換処理)し、符号化対象画像F10の縮小画像と参照画像F20の縮小画像を対象に動き情報を検出するものとする。これにより、動き情報検出部104では、演算量を削減することができる。なお、この実施形態では、動き情報検出部104は、縮小画像について4×4のブロックに分割し、ブロックごとの動きベクトルの情報の集合体を動き情報D1として求めるものとする。
符号化対象画像F10の縮小画像や参照画像F20の縮小画像は、画像処理が施されたものでもよく、非特許文献4のようにスケーラブル構造を備えるDVC方式の場合、縮小画像レイヤの情報から上述符号化対象画像F10の縮小画像や、上述参照画像F20の縮小画像を取り出し、動き情報の検出に用いても良い。
次に、平均動き情報計算部132により、動き情報D1から平均動き情報D2が生成される(S102)。
平均動き情報D2とは、たとえば、動き情報D1のフレーム内平均情報が該当する。 動き情報D1として、符号化対象画像F10のブロックごとに動きベクトルが割り当てられている場合、すべてのブロックの動きベクトルを足し合わせ、総ブロック数で割ったベクトルが平均動き情報D2となる。
次に、領域識別信号生成部133により、動き情報D1と平均動き情報D2に基づいて、領域識別情報D3を生成し、さらに、領域識別情報D3の内容を表した信号を領域識別信号S2として生成し、レート制御部11に供給する(S103)。
領域識別信号生成部133は、例えば、各ブロックについて、動きベクトル(動き情報D1)から平均動き情報D2を差し引きいた差分の大きさに応じて、並進運動領域であるか否かを決定する。例えば、領域識別信号生成部133は、上述の差分の大きさが、所定の閾値Th1未満のブロックについては並進運動領域と判定し、上述の差分が閾値Th1以上のブロックについては通常領域と判定するものとする。これは、平均動き情報D2が、並進運動領域の動き情報に近いという仮定に基づいた判定方法である。
通常、動画像において、並進運動領域に含まれる画素は、すべてほぼ同じ動き情報を持つ。そのため、並進運動領域の動き情報は、平均動き情報に大きな影響を与えやすい傾向がある。すなわち、動画像において、上述の仮定が適合するケースは多いと言える。領域識別信号生成部133は、平均動き情報に近い動き情報を持つ領域を探索することで、動画像符号化に、最も大きな影響を与える並進運動領域を求めることができる。
ここで、並進運動領域認識部13の動作例を図3と図4を用いて説明する。
図3では、符号化対象画像F10、参照画像F20及び領域識別情報D3(領域識別信号S2)の具体例について示した説明図である。図3(a)は、参照画像F20の例について示している。そして、図3(b)は、符号化対象画像F10の例について示している。図3(a)、図3(b)には、同様の歩行者の画像G1、家の画像G2、雲の画像G3等が撮影された画像となっている。そして、図3(a)と図3(b)でそれぞれの画像は画面内で移動している。なお、ここでは、図3(a)の参照画像F20は、図3(b)の符号化対象画像F10の直前フレームであるものとする。また、図3(b)では、動画像を撮影しているカメラは、画像G2に係る歩行者の方向する方向と逆方向に動いているものとして説明する。そして、当該動画像を撮影しているカメラは、歩行者と逆方向に動いているものとする。そのため、図3では、実際には静止しているはずの画像G2に係る家や、画像G3に係る雲等の背景は、画面左方向に移動している。また、図3では、画像G1に係る歩行者は、画面右方向に向かって移動(歩行)しているものとする。したがって、図3の例の画像では、画像G2に係る家、画像G3に係る雲等の背景の物体は、画面左方向に向かって並進運動していることになる。これに対して、通常、歩行者は、手を振る、足を動かすなど、複雑な運動をしている場合が多い。
図4では、図3(a)、図3(b)の例の画像について、4×4のブロックごとに分割して並進運動領域を抽出する場合の具体的な処理について示した説明図である。図4(a)では、図3(b)の符号化対象画像F10について4×4のブロックに分割し、各ブロックの動きベクトルの方向(動き情報D1)について矢印の向きで示している。そして図4(b)は、ブロックごとの動き情報が図4(a)のようになった場合に並進運動領域として抽出されるブロック(領域)について示している。図4に示すように、この例では、ほとんどのブロックで動きベクトルが左向きとなる並進運動を行っており、人の画像G1が含まれている領域A2に係るブロックでのみ、動き情報が、下向き、右下向きへと複雑な動きをしている。したがって、図3、図4の例の場合、全ての動き情報を足し合わせ、平均動き情報D2を求めると、ほぼ画面左方向となる向きの情報が得られることになる。すなわち、図3、図4の例において、領域識別信号生成部133は、各ブロックの動き情報から、平均動き情報D2を差し引き、その差分の大きさが閾値Th1未満の場合当該ブロックについて並進運動領域と認識し、その差分の大きさが閾値Th1以上の場合、通常領域と認識することになる。
したがって、図3、図4の例では、領域識別信号生成部133は、画像G2に係る家や画像G3に係る雲等の背景の領域(図4(b)の領域A1)については並進運動領域と判断し、画像G1に係る歩行者(複雑な運動をする物体)が含まれている領域(図4(b)の領域A2)については通常領域と判断することになる。
なお、並進運動領域認識部13は、並進運動領域を認識できれば良く、動き情報D1及び平均動き情報D2の組み合わせによる並進運動領域の認識は、低演算量で並進運動領域を認識するための1例である。
以上のように、並進運動領域認識部13では、領域識別情報D3(領域識別信号S2)を生成する。
そして、レート制御部11は、領域識別信号S2が供給されると、符号化対象画像F10と参照画像F20と領域識別信号S2とに基づいて、レート情報S1を算出する(S104)。
この実施形態では、レート制御部11は、並進運動領域と通常領域とで重み付けをしながら、符号化対象画像F10とエンコーダ予測画像との間を比較することで、復号側で復号画像を生成するのに必要十分なレートを推定するものとする。言い換えると、レート制御部11は、符号化対象画像F10とエンコーダ予測画像との間を、並進運動領域と通常領域とで重み付けに基づく評価(比較)を行い、その評価結果に基づいてレートの推定を行う。なお、レート制御部11で、エンコーダ予測画像を生成する方式については限定されないものであり、種々の方式を適用することができる。
例えば、レート制御部11は、非特許文献2のように、符号化対象画像F10とエンコーダ予測画像間で誤差の統計量(並進運動領域と通常領域とで重み付けされた誤差の統計量)を利用して、復号側で必要となるレートを求め、レート情報S1を生成するようにしてもよい。この場合、レート制御部11は、ブロックごとの誤差を、並進運動領域ではα倍、通常領域ではβ倍で重みづけして評価するようにしてもよい。
また、例えば、レート制御部11は、非特許文献3のように、符号化対象画像F10とエンコーダ予測画像間でのビット反転数に基づいて、復号側で必要となるレートを求め、レート情報S1を生成するようにしてもよい。この場合、レート制御部11は、並進運動領域で発生したビット反転数をα倍、通常領域で発生したビット反転数をβ倍して重みづけし、ビット反転数を計数するようにしてもよい。そして、レート制御部11は、求められたビット反転数から計算できるビット反転確率に基づき、復号画像を得るために必要十分なレート情報S1を推定するようにしてもよい。
そして、レート制御部11では、並進運動領域について、符号化対象画像F10とエンコーダ予測画像との間で実際に発生している誤差よりも、小さい誤差で評価されるように重みづけ(上述のα、βの設定)を行うことが望ましい。具体的には、例えば、αについては、0.0以上1.0以下の間のいずれかの値を設定し、βに1.0以上の値を設定するようにしてもよい。
具体的な算出式の例として、非特許文献3をベースにレート情報S1を求める場合の算出式の例について、以下の(1)式、及び(2)式を用いて説明する。以下の(1)式では、全ビット数をE、並進運動領域で発生したビット反転数をC1、通常領域で発生したビット反転数をC2としている。また、非特許文献3に基づくレートRは、以下の(2)式により、算出することができる。
p=(α×C1+β×C2)/E …(1)
R=−p×log(p)−(1−p)×log(1−p)+T …(2)
ここで、Tは、経験的に決定する定数である。非特許文献3との差異は、ビット反転確率pを求める際に、C1とC2を重み付きで加算しているか否かである。C1とC2を単純に加算すると、pは符号化対象画像F10とエンコーダ予測画像との間の誤差を反映したビット反転確率となり、本来、推定したい符号化対象画像F10とデコーダ予測画像との間の誤差を反映したビット反転確率とは異なっている。αとβを使って、ビット反転数を重み付きで評価することにより、pを符号化対象画像F10とデコーダ予測画像との間のビット反転確率に近づけることで、レート制御の高精度化を実現している。
以上のように、動画像符号化装置10(レート制御部11)では、符号化対象画像F10とデコーダ予測画像間の誤差の統計量やビット反転数を推定するプロセスを加えることで、レート制御の高精度化を実現している。
そして、レート情報S1が供給されると、Wyner−Ziv符号化部12は、そのレート情報S1にしたがって、符号化対象画像F10をWyner−Ziv符号化し、Wyner−ZivストリームSTのレートを調整する(S105)。
上述のように、並進運動領域と通常領域とで、異なる重みづけを適用して評価することにより、並進運動領域では、符号化対象画像F10とエンコーダ予測画像間で実際に発生している誤差よりも、誤差が小さく評価されることになる。また、並進運動領域は、符号化対象画像F10と参照画像F20間で同じ部分が含まれる可能性が極めて高く、かつ並進運動領域の画素は、ほぼ同じ動き情報を有しているため、動きベクトル探索等での予測が当たりやすい領域である。つまり、デコーダ予測画像が高品質になる可能性の高い領域であるとも言える。そのため、たとえ符号化対象画像F10とエンコーダ予測画像間で大きな誤差が発生していたとしても、符号化対象画像F10とデコーダ予測画像間では誤差量が小さくなる可能性が、少なくとも通常領域に比べて高い傾向となる。
そこで、上述の傾向を反映するために、レート制御部11は、符号化対象画像F10とエンコーダ予測画像間で誤差の統計量を計算する際に、あるいはビット反転数を数える際に、並進運動領域と通常領域とで重み付けをしながら、符号化対象画像F10とエンコーダ予測画像間の誤差を評価する。言い換えると、レート制御部11により求められる誤差の統計量やビット反転数は、符号化対象画像F10とデコーダ予測画像間の誤差の統計量やビット反転数の推定値とみなすことができる。
従来では、符号化対象画像F10とエンコーダ予測画像間の誤差の統計量やビット反転数に基づき、デコーダが復号するのに必要十分なレート情報S1を推定している。これに対して、この実施形態の動画像符号化装置10の場合は、領域識別信号S2に基づき、符号化対象画像F10とデコーダ予測画像間の誤差の統計量やビット反転数の推定値を求め、この推定値に基づき、デコーダが復号するのに必要十分なレート情報S1を推定している。
なお、上述ステップS103で、領域識別信号生成部133が、並進運動領域を認識する方法の例として、動き情報D1から平均動き情報D2を差し引き、差分情報の大きさが予め定められた閾値Th1未満ならば、並進運動領域と判定し、差分情報の大きさが上述閾値Th1以上ならば、通常領域と判定することで生成する方法を説明した。
しかし、静止状態も一つの運動であるとみなした場合、領域識別信号生成部133は、静止状態ではない並進運動領域を、並進運動領域とみなしたほうが好ましい。なぜならば、静止している領域は、デコーダ予測画像だけに限らずエンコーダ予測画像でも予測精度の高い領域であり、予測精度が高いのにも関わらず、誤差ないしビット反転があるということは、つまり予測ではそもそも補えない誤差ないしビット反転であることを示唆しているからである。このような誤差ないしビット反転は、たとえば、照明のちらつきによって発生する場合がある。照明のちらつきは、ランダムな変化であり、予測によって補うことは極めて難しい。レート制御部11が、静止している並進運動領域を、並進運動領域とみなして、上述のステップS104でレート制御した場合、上述のような予測ではそもそも補えないような誤差ないしビット反転をα倍して過小評価してしまう。したがって、上述ステップS103で、領域識別信号生成部133は、上述差分情報の大きさが閾値Th1未満であり、かつ動き情報が静止以外を示唆している場合に、並進運動領域と認識し、それ以外の場合は、通常領域として認識し、該領域識別信号S2を生成することが好ましい。動き情報が静止状態を示唆しているか否かは、たとえば、動き情報の大きさが予め定められた閾値(以下、「閾値Th2」と呼ぶ;ただし、閾値Th1>閾値Th2)以上か否かによって判定できる。このように、領域識別信号生成部133では、動き情報の大きさが、閾値Th2未満のブロックについては、静止状態と判定できるし、動き情報の大きさが閾値Th2以上のブロックについては、静止以外の状態と判定できる。
(A−3)第1の実施形態の効果
第1の実施形態によれば、以下のような効果を奏することができる。
動画像符号化装置10では、符号化対象画像F10と参照画像F20との間で、並進運動領域と通常領域とで異なる重み付きに基づく評価を行うことで、並進運動領域ではデコーダ予測画像の品質が良好である確率が高いという傾向に基づき、より精度の高いレートを推定することができる。また、動画像符号化装置10では、推定されたレートの精度向上により、Wyner−Ziv符号化部12による符号化効率が改善される。
(B)第2の実施形態
以下、本発明による動画像符号化装置及びプログラムの第2の実施形態を、図面を参照しながら詳述する。
(B−1)第2の実施形態の構成
図5は、第2の実施形態の動画像符号化装置10Aの機能的構成を示すブロック図であり、上述の図1と同一又は対応する部分には、同一又は対応する符号を付している。
動画像符号化装置10Aでは、並進運動領域認識部13が、並進運動領域認識部13Aに置き換えられている点で、第1の実施形態と異なっている。そして、並進運動領域認識部13Aでは、領域識別信号生成部133が領域識別信号生成部133Aに置き換えられ、さらに、認識割合計算部134が追加されている点で、第1の実施形態と異なっている。
認識割合計算部134は、領域識別信号生成部133Aで生成される領域識別情報D3に基づき、符号化対象画像F10の全体と、並進運動領域と認識された領域との割合(比率)を、認識割合D4として求める。そして、認識割合計算部134は、認識割合D4を、領域識別信号生成部133Aに供給(フィードバック)する。例えば、上述の図4のように、フレーム全体の広さ(4×4=16ブロック)に対して、並進運動領域の広さが2ブロックの場合には、認識割合D4には、2/16を設定するようにしてもよい。
領域識別信号生成部133Aは、動き情報D1と平均動き情報D2と閾値Th1とを用いて、第1の実施形態と同様に領域識別情報D3を生成して、認識割合計算部134に供給する。そして、領域識別信号生成部133Aは、認識割合計算部134から供給される認識割合D4に応じて、閾値Th1を変更するかどうかを判定する。
そして、閾値Th1を変更する場合は、領域識別信号生成部133Aは、変更後の閾値Th1に基づいて、領域識別情報D3を再生成して、認識割合計算部134に供給する。
また、領域識別信号生成部133Aが、最新に取得した認識割合D4に基づいて閾値Th1を変更するか否かを判定する方法については、例えば、認識割合D4と予め設定された閾値(以下、「閾値Th3」と呼ぶ)との比較結果に応じて決定してもよい。例えば、領域識別信号生成部133Aは、認識割合D4が閾値Th3未満の場合に閾値Th1を変更しないと判定し、認識割合D4が閾値Th3以上の場合に閾値Th1を変更すると判定するようにしてもよい。一方、閾値Th1を変更しない場合は、領域識別信号生成部133Aは、最新に取得した領域識別情報D3を、領域識別信号S2として生成し、レート制御部11に供給する。
なお、領域識別信号生成部133Aは、差分情報の大きさが閾値Th1の初期値未満のときに並進運動領域と認識し、それ以外の場合は、通常領域として認識することで領域識別情報D3を生成する。また、領域識別信号生成部133Aは、認識割合D4が閾値Th3以上の場合には、閾値Th1を変更(減算)して、再び領域識別情報D3を生成する処理を、認識割合D4が閾値Th3未満となるまで繰り返し、領域識別信号S2に適用する領域識別情報D3を取得する。
(B−2)第2の実施形態の動作
次に、以上のような構成を有する第2の実施形態の動画像符号化装置10Aの動作を説明する。
図6は、動画像符号化装置10Aの動作について示したフローチャートである。
第2の実施形態の動画像符号化装置10Aの動作は、第1の実施形態におけるステップS106をステップS206に入れ替えたものに等しい。そこで、ここでは、ステップS206の詳細についてのみ説明する。
ステップS206では、まず、領域識別信号生成部133Aにより、動き情報D1と平均動き情報D2から領域識別情報D3が生成される(S206−1)。
領域識別情報D3の生成法は、第1の実施形態と同様である。なお、ここで、領域識別情報D3の生成に用いられる閾値Th1には、予め設定された初期値を用いるようにしてもよい。
そして、認識割合計算部134により、領域識別情報D3に基づいて、認識割合D4が算出され、領域識別信号生成部133Aに供給される(S206−2)。
そして、領域識別信号生成部133Aは、供給された認識割合D4が、閾値Th3未満であるか否かを判定する(S206−3)。そして、領域識別信号生成部133Aは、認識割合D4が閾値Th3未満の場合は後述するステップS206−5に移行し、認識割合D4が閾値Th3以上の場合は、後述するステップS206−4に移行する。
認識割合D4が閾値Th3以上の場合は、領域識別信号生成部133Aは、閾値Th1を変更して、再度、領域識別情報D3を生成し(S206−4)、上述のステップS206−2に戻って動作する。
領域識別信号生成部133Aが、閾値Th1を変更する計算式については限定されないものであるが、例えば、閾値Th1(初期値又は、最後に変更された値)について、一定値を減算したり、一定割合で減少させたり(1以下の所定値を乗算)するようにしてもよい。このように、閾値Th1を段階的に減少させることで、並進運動領域と判定される面積が減少し、上述のステップS206−3の判定で、ステップS206−5に進む可能性が高まることになる。
そして、認識割合D4が閾値Th2未満の場合は、領域識別信号生成部133Aは、領域識別情報D3を領域識別信号S2として出力する(S206−5)。
なお、ステップS206−4の閾値Th1の変更方法によっては、ステップS206−3で、限りなくステップS206−4に進み続ける可能性がある。その場合には、領域識別信号生成部133Aは、閾値Th1を変更する回数に制限を設け、領域識別情報D3の計算回数が指定された反復回数に達した場合、強制的にステップS206−3で、ステップS206−5に移行するようにしてもよい。
(B−3)第2の実施形態の効果
第2の実施形態によれば、第1の実施形態の効果に加えて、以下のような効果を奏することができる。
領域識別信号生成部133Aでは、閾値Th1を段階的に減少させることで、並進運動領域と認識される面積の割合が、指定した割合よりも小さくなる場合がある。
第1の実施形態の領域識別信号生成部133では、並進運動領域の認識が難しい画像では、画像のほとんどの領域を誤って並進運動領域と判断してしまう可能性がある。この場合、領域識別信号生成部133では、並進運動領域でないのにも関わらず、誤差ないしビット反転をα倍して過小評価してしまう可能性が増大する。第1の実施形態のレート制御部11では、誤差ないしビット反転の過小評価が生じると、レートの過小評価を招く可能性があり、その場合、レートの過小評価は、復号側で復号できない状態を引き起こすことになる。
そこで、第2の実施形態の動画像符号化装置10A(並進運動領域認識部13A)のように、並進運動領域と認識される面積の割合を、減少させることで、上述の過小評価を防いで、より高い精度のレート推定を行うことができる。
(C)他の実施形態
本発明は、上記の各実施形態に限定されるものではなく、以下に例示するような変形実施形態も挙げることができる。
(C−1)上記の各実施形態では、並進運動領域認識部とレート制御部とを別の構成要素として説明したが、共通する処理については処理結果を共有して、装置全体の処理量を低減するようにしてもよい。例えば、動き検出部とレート制御部とで、エンコーダ予測画像を共有するようにしてもよい。
(C−2)上記の各実施形態の動画像符号化装置では、DCT変換(Discrete Cosine Transform)を初めとする直交変換を用いずに動画像を符号化する構成を説明しているが、このような直行変換の有無については限定されないものである。
(C−3)上記の各実施形態では、エンコーダレート制御方式に基づく動画像符号化装置についてのみ構成を説明しているが、レート制御部を備えるデコーダレート制御方式に基づく動画像符号化装置に、本発明の動画像符号化装置を適用するようにしてもよい。
10…動画像符号化装置10…レート制御部、12…Wyner−Ziv符号化部、13…並進運動領域認識部、131…動き検出部、132…平均動き情報計算部、133…領域識別信号生成部。

Claims (10)

  1. 符号化対象画像をWyner−Ziv符号化して、符号化データのビットストリームを生成するWyner−Ziv符号化手段と、
    符号化対象画像と参照画像から、符号化対象画像内の並進運動領域を求める並進運動領域認識手段と、
    符号化対象画像と予測画像との間で、上記並進運動領域認識手段が求めた並進運動領域と非並進運動領域とで異なる重みづけに基づく評価を行い、その評価結果に基づいて、復号画像を生成するのに必要なビットストリームのレートを推定し、上記Wyner−Ziv符号化手段に推定した推定レートで、符号化データのビットストリームを生成するように制御するレート制御手段と
    を有することを特徴とする動画像符号化装置。
  2. 上記レート制御手段は、符号化対象画像とエンコーダ予測画像間で、並進運動領域と非並進運動領域とで異なる重みづけを利用して、誤差の統計量を計算し、計算した統計量に基づいて、推定レートを求めることを特徴とする請求項1に記載の動画像符号化装置。
  3. 上記レート制御手段は、符号化対象画像とエンコーダ予測画像間で、並進運動領域と非並進運動領域とで異なる重みづけを行ったビット反転数を求め、求めたビット反転数に基づいて、符号化対象画像とデコーダ予測画像との間に存在するビット反転確率を推定し、推定したビット反転確率に基づいて推定レートを求めることを特徴とする請求項1に記載の動画像符号化装置。
  4. 上記並進運動領域認識手段は、
    符号化対象画像と参照画像とから、領域ごとの動き情報を検出する動き情報検出部と、
    上記動き検出部が求めた領域ごとの動き情報に基づいて、画像全体の平均動き情報を求める平均動き情報検出部と、
    上記動き検出部が求めた領域ごとの動き情報と、上記平均動き情報検出部が求めた平均動き情報とに基づいて、並進運動領域を検出する並進運動領域検出部と
    を有することを特徴とする請求項1〜3のいずれかに記載の動画像符号化装置。
  5. 上記並進運動領域検出部は、領域ごとに、動き情報と、平均動き情報とを比較し、その差分の大きさが第1の閾値未満の場合に、当該領域を並進運動領域と認識することを特徴とする請求項4に記載の動画像符号化装置。
  6. 上記並進運動領域検出部は、領域ごとに、動き情報と、平均動き情報とを比較し、その差分の大きさが第1の閾値未満であり、かつ、当該領域の動き情報が静止以外を示唆している場合にのみ、当該領域を並進運動領域と認識することを特徴とする請求項4に記載の動画像符号化装置。
  7. 上記並進運動領域検出部は、領域ごとに、動き情報と、平均動き情報とを比較し、その差分の大きさが第1の閾値未満であり、かつ、第2の閾値以上の大きさである場合にのみ、当該領域を並進運動領域と認識することを特徴とする請求項4に記載の動画像符号化装置。
  8. 上記並進運動領域検出手段は、
    符号化対象画像全体の広さに対する、上記並進運動領域検出部が求めた並進運動領域の割合を示す認識割合を求める認識割合計算部をさらに備え、
    上記並進運動領域検出部は、最新に求めた並進運動領域について、上記認識割合計算部から認識割合を取得し、取得した認識割合に応じて、少なくとも上記第1の閾値を変更するか否かを判定し、上記第1の閾値を変更する場合には再度並進運動領域を求め、上記第1の閾値を変更しない場合には、最新に求めた並進運動領域の情報を、上記レート制御手段に供給する
    ことを特徴とする請求項4に記載の動画像符号化装置。
  9. 上記並進運動領域検出部は、認識割合が第3の閾値未満となるまで、段階的に上記第1の閾値を減少させて、並進運動領域を求める処理を繰り返し、認識割合が上記第3の閾値未満となる並進運動領域を取得して、上記レート制御手段に供給することを特徴とする請求項8に記載の動画像符号化装置。
  10. コンピュータを、
    符号化対象画像をWyner−Ziv符号化して、符号化データのビットストリームを生成するWyner−Ziv符号化手段と、
    符号化対象画像と参照画像から、符号化対象画像内の並進運動領域を求める並進運動領域認識手段と、
    符号化対象画像と予測画像との間で、上記並進運動領域認識手段が求めた並進運動領域と非並進運動領域とで異なる重みづけに基づく評価を行い、その評価結果に基づいて、復号画像を生成するのに必要なビットストリームのレートを推定し、上記Wyner−Ziv符号化手段に推定した推定レートで、符号化データのビットストリームを生成するように制御するレート制御手段と
    して機能させることを特徴とする動画像符号化プログラム。
JP2012269495A 2012-12-10 2012-12-10 動画像符号化装置及びプログラム Active JP6127487B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012269495A JP6127487B2 (ja) 2012-12-10 2012-12-10 動画像符号化装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012269495A JP6127487B2 (ja) 2012-12-10 2012-12-10 動画像符号化装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2014116786A true JP2014116786A (ja) 2014-06-26
JP6127487B2 JP6127487B2 (ja) 2017-05-17

Family

ID=51172372

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012269495A Active JP6127487B2 (ja) 2012-12-10 2012-12-10 動画像符号化装置及びプログラム

Country Status (1)

Country Link
JP (1) JP6127487B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108012163A (zh) * 2017-12-19 2018-05-08 希诺麦田技术(深圳)有限公司 视频编码的码率控制方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05122590A (ja) * 1991-10-24 1993-05-18 Sanyo Electric Co Ltd 手ブレ補正機能付きビデオカメラの動きベクトル特定回路
JPH06217294A (ja) * 1993-01-19 1994-08-05 Sony Corp 画像データ圧縮装置および画像データ伝送方法
JP2009141688A (ja) * 2007-12-06 2009-06-25 Nippon Telegr & Teleph Corp <Ntt> 画像符号化・復号化方法及びシステム及び画像符号化プログラム及び画像復号化プログラム
JP2010193304A (ja) * 2009-02-19 2010-09-02 Oki Electric Ind Co Ltd 動画像復号装置、方法及びプログラム、動画像符号化装置、方法及びプログラム、並びに、動画像符号化システム
JP2010212863A (ja) * 2009-03-09 2010-09-24 Oki Electric Ind Co Ltd 動画像符号化装置、及び動画像復号装置、並びに動画像伝送システム
JP2011077881A (ja) * 2009-09-30 2011-04-14 Oki Electric Industry Co Ltd 動画像符号化装置及びプログラム、並びに、動画像配信システム
JP2012175527A (ja) * 2011-02-23 2012-09-10 Nippon Telegr & Teleph Corp <Ntt> 符号化装置、符号化及び復号化システム、符号化方法並びに符号化及び復号化方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05122590A (ja) * 1991-10-24 1993-05-18 Sanyo Electric Co Ltd 手ブレ補正機能付きビデオカメラの動きベクトル特定回路
JPH06217294A (ja) * 1993-01-19 1994-08-05 Sony Corp 画像データ圧縮装置および画像データ伝送方法
JP2009141688A (ja) * 2007-12-06 2009-06-25 Nippon Telegr & Teleph Corp <Ntt> 画像符号化・復号化方法及びシステム及び画像符号化プログラム及び画像復号化プログラム
JP2010193304A (ja) * 2009-02-19 2010-09-02 Oki Electric Ind Co Ltd 動画像復号装置、方法及びプログラム、動画像符号化装置、方法及びプログラム、並びに、動画像符号化システム
JP2010212863A (ja) * 2009-03-09 2010-09-24 Oki Electric Ind Co Ltd 動画像符号化装置、及び動画像復号装置、並びに動画像伝送システム
JP2011077881A (ja) * 2009-09-30 2011-04-14 Oki Electric Industry Co Ltd 動画像符号化装置及びプログラム、並びに、動画像配信システム
JP2012175527A (ja) * 2011-02-23 2012-09-10 Nippon Telegr & Teleph Corp <Ntt> 符号化装置、符号化及び復号化システム、符号化方法並びに符号化及び復号化方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108012163A (zh) * 2017-12-19 2018-05-08 希诺麦田技术(深圳)有限公司 视频编码的码率控制方法及装置
CN108012163B (zh) * 2017-12-19 2020-08-18 希诺麦田技术(深圳)有限公司 视频编码的码率控制方法及装置

Also Published As

Publication number Publication date
JP6127487B2 (ja) 2017-05-17

Similar Documents

Publication Publication Date Title
KR101366242B1 (ko) 움직임 모델 파라메터의 부호화, 복호화 방법 및 움직임모델 파라메터를 이용한 영상의 부호화, 복호화 방법 및장치
US8761254B2 (en) Image prediction encoding device, image prediction decoding device, image prediction encoding method, image prediction decoding method, image prediction encoding program, and image prediction decoding program
JP5619692B2 (ja) より正確な動き情報を用いたフレーム補間
WO2019062226A1 (zh) 视频编码处理方法、计算机设备和存储介质
US9729870B2 (en) Video coding efficiency with camera metadata
JPWO2010092772A1 (ja) 多視点画像符号化方法、多視点画像復号方法、多視点画像符号化装置、多視点画像復号装置、多視点画像符号化プログラムおよび多視点画像復号プログラム
KR20090090232A (ko) 직접 모드 부호화 및 복호화 방법
JP2015508954A (ja) オブジェクト検出情報に基づく符号化
JP4195057B2 (ja) 適応動きベクトルの探索領域を決定する方法、および適応動きベクトルの探索領域を決定する画像圧縮装置。
JP5441803B2 (ja) 動きベクトル決定装置及び動きベクトル決定方法、コンピュータプログラム
JP2006511113A (ja) 選択されたマクロブロックにおける動き推定のスキップを伴うビデオエンコーディング
JP2011077881A (ja) 動画像符号化装置及びプログラム、並びに、動画像配信システム
KR20130046377A (ko) 화소 블록 코딩 및 재구성 방법 및 대응 장치
JP6127487B2 (ja) 動画像符号化装置及びプログラム
US10666970B2 (en) Encoding apparatus, encoding method, and storage medium
Tomé et al. Low delay distributed video coding with refined side information
KR101035746B1 (ko) 동영상 인코더와 동영상 디코더에서의 분산적 움직임 예측 방법
JP2007110409A (ja) 画像処理装置及び画像処理方法をコンピュータに実行させるためのプログラム
ZHANG et al. Improved side information generation algorithm for Wyner-Ziv video coding
JP2009194474A (ja) 動画像符号化装置
JP2008301270A (ja) 動画像符号化装置及び動画像符号化方法
JP6398149B2 (ja) 動画像符号化装置及びプログラム、並びに、動画像符号化システム
EP3322188A1 (en) Method and device for generating a signal comprising video transcoding hints
JP2005516501A (ja) Pbフレームモードでのビデオ画像の符号化
US11956441B2 (en) Identifying long term reference frame using scene detection and perceptual hashing

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150817

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160408

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160419

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160617

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161122

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161202

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170314

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170327

R150 Certificate of patent or registration of utility model

Ref document number: 6127487

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150