WO2017104010A1

WO2017104010A1 - 動画像符号化装置および動画像符号化方法

Info

Publication number: WO2017104010A1
Application number: PCT/JP2015/085145
Authority: WO
Inventors: 淳真大澤
Original assignee: 三菱電機株式会社
Priority date: 2015-12-16
Filing date: 2015-12-16
Publication date: 2017-06-22

Abstract

画質を損なわずフレームメモリ容量を小さくすることが可能な動画像符号化装置を得ることを目的とする。本発明の動画像符号化装置は、符号化対象ブロックの画面内予測処理を行い、画面内予測モードを出力する画面内予測部と、前記画面内予測モードを用いて局部復号画像に対して画面内予測処理を行い、第１の画面内予測画像を生成するフレームメモリ入力用予測画生成部と、前記局部復号画像と前記第１の画面内予測画像との差分画像のデータを格納するフレームメモリと、前記画面内予測モードを用いて前記フレームメモリから出力されたデータに基づく画面内予測処理を行い、第２の画面内予測画像を生成するフレームメモリ出力用予測画生成部と、を備える。

Description

動画像符号化装置および動画像符号化方法

　本発明は、動画像を符号化する動画像符号化装置および動画像符号化方法に関するものである。

　従来の動画像符号化装置は、フレームメモリの前段で局部復号した画像をそのまま圧縮器に入力することで画像信号を圧縮し、フレームメモリから読みだされた画像信号を伸張することによって、フレームメモリ容量の削減を行っていた（例えば、特許文献１）。

特開平８－１１６５３９号公報

　従来の動画像符号化装置は、局部復号した画像をそのまま圧縮してフレームメモリへ格納するため、フレームメモリの容量を小さくする効果が限定的である問題点があった。

　この発明は、上記のような問題点を解決するためになされたもので、画質を損なわずフレームメモリ容量をさらに小さくすることが可能な動画像符号化装置の実現を目的とする。

　この発明に係る動画像符号化装置は、
　符号化対象ブロックの画面内予測処理を行い、画面内予測モードを出力する画面内予測部と、
　前記画面内予測モードを用いて局部復号画像に対して画面内予測処理を行い、第１の画面内予測画像を生成するフレームメモリ入力用予測画生成部と、
　前記局部復号画像と前記第１の画面内予測画像との差分画像のデータを格納するフレームメモリと、
　前記画面内予測モードを用いて前記フレームメモリから出力されたデータに基づく画面内予測処理を行い、第２の画面内予測画像を生成するフレームメモリ出力用予測画生成部と、
　を備えたことを特徴とするものである。

　この発明によれば、画質を損なわずフレームメモリ容量を小さくすることが可能な動画像符号化装置を得ることができる。

この発明の実施の形態１に係る動画像符号化装置を示す構成図である。この発明の実施の形態１に係る動画像符号化装置の動作を説明するための説明図である。この発明の実施の形態１に係る動画像符号化装置の動作を説明するための説明図である。この発明の実施の形態１に係る動画像符号化装置の動作を説明するための説明図である。この発明の実施の形態１に係る動画像符号化装置のハードウェア構成を示す構成図である。この発明の実施の形態２に係る動画像符号化装置を示す構成図である。

実施の形態１．
　図１はこの発明の実施の形態１の動画像符号化装置を示す構成図である。
　図において、１は第１の差分器、２は周波数変換量子化部、３はエントロピー符号化部、４は逆周波数変換量子化部、５は第１の加算器、６は画面内予測部、７はセレクタ、８は画面内予測画素メモリ、９はループフィルタ部、１０はフレームメモリ入力用予測画像生成画素メモリ、１１は第２の差分器、１２は動き補償予測部、１３はフレームメモリ入力用予測画生成部、１４はデータ圧縮部、１５はフレームメモリ、１６はデータ伸張部、１７は第２の加算器、１８はフレームメモリ出力用予測画生成部、１９はフレームメモリ出力用予測画像生成用画素メモリ、である。

　図１において、第１の差分器（差分器１）１は画像入力すなわち現フレームとセレクタ７が出力する動き補償予測部１２から出力される前または後または前後のフレーム間予測画像または画面内予測部６から出力される画面内予測画像の差分を周波数変換量子化部２に出力する。

　周波数変換量子化部２は第１の差分器１から出力された差分画像を周波数成分に係数変換したあとに周波数変換後の係数を量子化することで、量子化後の画像差分データの周波数変換係数を出力する処理を実施して、エントロピー符号化部３に出力する。なお、周波数変換の方式としては、例えば直交変換を用いる。

　逆周波数変換量子化部４は周波数変換量子化部２から出力された圧縮データを逆量子化したあとに逆変換周波数し、逆変換周波数後の信号を局部復号予測差分信号として出力する。

　第１の加算器（加算器１）５は逆周波数変換量子化部４から局部復号予測差分信号を受けると、その局部復号予測差分信号とセレクタ７から出力された予測画像を示す予測信号を加算することで、局部復号画像を示す局部復号画像信号を生成する。

　画面内予測部６は符号化対象ブロックの画面内予測処理に最適な画面内予測モードを選択し、画面内予測メモリ８から入力した符号化対象ブロックの周辺に位置する画素を用いる画面内予測画生成処理を実施して予測画像を生成し、その予測画像をセレクタ７と画面内予測画素メモリ８に出力するとともに最適な画面内予測モードをフレームメモリ１５とエントロピー符号化部３に出力する処理を実施する。なお、画面内予測部６は予測画像生成手段を構成している。

　画面内予測画素メモリ８は画面内予測部６により次回の画面内予測処理で用いられる画素として、加算器により生成された局部復号画像信号が示す局部復号画像を格納する。

　ループフィルタ部９は第１の加算器５が局部復号画像信号を生成すると、その局部復号画像信号に含まれている符号化歪みを補償し、符号化歪み補償後の局部復号画像信号が示す局部復号画像をフレームメモリ入力用予測画像生成画素メモリ１０と第２の差分器（差分器２）１１に出力する。

　動き補償予測部１２は、符号化対象ブロックと第２の加算器（加算器２）１７から出力される参照画像を比較しながら動きベクトルを探索する動き探索処理を実施し、その動きベクトルを用いる画面間予測処理を実施して予測画像を生成し、その予測画像をセレクタ７に出力する処理を実施する。また、動きベクトル等の動きパラメータをエントロピー符号化部３に出力する。なお、動き補償予測部１２は動きベクトル探索手段及び動き補償予測手段を構成している。

　フレームメモリ入力用予測画像生成画素メモリ１０はフレームメモリ入力用予測画生成部１３により次回のフレームメモリ入力用画素生成処理で用いられる画素として、ループフィルタ部９により生成された符号化歪み補償後の局部復号画像信号が示す局部復号画像を格納する。

　フレームメモリ入力用予測画生成部１３は、画面内予測部６から入力した符号化対象ブロックの画面内予測処理に最適な画面内予測モード、またはフレームメモリ予測画素生成部１３で選択した画面内予測モードと、フレームメモリ用予測画像生成用画素メモリ１０から入力した符号化対象ブロックの周辺に位置しているループフィルタ後の局部復号画像を用いる画面内予測画像生成処理を実施して、第１の画面内予測画像を生成し、その予測画像を第２の差分器１１に出力する処理を実施する。

　第２の差分器１１はループフィルタ部９から入力した符号化歪み補償後の局部復号画像とフレームメモリ入力用予測画生成部１３から入力した予測画像の差分をフレームメモリ１５に出力する。

　データ圧縮部１４は、第２の差分器１１から入力した差分データに対してランレングス、ハフマン符号等の可逆圧縮アルゴリズムでデータの圧縮を実施して、圧縮データをフレームメモリ１５に出力する。

　フレームメモリ１５は動き補償予測部１２により次回の動き補償予測処理で用いられる参照画像等を生成するために、データ圧縮部１４から入力した符号化歪み補償後の局部復号画像の圧縮データとフレームメモリ入力用予測画生成部１３から入力した予測画像の差分を格納する。

　データ伸張部１６は、フレームメモリ１５から入力した圧縮データに対して、データ圧縮部１４で使用した圧縮アルゴリズムの逆変換処理を施して伸張し、符号化歪み補償後の局部復号画像とフレームメモリ入力用予測画生成部１３から入力した予測画像の差分として第２の加算器１７に出力する。

　フレームメモリ出力用予測画生成部１８は、フレームメモリ１５から入力した画面内予測モードと、フレームメモリ出力用予測画像生成用画素メモリ１９から入力した符号化対象ブロックの周辺に位置している画素を用いる画面内予測画像生成処理を実施して、第２の画面内予測画像を生成し、その予測画像を第２の加算器１７に出力する。

　フレームメモリ出力用予測画像生成画素メモリ１９は、フレームメモリ出力用予測画生成部１８により次回のフレームメモリ出力用画素生成処理で用いられる画素として、第２の加算器１７から入力する画素とフレームメモリ出力用予測画生成部１８から入力する画素を格納する。

　第２の加算器１７は、データ伸張部１６からループフィルタ処理後の局部復号予測差分信号とフレームメモリ出力用予測画生成部１８から対象ブロックの予測画象を受けると、それらを加算することでループフィルタ後の局部復号画像を示す局部復号画像を生成して動き補償予測部１２に出力する。

　エントロピー符号化部３は、周波数変換量子化部２から出力された圧縮データと、画面内予測部６から出力された画面内予測モードや動き補償予測部１２から出力された動きベクトル等の各種符号化パラメータをエントロピー符号化して、それらのデータが多重化されているビットストリームを生成して出力する。

　次に動作について説明する。
　例えば、Ｈ．２６４、Ｈ．２６５等の動画像符号化方式では、符号化対象のブロックと隣接する画素から予測画像を生成して画面内予測を実現している。Ｈ．２６４では輝度で９通りの予測方法、Ｈ．２６５では３５通りの予測方法があり、符号化対象ブロックと最も似た予測画を選択することで符号化効率を高めることができる。

　前述の通り、Ｈ．２６５の画面内予測ではＤＣ予測を含めた３４の方向性予測とＰｌａｎｅｒ予測という選択肢がある。図２にＨ．２６５の画面内予測について示す。矢印の向きは参照画像が参照される方向を示すものであるため、画面内予測は矢印とは逆方向に行われる。方向性予測のうちＤＣ予測は方向を持たずエッジのない平坦なテクスチャ領域の予測に適しているが、特に符号化対象ブロックの左側と上側の画素が存在しない場合においても入力画像のビット数に応じた特定の値を用いることで予測画像を生成することができる。

　画面内予測部６では、まず、画面内予測画素メモリ８から局部復号処理済みの符号化対象ブロック周辺画素と第１の加算器５から符号化対象ブロック画素を入力し、Ｈ．２６５の場合を例にとると最大で３５通りの画面内予測画像を生成する。次に、生成した画面内予測画像と符号化対象ブロックを比較して、最も似通った画面内予測画像を生成した画面内予測モードを最適画面内予測モードとして、フレームメモリ入力用予測画生成部１３とフレームメモリ１５に出力する。

　フレームメモリ入力用予測画生成画素メモリ１０は、ループフィルタ部９から入力する符号化対象ブロックの上側と左側の画素を格納する（図３）。一般的に動画像の符号化は画面の左上からラスター順に行うことが多いため、上側の画素についてはラインメモリ等を設けることによって保持しておく。

　フレームメモリ入力用予測画生成部１３は、フレームメモリ入力用予測画生成画素メモリ１０から入力する符号化対象ブロックの上側と左側の画素と、画面内予測部６から入力する符号化対象ブロックの最適画面内予測モードから、符号化対象ブロックのループフィルタ後の画面内予測画像を生成する。この画面内予測画像は、画面内予測部６で最適と判断した予測モードから生成したものであるため、符号化対象ブロックと最も似通ったものである。

　第２の差分器１１には、ループフィルタ部９から符号化対象ブロック画像と、フレームメモリ入力用予測画生成部１３から画面内予測部６で判定した最適画面内予測モードで生成した画面内予測画像が入力される。対応した位置の差分を取り、差分値をデータ圧縮部１４に出力する。ここで出力される差分値は、最適画面内予測モードで生成されるため、元の符号化対象ブロック画像や他のモードで生成された画面内予測画像との差分よりも絶対値が小さく、分散も小さくなる可能性が高い。

　データ圧縮部１４は、量子化は行わず可逆符号化を実施するものである。符号化方式としてはランレングス、ハフマン符号などの可逆符号化アルゴリズムを用いる。データ圧縮部１４は、第２の差分器１１から符号化対象ブロックと、画面内予測画像の差分信号を入力し、可逆符号化による圧縮を実施する。ここで入力される差分値は、元の符号化対象ブロック画像の値や最適予測モードでない予測モードで生成された予測画像との差分信号よりも絶対値が小さく、分散が小さいものである。すなわち情報量の少ないデータとなっている。このため、データ圧縮部１４において従来方式よりも効率のよいデータ圧縮を実現することが出来る。

　フレームメモリ１５は、画面内予測部６から入力する最適画面内予測モードと、データ圧縮部１４から入力する圧縮信号を格納する。フレームメモリ１５に格納するデータは圧縮信号であるため、ブロック毎のデータを判別できるようにする必要がある。そのための手法としては、読出し順は画面内でラスター順と決まっているため、圧縮データ列に存在しないブロック区切り位置を示すコードを埋め込む方法などを用いることができる。また、複数のフレームを格納する場合には、フレームの区切り位置を同様にコードに埋め込む方法や、１フレームの上限を予め決め打ちで設定してしまう方法がある。圧縮データのデータ量に関しては、確定することが出来ないため、最悪値でフレームメモリ１５の容量を決定すると圧縮しない場合と同じになってしまう。しかし、フレームメモリ１５の容量を圧縮しない場合より小さく設定しても、仮に容量を超えて保存できない画素がある場合には、フレームメモリ１５からその情報を動き補償予測部１２に通知してその範囲を探索しない機能を持たせることもできる。

　データ伸張部１６はフレームメモリ１５から入力する圧縮データをブロック毎に伸張し、伸張した残差信号を第２の加算器１７に出力する。フレームメモリ出力用予測画生成部１８は、フレームメモリ１５から入力する画面内予測結果と、フレームメモリ出力用予測画像生成メモリ１９から入力する画素から画面内予測画像を生成する。そして、第２の加算器１７で残差信号と画面内予測画像を加算することで動き補償予測部１２で用いる参照画像を生成する。

　画面内予測部６で決定する予測モードをそのまま用いる場合には、フレーム内で左上から符号化していくため、例えばフレーム内右下のブロック位置の画素を取り出したい場合にフレームの左上から順次伸張して取り出さなければならない。このような事態を避け、自由度の高い参照画像アクセスを実現する手法として、フレームメモリ入力用予測画生成部１３は例えば図４のようにフレームを矩形のブロックに分けた位置で前述のＤＣ予測のように周辺画素が存在しなくとも予測画像を生成できるモードで画面内予測画像を生成することで参照画アクセスの自由度を担保する手段を持たせることもできる。フレームを矩形に分けるときの、矩形毎の大きさは自由に設定することが出来る。また、可逆圧縮アルゴリズムを用いているため、圧縮しない場合と同じ参照画象を得ることができ、Ｈ．２６４、Ｈ．２６５等の符号化規格に則ったビットストリームを出力することが可能である。

　以上のように、画面内予測部６で判定する最適な画面内予測モードを用いて、画面内予測画像を生成し、ループフィルタ９から出力するフレームメモリ１５への格納対象のブロックの画素との差分を取ることにより、絶対値、分散が小さいデータを得られるようにしている。このため、従来技術よりもデータ圧縮部１４でより効率の高い圧縮を実現することが出来、フレームメモリ１５の容量をより小さくする構成が可能となる。なお、実施の形態１ではＨ．２６４やＨ．２６５の規格に従ったビットストリームを出力することが可能である。

　図５にこの構成のハードウェア構成の一例を示す。図１のフレームメモリ１５以外の要素は符号化コア２０で実現される。符号化コア２０はＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field Programmable Gate Array）で構成され、プロセッサ２１とフレームメモリ１５と接続する。またプロセッサ２１をＡＳＩＣやＦＰＧＡに内包する構成をとることも可能である。

　以上のように、本発明の実施形態１における動画像符号化装置では、画質を損なわずに効率の高い圧縮を実現することができ、フレームメモリ容量を削減することが可能となる効果が得られる。

実施の形態２．
　図６はこの発明の実施の形態１の動画像符号化装置を示す構成図である。
　図において、図１と同一符号は、同一または相当部分を表す。２２は量子化部、２３は逆量子化部、である。

　実施の形態２の構成では、実施の形態１と比較して、データ圧縮部１４の前段に量子化部２２、データ伸張部１６の後段に逆量子化部２３を設ける構成となっている。量子化部２２では量子化パラメータで第２の差分器１１から出力する残差信号に対して量子化を実施してからデータを圧縮するため、より高い圧縮データを生成できる。ここで用いる量子化パラメータはフレームメモリ１５とエントロピー符号化部３に出力し、フレームメモリ１５では画面内予測モードと併せて格納し、エントロピー符号化部３では出力するビットストリームに多重する。逆量子化部２３ではフレームメモリ１５から入力するブロックに対応する量子化パラメータでデータ伸張部１６から入力する残差信号を逆量子化し、第２の加算器１７に出力する。

　実施の形態２では残差信号を量子化することにより、実施の形態１と比較してより効率の高い圧縮を実現することができ、フレームメモリ容量をより削減することが可能となる。なお、実施の形態２では従来の規格に則ったビットストリームではなく、この方法独自のビットストリームを出力する。

　以上のように、本発明の実施形態２における動画像符号化装置では、より効率の高い圧縮を実現することができ、フレームメモリ容量をより削減することが可能となる効果が得られる。

　本発明にかかる動画像符号化装置は、動画像を符号化して圧縮する動画像符号化装置として種々の画像システム等に適用できる。

　１　第１の差分器、２　周波数変換量子化部、３　エントロピー符号化部、４　逆周波数変換量子化部、５　第１の加算器、６　画面内予測部、７　セレクタ、８　画面内予測画素メモリ、９　ループフィルタ部、１０　フレームメモリ入力用予測画像生成画素メモリ、１１　第２の差分器、１２　動き補償予測部、１３　フレームメモリ入力用予測画生成部、１４　データ圧縮部、１５　フレームメモリ、１６　データ伸張部、１７　第２の加算器、１８　フレームメモリ出力用予測画生成部、１９　フレームメモリ出力用予測画像生成用画素メモリ、２０　符号化コア、２１　プロセッサ、２２　量子化部、２３　逆量子化部

Claims

　符号化対象ブロックの画面内予測処理を行い、画面内予測モードを出力する画面内予測部と、
　前記画面内予測モードを用いて局部復号画像に対して画面内予測処理を行い、第１の画面内予測画像を生成するフレームメモリ入力用予測画生成部と、
　前記局部復号画像と前記第１の画面内予測画像との差分画像のデータを格納するフレームメモリと、
　前記画面内予測モードを用いて前記フレームメモリから出力されたデータに基づく画面内予測処理を行い、第２の画面内予測画像を生成するフレームメモリ出力用予測画生成部と、
　を備えたことを特徴とする動画像符号化装置。
　前記フレームメモリ入力用予測画生成部が画面内予測処理に用いるための符号化対象ブロックの周辺に位置している局部復号画像を格納するフレームメモリ入力用予測画像生成画素メモリ
　を備えたことを特徴とする請求項１に記載の動画像符号化装置。
　前記フレームメモリから出力した差分画像と前記第２の画面内予測画像との加算画像である参照画像を用いて符号化対象ブロックの動きベクトルを探索する動き補償予測部
　を備えたことを特徴とする請求項１または請求項２に記載の動画像符号化装置。
　前記フレームメモリに入力する前記差分画像に圧縮処理を行うデータ圧縮部と、
　前記フレームメモリから出力したデータに伸張処理を行うデータ伸張部と、
　を備えたことを特徴とする請求項１から請求項３のいずれか一項に記載の動画像符号化装置。
　前記データ圧縮部に入力する前記差分画像に量子化を行う量子化部と、
　前記データ伸張部から出力したデータに前記量子化に用いた量子化パラメータで逆量子化を行う逆量子化部と、
　を備えたことを特徴とする請求項４に記載の動画像符号化装置。
　符号化対象ブロックの画面内予測処理を行い、画面内予測モードを出力する画面内予測ステップと、
　前記画面内予測モードを用いて局部復号画像に対して画面内予測処理を行い、第１の画面内予測画像を生成するフレームメモリ入力用予測画生成ステップと、
　前記局部復号画像と前記第１の画面内予測画像との差分画像のデータをフレームメモリに格納するデータ格納ステップと、
　前記画面内予測モードを用いて前記フレームメモリから出力されたデータに基づく画面内予測処理を行い、第２の画面内予測画像を生成するフレームメモリ出力用予測画生成ステップと、
　を備えたことを特徴とする動画像符号化方法。