JP2016184844A - 画像処理装置および方法 - Google Patents

画像処理装置および方法 Download PDF

Info

Publication number
JP2016184844A
JP2016184844A JP2015063826A JP2015063826A JP2016184844A JP 2016184844 A JP2016184844 A JP 2016184844A JP 2015063826 A JP2015063826 A JP 2015063826A JP 2015063826 A JP2015063826 A JP 2015063826A JP 2016184844 A JP2016184844 A JP 2016184844A
Authority
JP
Japan
Prior art keywords
data
image
unit
encoding
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015063826A
Other languages
English (en)
Inventor
智 隈
Satoshi Kuma
智 隈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2015063826A priority Critical patent/JP2016184844A/ja
Publication of JP2016184844A publication Critical patent/JP2016184844A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】画像データが階層符号化された符号化データのデータ量制御をより高速に行うことができるようにする。【解決手段】画像データが階層符号化された符号化データの、少なくとも一部のエンハンスメントレイヤのデータを、下位のレイヤの画像データを複製して利用するモードのデータに変更するデータ変更を行うようにする。例えば、画像処理装置において、画像データが階層符号化された符号化データの、少なくとも一部のエンハンスメントレイヤのデータを、下位のレイヤの画像データを複製して利用するモードのデータに変更するデータ変更を行うデータ変更部を備えるようにする。本開示は、例えば、画像処理装置または画像符号化装置等に適用することができる。【選択図】図11

Description

本開示は、画像処理装置および方法に関し、特に、画像データが階層符号化された符号化データのデータ量制御をより高速に行うことができるようにした画像処理装置および方法に関する。
従来、所定のパラメータについてスケーラビリティ(scalability)機能を有するように、画像データを複数レイヤ化(階層化)して符号化する階層符号化があった(例えば、特許文献1および非特許文献1参照)。
また、画像データを即時的に(リアルタイムに)符号化して伝送するシステムに、この階層符号化を用いることも考えられた。階層符号化の場合、符号化するレイヤを選択することにより、生成する符号化データのデータ量を容易に制御することができるので、伝送路の帯域変動に対応させやすい特徴がある。
特開2007−081983号公報
Jill Boyce, Jianle Chen, Ying Chen, David Flynn, Miska M. Hannuksela, Matteo Naccari, Chris Rosewarne, Karl Sharman, Joel Sole, Gary J. Sullivan, Teruhiko Suzuki, Gerhard Tech, Ye-Kui Wang, Krzysztof Wegner, Yan Ye, "Draft high efficiency video coding (HEVC) version 2, combined format range extensions (RExt), scalability (SHVC), and multi-view (MV-HEVC) extensions", JCTVC-R1013_v6, 2014.10.1
しかしながら、階層符号化におけるレイヤ制御が伝送時の符号化データのデータ量に影響するまでには、そのレイヤ制御の下で画像データが階層符号化され、生成された符号化データが伝送するまでの時間が必要になる。つまり、階層符号化におけるレイヤ制御により伝送する符号化データのデータ量制御を行う方法では、データ量制御に遅延が生じてしまうおそれがあった。また、この方法の場合、符号化するレイヤ数を低減させると、その符号化するレイヤ数を次のIDRピクチャまで増大させることが困難であった。つまり、データ量制御に遅延が生じてしまうおそれがあった。このようなデータ量制御の遅延により、伝送路の帯域変動に追従できなくなるおそれがあった。
本開示は、このような状況に鑑みてなされたものであり、画像データが階層符号化された符号化データのデータ量制御をより高速に行うことができるようにするものである。
本技術の一側面は、画像データが階層符号化された符号化データの、少なくとも一部のエンハンスメントレイヤのデータを、下位のレイヤの画像データを複製して利用するモードのデータに変更するデータ変更を行うデータ変更部を備える画像処理装置である。
前記データ変更部は、前記符号化データのデータ量が伝送媒体の帯域制限に基づく上限を越える場合、前記データ変更を行うことができる。
前記データ変更部は、前記符号化データのデータ量が前記上限以下となるまで、最上位レイヤから順に各エンハンスメントレイヤについて前記データ変更を行うことができる。
前記階層符号化における参照方向をレイヤ間に制限する参照制限部をさらに備えることができる。
前記参照制限部は、カレントピクチャのカレントレイヤの参照先において前記データ変更が行われた場合、次に前記階層符号化されるピクチャの前記カレントレイヤの参照方向をレイヤ間に制限することができる。
前記参照制限部は、前記階層符号化における参照関係を示す情報に基づいて前記カレントピクチャの前記カレントレイヤの参照先を特定し、前記参照先において前記データ変更が行われたか否かを判定することができる。
前記参照関係を示す情報は、各レイヤの参照先を、レイヤ番号と参照元からの相対時刻とで示す情報を含むことができる。
前記データ変更部によりデータ変更された前記符号化データを伝送する伝送部をさらに備えることができる。
前記画像データを階層符号化する符号化部をさらに備え、前記データ変更部は、前記符号化部により階層符号化された符号化データに対して前記データ変更を行うことができる。
前記符号化部は、画像データを階層化し、各レイヤの画像データを再帰的に分割されたブロック構造にして符号化し、各レイヤの符号化データを多重化することができる。
前記符号化部は、各レイヤの符号化において、伝送媒体の帯域制限に基づいて、符号化データのデータ量を制御することができる。
前記符号化部は、前記伝送媒体の帯域制限に基づく上限のデータ量を、所定の割合で各レイヤに割り当てることができる。
前記符号化部は、前記伝送媒体の帯域制限に応じて、より上位のレイヤから順にデータ量を所定の下限まで制限することができる。
前記符号化部は、各レイヤの符号化において、前記伝送媒体の帯域制限の変動の程度に応じた方法で、前記符号化データのデータ量を制御することができる。
前記符号化部は、前記伝送媒体の帯域制限の変動が緩やかな場合、前記伝送媒体の帯域制限に基づく上限のデータ量を、所定の割合で各レイヤに割り当てることができる。
前記符号化部は、前記伝送媒体の帯域制限の変動が急激な場合、前記伝送媒体の帯域制限に応じて、より上位のレイヤから順にデータ量を所定の下限まで制限することができる。
本技術の一側面は、また、画像データが階層符号化された符号化データの、少なくとも一部のエンハンスメントレイヤのデータを、下位のレイヤの画像データを複製して利用するモードのデータに変更するデータ変更を行う画像処理方法である。
本技術の一側面においては、画像データが階層符号化された符号化データの、少なくとも一部のエンハンスメントレイヤのデータを、下位のレイヤの画像データを複製して利用するモードのデータに変更するデータ変更が行われる。
本開示によれば、画像データを符号化することができる。特に、画像データが階層符号化された符号化データのデータ量制御をより高速に行うことができる。
SHVCにおけるCUについての再帰的なブロック分割の概要を説明するための説明図である。 図1に示したCUへのPUの設定について説明するための説明図である。 図1に示したCUへのTUの設定について説明するための説明図である。 CU/PUの走査順について説明するための説明図である。 画像伝送システムの主な構成例を示すブロック図である。 階層符号化における参照関係の例を説明する図である。 階層符号化のレイヤ制御の様子の例を説明する図である。 データ変更の様子の例を説明する図である。 エンコードモジュールの主な構成例を示すブロック図である。 符号化部の主な構成例を示すブロック図である。 伝送判断モジュールの主な構成例を示すブロック図である。 参照関係補助情報を説明する図である。 デコードモジュールの主な構成例を示すブロック図である。 復号部の主な構成例を示すブロック図である。 画像送信処理の流れの例を説明するフローチャートである。 階層符号化処理の流れの例を説明するフローチャートである。 符号化処理の流れの例を説明するフローチャートである。 伝送判断処理の流れの例を説明するフローチャートである。 画像受信処理の流れの例を説明するフローチャートである。 階層復号処理の流れの例を説明するフローチャートである。 復号処理の流れの例を説明するフローチャートである。 データ量制御の様子の例を説明する図である。 エンコードモジュールのレート制御の例を説明する図である。 エンコードモジュールのレート制御の他の例を説明する図である。 コンピュータの主な構成例を示すブロック図である。
以下、本開示を実施するための形態(以下実施の形態とする)について説明する。なお、説明は以下の順序で行う。
1.第1の実施の形態(画像伝送システム)
2.第2の実施の形態(画像伝送システム)
3.第3の実施の形態(コンピュータ)
<1.第1の実施の形態>
<符号化方式>
以下においては、画像データをHEVC(High Efficiency Video Coding)方式をスケーラブル拡張したSHVC(Scalable High-efficiency Video Coding)で符号化して、その符号化データを伝送する際の制御に適用する場合を例に、本技術を説明する。
<ブロック分割>
MPEG2(Moving Picture Experts Group 2(ISO/IEC 13818-2))又はH.264及びMPEG-4 Part10(以下、AVC(Advanced Video Coding)と称する)などの旧来の画像符号化方式では、符号化処理は、マクロブロックと呼ばれる処理単位で実行される。マクロブロックは、16x16画素の均一なサイズを有するブロックである。これに対し、HEVCでは、符号化処理は、CU(Coding Unit)と呼ばれる処理単位(符号化単位)で実行される。CUは、最大符号化単位であるLCU(Largest Coding Unit)を再帰的に分割することにより形成される、可変的なサイズを有するブロックである。選択可能なCUの最大サイズは、64x64画素である。選択可能なCUの最小サイズは、8x8画素である。最小サイズのCUは、SCU(Smallest Coding Unit)と呼ばれる。
このように、可変的なサイズを有するCUが採用される結果、HEVCでは、画像の内容に応じて画質及び符号化効率を適応的に調整することが可能である。予測符号化のための予測処理は、PU(Prediction Unit)と呼ばれる処理単位(予測単位)で実行される。PUは、CUをいくつかの分割パターンのうちの1つで分割することにより形成される。さらに、直交変換処理は、TU(Transform Unit)と呼ばれる処理単位(変換単位)で実行される。TUは、CU又はPUをある深さまで分割することにより形成される。
<再帰的なブロックの分割>
図1は、HEVCにおけるCUについての再帰的なブロック分割の概要を説明するための説明図である。CUのブロック分割は、1つのブロックの4(=2x2)個のサブブロックへの分割を再帰的に繰り返すことにより行われ、結果として四分木(Quad-Tree)状のツリー構造が形成される。1つの四分木の全体をCTB(Coding Tree Block)といい、CTBに対応する論理的な単位をCTU(Coding Tree Unit)という。
図1の上部には、一例として、64x64画素のサイズを有するCUであるC01が示されている。C01の分割の深さは、ゼロに等しい。これは、C01がCTUのルートでありLCUに相当することを意味する。LCUサイズは、SPS(Sequence Parameter Set)又はPPS(Picture Parameter Set)において符号化されるパラメータにより指定され得る。CUであるC02は、C01から分割される4つのCUのうちの1つであり、32x32画素のサイズを有する。C02の分割の深さは、1に等しい。CUであるC03は、C02から分割される4つのCUのうちの1つであり、16x16画素のサイズを有する。C03の分割の深さは、2に等しい。CUであるC04は、C03から分割される4つのCUのうちの1つであり、8x8画素のサイズを有する。C04の分割の深さは、3に等しい。このように、CUは、符号化される画像を再帰的に分割することにより形成される。分割の深さは、可変的である。例えば、青空のような平坦な画像領域には、より大きいサイズの(即ち、深さが小さい)CUが設定され得る。一方、多くのエッジを含む急峻な画像領域には、より小さいサイズの(即ち、深さが大きい)CUが設定され得る。そして、設定されたCUの各々が、符号化処理の処理単位となる。
<CUへのPUの設定>
PUは、イントラ予測及びインター予測を含む予測処理の処理単位である。PUは、CUをいくつかの分割パターンのうちの1つで分割することにより形成される。図2は、図1に示したCUへのPUの設定について説明するための説明図である。図2の右には、2Nx2N、2NxN、Nx2N、NxN、2NxnU、2NxnD、nLx2N及びnRx2Nという、8種類の分割パターンが示されている。これら分割パターンのうち、イントラ予測では、2Nx2N及びNxNの2種類が選択可能である(NxNはSCUでのみ選択可能)。これに対してインター予測では、非対称動き分割が有効化されている場合に、8種類の分割パターンの全てが選択可能である。
<CUへのTUの設定>
TUは、直交変換処理の処理単位である。TUは、CU(イントラCUについては、CU内の各PU)をある深さまで分割することにより形成される。図3は、図1に示したCUへのTUの設定について説明するための説明図である。図3の右には、C02に設定され得る1つ以上のTUが示されている。例えば、TUであるT01は、32x32画素のサイズを有し、そのTU分割の深さはゼロに等しい。TUであるT02は、16x16画素のサイズを有し、そのTU分割の深さは1に等しい。TUであるT03は、8x8画素のサイズを有し、そのTU分割の深さは2に等しい。
上述したCU、PU及びTUといったブロックを画像に設定するためにどのようなブロック分割を行うかは、典型的には、符号化効率を左右するコストの比較に基づいて決定される。エンコーダは、例えば1つの2Mx2M画素のCUと、4つのMxM画素のCUとの間でコストを比較し、4つのMxM画素のCUを設定した方が符号化効率が高いならば、2Mx2M画素のCUを4つのMxM画素のCUへと分割することを決定する。
<CUとPUの走査順>
画像を符号化する際、画像(又はスライス、タイル)内に格子状に設定されるCTB(又はLCU)が、ラスタスキャン順に走査される。1つのCTBの中では、CUは、四分木を左から右、上から下に辿るように走査される。カレントブロックを処理する際、上及び左の隣接ブロックの情報が入力情報として利用される。図4は、CUとPUの走査順について説明するための説明図である。図4の左上には、1つのCTBに含まれ得る4つのCUである、C10、C11、C12及びC13が示されている。各CUの枠内の数字は、処理の順序を表現している。符号化処理は、左上のCUであるC10、右上のCUであるC11、左下のCUであるC12、右下のCUであるC13の順で実行される。図4の右には、CUであるC11に設定され得るインター予測のための1つ以上のPUが示されている。図4の下には、CUであるC12に設定され得るイントラ予測のための1つ以上のPUが示されている。これらPUの枠内の数字に示したように、PUもまた、左から右、上から下に辿るように走査される。
以下において、LCUは、AVC方式におけるマクロブロックをも含むものとし、CUは、AVC方式におけるブロック(サブブロック)をも含むものとする。つまり、以下の説明に用いる「ブロック」は、ピクチャ内の任意の部分領域を示し、その大きさ、形状、および特性等は限定されない。つまり、「ブロック」には、例えば、TU、PU、SCU、CU、LCU、サブブロック、マクロブロック、またはスライス等任意の領域(処理単位)が含まれる。もちろん、これら以外の部分領域(処理単位)も含まれる。サイズや処理単位等を限定する必要がある場合は、適宜説明する。
<画像伝送システム>
図5は、本技術を適用した画像処理装置の一態様である画像送信装置を用いた画像伝送システムの主な構成の一例を示すブロック図である。図5に示される画像伝送システム100は、画像データを符号化して得られた符号化データをネットワーク102を介して伝送するシステムである。
図5に示されるように、画像伝送システム100は、ネットワーク102を介して互いに通信可能に接続される画像送信装置101および画像受信装置103を有する。
画像送信装置101は、即時的に(リアルタイムに)、入力される画像データを符号化して符号化データを生成して、ネットワーク102を介して画像受信装置103に送信する。画像送信装置101は、例えば、エンコードモジュール111、伝送判断モジュール112、伝送モジュール113、および伝送制御部114を有する。
エンコードモジュール111は、入力される画像データを所定のパラメータについてスケーラビリティ(scalability)機能を有するように、複数レイヤ化(階層化)して符号化する。このような符号化を階層符号化とも称する。また、このような階層符号化により生成される符号化データを階層画像符号化ストリームとも称する。
なお、エンコードモジュール111が、伝送路となるネットワーク102についての伝送可能な帯域に関する情報を、伝送制御部114から取得し、その情報(伝送可能帯域とも称する)に基づいて、階層符号化におけるレイヤ数の制御や、各レイヤの符号化におけるレート制御を行うようにしてもよい。また、エンコードモジュール111が、インター予測における参照方向の制限に関する情報を、伝送判断モジュール112から取得し、その情報(参照の制限とも称する)に基づいて、インター予測における参照方向の制限を適宜行うようにしてもよい。
エンコードモジュール111は、入力される画像データを逐次階層符号化して階層画像符号化ストリームを生成し、生成した階層画像符号化ストリームを逐次伝送判断モジュール112に供給する。なお、エンコードモジュール111が、その階層符号化のインター予測におけるピクチャ間やレイヤ間の参照関係に関する情報(参照関係補助情報とも称する)を生成し、生成した参照関係補助情報を伝送判断モジュール112に供給するようにしてもよい。
伝送判断モジュール112は、エンコードモジュール111から供給された階層画像符号化ストリームを伝送可能な状態にするための処理を行う。例えば、伝送判断モジュール112は、階層画像符号化ストリームを伝送可能なデータ量(ビットレート)にするためのデータ変更を行う。このデータ変更の詳細については後述する。
なお、伝送判断モジュール112が、伝送制御部114から供給される伝送可能帯域に基づいて、そのデータ変更を行うようにしてもよい。また、伝送判断モジュール112が、エンコードモジュール111から供給される参照関係補助情報に基づいて、そのデータ変更を行うようにしてもよい。さらに、伝送判断モジュール112が、伝送モジュール113から供給される送信結果に関する情報(送信結果とも称する)を記憶するようにしてもよい。
伝送判断モジュール112は、データ変更を行った階層画像符号化ストリーム、若しくは、データ変更を行う必要がなかった階層画像符号化ストリームを、逐次、伝送モジュール113に供給する。また、伝送判断モジュール112は、データ変更に関する制御に従って参照の制限を生成し、それをエンコードモジュール111に供給するようにしてもよい。
伝送モジュール113は、符号化データの送信に関する処理を行う。例えば、伝送モジュール113は、伝送判断モジュール112から供給される階層画像符号化ストリームを、逐次、ネットワーク102に送信する(画像送信装置101から出力する)。なお、伝送モジュール113が、伝送制御部114から供給される伝送可能帯域に応じて、階層画像符号化ストリームの伝送(送信)を制御するようにしてもよい。
伝送制御部114は、階層画像符号化ストリームの伝送路(伝送媒体)となるネットワーク102についての伝送可能帯域を、エンコードモジュール111、伝送判断モジュール112、および伝送モジュール113に供給する。この伝送可能帯域は、ネットワーク102の利用可能な帯域幅(つまり伝送可能なビットレートの上限)を示す。つまり、エンコードモジュール111、伝送判断モジュール112、および伝送モジュール113は、この伝送制御部114から供給される伝送可能帯域に基づいて、ネットワーク102の利用可能な帯域幅(つまり伝送可能なビットレートの上限)を把握することができる。
なお、伝送制御部114が、ネットワーク102の利用可能な帯域幅(つまり伝送可能なビットレートの上限)を把握する方法は任意である。例えば、ネットワーク102の帯域を管理する他の装置からその情報を取得するようにしてもよいし、画像受信装置103から供給される階層画像符号化ストリームの伝送に対する応答に基づいて算出するようにしてもよいし、その他の方法であってもよい。
なお、伝送制御部114が、このような伝送可能帯域を、くりかえし、エンコードモジュール111、伝送判断モジュール112、および伝送モジュール113に供給するようにしてもよい。例えば、伝送制御部114が、定期的に若しくは不定期に、その時点のネットワーク102の利用可能な帯域幅(つまり伝送可能なビットレートの上限)を示す伝送可能帯域をエンコードモジュール111、伝送判断モジュール112、および伝送モジュール113に供給するようにしてもよい。このようにすることにより、エンコードモジュール111、伝送判断モジュール112、および伝送モジュール113は、ネットワーク102の利用可能な帯域幅(伝送可能なビットレートの上限)の変動(帯域変動とも称する)を、より正確に(より即時的に)把握することができ、その帯域変動に応じてより適切な処理を行うことができる。
画像送信装置101(伝送モジュール113)より出力された階層画像符号化ストリームは、ネットワーク102を介して画像受信装置103に伝送される。
ネットワーク102は、階層画像符号化ストリームの伝送媒体となる通信網である。ネットワーク102は、どのような通信網であってもよく、有線通信網であってもよいし、無線通信網であってもよいし、それらの両方であってもよい。例えば、有線LAN(Local Area Network)、無線LAN、公衆電話回線網、所謂3G回線や4G回線等の無線移動体用の広域通信網、またはインターネット等であってもよいし、それらの組み合わせであってもよい。また、ネットワーク102は、単数の通信網であってもよいし、複数の通信網であってもよい。また、例えば、ネットワーク102は、その一部若しくは全部が、例えばUSB(Universal Serial Bus)ケーブルやHDMI(登録商標)(High-Definition Multimedia Interface)ケーブル等のような、所定の規格の通信ケーブルにより構成されるようにしてもよい。さらに、例えば、ネットワーク102は、その一部若しくは全部が、IEEE(Institute of Electrical and Electronic Engineers)802.11無線LANのアドホックモード、IrDA(InfraRed Data Association)のような赤外線等の光通信、またはBluetooth(登録商標)等の所定の規格に準拠する方法であっても良いし、独自の通信方式の無線通信により構成されるようにしてもよい。
画像受信装置103は、即時的に(リアルタイムに)、ネットワーク102を介して画像送信装置101から伝送された符号化データ(階層画像符号化ストリーム)を受信し、受信した符号化データを復号して復号画像の画像データを生成し、その画像データを出力する。画像受信装置103は、例えば、伝送モジュール121およびデコードモジュール122を有する。
伝送モジュール121は、符号化データの受信に関する処理を行う。例えば、伝送モジュール121は、ネットワーク102を介して画像送信装置101から伝送された階層画像符号化ストリームを逐次受信する。伝送モジュール121は、受信した階層画像符号化ストリームを、逐次、デコードモジュール122に供給する。
デコードモジュール122は、伝送モジュール121から供給される階層画像符号化ストリームの各レイヤを復号して、復号画像の画像データを生成する。つまり、デコードモジュール122は、この復号により、階層画像符号化ストリームとして伝送された中で最上位のレイヤの復号画像の画像データを生成する。このような、階層符号化に対応する復号を階層復号とも称する。
デコードモジュール122は、伝送モジュール121から供給される階層画像符号化ストリームを、逐次階層復号する。デコードモジュール122は、この階層復号により生成した復号画像の画像データを、逐次、画像受信装置103の外部(例えば、後段の画像処理装置や記憶装置等)に出力する。
<階層符号化のレイヤ制御によるデータ量制御>
例えば、SHVCのような階層符号化では、画像データの各ピクチャ(フレームとも称する)が、複数のレイヤに階層化されて符号化される。最下位のレイヤがベースレイヤであり、ベースレイヤ以外のレイヤがエンハンスメントレイヤである。また、予測処理として画像の参照を行うことができる。例えば、インター予測として、画像間(ピクチャ間やレイヤ間)で画像の参照を行うことができる。
図6は、階層符号化される画像データの例を示している。図6において、各四角は、階層化された画像データの各ピクチャの各レイヤの画像を示している。図6の例の場合、画像データは、最下位レイヤのベースレイヤと、2つのエンハンスメントレイヤの3レイヤに階層化されている。また、図6において、画像間の各矢印がその画像間(ピクチャ間やレイヤ間)の参照の関係を示している。矢印の始点が参照先の画像を示し、終点が参照元の画像を示している。
このような階層符号化において、符号化するレイヤを選択することにより符号化データのデータ量を制御する場合、階層符号化は、例えば図7のように行われる。図7においても図6の場合と同様に、各四角は、画像データの階層化された各ピクチャの各レイヤの画像を示し、各矢印は、画像間(ピクチャ間およびレイヤ間)の参照関係を示している。
図7においてバツ印(×)が付された画像は、符号化対象から外された画像を示している。つまり、これらの画像は符号化されない(符号化データが生成されない)。したがって、図7の例のように、最上位レイヤから所望のレイヤまでを符号化対象から外す(レイヤ数を低減させる)ことにより、その分、各ピクチャの符号化データのデータ量を低減させることができる。
画像伝送システム100(画像送信装置101)の場合、エンコードモジュール111が、階層符号化のレイヤ数をこのように制御することにより、符号化データのデータ量を低減させることができる。
しかしながら、このようなレイヤ制御が、伝送時の符号化データのデータ量(ビットレート)に反映されるまでには、そのレイヤ制御の下で画像データが階層符号化され、生成された符号化データが伝送するまでの時間が必要になる。例えば、図7の場合、エンコードモジュール111が、フレーム番号2について最上位レイヤと下から2番目のレイヤを符号化対象から外し、最下位レイヤ(ベースレイヤ)のみを符号化対象とするように制御するとする。この場合、そのフレーム番号2のベースレイヤ画像が符号化されて、伝送モジュール113からネットワーク102に出力されて、ようやく、そのレイヤ制御が伝送時の符号化データのデータ量に反映されることになる。
つまり、階層符号化におけるレイヤ制御により伝送する符号化データのデータ量制御を行う方法では、データ量制御に遅延が生じてしまうおそれがあった。符号化データの即時的な(リアルタイムな)伝送を破綻しないようにするためには、符号化データのデータ量が伝送媒体であるネットワーク102の帯域制限に基づく上限を越えないようにしなければならない。そのため、上述したような遅延分のマージンを確保しなければならず、その分、符号化データ量を低く設定しなければならず、それによって復号画像の画質が低減するおそれがあった。
また、このようなレイヤ制御の場合、図7に示されるように、符号化するレイヤ数を低減させることになるので、符号化対象から外したレイヤの情報が、符号化データ(階層画像符号化ストリーム)に含まれなくなる。したがって、一旦符号化対象から外したレイヤは、次のIDRピクチャまで符号化対象に戻すことな困難であった。つまり、符号化対象とするレイヤ数を増大させることにより符号化データのデータ量を増大させることは、IDRピクチャでしかできなかった。
そのため、次のIDRピクチャが出現するまでの間、符号化データのデータ量が、伝送媒体であるネットワーク102の帯域制限に基づく上限に対して、不要に抑制されることになり、それによって復号画像の画質が低減するおそれがあった。
このようなデータ量の増大に関する遅延については、IDRピクチャの出現頻度をあげることで再び利用可能になるまでの待ちを短くすることができるが、予測符号化で高圧縮が行える画像をIDRピクチャで圧縮することは圧縮率の低下につながる。また、IDRピクチャはデータサイズが、PピクチャやBピクチャと比べて大きいためネットワーク帯域を消費する。これらのことから、IDRピクチャの出現頻度を上げることは現実的ではない。そして、データ量の低減に関する遅延の場合と同様に、符号化処理時間等による遅延は、低減させることが困難であった。
以上のように、階層符号化におけるレイヤ制御によるデータ量制御では、制御の遅延により、伝送路の帯域変動に追従できなくなるおそれがあった。
<符号化データのデータ変更によるデータ量制御>
そこで、画像データが階層符号化された符号化データの、少なくとも一部のエンハンスメントレイヤのデータを、下位のレイヤの画像データを複製して利用するモードのデータに変更するデータ変更を行うようにする。
例えば、画像処理装置において、画像データが階層符号化された符号化データの、少なくとも一部のエンハンスメントレイヤのデータを、下位のレイヤの画像データを複製して利用するモードのデータに変更するデータ変更を行うデータ変更部を備えるようにする。
このような符号化データのデータ変更によるデータ量制御の例を図8に示す。図8においても図6の場合と同様に、各四角は、画像データの階層化された各ピクチャの各レイヤの画像を示し、各矢印は、画像間(ピクチャ間およびレイヤ間)の参照関係を示している。なお、点線矢印は、復号の際に、画像データを複製することを示している。
図8において白三角形(△)が付された画像は、下位のレイヤの画像データを複製して利用するモードのデータに変更された画像を示している。このモードの場合、処理対象のレイヤであるカレントレイヤの画像に対応する符号化データは伝送されない。つまり、白三角形(△)が付された画像の符号化データは伝送されない。したがって、その分、符号化データのデータ量が低減される。つまり、このようにデータ変更を行ったり、行わなかったりすることで、符号化データのデータ量を制御することができる。
そして、符号化データのデータ変更であるので、この処理は、符号化後に行うことができる。例えば、図1の画像伝送システム100の場合、このような符号化データのデータ変更によるデータ量制御は、伝送判断モジュール112において行うことができる。したがって、この場合、符号化時のレイヤ制御のときのような符号化処理時間等によるデータ量制御の遅延を抑制することができる。つまり、符号化データのデータ量制御をより高速に行うことができる。
また、下位のレイヤの画像データを複製して利用するモードの場合、復号の際には下位のレイヤの画像データを複製してカレントレイヤの復号画像の画像データとすることを示す情報が、シンタクスとして階層画像符号化ストリームに含められる。つまり、階層画像符号化ストリームには、各ピクチャの全レイヤについての情報が含まれ、いずれのピクチャも全レイヤが符号化されたものとして取り扱われる。したがって、この場合、全ピクチャについて、階層復号の際には全レイヤが復号される。つまり、画質は下位のレイヤ相当に低減されるものの、最上位レイヤの復号画像が得られる。
例えば図8の場合、データ変換された白三角形(△)が付された画像に対応する符号化データは伝送されないが、下位のレイヤの画像データを複製してカレントレイヤの復号画像の画像データとすることを示す情報がシンタクスとして階層画像符号化ストリームに含められる。
そのため、図8に示されるフレーム番号「3」や「4」のピクチャのように、任意のピクチャにおいて、データ変換の実行を制御することができる。例えば、IDRピクチャを待たずに、データ変換が行われていたレイヤの画像に対して、データ変換を行わないように制御することができる。すなわち、より高速に、符号化データのデータ量を増大させることができる。
図8において、白丸(○)が付された画像は、データ変更が行われない画像であり、何も図形を付していない画像と同様である。
なお、データ変更された画像(白三角形(△)が付された画像)は、上述したように下位レイヤの画像の複製であるのでデータ変更前の画像と異なる。そのため、復号の際に、そのような画像を参照先とするピクチャ間の予測を行わせると、符号化時の参照先の画像と復号時の参照先の画像とで不一致が生じ、正しく復号することができなくなるおそれがある。
そこで、データ変更の際に、エンコードモジュール111を制御して、データ変更される画像(白三角形(△)が付された画像)を参照先とするピクチャ間の参照を行わせないように制御するようにしてもよい。より具体的には、参照の方向をレイヤ間に制限する(限定する)ようにしてもよい。
図8において、黒三角形(▲)が付された画像は、参照の方向をレイヤ間に制限された(限定された)画像を示している。そして、フレーム番号「3」のピクチャの、黒三角形(▲)が付された画像においては、レイヤ間の参照のみが行われ、他のピクチャを参照先とするピクチャ間の参照は禁止されている。
このように制御することにより、階層復号をより正確に行うことができるようになり、復号画像の画質の低減を抑制することができる。
<エンコードモジュール>
エンコードモジュール111は、供給された画像データを階層符号化する。例えば、エンコードモジュール111が、画像データを階層化し、各レイヤの画像データを再帰的に分割されたブロック構造にして符号化し、各レイヤの符号化データを多重化するようにしてもよい。
例えば、図9に示されるように、エンコードモジュール111は、画像階層化部151、符号化部152−1乃至符号化部152−3、多重化部153、伝送制御部154、参照制限部155、および参照関係補助情報生成部156を有する。
画像階層化部151は、供給された画像データの各ピクチャを階層化する。図9の例の場合、画像階層化部151は、画像データを、1つのベースレイヤと2つのエンハンスメントレイヤからなる3レイヤの画像に階層化する。画像階層化部151は、生成した最下位レイヤ(ベースレイヤ)の画像データ(ベースレイヤ画像とも称する)を、符号化部152−1に供給する。また、画像階層化部151は、生成した下から2番目のレイヤ(エンハンスメントレイヤ)の画像データ(エンハンスメントレイヤ画像とも称する)を、符号化部152−2に供給する。さらに、画像階層化部151は、生成した最上位レイヤ(エンハンスメントレイヤ)の画像データ(エンハンスメントレイヤ画像とも称する)を、符号化部152−3に供給する。
符号化部152−1は、供給されたベースレイヤ画像をSHVC方式で符号化し、最下位レイヤのビットストリーム(ベースレイヤ画像符号化ストリームとも称する)を生成し、それを多重化部153に供給する。なお、符号化部152−1は、伝送制御部154から符号化の目標レートが供給される場合、符号化の際(量子化の際)に、それに従ってベースレイヤ画像符号化ストリームのデータ量を制御する。また、符号化部152−1は、参照制限部155から参照の制限が供給される場合、その情報に基づいて参照の方向を制限する(限定する)。
符号化部152−2は、供給されたエンハンスメントレイヤ画像をSHVC方式で符号化し、下から2番目のレイヤのビットストリーム(エンハンスメントレイヤ画像符号化ストリームとも称する)を生成し、それを多重化部153に供給する。なお、符号化部152−2は、伝送制御部154から符号化の目標レートが供給される場合、符号化の際(量子化の際)に、それに従ってベースレイヤ画像符号化ストリームのデータ量を制御する。また、符号化部152−2は、参照制限部155から参照の制限が供給される場合、その情報に基づいて参照の方向を制限する(限定する)。
符号化部152−3は、供給されたエンハンスメントレイヤ画像をSHVC方式で符号化し、最上位のレイヤのビットストリーム(エンハンスメントレイヤ画像符号化ストリームとも称する)を生成し、それを多重化部153に供給する。なお、符号化部152−3は、伝送制御部154から符号化の目標レートが供給される場合、符号化の際(量子化の際)に、それに従ってベースレイヤ画像符号化ストリームのデータ量を制御する。また、符号化部152−3は、参照制限部155から参照の制限が供給される場合、その情報に基づいて参照の方向を制限する(限定する)。
なお、符号化部152−1乃至符号化部152−3を互いに区別して説明する必要が無い場合、符号化部152と称する。以上のように、符号化部152は、全てのレイヤを符号化することができるように、レイヤ数に相当する数だけ設けられる。なお、符号化部152の数と画像データのレイヤ数とが一致していなくてもよい。例えば、全てのレイヤを符号化することができるのであれば、符号化部152の数が、レイヤ数より多くてもよいし、少なくてもよい。
多重化部153は、各符号化部152から供給される各レイヤの符号化ストリーム(エンハンスメントレイヤ画像符号化ストリームやベースレイヤ画像符号化ストリーム)を多重化し、1本の階層画像符号化ストリームとし、伝送判断モジュール112(図5)に供給する。
伝送制御部154は、伝送制御部114(図5)から供給される伝送可能帯域に基づいて、各レイヤの符号化の目標レートを設定し、その目標レートを各レイヤの符号化部152に供給する。
参照制限部155は、伝送判断モジュール112(図5)から供給される参照の制限を、参照の制限を行うレイヤの符号化部152に供給する。
参照関係補助情報生成部156は、多重化部153において生成される階層画像符号化ストリームを参照し、各ピクチャの各レイヤについて、画像の参照先を示す参照関係補助情報を生成する。参照関係補助情報生成部156は、生成した参照関係補助情報を伝送判断モジュール112(図5)に供給する。
<符号化部>
図10は、符号化部152の主な構成例を示すブロック図である。図10に示されるように符号化部152は、画面並べ替えバッファ171、演算部172、直交変換部173、量子化部174、可逆符号化部175、蓄積バッファ176、逆量子化部177、および逆直交変換部178を有する。また、符号化部152は、演算部179、ループフィルタ180、フレームメモリ181、イントラ予測部182、インター予測部183、および予測画像選択部184を有する。さらに、符号化部152は、レート制御部185を有する。
画面並べ替えバッファ171は、入力された画像データの各フレームの画像をその表示順に記憶し、記憶した表示の順番のフレームの画像を、GOP(Group Of Picture)に応じて、符号化のためのフレームの順番に並べ替え、フレームの順番を並び替えた画像を、演算部172に供給する。また、画面並べ替えバッファ171は、フレームの順番を並び替えた画像を、イントラ予測部182およびインター予測部183にも供給する。
演算部172は、画面並べ替えバッファ171から読み出された画像から、予測画像選択部184を介してイントラ予測部182若しくはインター予測部183から供給される予測画像を減算し、その差分情報(残差データ)を直交変換部173に供給する。例えば、イントラ符号化が行われる画像の場合、演算部172は、画面並べ替えバッファ171から読み出された画像の画像データから、イントラ予測部182から供給される予測画像の画像データを減算する。また、例えば、インター符号化が行われる画像の場合、演算部172は、画面並べ替えバッファ171から読み出された画像の画像データから、インター予測部183から供給される予測画像の画像データを減算する。
直交変換部173は、演算部172から供給される残差データに対して、離散コサイン変換やカルーネン・レーベ変換等の直交変換を施す。直交変換部173は、その直交変換により得られた変換係数を量子化部174に供給する。
量子化部174は、直交変換部173から供給される変換係数を量子化する。量子化部174は、レート制御部185から供給される符号量の目標値に関する情報に基づいて量子化パラメータを設定し、その量子化を行う。量子化部174は、量子化された変換係数を可逆符号化部175に供給する。
可逆符号化部175は、量子化部174において量子化された変換係数を任意の符号化方式で符号化する。また、可逆符号化部175は、イントラ予測のモードを示す情報などをイントラ予測部182から取得し、インター予測のモードを示す情報や差分動きベクトル情報などをインター予測部183から取得する。
可逆符号化部175は、これらの各種情報を任意の符号化方式で符号化し、符号化データ(符号化ストリームとも称する)のヘッダ情報の一部とする(多重化する)。可逆符号化部175は、符号化して得られた符号化データを蓄積バッファ176に供給して蓄積させる。
可逆符号化部175の符号化方式としては、例えば、可変長符号化または算術符号化等が挙げられる。可変長符号化としては、例えば、CAVLC(Context-Adaptive Variable Length Coding)などが挙げられる。算術符号化としては、例えば、CABAC(Context-Adaptive Binary Arithmetic Coding)などが挙げられる。
蓄積バッファ176は、可逆符号化部175から供給された符号化データを、一時的に保持する。蓄積バッファ176は、所定のタイミングにおいて、保持している符号化データを、符号化部152の外部(多重化部153(図9))に出力する。
また、量子化部174において量子化された変換係数は、逆量子化部177にも供給される。逆量子化部177は、その量子化された変換係数を、量子化部174による量子化に対応する方法で逆量子化する。逆量子化部177は、その逆量子化により得られた変換係数を、逆直交変換部178に供給する。
逆直交変換部178は、逆量子化部177から供給された変換係数を、直交変換部173による直交変換処理に対応する方法で逆直交変換する。逆直交変換部178は、逆直交変換された出力(復元された残差データ)を演算部179に供給する。
演算部179は、逆直交変換部178から供給された、復元された残差データに、予測画像選択部184を介してイントラ予測部182若しくはインター予測部183から供給される予測画像を加算し、局所的に再構成された画像(以下、再構成画像と称する)を得る。その再構成画像は、ループフィルタ180に供給される。
ループフィルタ180は、デブロックフィルタや適応ループフィルタ等を含み、演算部179から供給される再構成画像に対して適宜フィルタ処理を行う。例えば、ループフィルタ180は、再構成画像に対してデブロックフィルタ処理を行うことにより再構成画像のブロック歪を除去する。また、例えば、ループフィルタ180は、そのデブロックフィルタ処理結果(ブロック歪みの除去が行われた再構成画像)に対して、ウィナーフィルタ(Wiener Filter)を用いてループフィルタ処理を行うことにより画質改善を行う。
なお、ループフィルタ180が、再構成画像に対してさらに、他の任意のフィルタ処理を行うようにしてもよい。また、ループフィルタ180は、必要に応じて、フィルタ処理に用いたフィルタ係数等の情報を可逆符号化部175に供給し、それを符号化させるようにすることもできる。ループフィルタ180は、フィルタ処理結果(以下、復号画像と称する)をフレームメモリ181に供給する。また、ループフィルタ180は、上述したフィルタ処理を行う前の再構成画像の画像データをさらにフレームメモリ181に供給することができるようにしてもよい。
フレームメモリ181は、ループフィルタ180から供給される再構成画像や復号画像の画像データを記憶する。なお、フレームメモリ181は、他のレイヤの符号化部152のフレームメモリ181との間で、互いが記憶する画像データを共有することができる。フレームメモリ181は、イントラ予測部182やインター予測部183等からの要求に応じて若しくは所定のタイミングにおいて、記憶している画像データや共有している他のレイヤの画像データを、イントラ予測部182若しくはインター予測部183に供給する。
イントラ予測部182は、フレームメモリ181から参照画像として供給される再構成画像である処理対象ピクチャ内の画素値を用いて予測画像を生成するイントラ予測(画面内予測)を行う。イントラ予測部182は、予め用意された複数のイントラ予測モードでこのイントラ予測を行う。
イントラ予測部182は、候補となる全てのイントラ予測モードで予測画像を生成し、画面並べ替えバッファ171から供給される入力画像を用いて各予測画像のコスト関数値を評価し、最適なモードを選択する。イントラ予測部182は、最適なイントラ予測モードを選択すると、その最適なモードで生成された予測画像を、予測画像選択部184に供給する。また、イントラ予測部182は、採用されたイントラ予測モードを示すイントラ予測モード情報等を、適宜可逆符号化部175に供給し、符号化させる。
インター予測部183は、画面並べ替えバッファ171から供給される入力画像と、フレームメモリ181から供給される参照画像とを用いてインター予測処理を行う。より具体的には、インター予測部183は、動き予測を行って動きベクトルを検出し、その動きベクトルに応じて動き補償処理を行い、予測画像(インター予測画像情報)を生成する。
インター予測部183は、候補となる全てのインター予測モードで予測画像を生成する。インター予測部183は、画面並べ替えバッファ171から供給される入力画像と、生成した差分動きベクトルの情報などを用いて、各予測画像のコスト関数値を評価し、最適なモードを選択する。インター予測部183は、最適なインター予測モードを選択すると、その最適なモードで生成された予測画像を、予測画像選択部184に供給する。また、インター予測部183は、採用されたインター予測モードを示す情報や、符号化データを復号する際に、そのインター予測モードで処理を行うために必要な情報等を可逆符号化部175に供給し、符号化させる。その必要な情報には、例えば、生成された差分動きベクトルの情報や、予測動きベクトル情報として、予測動きベクトルのインデックスを示すフラグ等が含まれるようにしてもよい。
予測画像選択部184は、演算部172および演算部179に供給する予測画像の供給元を選択する。例えば、イントラ符号化の場合、予測画像選択部184は、予測画像の供給元としてイントラ予測部182を選択し、そのイントラ予測部182から供給される予測画像を演算部172や演算部179に供給する。また、例えば、インター符号化の場合、予測画像選択部184は、予測画像の供給元としてインター予測部183を選択し、そのインター予測部183から供給される予測画像を演算部172や演算部179に供給する。
レート制御部185は、伝送制御部154(図9)から供給される目標レートと、蓄積バッファ176に蓄積された符号化データの符号量とに基づいて、オーバフローあるいはアンダーフローが発生しないように、量子化部174の量子化動作のレートを制御する。
<伝送判断モジュール>
図11は、伝送判断モジュール112(図5)の主な構成例を示すブロック図である。図11に示されるように伝送判断モジュール112は、データ変更処理部201および記憶部202を有する。
記憶部202は、エンコードモジュール111(図5)から供給される階層符号化ストリームを記憶する。また、記憶部202は、記憶している階層符号化ストリームを伝送モジュール113(図5)に供給する。
データ変更処理部201は、データ変更に関する処理を行う。例えば、データ変更処理部201は、記憶部202に記憶されている階層画像符号化データに対するデータ変更に関する処理を行う。図11に示されるように、データ変更処理部201は、データ変更制御部211、サイズ見積部212、帯域判定部213、参照関係判定部214、参照制限部215、データ変更設定部216、データ変更部217、および送信結果記憶部218を有する。
データ変更制御部211は、データ変更処理部201の各処理部のデータ変更に関する動作を制御する。
サイズ見積部212は、記憶部202に記憶されている階層画像符号化ストリームのサイズの見積もりを行う。例えば、サイズ見積部212が、記憶部202から階層画像符号化ストリームのデータ量に関する情報であるサイズ情報を取得し、そのサイズ情報に基づいてサイズの見積もりを行うようにしてもよい。このサイズ情報の内容やデータ形式等は任意である。例えば、レイヤ毎の符号化データのデータ量を示す情報が含まれるようにしてもよい。
また、サイズ見積部212が、データ変更設定部216から供給されるデータ変更に関する情報であるデータ変更情報を取得し、そのデータ変更情報に基づいてサイズの見積もりを行うようにしてもよい。このデータ変更情報の内容やデータ形式等は任意である。例えば、サイズ見積部212が、サイズ情報とデータ変更情報とに基づいて、データ変更を反映させた状態の階層画像符号化ストリームのサイズの見積もりを行うようにしてもよい。
サイズ見積部212は、その見積もり結果であるサイズ情報、すなわち、見積もりした階層画像符号化ストリームのデータ量を示す情報を含むサイズ情報を帯域判定部213に供給する。
帯域判定部213は、階層画像符号化ストリームのデータ量がネットワーク102の帯域制限に基づく上限を越えるか否かを判定する。例えば、帯域判定部213が、伝送制御部114(図5)から供給される伝送可能帯域を取得し、サイズ見積部212からサイズ情報を取得し、それらの情報に基づいて、見積もりした階層画像符号化ストリームのデータ量(データ変更を反映させたデータ量)が、伝送可能帯域に示されるネットワーク102の帯域制限に基づく上限を越えるか否かの判定を行うようにしてもよい。
また、例えば帯域判定部213が、その判定結果を示す情報を、データ変更の設定を制御する制御情報(設定変更制御)としてデータ変更設定部216に供給するようにしてもよい。
参照関係判定部214は、カレントピクチャの参照先がデータ変更されているか否かを判定する。例えば、参照関係判定部214が、エンコードモジュール111から参照関係補助情報を取得し、その参照関係補助情報に基づいて、参照先のピクチャおよびレイヤを特定し、データ変更設定部216からデータ変更情報を取得し、そのデータ変更情報に基づいて、参照先の画像がデータ変更されたか否かを判定するようにしてもよい。
また、例えば、参照関係判定部214が、その判定結果を示す情報を、データ変更の設定を制御する制御情報(設定変更制御)としてデータ変更設定部216に供給するようにしてもよい。さらに、例えば、参照関係判定部214が、その判定結果を示す情報を、参照の制限を制御する制御情報として参照制限部215に供給するようにしてもよい。
参照制限部215は、適宜、エンコードモジュール111による階層符号化における参照方向をレイヤ間に制限する。例えば、参照制限部215が、カレントピクチャのカレントレイヤの参照先においてデータ変更が行われた場合、次に階層符号化されるピクチャのカレントレイヤの参照方向をレイヤ間に制限するようにしてもよい。例えば、参照制限部215が、参照関係判定部214から供給される、カレントピクチャの参照先がデータ変更されているか否かの判定結果を示す情報に基づいて、階層符号化における参照方向をレイヤ間に制限するようにしてもよい。
また、参照制限部215が、階層符号化における参照関係を示す情報に基づいてカレントピクチャのカレントレイヤの参照先を特定し、参照先において前記データ変更が行われたか否かを判定するようにしてもよい。つまり、例えば、参照制限部215が、参照関係判定部214の判定結果に基づいて、階層符号化における参照方向をレイヤ間に制限するようにしてもよい。
さらに、例えば、参照制限部215が、階層符号化における参照方向をレイヤ間に制限する制御情報として参照の制限をエンコードモジュール111に供給するようにしてもよい。
データ変更設定部216は、各レイヤについてデータ変更を行うか否かの設定を行う。例えば、データ変更設定部216が、帯域判定部213から供給される設定変更制御に従って、各レイヤのデータ変更を行うか否かを制御するようにしてもよい。また、例えば、データ変更設定部216が、参照関係判定部214から供給される設定変更制御に従って、各レイヤのデータ変更を行うか否かを制御するようにしてもよい。
また、例えば、データ変更設定部216が、各レイヤのデータ変更に関する設定を示すデータ変更情報をサイズ見積部212や参照関係判定部214に供給するようにしてもよい。さらに、例えば、データ変更設定部216が、各レイヤのデータ変更に関する設定を示すデータ変更設定をデータ変更部217に供給するようにしてもよい。
データ変更部217は、画像データが階層符号化された符号化データの、少なくとも一部のエンハンスメントレイヤのデータを、下位のレイヤの画像データを複製して利用するモードのデータに変更するデータ変更を行う。例えば、データ変更部217が、データ変更設定部216から供給されるデータ変更設定に基づいて、記憶部202に記憶されている階層画像符号化ストリームの各レイヤのデータを変更するようにしてもよい。
また、データ変更部217は、帯域判定部213や参照関係判定部214の判定結果に基づいて、符号化データのデータ量が伝送媒体の帯域制限に基づく上限を越える場合、前記データ変更を行うようにしてもよい。
例えば、データ変更部217は、前記符号化データのデータ量が上限以下となるまで、最上位レイヤから順に各エンハンスメントレイヤについてデータ変更を行うようにしてもよい。
送信結果記憶部218は、伝送モジュール113から供給される送信結果に関する情報(送信結果)を記憶する。この送信結果に関する情報の内容やデータ形式等は任意である。
以上のように、データ変更を行うことにより、データ変更処理部201は、画像データが階層符号化された符号化データのデータ量制御をより高速に行うことができる。
なお、本技術を適用した画像処理装置は、データ変更部217を有していればよく、その他の構成は任意である。換言するに、本技術を適用した画像処理装置は、例えば、データ変更部217のみを有するようにしてもよい。また、参照制限部215を備えるようにしてもよい。また、その他の構成を有するようにしてもよい。例えば、伝送モジュール113やエンコードモジュール111を備えるようにしてもよい。
<参照関係補助情報>
次に、参照関係補助情報について説明する。参照関係補助情報は、画像間の参照の様子の例を説明する情報である。参照関係補助情報の内容やデータ形式は任意であるが、例えば、(参照先のフレームのインデックス,参照先のレイヤのインデックス)により、各画像の参照先を示すようにしてもよい。例えば、図12Aの例の場合、矢印で示される参照関係は、(−1,1)として表すことができる。このような情報により、参照関係判定部214は、より容易に各画像の参照関係を特定することができる。
参照関係補助情報が、このような表現の情報の集合を含むようにしてもよい。例えば、参照関係補助情報が、カレントピクチャの各レイヤについて、このような表現の情報を含むようにしてもよい。もちろん、その他の構成例であってもよい。例えば、図12Bに示されるような参照関係は、Layer #2 : (-1, 2), (0, 1), Layer #1 : (-1, 1), (0, 0), Base Layer #0 : (-1,0) のような、レイヤ毎の情報の集合としてもよい。
<デコードモジュール>
デコードモジュール122は、供給された階層画像符号化ストリームを階層復号する。例えば、デコードモジュール122が、階層画像符号化ストリームを逆多重化し、各レイヤの符号化データを復号し、その内最上位の画像データを出力するようにしてもよい。
図13に示されるように、デコードモジュール122は、逆多重化部301、復号部302−1乃至復号部302−3、並びに画像出力部303を有する。
逆多重化部301は、供給された階層画像符号化ストリームを逆多重化し、各レイヤのビットストリーム(エンハンスメントレイヤ画像符号化ストリームやベースレイヤ画像符号化ストリーム)を生成する。逆多重化部301は、最下位レイヤのビットストリーム(ベースレイヤ画像符号化ストリーム)を復号部302−1に供給し、下から2番目のビットストリーム(エンハンスメントレイヤ画像符号化ストリーム)を復号部302−2に供給し、最上位のビットストリーム(エンハンスメントレイヤ画像符号化ストリーム)を復号部302−3に供給する。
復号部302−1は、供給されたベースレイヤ画像符号化ストリームをSHVC方式で復号し、最下位レイヤの画像データ(ベースレイヤ画像)を生成し、それを画像出力部303に供給する。
復号部302−2は、供給されたエンハンスメントレイヤ画像符号化ストリームをSHVC方式で復号し、下から2番目のレイヤの画像データ(エンハンスメントレイヤ画像)を生成し、それを画像出力部303に供給する。
復号部302−3は、供給されたエンハンスメントレイヤ画像符号化ストリームをSHVC方式で復号し、最上位レイヤの画像データ(エンハンスメントレイヤ画像)を生成し、それを画像出力部303に供給する。
なお、復号部302−1乃至復号部302−3を互いに区別して説明する必要が無い場合、復号部302と称する。以上のように、復号部302は、全てのレイヤを復号することができるように、レイヤ数に相当する数だけ設けられる。なお、復号部302の数と符号化データのレイヤ数とが一致していなくてもよい。例えば、全てのレイヤを復号することができるのであれば、復号部302の数が、レイヤ数より多くてもよいし、少なくてもよい。
画像出力部303は、復号部302から供給される各ピクチャの画像データを出力する。画像出力部303は、その際、最上位のレイヤの画像データを出力する。
<復号部>
図14は、復号部302の主な構成例を示すブロック図である。図14に示されるように復号部302は、蓄積バッファ321、可逆復号部322、逆量子化部323、逆直交変換部324、演算部325、ループフィルタ326、および画面並べ替えバッファ327を有する。また、復号部302は、フレームメモリ328、イントラ予測部329、インター予測部330、および予測画像選択部331を有する。
蓄積バッファ321は、逆多重化部301(図13)から供給される符号化データを受け取って、蓄積し、所定のタイミングにおいてその符号化データを可逆復号部322に供給する。
可逆復号部322は、蓄積バッファ321より供給された符号化データを、符号化側の可逆符号化部(例えば、可逆符号化部175)において行われた可逆符号化の符号化方式に対応する復号方式で可逆復号する。例えば、可逆復号部322は、可変長符号化(CAVLC等)に対応する復号方式や、算術符号化(CABAC等)に対応する復号方式で復号を行う。可逆復号部322は、復号して得られた、量子化された係数データを、逆量子化部323に供給する。
また、可逆復号部322は、符号化データに付加された最適な予測モードに関する情報に基づいて、最適な予測モードとしてイントラ予測モードが選択されたかインター予測モードが選択されたかを判定し、その最適な予測モードに関する情報を、イントラ予測部329およびインター予測部330の内、選択されたと判定したモードの方に供給する。例えば符号化側において最適な予測モードとしてイントラ予測モードが選択された場合、その最適な予測モードに関する情報がイントラ予測部329に供給される。また、例えば符号化側において最適な予測モードとしてインター予測モードが選択された場合、その最適な予測モードに関する情報がインター予測部330に供給される。
さらに、可逆復号部322は、例えば、量子化行列や量子化パラメータ等の、逆量子化に必要な情報を逆量子化部323に供給する。さらに、図14において矢印は省略しているが、可逆復号部322は、符号化データ(ビットストリーム)を復号して得られる各種情報(例えばヘッダ情報等)を、適宜、復号部302の任意の処理部に供給することができる。
逆量子化部323は、可逆復号部322から供給された、量子化された係数データを、符号化側の量子化部(例えば量子化部174)により行われた量子化の量子化方式に対応する方式で逆量子化する。逆量子化部323は、得られた係数データを逆直交変換部324に供給する。
逆直交変換部324は、逆量子化部323から供給される直交変換係数を、符号化側の直交変換部(例えば直交変換部173)により行われた直交変換の直交変換方式に対応する方式で逆直交変換する。逆直交変換部324は、この逆直交変換処理により、符号化側において直交変換される前の状態に対応する残差データを得る。逆直交変換されて得られた残差データは、演算部325に供給される。
演算部325は、逆直交変換部324から残差データを取得する。また、演算部325は、予測画像選択部331を介して、イントラ予測部329若しくはインター予測部330から予測画像を取得する。演算部325は、差分画像と予測画像とを加算し、符号化側において予測画像が減算される前の画像に対応する復号画像を得る。演算部325は、その復号画像をループフィルタ326に供給する。
ループフィルタ326は、符号化側のループフィルタ(例えばループフィルタ180)と同様の処理部であり、同様の処理を行う。すなわち、ループフィルタ326は、演算部325から供給される復号画像に対して適宜ループフィルタ処理を行う。このループフィルタ処理は、少なくともデブロッキングフィルタ処理を含むフィルタ処理であれば任意である。例えば、ループフィルタ326が、復号画像に対してデブロッキングフィルタ処理を行ってデブロック歪を除去するとともに、ウィナーフィルタ(Wiener Filter)を用いて適応ループフィルタ処理を行うことにより画質改善を行うようにしてもよい。ループフィルタ326は、フィルタ処理を適宜施した復号画像を画面並べ替えバッファ327およびフレームメモリ328に供給する。なお、ループフィルタ326は、ループフィルタ処理を省略した復号画像をフレームメモリ328に供給し、記憶させることもできる。
画面並べ替えバッファ327は、画像の並べ替えを行う。すなわち、符号化側において符号化の順番のために並べ替えられたフレームの順番が、元の表示の順番に並べ替えられる。画面並べ替えバッファ327は、フレームの順番を並べ替えた復号画像データを画像復号部302の外部、すなわち、画像出力部303(図13)に出力する。
フレームメモリ328は、供給される復号画像を記憶し、所定のタイミングにおいて、若しくは、インター予測部330等の外部の要求に基づいて、記憶している復号画像を参照画像として、インター予測部330に供給する。なお、フレームメモリ328は、他のレイヤの復号部302のフレームメモリ328との間で、互いが記憶する画像データを共有することができる。フレームメモリ328は、イントラ予測部329やインター予測部330等からの要求に応じて若しくは所定のタイミングにおいて、記憶している画像データや共有している他のレイヤの画像データを、イントラ予測部329若しくはインター予測部330に供給する。
イントラ予測部329には、ヘッダ情報を復号して得られたイントラ予測モードを示す情報等が可逆復号部322から適宜供給される。イントラ予測部329は、符号化側において用いられたイントラ予測モードで、フレームメモリ328から供給されるループフィルタ処理が省略された復号画像を参照画像として用いてイントラ予測を行い、予測画像を生成する。イントラ予測部329は、生成した予測画像を予測画像選択部331に供給する。
インター予測部330は、ヘッダ情報を復号して得られた情報(最適予測モード情報、参照画像情報等)を可逆復号部322から取得する。インター予測部330は、可逆復号部322から取得された最適予測モード情報が示すインター予測モードで、フレームメモリ328から取得した参照画像を用いてインター予測を行い、予測画像を生成する。インター予測部330は、生成した予測画像を予測画像選択部331に供給する。
予測画像選択部331は、イントラ予測部329またはインター予測部330から供給された予測画像を、演算部325に供給する。
<画像送信処理の流れ>
次に、画像伝送システム100の各装置において実行される処理の流れの例を説明する。最初に画像送信装置101により実行される画像送信処理の流れの例を、図15のフローチャートを参照して説明する。
画像送信処理が開始されると、画像送信装置101のエンコードモジュール111は、ステップS101において、供給された画像データを階層符号化する。
ステップS102において、伝送判断モジュール112は、ステップS101の処理により生成された階層画像符号化ストリームに対して、データ変更によるデータ量制御を行い、その階層画像符号化ストリームを伝送可能な状態にする。
ステップS103において、伝送モジュール113は、ステップS102において伝送可能な状態となった階層画像符号化ストリームを、逐次ネットワーク102を介して画像受信装置103に送信する。
これらの各処理は、画像データのピクチャ毎に繰り返し行われる。ステップS103の処理が終了すると、画像送信処理が終了する。
<階層符号化処理の流れ>
次に、図16のフローチャートを参照して、図15のステップS101において実行される階層符号化処理の流れの例を説明する。階層符号化処理が開始されると、ステップS121において、画像階層化部151は、入力された画像データの各フレームを逐次階層化する。
ステップS122において、伝送制御部154は、供給された伝送可能帯域に基づいて、各レイヤの目標レートを設定する。
ステップS123において、参照制限部155は、供給された参照の制限に基づいて、各レイヤの参照制限を設定する。
ステップS124において、符号化部152は、各レイヤの画像データを符号化する。
ステップS125において、多重化部153は、ステップS124において得られた各レイヤのビットストリーム(ベースレイヤ画像符号化ストリームやエンハンスメントレイヤ画像符号化ストリーム)を多重化し、1本の階層画像符号化ストリームとして伝送判断モジュール112(図5)に供給する。なお、参照関係補助情報を伝送判断モジュール112に供給する場合、参照関係補助情報生成部156は、符号化ストリームから参照関係補助情報を生成し、それを伝送判断モジュール112に供給する。
ステップS125の処理が終了すると、階層符号化処理が終了し、処理は図15に戻る。
<符号化処理の流れ>
次に、図16のステップS124において実行される各レイヤの符号化処理の流れの例を、図17のフローチャートを参照して説明する。
符号化処理が開始されると、ステップS141において、フレームメモリ181は、下位レイヤの復号画像を共有する。
ステップS142において、画面並べ替えバッファ171は、入力された動画像の各フレーム(ピクチャ)の画像をその表示する順番に記憶し、各ピクチャの表示する順番から符号化する順番への並べ替えを行う。
ステップS143において、イントラ予測部182は、イントラ予測処理を行う。また、ステップS144において、インター予測部183は、インター予測処理を行う。
ステップS145において、予測画像選択部184は、コスト関数値等に基づいて、ステップS143のイントラ予測処理により生成された予測画像と、ステップS144のインター予測処理により生成された予測画像のいずれか一方を選択する。
ステップS146において、演算部172は、ステップS142の処理によりフレーム順を並び替えられた入力画像と、ステップS145の処理により選択された予測画像との差分を演算する。つまり、演算部172は、入力画像と予測画像との残差データを生成する。このようにして求められた残差データは、元の画像データに比べてデータ量が低減される。したがって、画像をそのまま符号化する場合に比べて、データ量を圧縮することができる。
ステップS147において、直交変換部173は、ステップS146の処理により生成された残差データを直交変換する。
ステップS148において、量子化部174は、ステップS147の処理により得られた直交変換係数を量子化する。その際、量子化部174は、レート制御部185による目標レートを用いたレート制御の下で量子化を行う。
ステップS149において、逆量子化部177は、ステップS148の処理により生成された量子化された係数(量子化係数とも称する)を、その量子化の特性に対応する特性で逆量子化する。
ステップS150において、逆直交変換部178は、ステップS147の処理により得られた直交変換係数を逆直交変換する。
ステップS151において、演算部179は、ステップS150の処理により復元された残差データに、ステップS145の処理により選択された予測画像を加算することにより、再構成画像の画像データを生成する。
ステップS152においてループフィルタ180は、ステップS151の処理により生成された再構成画像の画像データにループフィルタ処理を行う。これにより、再構成画像のブロック歪み等が除去される。
ステップS153において、フレームメモリ181は、ステップS152の処理によりブロック歪み等が除去された再構成画像を記憶する。
ステップS154において、可逆符号化部175は、ステップS148の処理により得られた、量子化された係数を符号化する。すなわち、残差データに対応するデータに対して、可変長符号化や算術符号化等の可逆符号化が行われる。
また、このとき、可逆符号化部175は、ステップS145の処理により選択された予測画像の予測モードに関する情報を符号化し、差分画像を符号化して得られる符号化データに付加する。つまり、可逆符号化部175は、イントラ予測部182から供給される最適イントラ予測モード情報、または、インター予測部183から供給される最適インター予測モードに応じた情報なども符号化し、符号化データに付加する。
ステップS155において蓄積バッファ176は、ステップS154の処理により得られた符号化データ等を蓄積する。蓄積バッファ176に蓄積された符号化データ等は、ビットストリームとして適宜読み出され、伝送路や記録媒体を介して復号側に伝送される。
ステップS156において、レート制御部185は、ステップS155の処理により蓄積バッファ116に蓄積された符号化データ等の符号量(発生符号量)に基づいて、オーバフローあるいはアンダーフローが発生しないように、ステップS148の量子化処理のレートを制御する。
ステップS148の処理が終了すると、符号化処理が終了し、処理は図16に戻る。
<伝送判断処理の流れ>
次に、図18のフローチャートを参照して、図15のステップS102において実行される伝送判断処理の流れの例を説明する。
伝送判断処理が開始されると、ステップS171において、データ変更制御部211は、処理対象であるカレントレイヤを最上位レイヤにする。
ステップS172において、データ変更制御部211は、カレントレイヤがベースレイヤであるか否かを判定する。ベースレイヤではない(すなわち、最下位レイヤではない)と判定された場合、処理はステップS173に進む。
ステップS173において、サイズ見積部212は、これまでに設定したデータ変更を反映したサイズの見積もりを行う。
ステップS174において、帯域判定部213は、伝送可能帯域に基づいて、ステップS173において見積もられたサイズ(データ量)で全レイヤを伝送可能化否かを判定する。見積もったサイズが、伝送媒体であるネットワーク102の帯域制限に基づく上限以下の場合、処理はステップS177に進む。
また、ステップS174において、見積もられたサイズ(データ量)が伝送媒体であるネットワーク102の帯域制限に基づく上限を越えており、伝送不可能であると判定された場合、処理はステップS175に進む。
ステップS175において、参照関係判定部214は、カレントピクチャのカレントレイヤの画像が参照先がデータ変更済みであるか否かを判定する。参照先の符号化データがデータ変更済みであると判定された場合、処理はステップS176に進む。
ステップS176において、参照制限部215は、符号化の参照をレイヤ間に制限する(限定する)。ステップS176の処理が終了すると処理はステップS177に進む。
ステップS177において、データ変更設定部216は、カレントレイヤのデータ変更の対象に設定する。ステップS177の処理が終了すると、処理はステップS178に進む。
ステップS175において、参照先がデータ変更されていないと判定された場合、処理はステップS178に進む。
ステップS178において、データ変更制御部211は、カレントレイヤを1階層下げる。ステップS178の処理が終了すると、処理はステップS172に戻り、それ以降の処理を繰り返す。
ステップS172において、カレントレイヤが最下位レイヤ(ベースレイヤ)であると判定された場合、処理は、ステップS179に進む。
ステップS179において、データ変更部217は、変更対象に設定されたレイヤをデータ変更する。
ステップS180において、送信結果記憶部218は、伝送モジュール113から供給される送信結果を取得し、記憶する。
ステップS180の処理が終了すると伝送判断処理が終了し、処理は図15に戻る。
以上のように各処理を実行することにより、画像送信装置101は、画像データが階層符号化された符号化データのデータ量制御をより高速に行うことができる。
<画像受信処理の流れ>
次に、図19のフローチャートを参照して、画像受信処理の流れの例を説明する。画像受信処理が開始されると、画像受信装置103の伝送モジュール121は、ステップS201において、ネットワーク102を介して伝送される階層画像符号化ストリームを受信する。
ステップS202において、デコードモジュール122は、ステップS201の処理により得られた階層画像符号化ストリームを階層復号する。ステップS202の処理が終了すると、画像受信処理が終了する。
<階層復号処理の流れ>
次に、図20のフローチャートを参照して、図19のステップS202において実行される階層復号処理の流れの例を説明する。
階層復号処理が開始されると、逆多重化部301は、ステップS221において、階層画像符号化ストリームを逆多重化し、各階層のビットストリームを得る。
ステップS222において、復号部302は、ステップS221の処理により得られた各レイヤのビットストリームを復号し、各レイヤの復号画像の画像データを得る。
ステップS223において、画像出力部303は、ステップS222において復号されたレイヤの中から画像データを出力するレイヤを選択し、そのレイヤの画像データを出力する。
ステップS223の処理が終了すると、階層復号処理が終了し、処理は図19に戻る。
<復号処理の流れ>
次に、図21のフローチャートを参照して、図20のステップS222において実行される復号処理の流れの例を説明する。
復号処理が開始されると、ステップS241において、フレームメモリ328は、下位レイヤの復号画像を共有する。
ステップS242において、蓄積バッファ321は、逆多重化部301から供給されたビットストリームを蓄積する。
ステップS243において、可逆復号部322は、蓄積バッファ321から供給されるビットストリームを復号する。すなわち、符号化側により符号化されたIピクチャ、Pピクチャ、並びにBピクチャが復号される。このとき、ヘッダ情報などのビットストリームに含められた画像情報以外の各種情報も復号される。
ステップS244において、逆量子化部323は、ステップS243の処理により得られた、量子化された係数を逆量子化する。
ステップS245において、逆直交変換部324は、ステップS244の処理により得られた直交変換係数を逆直交変換する。この処理により、輝度成分の残差データと色差成分の予測残差データが復元される。
ステップS246において、イントラ予測部329若しくはインター予測部330は、予測処理を行い、予測画像を生成する。つまり、可逆復号部322において判定された、符号化の際に適用された予測モードで予測処理が行われる。
ステップS247において、演算部325は、ステップS245の処理により復元された残差データに、ステップS246において生成された予測画像を加算する。これにより再構成画像が得られる。
ステップS248において、ループフィルタ326は、ステップS247の処理により得られた再構成画像に対して、デブロックフィルタ処理やSAO処理等を含むループフィルタ処理を行う。
ステップS249において、画面並べ替えバッファ327は、ステップS248の処理により得られた復号画像のフレームの並べ替えを行う。すなわち、符号化の際に並べ替えられたフレームの順序が、元の表示の順序に並べ替えられる。フレームが並べ替えられた復号画像は、復号部302の外部、すなわち、画像出力部303に出力される。
ステップS250において、フレームメモリ328は、ステップS108の処理により得られた復号画像を記憶する。
ステップS110の処理が終了すると、復号処理が終了し、処理は図20に戻る。
以上のように各処理を実行することにより、画像受信装置103は、画像送信装置101により生成された符号化ストリームを、より正確に復号することができる。
<制御例>
図22を参照して、本技術を適用した伝送判断モジュール112によるデータ量制御の様子の例を説明する図である。
図22Aは、階層符号化のレイヤ選択によるデータ量制御の例を示している。図22Aに示される表の太線は、ネットワーク102の帯域変動の様子の例を示している。つまり、この太線より下側のレイヤの符号化データが伝送可能であることを示している。
図22Aに示されるように、フレーム番号3乃至5の各ピクチャにおいてネットワーク102の利用可能な帯域幅が低減している。仮に符号化処理時間による遅延を考慮しなかったとしても、図22Aのフレーム番号6乃至14のようにIDRピクチャが出現するまで、ネットワークの帯域幅の回復に追従することができない。したがって、この間不要にビットストリームのデータ量が低減し、復号画像の画質が不要に低減してしまうおそれがあった。
図22Bは、本技術を適用した場合のデータ量制御の例を示しており、符号化データのデータ変更によるデータ量制御の例を示している。この場合、符号化されたデータを処理することによりデータ量を変更しているので、符号化処理時間等による遅延が発生しない。したがって、画像データが階層符号化された符号化データのデータ量制御をより高速に行うことができる。
また、この場合、フレーム番号3乃至フレーム番号5の各ピクチャのように、レイヤ数を維持したままビットストリームのデータ量が低減されるので、フレーム番号6以降のピクチャのように、IDRピクチャの出現を待たずに、符号化データのデータ量を増大させることができ、復号画像の画質の低減を抑制することができる。
ここで、符号化処理により1ピクチャ分遅延するとする。フレーム番号6において、ネットワーク102の利用可能な帯域幅が回復しているので、符号化データのデータ量も増大させたいが、エンハンスメントレイヤ(EL0およびEL1)では、画像の参照先となるフレーム番号5の画像がデータ変更されているので、符号化時と復号時とで予測(ピクチャ間の参照)の不一致が生じるおそれがある。そこで、このフレーム番号6のピクチャのエンハンスメントレイヤ(EL0およびEL1)の画像は、データ変更する必要がある。
ここで、階層符号化の参照方向をレイヤ間方向に制限すると、フレーム番号7のエンハンスメントレイヤ(EL0およびEL1)では、レイヤ間の参照のみで予測画像が生成されることになる。したがって、このフレーム番号7のエンハンスメントレイヤ(EL0およびEL1)の画像は正しく復号することができる(符号化時と復号時とで予測が一致する)。これにより、フレーム番号8以降は、参照方向の制限も解除することができる(ピクチャ間の参照も可能になる)。
以上のように、画像データが階層符号化された符号化データのデータ量制御をより高速に行うことができる。
<2.第2の実施の形態>
<エンコーダのレート制御との併用>
符号化データのデータ量制御は、以上のような符号化後のデータ変換だけでなく、符号化時のレート制御も併用するようにしてもよい。
その場合の符号化時のレート制御の方法は任意である。例えば、図23の例のように、各レイヤの符号化において、伝送媒体の帯域制限に基づく上限のデータ量を、所定の割合で各レイヤに割り当てるようにしてもよい。また、例えば、図24の例のように、伝送媒体の帯域制限に応じて、より上位のレイヤから順にデータ量を所定の下限まで制限するようにしてもよい。
このような符号化時のレート制御では追従出来ない分を、第1の実施の形態において説明したようなデータ変換によるデータ量制御で補間するようにしてもよい。このようにすることにより、第1の実施の形態において説明したように、符号化データのデータ量制御をより高速に行うことができる。
また、各レイヤの符号化において、伝送媒体の帯域制限の変動の程度に応じた方法で、符号化データのデータ量を制御するようにしてもよい。つまり、帯域変動の急峻さ等に応じて、符号化時のレート制御の方法を切り替えるようにしてもよい。例えば、ネットワーク102の構成によって帯域の変化の仕方は異なる。例えば、有線より無線ネットワークの方がより伝送帯域が狭く、また、帯域の急な変化が起こりやすい。このようなネットワーク102の性質に応じてレート制御の方法を変えることにより、ネットワークの性質により適した制御を行うことができる。
例えば、伝送媒体の帯域制限の変動が緩やかな場合、符号化時のレート制御において、図23の例のように、伝送媒体の帯域制限に基づく上限のデータ量を、所定の割合で各レイヤに割り当てるようにしてもよい。このようにすることにより、予測符号化の圧縮効率を各レイヤで効率よく利用することができる。
また、伝送媒体の帯域制限の変動が急激な場合、符号化時のレート制御において、図24の例のように、より上位のレイヤから順にデータ量を所定の下限まで制限するようにしてもよい。このようにすることにより、より上位のレイヤのデータが伝送され易くなり、復号画像の画質の低減を抑制することができる。
また、本技術は、例えば、MPEG、H.26x等の様に、離散コサイン変換等の直交変換と動き補償によって圧縮された画像情報(ビットストリーム)を、衛星放送、ケーブルテレビジョン、インターネット、または携帯電話機などのネットワークメディアを介して送信する際に用いられる画像処理装置に適用することができる。
<3.第3の実施の形態>
<コンピュータ>
上述した一連の処理は、ハードウエアにより実行させることもできるし、ソフトウエアにより実行させることもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここでコンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータ等が含まれる。
図25は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。
図25に示されるコンピュータ800において、CPU(Central Processing Unit)801、ROM(Read Only Memory)802、RAM(Random Access Memory)803は、バス804を介して相互に接続されている。
バス804にはまた、入出力インタフェース810も接続されている。入出力インタフェース810には、入力部811、出力部812、記憶部813、通信部814、およびドライブ815が接続されている。
入力部811は、例えば、キーボード、マウス、マイクロホン、タッチパネル、入力端子などよりなる。出力部812は、例えば、ディスプレイ、スピーカ、出力端子などよりなる。記憶部813は、例えば、ハードディスク、RAMディスク、不揮発性のメモリなどよりなる。通信部814は、例えば、ネットワークインタフェースよりなる。ドライブ815は、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリなどのリムーバブルメディア821を駆動する。
以上のように構成されるコンピュータでは、CPU801が、例えば、記憶部813に記憶されているプログラムを、入出力インタフェース810およびバス804を介して、RAM803にロードして実行することにより、上述した一連の処理が行われる。RAM803にはまた、CPU801が各種の処理を実行する上において必要なデータなども適宜記憶される。
コンピュータ(CPU801)が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア821に記録して適用することができる。その場合、プログラムは、リムーバブルメディア821をドライブ815に装着することにより、入出力インタフェース810を介して、記憶部813にインストールすることができる。
また、このプログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することもできる。その場合、プログラムは、通信部814で受信し、記憶部813にインストールすることができる。
その他、このプログラムは、ROM802や記憶部813に、あらかじめインストールしておくこともできる。
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
また、本明細書において、記録媒体に記録されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
また、本明細書において、システムとは、複数の構成要素(装置、モジュール(部品)等)の集合を意味し、全ての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、1つの筐体の中に複数のモジュールが収納されている1つの装置は、いずれも、システムである。
また、以上において、1つの装置(または処理部)として説明した構成を分割し、複数の装置(または処理部)として構成するようにしてもよい。逆に、以上において複数の装置(または処理部)として説明した構成をまとめて1つの装置(または処理部)として構成されるようにしてもよい。また、各装置(または各処理部)の構成に上述した以外の構成を付加するようにしてももちろんよい。さらに、システム全体としての構成や動作が実質的に同じであれば、ある装置(または処理部)の構成の一部を他の装置(または他の処理部)の構成に含めるようにしてもよい。
以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。
例えば、本技術は、1つの機能を、ネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。
また、上述のフローチャートで説明した各ステップは、1つの装置で実行する他、複数の装置で分担して実行することができる。
さらに、1つのステップに複数の処理が含まれる場合には、その1つのステップに含まれる複数の処理は、1つの装置で実行する他、複数の装置で分担して実行することができる。
上述した実施形態に係る画像処理装置は、例えば、衛星放送、ケーブルTVなどの有線放送、インターネット上での配信、及びセルラー通信による端末への配信などにおける送信機などの様々な電子機器に応用され得る。
また、本明細書では、各種情報が、符号化ストリームに多重化されて、符号化側から復号側へ伝送される例について説明した。しかしながら、これら情報を伝送する手法はかかる例に限定されない。例えば、これら情報は、符号化ビットストリームに多重化されることなく、符号化ビットストリームと関連付けられた別個のデータとして伝送され又は記録されてもよい。ここで、「関連付ける」という用語は、ビットストリームに含まれる画像(スライス若しくはブロックなど、画像の一部であってもよい)と当該画像に対応する情報とを復号時にリンクさせ得るようにすることを意味する。即ち、情報は、画像(又はビットストリーム)とは別の伝送路上で伝送されてもよい。また、情報は、画像(又はビットストリーム)とは別の記録媒体(又は同一の記録媒体の別の記録エリア)に記録されてもよい。さらに、情報と画像(又はビットストリーム)とは、例えば、複数フレーム、1フレーム、又はフレーム内の一部分などの任意の単位で互いに関連付けられてよい。
なお、本技術は以下のような構成も取ることができる。
(1) 画像データが階層符号化された符号化データの、少なくとも一部のエンハンスメントレイヤのデータを、下位のレイヤの画像データを複製して利用するモードのデータに変更するデータ変更を行うデータ変更部
を備える画像処理装置。
(2) 前記データ変更部は、前記符号化データのデータ量が伝送媒体の帯域制限に基づく上限を越える場合、前記データ変更を行う
(1)に記載の画像処理装置。
(3) 前記データ変更部は、前記符号化データのデータ量が前記上限以下となるまで、最上位レイヤから順に各エンハンスメントレイヤについて前記データ変更を行う
(2)に記載の画像処理装置。
(4) 前記階層符号化における参照方向をレイヤ間に制限する参照制限部
をさらに備える(1)乃至(3)のいずれかに記載の画像処理装置。
(5) 前記参照制限部は、カレントピクチャのカレントレイヤの参照先において前記データ変更が行われた場合、次に前記階層符号化されるピクチャの前記カレントレイヤの参照方向をレイヤ間に制限する
(4)に記載の画像処理装置。
(6) 前記参照制限部は、前記階層符号化における参照関係を示す情報に基づいて前記カレントピクチャの前記カレントレイヤの参照先を特定し、前記参照先において前記データ変更が行われたか否かを判定する
(5)に記載の画像処理装置。
(7) 前記参照関係を示す情報は、各レイヤの参照先を、レイヤ番号と参照元からの相対時刻とで示す情報を含む
(6)に記載の画像処理装置。
(8) 前記データ変更部によりデータ変更された前記符号化データを伝送する伝送部をさらに備える
(1)乃至(7)のいずれかに記載の画像処理装置。
(9) 前記画像データを階層符号化する符号化部をさらに備え、
前記データ変更部は、前記符号化部により階層符号化された符号化データに対して前記データ変更を行う
(1)乃至(8)のいずれかに記載の画像処理装置。
(10) 前記符号化部は、画像データを階層化し、各レイヤの画像データを再帰的に分割されたブロック構造にして符号化し、各レイヤの符号化データを多重化する
(9)に記載の画像処理装置。
(11) 前記符号化部は、各レイヤの符号化において、伝送媒体の帯域制限に基づいて、符号化データのデータ量を制御する
(10)に記載の画像処理装置。
(12) 前記符号化部は、前記伝送媒体の帯域制限に基づく上限のデータ量を、所定の割合で各レイヤに割り当てる
(11)に記載の画像処理装置。
(13) 前記符号化部は、前記伝送媒体の帯域制限に応じて、より上位のレイヤから順にデータ量を所定の下限まで制限する
(11)に記載の画像処理装置。
(14) 前記符号化部は、各レイヤの符号化において、前記伝送媒体の帯域制限の変動の程度に応じた方法で、前記符号化データのデータ量を制御する
(11)に記載の画像処理装置。
(15) 前記符号化部は、前記伝送媒体の帯域制限の変動が緩やかな場合、前記伝送媒体の帯域制限に基づく上限のデータ量を、所定の割合で各レイヤに割り当てる
(14)に記載の画像処理装置。
(16) 前記符号化部は、前記伝送媒体の帯域制限の変動が急激な場合、前記伝送媒体の帯域制限に応じて、より上位のレイヤから順にデータ量を所定の下限まで制限する
(14)に記載の画像処理装置。
(17) 画像データが階層符号化された符号化データの、少なくとも一部のエンハンスメントレイヤのデータを、下位のレイヤの画像データを複製して利用するモードのデータに変更するデータ変更を行う
画像処理方法。
100 画像伝送システム, 101 画像送信装置, 102 ネットワーク, 103 画像受信装置, 111 エンコードモジュール, 112 伝送判断モジュール, 113 伝送モジュール, 114 伝送制御部, 121 伝送モジュール, 122 デコードモジュール, 151 画像階層化部, 152 符号化部, 153 多重化部, 154 伝送制御部, 155 参照制限部, 156 参照関係補助情報生成部, 181 フレームメモリ, 182 イントラ予測部, 183 インター予測部, 185 レート制御部, 201 データ変更処理部, 202 記憶部, 211 データ変更制御部, 212 サイズ見積部, 213 帯域判定部, 214 参照関係判定部, 215 参照制限部, 216 データ変更設定部, 217 データ変更部, 218 送信結果記憶部, 301 逆多重化部, 302 復号部, 303 画像出力部

Claims (17)

  1. 画像データが階層符号化された符号化データの、少なくとも一部のエンハンスメントレイヤのデータを、下位のレイヤの画像データを複製して利用するモードのデータに変更するデータ変更を行うデータ変更部
    を備える画像処理装置。
  2. 前記データ変更部は、前記符号化データのデータ量が伝送媒体の帯域制限に基づく上限を越える場合、前記データ変更を行う
    請求項1に記載の画像処理装置。
  3. 前記データ変更部は、前記符号化データのデータ量が前記上限以下となるまで、最上位レイヤから順に各エンハンスメントレイヤについて前記データ変更を行う
    請求項2に記載の画像処理装置。
  4. 前記階層符号化における参照方向をレイヤ間に制限する参照制限部
    をさらに備える請求項1に記載の画像処理装置。
  5. 前記参照制限部は、カレントピクチャのカレントレイヤの参照先において前記データ変更が行われた場合、次に前記階層符号化されるピクチャの前記カレントレイヤの参照方向をレイヤ間に制限する
    請求項4に記載の画像処理装置。
  6. 前記参照制限部は、前記階層符号化における参照関係を示す情報に基づいて前記カレントピクチャの前記カレントレイヤの参照先を特定し、前記参照先において前記データ変更が行われたか否かを判定する
    請求項5に記載の画像処理装置。
  7. 前記参照関係を示す情報は、各レイヤの参照先を、レイヤ番号と参照元からの相対時刻とで示す情報を含む
    請求項6に記載の画像処理装置。
  8. 前記データ変更部によりデータ変更された前記符号化データを伝送する伝送部をさらに備える
    請求項1に記載の画像処理装置。
  9. 前記画像データを階層符号化する符号化部をさらに備え、
    前記データ変更部は、前記符号化部により階層符号化された符号化データに対して前記データ変更を行う
    請求項1に記載の画像処理装置。
  10. 前記符号化部は、画像データを階層化し、各レイヤの画像データを再帰的に分割されたブロック構造にして符号化し、各レイヤの符号化データを多重化する
    請求項9に記載の画像処理装置。
  11. 前記符号化部は、各レイヤの符号化において、伝送媒体の帯域制限に基づいて、符号化データのデータ量を制御する
    請求項10に記載の画像処理装置。
  12. 前記符号化部は、前記伝送媒体の帯域制限に基づく上限のデータ量を、所定の割合で各レイヤに割り当てる
    請求項11に記載の画像処理装置。
  13. 前記符号化部は、前記伝送媒体の帯域制限に応じて、より上位のレイヤから順にデータ量を所定の下限まで制限する
    請求項11に記載の画像処理装置。
  14. 前記符号化部は、各レイヤの符号化において、前記伝送媒体の帯域制限の変動の程度に応じた方法で、前記符号化データのデータ量を制御する
    請求項11に記載の画像処理装置。
  15. 前記符号化部は、前記伝送媒体の帯域制限の変動が緩やかな場合、前記伝送媒体の帯域制限に基づく上限のデータ量を、所定の割合で各レイヤに割り当てる
    請求項14に記載の画像処理装置。
  16. 前記符号化部は、前記伝送媒体の帯域制限の変動が急激な場合、前記伝送媒体の帯域制限に応じて、より上位のレイヤから順にデータ量を所定の下限まで制限する
    請求項14に記載の画像処理装置。
  17. 画像データが階層符号化された符号化データの、少なくとも一部のエンハンスメントレイヤのデータを、下位のレイヤの画像データを複製して利用するモードのデータに変更するデータ変更を行う
    画像処理方法。
JP2015063826A 2015-03-26 2015-03-26 画像処理装置および方法 Pending JP2016184844A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015063826A JP2016184844A (ja) 2015-03-26 2015-03-26 画像処理装置および方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015063826A JP2016184844A (ja) 2015-03-26 2015-03-26 画像処理装置および方法

Publications (1)

Publication Number Publication Date
JP2016184844A true JP2016184844A (ja) 2016-10-20

Family

ID=57243216

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015063826A Pending JP2016184844A (ja) 2015-03-26 2015-03-26 画像処理装置および方法

Country Status (1)

Country Link
JP (1) JP2016184844A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019073802A1 (ja) * 2017-10-11 2019-04-18 ソニー株式会社 送信装置および送信方法、並びにプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019073802A1 (ja) * 2017-10-11 2019-04-18 ソニー株式会社 送信装置および送信方法、並びにプログラム
JPWO2019073802A1 (ja) * 2017-10-11 2020-11-12 ソニー株式会社 送信装置および送信方法、並びにプログラム
JP7173028B2 (ja) 2017-10-11 2022-11-16 ソニーグループ株式会社 送信装置および送信方法、並びにプログラム

Similar Documents

Publication Publication Date Title
AU2018205779B2 (en) Modified adaptive loop filter temporal prediction for temporal scalability support
KR102338145B1 (ko) 팔레트 모드 인코딩 및 디코딩 설계
AU2016219428B2 (en) Restriction on palette block size in video coding
KR101847899B1 (ko) 동영상 처리 방법 및 장치
RU2740164C2 (ru) Устройство и способ обработки изображений
KR20180120200A (ko) 비디오 코딩 툴들을 위한 제약된 블록 레벨 최적화 및 시그널링
KR20210113390A (ko) 인트라 예측의 인코더, 디코더 및 대응하는 방법
US20140079135A1 (en) Performing quantization to facilitate deblocking filtering
EP3205097A1 (en) Deblock filtering for intra block copying
EP3183881B1 (en) Methods incorporating extensions to copy-above mode for palette mode coding
JP2022507670A (ja) ビデオ復号化方法、ビデオ復号化装置、コンピュータ・プログラム及びビデオ符号化方法
KR101895295B1 (ko) 동영상 처리 방법 및 장치
KR102625986B1 (ko) 인트라 서브파티션 코딩 툴로 인한 서브파티션 경계를 위한 디블로킹 필터
KR20230165354A (ko) 디블로킹 필터의 경계 강도를 도출하는 인코더, 디코더 및 대응 방법
JP2022518378A (ja) 画像予測方法、機器、及びシステム、装置、及び記憶媒体
CN114208199A (zh) 用于视频译码的色度帧内预测单元
KR20240074918A (ko) 인코더, 디코더 및 디블로킹 필터 적응 방법
KR20210103572A (ko) 타일 구성 시그널링을 위한 인코더, 디코더 및 대응 방법
KR102595146B1 (ko) 비디오 인코더, 비디오 디코더 및 그에 대응하는 방법
JP2016184844A (ja) 画像処理装置および方法
JP2023519978A (ja) レジデュアルコーディングに対する映像デコーディング方法及びその装置
RU2777967C1 (ru) Деблокирующий фильтр для границ подразделов, возникающих под действием инструмента кодирования интра-подразделов
RU2793802C2 (ru) Видеокодер, видеодекодер и соответствующие способы
RU2803063C2 (ru) Кодер, декодер и соответствующие способы, которые используются для процесса преобразования
JP7234365B2 (ja) イントラ予測方法及び装置