JP2013229674A - 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法、画像符号化プログラム、及び画像復号プログラム - Google Patents
画像符号化装置、画像復号装置、画像符号化方法、画像復号方法、画像符号化プログラム、及び画像復号プログラム Download PDFInfo
- Publication number
- JP2013229674A JP2013229674A JP2012099118A JP2012099118A JP2013229674A JP 2013229674 A JP2013229674 A JP 2013229674A JP 2012099118 A JP2012099118 A JP 2012099118A JP 2012099118 A JP2012099118 A JP 2012099118A JP 2013229674 A JP2013229674 A JP 2013229674A
- Authority
- JP
- Japan
- Prior art keywords
- prediction
- image
- unit
- shape
- parallax
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【課題】符号量の増大を防止できること。
【解決手段】予測画像生成部は、予測ユニット各々の形状を、予め決められた複数の形状の中から選択し、画像とは異なる視点を基準とした画像を参照して予測画像を生成する予測方法である視差予測を少なくとも含む複数の予測方法の中から選択した予測方法を用いて、該予測ユニットの予測画像を生成する。予め決められた複数の形状は、視差予測における視差方向に対して垂直な方向に長い形状の方を、前記視差方向に長い形状よりも多く含む。
【選択図】図5
【解決手段】予測画像生成部は、予測ユニット各々の形状を、予め決められた複数の形状の中から選択し、画像とは異なる視点を基準とした画像を参照して予測画像を生成する予測方法である視差予測を少なくとも含む複数の予測方法の中から選択した予測方法を用いて、該予測ユニットの予測画像を生成する。予め決められた複数の形状は、視差予測における視差方向に対して垂直な方向に長い形状の方を、前記視差方向に長い形状よりも多く含む。
【選択図】図5
Description
本発明は、画像符号化装置、画像復号装置、画像符号化方法、画像復号方法、画像符号化プログラム、及び画像復号プログラムに関する。
近年、画像の符号化に関する技術の議論が進められている。例えば、非特許文献1には、HEVC(High Efficiency Video Coding、高効率動画像圧縮符号化)に関する技術の記載がある。
非特許文献1によれば、HEVCにおいては、動画像を構成する画像(ピクチャ)は、画像を分割することにより得られるツリーブロック、ツリーブロックを分割することにより得られる符号化ユニット(Coding Unit:CU)に分割され、普通、符号化ユニットごとに符号化/復号される。また、画面内予測および画面間予測において、符号化処理の単位となる符号化ユニットをさらに予測ユニット(Prediction Unit:PU)に分割する。この予測ユニットの形状は、予め決められた複数の形状の中から選択される。例えば、図3の複数の形状は、全体として、縦方向と横方向で均等(対称)な形状となっている。
非特許文献1によれば、HEVCにおいては、動画像を構成する画像(ピクチャ)は、画像を分割することにより得られるツリーブロック、ツリーブロックを分割することにより得られる符号化ユニット(Coding Unit:CU)に分割され、普通、符号化ユニットごとに符号化/復号される。また、画面内予測および画面間予測において、符号化処理の単位となる符号化ユニットをさらに予測ユニット(Prediction Unit:PU)に分割する。この予測ユニットの形状は、予め決められた複数の形状の中から選択される。例えば、図3の複数の形状は、全体として、縦方向と横方向で均等(対称)な形状となっている。
"次世代動画像符号化「HEVC」の符号化技術に関する議論が進む"、[online]、石川孝明、[2012年4月17日検索]、インターネット〈URL: http://wbb.forum.impressrd.jp/feature/20110412/837〉
しかしながら、例えば、MPEG(Moving Picture Experts Group)−3DVにおいては、カメラは1D(光軸並行、横に1直線)に配置されるため、視差は水平方向にしか生じない。そして、水平視差が顕著に表れるのは縦エッジがある領域である場合がある。このように、エッジ等が表れる方向が水平と垂直で均等でない場合がある。このような場合に、従来技術では、エッジを検出するために予測ユニットの横幅を狭くしようとすると、符号化ユニットのサイズを小さくする必要がある。そうすると、ピクチャを多数の符号化ユニットに分割することになり、それに伴い符号化ユニットに付随する情報(例えば、符号化モードや予測ユニットへの分割方法を示す情報)も増えるため、符号量が増大してしまう。
本発明は上記の点に鑑みてなされたものであり、符号量の増大を防止できる画像符号化装置、画像復号装置、画像符号化方法、画像復号方法、画像符号化プログラム、及び画像復号プログラムを提供する。
(1)本発明は上記の課題を解決するためになされたものであり、本発明の一態様は、画像を予測ユニットに分割し、前記予測ユニット毎に予測画像を生成して前記画像を符号化する画像符号化装置であって、前記予測ユニット各々の形状を、予め決められた複数の形状の中から選択し、前記画像とは異なる視点を基準とした画像を参照して予測画像を生成する予測方法である視差予測を少なくとも含む複数の予測方法の中から選択した予測方法を用いて、該予測ユニットの予測画像を生成する予測画像生成部を備え、前記予め決められた複数の形状は、前記視差予測における視差方向に対して垂直な方向に長い形状の方を、前記視差方向に長い形状よりも多く含むことを特徴とする画像符号化装置である。
(2)また、本発明の一態様は、上記の画像符号化装置において、前記予測ユニットの形状として用いることのできる形状のセットである、第1のセットと第2のセットとを記憶するユニット形状記憶部と、前記画像が、視差予測を用いることのできない基準視点画像であるか、視差予測を用いることができる非基準視点画像であるかを判定する判定部とを備え、前記予測画像生成部は、前記判定部の判定結果に応じて、前記ユニット形状記憶部が記憶するセットのうち一つを選択し、前記予め決められた複数の形状として用い、前記判定部が非基準視点画像であると判定したときに選択されるセットである前記第2のセットが、前記視差予測における視差方向に対して垂直な方向に長い形状の方を、前記視差方向に長い形状よりも多く含むことを特徴とする。
(3)また、本発明の一態様は、上記の画像符号化装置において、前記第1のセットは、前記判定部が基準視点画像であると判定したときに選択されるセットであり、前記第2のセットは、前記第1のセットのうちの一部を、前記視差予測における視差方向に対して垂直な方向に長い形状に入れ換えたものであることを特徴とする。
(4)また、本発明の一態様は、上記の画像符号化装置において、前記第1のセットは、前記判定部が基準視点画像であると判定したときに選択されるセットであり、前記第2のセットは、前記第1のセットに、前記視差予測における視差方向に対して垂直な方向に長い形状を追加したものであることを特徴とする。
(5)また、本発明の一態様は、上記の画像符号化装置において、前記第2のセットのうち一部は、前記視差方向に対して垂直な方向に長い形状となるように、前記視差方向に応じて向きを変更することを特徴とする。
(6)また、本発明の一態様は、予測ユニット毎に予測画像を生成して画像を復号する画像復号装置であって、前記予測ユニット各々の形状を、予め決められた複数の形状の中から選択し、前記画像とは異なる視点を基準とした画像を参照して予測画像を生成する予測方法である視差予測を少なくとも含む複数の予測方法の中から選択した予測方法を用いて、該予測ユニットの予測画像を生成する予測画像生成部を備え、前記予め決められた複数の形状は、前記視差予測における視差方向に対して垂直な方向に長い形状の方を、前記視差方向に長い形状よりも多く含むことを特徴とする画像復号装置である。
(7)また、本発明の一態様は、上記の画像復号装置において、前記予測ユニットの形状として用いることのできる形状のセットである、第1のセットと第2のセットとを記憶するユニット形状記憶部と、前記画像が、視差予測を用いることのできない基準視点画像であるか、視差予測を用いることができる非基準視点画像であるかを判定する判定部とを備え、前記予測画像生成部は、前記判定部の判定結果に応じて、前記ユニット形状記憶部が記憶するセットのうち一つを選択し、前記予め決められた複数の形状として用い、前記判定部が非基準視点画像であると判定したときに選択されるセットである前記第2のセットが、前記視差予測における視差方向に対して垂直な方向に長い形状の方を、前記視差方向に長い形状よりも多く含むことを特徴とする。
(8)また、本発明の一態様は、上記の画像復号装置において、前記第1のセットは、前記判定部が基準視点画像であると判定したときに選択されるセットであり、前記第2のセットは、前記第1のセットのうちの一部を、前記視差予測における視差方向に対して垂直な方向に長い形状に入れ換えたものであることを特徴とする。
(9)また、本発明の一態様は、上記の画像復号装置において、前記第1のセットは、前記判定部が基準視点画像であると判定したときに選択されるセットであり、前記第2のセットは、前記第1のセットに、前記視差予測における視差方向に対して垂直な方向に長い形状を追加したものであることを特徴とする。
(10)また、本発明の一態様は、上記の画像復号装置において、前記第2のセットのうち一部は、前記視差方向に対して垂直な方向に長い形状となるように、前記視差方向に応じて向きを変更することを特徴とする。
(11)また、本発明の一態様は、画像を予測ユニットに分割し、前記予測ユニット毎に予測画像を生成して前記画像を符号化する画像符号化装置における画像符号化方法であって、前記予測ユニット各々の形状を、予め決められた複数の形状の中から選択し、前記画像とは異なる視点を基準とした画像を参照して予測画像を生成する予測方法である視差予測を少なくとも含む複数の予測方法の中から選択した予測方法を用いて、該予測ユニットの予測画像を生成する予測画像生成過程を有し、前記予め決められた複数の形状は、前記視差予測における視差方向に対して垂直な方向に長い形状の方を、前記視差方向に長い形状よりも多く含むことを特徴とする画像符号化方法である。
(12)また、本発明の一態様は、予測ユニット毎に予測画像を生成して画像を復号する画像復号装置における画像復号方法であって、前記予測ユニット各々の形状を、予め決められた複数の形状の中から選択し、前記画像とは異なる視点を基準とした画像を参照して予測画像を生成する予測方法である視差予測を少なくとも含む複数の予測方法の中から選択した予測方法を用いて、該予測ユニットの予測画像を生成する予測画像生成過程を有し、前記予め決められた複数の形状は、前記視差予測における視差方向に対して垂直な方向に長い形状の方を、前記視差方向に長い形状よりも多く含むことを特徴とする画像復号方法である。
(13)また、本発明の一態様は、画像を予測ユニットに分割し、前記予測ユニット毎に予測画像を生成して前記画像を符号化する画像符号化装置のコンピュータに、前記予測ユニット各々の形状を、予め決められた複数の形状の中から選択し、前記画像とは異なる視点を基準とした画像を参照して予測画像を生成する予測方法である視差予測を少なくとも含む複数の予測方法の中から選択した予測方法を用いて、該予測ユニットの予測画像を生成する予測画像生成手順を実行させ、前記予め決められた複数の形状は、前記視差予測における視差方向に対して垂直な方向に長い形状の方を、前記視差方向に長い形状よりも多く含む画像符号化プログラムである。
(14)また、本発明の一態様は、予測ユニット毎に予測画像を生成して画像を復号する画像復号装置のコンピュータに、前記予測ユニット各々の形状を、予め決められた複数の形状の中から選択し、前記画像とは異なる視点を基準とした画像を参照して予測画像を生成する予測方法である視差予測を少なくとも含む複数の予測方法の中から選択した予測方法を用いて、該予測ユニットの予測画像を生成する予測画像生成手段を有し、前記予め決められた複数の形状は、前記視差予測における視差方向に対して垂直な方向に長い形状の方を、前記視差方向に長い形状よりも多く含む画像復号プログラムである。
本発明によれば、符号量の増大を防止できる。
(第1実施形態)
以下、図面を参照しながら本発明の第1実施形態について詳しく説明する。
図1は、本発明の第1実施形態に係る映像システムの構成を示す概略ブロック図である。この図において、映像システムは、符号化装置1及び表示装置D1を具備する。表示装置D1は、復号装置2及び表示部D11を含んで構成される。
符号化装置1は、入力された複数の視点からの映像(多視点映像)の画像を符号化することで、符号化データを生成して復号装置2へ送信する。復号装置2は、符号化装置1から送信された符号化データを復号することで画像を取得する。復号装置2は、取得した画像を表示部D11に入力する。表示部D11は、復号装置2から入力された画像に基づいて多視点映像を表示する。
以下、図面を参照しながら本発明の第1実施形態について詳しく説明する。
図1は、本発明の第1実施形態に係る映像システムの構成を示す概略ブロック図である。この図において、映像システムは、符号化装置1及び表示装置D1を具備する。表示装置D1は、復号装置2及び表示部D11を含んで構成される。
符号化装置1は、入力された複数の視点からの映像(多視点映像)の画像を符号化することで、符号化データを生成して復号装置2へ送信する。復号装置2は、符号化装置1から送信された符号化データを復号することで画像を取得する。復号装置2は、取得した画像を表示部D11に入力する。表示部D11は、復号装置2から入力された画像に基づいて多視点映像を表示する。
図2は、本実施形態に係る符号化装置1の構成を示す概略ブロック図である。符号化装置1は、符号化情報設定部100、減算部101、変換量子化部102、逆量子化逆変換部103、加算部104、フレームメモリ105、ユニット形状記憶部106、予測画像生成部107、及び符号化データ生成部108を含んで構成される。符号化装置1に入力される映像信号が表す映像は、多視点映像、すなわち、それぞれが異なる視点を基準としている複数の視点画像からなる映像である。なお、本実施形態における多視点映像を構成する視点画像間では、横方向(水平方向)にのみ視点が異なる、すなわち、視差があるのは横方向のみである。また、以下では、画像や映像を表すデータを、画像や映像ということがある。
符号化情報設定部100は、符号化情報設定部100の外部から入力された映像信号が表す視点画像の各々を、基準視点画像(Base_View)とするか、非基準視点画像(Non−base_View)とするかを判定する。ここで、基準視点画像とは、符号化の際に、他の視点画像を参照して予測画像を生成する予測方法である視差予測を用いず、単一視点用の符号化方式、例えばHEVC、で復号できるように符号化される視点画像である。また、非基準視点画像とは、符号化の際に、視差予測を用いることのできる視点画像である。例えば、符号化情報設定部100は、最初に入力された視点画像を、基準視点画像とし、その他の視点画像を非基準視点画像とする。符号化情報設定部100は、視点画像各々について、基準視点画像であるか、非基準視点画像であるかを示す情報(レイヤ情報とも称する)を、予測画像生成部107と符号化データ生成部108に入力する。符号化情報設定部100は、入力された視点画像を、減算部101、及び予測画像生成部107に入力する。
減算部101は、符号化情報設定部100が入力した視点画像のうち、予測画像生成部107が入力した予測画像に対応する領域から、該予測画像を減算して、差分画像を生成する。減算部101は、生成した差分画像を変換量子化部102に入力する。
変換量子化部102は、減算部101から入力した差分画像を、直交変換を行う単位となる変換ユニット(Transfrom Unit:TU)に分割する。分割方法は、4分割を再帰的に行い、4分割を行ったか否かを示すフラグ(split_transofrm_flag)を変換ユニットごとに生成する。変換量子化部102は、分割された変換ユニットごとに直交変換をする。直交変換として、例えばDCT変換(離散コサイン変換;Discrete Cosine Transform)してDCT係数を生成する。DCT変換に限らず、他の方法(例えば、FFT(高速フーリエ変換;Fast Fourier Transform))を用いてもよい。変換量子化部102は、直交変換した結果(例えば、DCT係数)を量子化して、量子化係数を算出する。変換量子化部102は、量子化した量子化係数を、符号化データ生成部108と逆量子化逆変換部103に入力する。
逆量子化逆変換部103は、変換量子化部102から入力された量子化係数に対して、変換量子化部102で行った量子化と逆の処理(逆量子化)をして逆量子化係数を生成する。逆量子化逆変換部103は、生成した逆量子化係数を変換量子化部102における直交変換とは逆の変換処理、例えば逆DCT変換して復号差分画像を生成する。逆量子化逆変換部103は、生成した復号差分画像を加算部104に入力する。
加算部104は、予測画像生成部107が入力した予測画像と、逆量子化逆変換部103が入力した復号差分画像とを加算する。加算部104は、この加算により、入力された視点画像を符号化・復号した参照画像を生成する(内部デコード)。この参照画像は、フレームメモリ105に入力される。フレームメモリ105は、加算部104が入力した参照画像を記憶する。
ユニット形状記憶部106は、予測画像生成部107が予測画像を生成する際の単位である予測ユニット(Prediction Unit)の形状として用いることができる情報を記憶している。本実施形態におけるユニット形状記憶部106は、視点画像が基準視点画像であるときに用いることができる形状のセットである第1のセットと、視点画像が非基準視点画像であるときに用いることができる形状のセットである第2のセットとを記憶する。本実施形態では、ユニット形状記憶部106は、後述する符号化ユニットを予測ユニットに分割する分割モードを記憶することで、予測ユニットの形状を記憶している。
予測画像生成部107は、符号化情報設定部100が入力した視点画像を、予測ユニットに分割し、フレームメモリ105が記憶している参照画像を参照して、予測ユニット毎に予測画像を生成する。予測画像生成部107は、生成した予測画像を減算部101及び加算部104に入力する。予測画像生成部107の詳細は、後述する。
符号化データ生成部108は、各部からの入力に対して、エントロピー符号化などのビット数を減少させる圧縮符号化を行い、符号化データを生成する。符号化データ生成部108は、生成した符号化データを符号化装置1の外部(例えば、復号装置2)に出力する。
符号化データ生成部108は、各部からの入力に対して、エントロピー符号化などのビット数を減少させる圧縮符号化を行い、符号化データを生成する。符号化データ生成部108は、生成した符号化データを符号化装置1の外部(例えば、復号装置2)に出力する。
図3は、本実施形態に係る予測画像生成部107の構成を示す概略ブロック図である。予測画像生成部107は、ツリーブロック分割部171、符号化ユニット分割部172、予測ユニット分割部173、画面間予測部174、画面内予測部175、選択部176を含んで構成される。ツリーブロック分割部171は、視点画像の各フレームをスライスに分割した後、ツリーブロックと呼ばれる64画素×64画素のブロックに分割する。
符号化ユニット分割部172は、このツリーブロックを、符号化ユニット(Coding Unit)と呼ばれる予測画像を生成する際の予測モードを決める単位に分割する。この符号化ユニットは、ツリーブロックを0回分割した場合の64画素×64画素から、3回分割した場合の8画素×8画素まで、取り得る大きさに範囲がある。符号化ユニット分割部172は、ツリーブロックを0回分割した場合の64画素×64画素の符号化ユニットから3回分割した場合の8画素×8画素の符号化ユニットまで、全ての場合の符号化ユニットを生成し、予測ユニット分割部173に入力する。
符号化ユニット分割部172は、このツリーブロックを、符号化ユニット(Coding Unit)と呼ばれる予測画像を生成する際の予測モードを決める単位に分割する。この符号化ユニットは、ツリーブロックを0回分割した場合の64画素×64画素から、3回分割した場合の8画素×8画素まで、取り得る大きさに範囲がある。符号化ユニット分割部172は、ツリーブロックを0回分割した場合の64画素×64画素の符号化ユニットから3回分割した場合の8画素×8画素の符号化ユニットまで、全ての場合の符号化ユニットを生成し、予測ユニット分割部173に入力する。
予測ユニット分割部173は、入力された符号化ユニットを予測ユニットに分割する。予測ユニット分割部173は、処理対象となっている視点画像を符号化情報設定部100が基準視点画像と判定しているときは、ユニット形状記憶部106が記憶する第1のセットに属する全ての分割方法で、符号化ユニットを予測ユニットに分割する。同様に、予測ユニット分割部173は、処理対象となっている視点画像を符号化情報設定部100が非基準視点画像と判定しているときは、ユニット形状記憶部106が記憶する第2のセットに属する全ての分割方法で、符号化ユニットを予測ユニットに分割する。予測ユニット分割部173は、分割して生成した全ての予測ユニットを、画面間予測部174に入力する。予測ユニット分割部173は、符号化ユニットを0回分割した場合と、4分割した場合の予測ユニットのみを画面内予測部175に入力する。
画面間予測部174は、入力された予測ユニットの予測画像を、画面間予測を用いて生成する。具体的には、画面間予測部174は、入力された予測ユニットに最も近い画像を、フレームメモリ105が記憶する参照画像の中から探し出し、その画像を予測画像とする。なお、予測ユニットが属する視点画像が、基準視点画像であるときは、画面間予測として用いることができるのは、動き予測のみであり、視差予測は用いることができない。したがって、その場合、画面間予測部174は、フレームメモリ105が記憶する参照画像のうち、同じ視点画像の他のフレームの中から、予測ユニットに最も近い画像を予測画像とする。
また、予測ユニットが属する視点画像が、非基準視点画像であるときは、画面間予測として、動き予測と視差予測とを用いることができる。したがって、その場合、画面間予測部174は、フレームメモリ105が記憶する全ての参照画像(他の視点を基準とした視点画像を含む)の中から、予測ユニットに最も近い画像を予測画像とする。画面間予測部174は、この予測画像と、予測画像への参照情報(動きベクトル(視差ベクトルともいう)と参照画像を指定するインデックス)とを、選択部176に入力する。
画面内予測部175は、入力された予測ユニットの予測画像を、画面内予測を用いて生成する。このとき、画面内予測部175は、予測方向などを示すモードとして、生成した予測画像が、入力された予測ユニットに最も近くなるモードを使用する。画面内予測部175は、生成した予測画像と、該予測画像を生成する際に用いたモードを示す画面内予測モードとを選択部176に入力する。
選択部176は、画面間予測部174及び画面内予測部175が入力した情報に基づき、各ツリーブロックについて、符号化ユニットへの分割回数、各符号化ユニットの予測モード、各符号化ユニットの予測ユニットへの分割方法を選択する。選択方法の詳細は、ここでは省略するが、選択部176には、画面間予測部174と画面内予測部175とから、ツリーブロックから符号化ユニットへの分割の全てのパターンに加えて、予測ユニットへの分割方法の全てのパターンに応じた予測ユニット各々の画面内予測を用いたときの予測画像と、画面間予測を用いたときの予測画像とが入力される。選択部176は、これらを参照することで、例えば、最も符号化効率が高くなるように、ツリーブロックから符号化ユニットへの分割回数、各符号化ユニットの予測モード、各符号化ユニットの予測ユニットへの分割方法(分割モード)を選択することができる。
選択部176は、これらの選択した内容と、該内容に対応した画面内予測モード又は参照情報とを、分割・モード情報として符号化データ生成部108に入力する。また、選択部176は、これらの選択した内容に応じた予測画像を、減算部101及び加算部104に入力する。ここで、予測モードには、画面内予測モード(Mode_INTRA)と、画面間予測モード(Mode_INTER)とがある。画面内予測モードは、その符号化ユニット内の予測ユニット各々の予測画像の生成に画面内予測を用いるモードである。また、画面間予測モードは、その符号化ユニット内の予測ユニット各々の予測画像の生成に画面間予測を用いるモードである。なお、この予測モード各々は、pred_mode_flagの各値に変換される。また、符号化ユニットを予測ユニットへ分割した際の分割方法を示す分割モードは、各々、part_modeの各値に変換される。
図4は、本実施形態に係るツリーブロックから符号化ユニットへの分割を説明する説明図である。この図に示すように、符号化ユニット分割フラグ(split coding unit flag)は、その値が「1」の場合は、ツリーブロックTBが、4つの32画素×32画素のブロックC1〜C4に分割されていることを表している。逆に「0」の場合は、ツリーブロックTBが、そのまま符号化ユニットCU1となることを表している。さらに、ブロックC1〜C4の各々に符号化ユニット分割フラグがある。それらの符号化ユニット分割フラグは、その値が「1」の場合は、そのブロックが、4つの16画素×16画素のブロックC11〜C14に分割されていることを表している。「0」の場合は、そのブロックが、そのまま符号化ユニットCU11となることを表している。
さらに、ブロックC11〜C14の各々に符号化ユニット分割フラグがあり、その値が「1」の場合は、そのブロックが、4つの8画素×8画素の符号化ユニットCU13〜CU16に分割されていることを表している。「0」の場合は、そのブロックが、そのまま符号化ユニットCU12となることを表している。このように、ツリーブロックから符号化ユニットへの分割回数は、符号化ユニット分割フラグを用いて表す。図中の“depth”は分割の深度を表しており、分割されるごとに値が1増加する。選択部176は、選択結果に応じた符号化ユニット分割フラグを、分割・モード情報の一部として、符号化データ生成部108に入力する。
図5は、本実施形態に係るユニット形状記憶部106が記憶する第1のセット及び第2のセットの例を示す図である。この図において、括弧内の数字は、各々のセットにおける分割モードの識別情報を表す。この図において、縦軸は画像の縦(垂直)方向を表し、横軸は画像の横(水平)方向を表す。ここで、横方向は、視差の方向である。また、この図は、符号化ユニットが2N個×2N個の画素から構成される場合を表す。
形状C101〜C108は、第1のセットのユニット形状を表す。第1のセットは、視点画像が基準視点画像であるときに用いることができる形状のセットである。例えば、形状C101(分割モードが「0」)は、つまり、符号化ユニットが分割されない場合(又は0回分割された場合)のものであり、符号化ユニットが予測ユニットとなることを表す。形状C102(分割モード「1」)では、つまり、符号化ユニットが横に分割される結果、(横)2N×(縦)N個の画素から構成される予測ユニットに分割される。以下では、(横)p×(縦)q個の画素から構成される予測ユニットを、p×q予測ユニットとも称する。
形状C201〜C208は、第2のセットのユニット形状を表す。第2のセットは、視点画像が非基準視点画像であるときに用いることができる形状のセットである。形状C201、C203、C207、C208は、それぞれ、形状C101、C103、C107、C108と同じである。
形状C202、C205、C206は、符号化ユニットが縦に3つに分割されることを表す。例えば、形状C202、C205、C206では、符号化ユニットは、(N/2)×2N予測ユニットの2つ、及び、N×2N予測ユニットに分割される。ここで、形状C202(分割モード「1」)では、符号化ユニットの横方向の両端(左右)部分が(N/2)×2N予測ユニットに分割され、横方向の中央部分がN×2N予測ユニットに分割される。分割モードC205(分割モード「4」)では、符号化ユニットの左側部分が(N/2)×2N予測ユニットの2つに分割され、右側部分がN×2N予測ユニットに分割される。分割モードC206(分割モード「5」)では、符号化ユニットの右側部分が(N/2)×2N予測ユニットの2つに分割され、左側部分がN×2N予測ユニットに分割される。分割モードC204は、符号化ユニットが縦に4つに分割されることを表す。例えば、分割モードC202では、符号化ユニットは、(N/2)×2N予測ユニットの4つに分割される。
図5のように、第1のセットのユニット形状には、3つ以上の縦長のブロックに分ける分割が含まれている(形状C202、C204、C205、C206)。例えば、これらのユニット形状は、縦方向と比較して、横方向の分割数が多い。また、第1のセットのユニット形状は、予測ユニットの画素数についての縦横比の総和が、横縦比の総和よりも大きい。例えば、分割モードC202では、縦横比の総和が{2N÷(N/2)}×2+2N÷N=10となり、縦横比の総和が{(N/2)÷2N}×2+N÷2N=1となり、縦横比の総和が、横縦比の総和よりも大きい。
また、図5において、第2のセットのユニット形状(C201〜C208)全体は、第1セットのユニット形状(C101〜C108)全体と比較して、横方向の分割数が多い。すなわち、第2セットにおいて、選択される予測ユニットの形状は、視差予測における視差方向に対して垂直な方向に長い形状の方を、視差方向に長い形状よりも多く含む。
また、図5において、第2のセットのユニット形状(C201〜C208)全体は、第1セットのユニット形状(C101〜C108)全体と比較して、横方向の分割数が多い。すなわち、第2セットにおいて、選択される予測ユニットの形状は、視差予測における視差方向に対して垂直な方向に長い形状の方を、視差方向に長い形状よりも多く含む。
図6は、本実施形態に係る予測ユニットの形状情報と分割の関係を表すテーブルである。なお、表中の“depth”は分割の深度を表している。例えば、「nLR×2N」が表す形状は、64画素×64画素のユニットが、16画素×64画素のユニットと、32画素×64画素のユニットと、16画素×64画素のユニットと、に分割されることを表す。また、「nLR×2N」が表す形状は、32画素×32画素のユニットが、8画素×32画素の予測ユニットと、16画素×32画素の予測ユニットと、8画素×32画素の予測ユニットと、に分割されることを表す。なお、「×」(例えば、8画素×8画素のユニットの場合に「nLR×2N」)は、ユニットを分割しない、つまり、分割として選択できないことを表す。
図7は、本実施形態に係るユニット形状記憶部106が記憶する予測ユニットの形状情報とレイヤ情報、予測モード、分割モード及び画面内分割フラグとの関係を示すテーブルである。このテーブルには、図7の第1のセット及び第2のセットの形状情報の例が含まれている。このテーブルには、レイヤ情報(Layer)、予測モード(PredMode)、分割モード(part_mode)、画面内分割フラグ(IntraSplitFlag)と、形状情報である予測ユニット形状情報(PartMode)が含まれている。ここで、予測ユニット形状情報は、予測ユニットの形状を表す。
例えば、図7は、分割モードが画面間(MODE_INTER)を示すとき、レイヤ情報が基準視点画像を示す場合に、第1のセットからユニット形状が選択されることを表す。また、この図は、分割モードが画面間(MODE_INTER)を示すとき、レイヤ情報が非基準視点画像を示す場合に、第2のセットからユニット形状が選択されることを表す。なお、分割モードが画面間(MODE_INTRA)を示すとき、第3のセット(PartModeが「PART_2N×2N」又は「PART_N×N」)からユニット形状が選択されることを表す。この第3のセットは、画面内予測用のユニット形状である。
例えば、図7は、分割モードが画面間(MODE_INTER)を示すとき、レイヤ情報が基準視点画像を示す場合に、第1のセットからユニット形状が選択されることを表す。また、この図は、分割モードが画面間(MODE_INTER)を示すとき、レイヤ情報が非基準視点画像を示す場合に、第2のセットからユニット形状が選択されることを表す。なお、分割モードが画面間(MODE_INTRA)を示すとき、第3のセット(PartModeが「PART_2N×2N」又は「PART_N×N」)からユニット形状が選択されることを表す。この第3のセットは、画面内予測用のユニット形状である。
図8は、本実施形態に係る符号化ユニットのSyntax表の一例を表す概略図である。この図は、PartMode各々についてのユニット形状を表す。例えば、PartModeが「nLRN×2N」(図5の形状C205)の場合には、符号化ユニットが3つの予測ユニット((x0,y0,log2CbSize)、(x2,y0,log2CbSize)、(x3,y0,log2CbSize))に分割されることを表す。
図9は、本実施形態に係る復号装置2の構成を示す概略ブロック図である。復号装置2は、Nalユニット復号部200、スライス情報復号部201、符号化ユニット情報復号部202、変換ユニット情報復号部203、逆量子化逆変換部204、加算部205、フレームメモリ206、ユニット形状記憶部207、予測ユニット情報復号部21、及び予測画像生成部208を含んで構成される。
Nalユニット復号部200は、Nalユニット復号部200の外部から入力される符号化データを、符号化データ生成部108が行った符号化方法(例えば、可変長符号化)と逆の処理(例えば、可変長復号)であるエントロピー復号する。
図10は、本実施形態に係るNalユニットのSyntax表の一例を表す概略図である。Nalユニット復号部200はこの表に示される情報を復号する。この図において、例えば、「nal_unit_type」には、復号対象の画像が基準視点か非基準視点かを推定できる情報が格納されている。
図9に戻って、Nalユニット復号部200は、復号した情報をスライス情報復号部201に入力する。また、Nalユニット復号部200は、復号したnal_unit_typeから復号対象の画像が基準視点か非基準視点かを示すレイヤ情報を生成し、生成したレイヤ情報を予測ユニット情報復号部21へ出力する。
スライス情報復号部201は、Nalユニット復号部200から入力された情報を復号することでツリーブロック情報を取得し、取得した情報を符号化ユニット情報復号部202に入力する。
図9に戻って、Nalユニット復号部200は、復号した情報をスライス情報復号部201に入力する。また、Nalユニット復号部200は、復号したnal_unit_typeから復号対象の画像が基準視点か非基準視点かを示すレイヤ情報を生成し、生成したレイヤ情報を予測ユニット情報復号部21へ出力する。
スライス情報復号部201は、Nalユニット復号部200から入力された情報を復号することでツリーブロック情報を取得し、取得した情報を符号化ユニット情報復号部202に入力する。
符号化ユニット情報復号部202は、スライス情報復号部201から入力されたツリーブロック情報を復号することで符号化ユニット分割フラグを取得する。符号化ユニット情報復号部202は、ツリーブロック情報と符号化ユニット分割フラグに基づいて、符号化ユニットに関する情報である符号化ユニット情報を取得する。符号化ユニット情報復号部202は、符号化ユニット情報を、変換ユニット情報復号部203と予測ユニット情報復号部21に入力する。
変換ユニット情報復号部203は、符号化ユニット情報復号部202から入力された符号化ユニット情報を復号することで、変換ユニット分割フラグを取得する。変換ユニット情報復号部203は、符号化ユニット情報と変換ユニット分割フラグに基づいて、変換ユニットに関する情報を取得する。例えば、この情報には、量子化係数が含まれている。符号化ユニット情報復号部202は、取得した情報を、逆量子化逆変換部204に入力する。
変換ユニット情報復号部203は、符号化ユニット情報復号部202から入力された符号化ユニット情報を復号することで、変換ユニット分割フラグを取得する。変換ユニット情報復号部203は、符号化ユニット情報と変換ユニット分割フラグに基づいて、変換ユニットに関する情報を取得する。例えば、この情報には、量子化係数が含まれている。符号化ユニット情報復号部202は、取得した情報を、逆量子化逆変換部204に入力する。
逆量子化逆変換部204は、変換ユニット情報復号部203から入力された情報から量子化係数を取得する。逆量子化逆変換部204は、取得した量子化係数に対して、変換量子化部102で行った量子化と逆の処理(逆量子化)をして逆量子化係数を生成する。逆量子化逆変換部204は、生成した逆量子化係数を変換量子化部102における直交変換とは逆の変換処理、例えば逆DCT変換して復号差分画像を生成する。逆量子化逆変換部204は、生成した復号差分画像を加算部205に入力する。
加算部205は、予測画像生成部208が入力した予測画像と、逆量子化逆変換部204が入力した復号差分画像とを加算する。加算部205は、この加算により、入力された視点画像を生成する。この視点画像は、復号装置2の外部(例えば、表示部D11)へ出力され、また、参照画像としてフレームメモリ206に入力される。フレームメモリ206は、加算部205が入力した参照画像を記憶する。
ユニット形状記憶部207は、ユニット形状記憶部106と同じ情報を記憶する(例えば、図6、図7参照)。具体的には、ユニット形状記憶部207は、予測画像生成部208が予測画像を生成する際の単位である予測ユニットの形状として用いることができる情報を記憶している。本実施形態におけるユニット形状記憶部207は、視点画像が基準視点画像であるときに用いることができる形状のセットである第1のセットと、視点画像が非基準視点画像であるときに用いることができる形状のセットである第2のセットとを記憶する。本実施形態では、ユニット形状記憶部207は、後述する符号化ユニットを予測ユニットに分割する分割モードを記憶することで、予測ユニットの形状を記憶している。
予測ユニット情報復号部21は、Nalユニット復号部200から入力したレイヤ情報と、符号化ユニット情報復号部202から入力した情報に含まれる符号化ユニット情報と、ユニット形状記憶部207が記憶する情報と、に基づいて、符号化ユニット内の各予測ユニットに関する予測情報を取得する。予測ユニット情報復号部21は、取得した予測情報を、予測画像生成部208に入力する。
予測画像生成部208は、予測ユニット情報復号部21から入力された予測情報に基づいて、予測ユニット毎に予測画像を生成する。予測画像生成部208は、生成した予測画像を加算部205に入力する。
予測画像生成部208は、予測ユニット情報復号部21から入力された予測情報に基づいて、予測ユニット毎に予測画像を生成する。予測画像生成部208は、生成した予測画像を加算部205に入力する。
図11は、本実施形態に係る予測ユニット情報復号部21の構成を示す概略ブロック図である。予測ユニット情報復号部21は、予測モード復号部210、分割モード復号部211、予測ユニットサイズ決定部212、及び予測情報復号部213を含んで構成される。
予測モード復号部210は、入力された符号化ユニット情報から予測モードを取得する。具体的には、予測モード復号部210は、符号化ユニット情報からpred_mode_flagを復号し、PredModeを決定する。例えば、予測モード復号部210は、pred_mode_flag=0の場合にPredMode=MODE_INTRA(画面内予測モード)とし、pred_mode_flag=1の場合にPredMode=MODE_INTER(画面間予測モード)とする。予測モード復号部210は、取得した予測モードを示す情報(PredMode)を、予測ユニットサイズ決定部212に入力する。
分割モード復号部211は、入力された符号化ユニット情報から分割モードを取得する。具体的には、分割モード復号部211は、符号化ユニット情報を復号し、part_modeを取得する。分割モード復号部211は、取得した分割モードを示す情報(part_mode)を予測ユニットサイズ決定部212に入力する。
予測ユニットサイズ決定部212は、ユニット形状記憶部207が記憶する情報、予測モード復号部210から入力された情報(PredMode)、分割モード復号部211から入力された情報(part_mode)、及び、入力されたレイヤ情報(Layer)に基づいて、符号化ユニット内の予測ユニット各々のサイズを表す予測ユニットサイズ情報(PartMode)を取得する。なお、予測ユニットサイズ情報は、予測ユニットの位置を表す情報を含んでもよい。予測ユニットサイズ決定部212は、取得した予測ユニットサイズ情報を、予測情報復号部213に入力する。
予測ユニットサイズ決定部212は、ユニット形状記憶部207が記憶する情報、予測モード復号部210から入力された情報(PredMode)、分割モード復号部211から入力された情報(part_mode)、及び、入力されたレイヤ情報(Layer)に基づいて、符号化ユニット内の予測ユニット各々のサイズを表す予測ユニットサイズ情報(PartMode)を取得する。なお、予測ユニットサイズ情報は、予測ユニットの位置を表す情報を含んでもよい。予測ユニットサイズ決定部212は、取得した予測ユニットサイズ情報を、予測情報復号部213に入力する。
予測情報復号部213は、入力された符号化ユニット情報、及び、予測ユニットサイズ決定部212から入力された予測ユニットサイズ情報に基づいて、予測ユニット毎の参照情報とユニットのサイズを示す予測情報を取得する。
図12は、本実施形態に係る予測ユニット情報復号部21の動作の一例を示すフローチャートである。
予測ユニット情報復号部21には、レイヤ情報が入力され(ステップS101)、符号化ユニット情報が入力される(ステップS102)。予測ユニット情報復号部21は、予測モードを復号し(ステップS103)、分割モードを復号する(ステップS104)。
予測ユニット情報復号部21には、レイヤ情報が入力され(ステップS101)、符号化ユニット情報が入力される(ステップS102)。予測ユニット情報復号部21は、予測モードを復号し(ステップS103)、分割モードを復号する(ステップS104)。
予測ユニット情報復号部21は、ステップS103で復号した予測モードが画面内予測モード(PredMode=MODE_INTRA)であるか否かを判定する(ステップS105)。予測モードが画面内予測モードでない場合(NO)、つまり、予測モードが画面間予測モード(MODE_INTER)である場合、予測ユニット情報復号部21は、画面内予測用のユニット形状のセット(第3のセット)を選択する(ステップS106)。一方、予測モードが画面内予測モードである場合(YES)、予測ユニット情報復号部21は、レイヤ情報が非基準視点画像(Layer=Non−base_View)であるか否かを判定する(ステップS107)。
レイヤ情報が非基準視点画像である場合(YES)、予測ユニット情報復号部21は、非基準視点画像用のユニット形状のセット(第2のセット)を選択する(ステップS108)。一方、レイヤ情報が非基準視点画像でない場合(NO)、つまり、レイヤ情報が基準視点画像である場合、予測ユニット情報復号部21は、非基準視点画像用のユニット形状のセット(第2のセット)を選択する(ステップS109)。
予測ユニット情報復号部21は、ステップS106、S108、S109のいずれかで選択されたセットを示す情報に基づいて、予測ユニット毎の予測情報を復号する(ステップS110)。
このように、本実施形態によれば、符号化装置1及び復号装置2は、予測ユニット各々の形状を、予め決められた複数の形状の中から選択し、画像とは異なる視点を基準とした画像を参照して予測画像を生成する予測方法である視差予測を少なくとも含む複数の予測方法の中から選択した予測方法を用いて、該予測ユニットの予測画像を生成する。ここで、予め決められた複数の形状は、前記視差予測における視差方向に対して垂直な方向に長い形状の方を、視差方向に長い形状よりも多く含む。
これにより、符号化装置1及び復号装置2は、符号量の増大を防止できる。例えば、水平視差が顕著に表れるのは縦エッジがある領域である場合がある。つまり、エッジ等が表れる方向が水平と垂直で均等でない場合がある。本実施形態では、符号化装置1及び復号装置2は、上記の予測ユニットの形状によって、小さな符号化ユニットに分割しなくても、エッジを検出できる。すなわち、本実施形態では、符号化装置1及び復号装置2は、ツリーブロックを多数の符号化ユニットに分割することを防止でき、符号化装置1及び復号装置2は、符号化ユニットに付随する情報(例えば、符号化モードや予測ユニット、変換ユニットへの分割方法を示す情報)が増えることを防止でき、符号量が増大することを防止できる。
これにより、符号化装置1及び復号装置2は、符号量の増大を防止できる。例えば、水平視差が顕著に表れるのは縦エッジがある領域である場合がある。つまり、エッジ等が表れる方向が水平と垂直で均等でない場合がある。本実施形態では、符号化装置1及び復号装置2は、上記の予測ユニットの形状によって、小さな符号化ユニットに分割しなくても、エッジを検出できる。すなわち、本実施形態では、符号化装置1及び復号装置2は、ツリーブロックを多数の符号化ユニットに分割することを防止でき、符号化装置1及び復号装置2は、符号化ユニットに付随する情報(例えば、符号化モードや予測ユニット、変換ユニットへの分割方法を示す情報)が増えることを防止でき、符号量が増大することを防止できる。
(第2実施形態)
以下、図面を参照しながら本発明の第2実施形態について詳しく説明する。本実施形態に係る符号化装置及び復号装置の構成は、第1の実施形態と同じであるため、説明は省略する。
以下、図面を参照しながら本発明の第2実施形態について詳しく説明する。本実施形態に係る符号化装置及び復号装置の構成は、第1の実施形態と同じであるため、説明は省略する。
図13は、本発明の第2実施形態に係るユニット形状記憶部106が記憶する第1のセット及び第2のセットの例を示す図である。この図において、括弧内の数字は、各々のセットにおける分割モードの識別情報を表す。この図において、縦軸は画像の縦(垂直)方向を表し、横軸は画像の横(水平)方向を表す。ここで、横方向は、視差の方向である。また、この図は、符号化ユニットが2N個×2N個の画素から構成される場合を表す。この図において、図5と同じ符号を付したユニット形状は、第1の実施形態のものと同じであるので、説明は省略する。
形状C101〜C108は、第1のセットのユニット形状を表す。形状C201、302、C203、C304〜C306、C207、C208は、第2のセットのユニット形状を表す。第2のセットは、視点画像が非基準視点画像であるときに用いることができる形状のセットである。
図13では、第2セットにおいて、選択される予測ユニットの形状は、視差予測における視差方向に対して垂直な方向に長い形状の方を、視差方向に長い形状よりも多く含む。
図13では、第2セットにおいて、選択される予測ユニットの形状は、視差予測における視差方向に対して垂直な方向に長い形状の方を、視差方向に長い形状よりも多く含む。
図14は、本実施形態に係る予測ユニットの形状情報と分割の関係を表すテーブルである。例えば、「n/2L×2N」が表す形状は、64画素×64画素のユニットが、8画素×64画素のユニットと、56画素×64画素のユニットに分割されることを表す。また、「n/2L×2N」が表す形状は、32画素×32画素のユニットが、4画素×32画素の予測ユニットと、28画素×32画素の予測ユニットに分割されることを表す。なお、「×」(例えば、16画素×16画素のユニットの場合に「n/2L×2N」)は、ユニットを分割しない、つまり、分割として選択できないことを表す。
図15は、本実施形態に係るユニット形状記憶部106が記憶する予測ユニットの形状情報とレイヤ情報、予測モード、分割モード及び画面内分割フラグとの関係を示すテーブルである。このテーブルは、図13の第1のセット及び第2のセットの形状情報の例が含まれている。このテーブルには、レイヤ情報(Layer)、予測モード(PredMode)、分割モード(part_mode)、画面内分割フラグ(IntraSplitFlag)、予測ユニット形状情報(PartMode)が含まれている。
(第3実施形態)
以下、図面を参照しながら本発明の第3実施形態について詳しく説明する。本実施形態に係る符号化装置及び復号装置の構成は、第1の実施形態と同じであるため、説明は省略する。
以下、図面を参照しながら本発明の第3実施形態について詳しく説明する。本実施形態に係る符号化装置及び復号装置の構成は、第1の実施形態と同じであるため、説明は省略する。
図16は、本発明の第3実施形態に係るユニット形状記憶部106が記憶する第1のセット及び第2のセットの例を示す図である。この図において、括弧内の数字は、各々のセットにおける分割モードの識別情報を表す。この図において、縦軸は画像の縦(垂直)方向を表し、横軸は画像の横(水平)方向を表す。ここで、横方向は、視差の方向である。また、この図は、符号化ユニットが2N個×2N個の画素から構成される場合を表す。この図において、図5と同じ符号を付したユニット形状は、第1の実施形態のものと同じであるので、説明は省略する。
形状C101〜C108、及び、形状C202、C204〜C206、C302〜C304〜C306は、第2のセットのユニット形状を表す。第2のセットは、視点画像が非基準視点画像であるときに用いることができる形状のセットである。
図16の第2のセットは、第1のセットにユニット形状が追加されたものである。
図16では、第2セットにおいて、選択される予測ユニットの形状は、視差予測における視差方向に対して垂直な方向に長い形状の方を、視差方向に長い形状よりも多く含む。
図16の第2のセットは、第1のセットにユニット形状が追加されたものである。
図16では、第2セットにおいて、選択される予測ユニットの形状は、視差予測における視差方向に対して垂直な方向に長い形状の方を、視差方向に長い形状よりも多く含む。
図17は、本実施形態に係るユニット形状記憶部106が記憶する予測ユニットの形状情報とレイヤ情報、予測モード、分割モード及び画面内分割フラグとの関係を示すテーブルである。このテーブルには、図13の第1のセット及び第2のセットの例が含まれている。このテーブルには、形状情報は、レイヤ情報(Layer)、予測モード(PredMode)、分割モード(part_mode)、画面内分割フラグ(IntraSplitFlag)、予測ユニット形状情報(PartMode)が含まれている。ここで、予測ユニット形状情報は、予測ユニットの形状を表す。
(第4実施形態)
以下、図面を参照しながら本発明の第4実施形態について詳しく説明する。本実施形態に係る符号化装置及び復号装置の構成は、第1の実施形態と同じであるため、説明は省略する。
以下、図面を参照しながら本発明の第4実施形態について詳しく説明する。本実施形態に係る符号化装置及び復号装置の構成は、第1の実施形態と同じであるため、説明は省略する。
図18は、本発明の第4実施形態に係るユニット形状記憶部106が記憶する第2のセットの例を示す図である。なお、第1のセットの例は、図5のものと同じである。この図において、括弧内の数字は、各々のセットにおける分割モードの識別情報を表す。なお、本実施形態では、分割モードは、2種類(part_modeとpart_sub_mode)ある。
この図において、縦軸は画像の縦(垂直)方向を表し、横軸は画像の横(水平)方向を表す。ここで、横方向は、視差の方向である。また、この図は、符号化ユニットが2N個×2N個の画素から構成される場合を表す。この図において、図5と同じ符号を付したユニット形状は、第1の実施形態のものと同じであるので、説明は省略する。図18では、第2セットにおいて、選択される予測ユニットの形状は、視差予測における視差方向に対して垂直な方向に長い形状の方を、視差方向に長い形状よりも多く含む。
この図において、縦軸は画像の縦(垂直)方向を表し、横軸は画像の横(水平)方向を表す。ここで、横方向は、視差の方向である。また、この図は、符号化ユニットが2N個×2N個の画素から構成される場合を表す。この図において、図5と同じ符号を付したユニット形状は、第1の実施形態のものと同じであるので、説明は省略する。図18では、第2セットにおいて、選択される予測ユニットの形状は、視差予測における視差方向に対して垂直な方向に長い形状の方を、視差方向に長い形状よりも多く含む。
図19は、本実施形態に係るユニット形状記憶部106が記憶する予測ユニットの形状情報とレイヤ情報、予測モード、分割モード及び画面内分割フラグとの関係を示すテーブルである。このテーブルには、図5の第1のセット及び図18の第2のセットの例が含まれている。このテーブルには、レイヤ情報(Layer)、予測モード(PredMode)、分割モード(part_mode)、下位分割モード(part_sub_mode)、画面内分割フラグ(IntraSplitFlag)、予測ユニット形状情報(PartMode及びPartSubMode)が含まれている。
分割モード「6」、「7」は、下位分割モードを有する。形状C501〜C504は、分割モード「6」の場合のユニット形状を表す。形状C511〜C514は、分割モード「7」の場合のユニット形状を表す。このように、分割モードは、階層化されていてもよい。また、分割モードは、グループ化されていてもよい。
分割モード「6」、「7」は、下位分割モードを有する。形状C501〜C504は、分割モード「6」の場合のユニット形状を表す。形状C511〜C514は、分割モード「7」の場合のユニット形状を表す。このように、分割モードは、階層化されていてもよい。また、分割モードは、グループ化されていてもよい。
図20は、本実施形態に係る符号化ユニットのSyntax表の一例を表す概略図である。図20は、PartMode及びPartSubMode各々についてのユニット形状を表す。このSyntax表は、PartModeが「PART_Left」又は「PART_Right」の場合に、PrttSubModeに応じたユニット形状があることを表す。例えば、PartModeが「PART_Left」のとき、PrttSubModeが「PART_nL×2N」の場合には、符号化ユニットが2つの予測ユニット((x0,y0,log2CbSize)、(x2,y0,log2CbSize))に分割されることを表す。
(第5実施形態)
以下、図面を参照しながら本発明の第5実施形態について詳しく説明する。本実施形態に係る符号化装置及び復号装置の構成は、第1の実施形態と同じであるため、説明は省略する。なお、本実施形態では、視差があるのは縦方向又は横方向のいずれかである。
以下、図面を参照しながら本発明の第5実施形態について詳しく説明する。本実施形態に係る符号化装置及び復号装置の構成は、第1の実施形態と同じであるため、説明は省略する。なお、本実施形態では、視差があるのは縦方向又は横方向のいずれかである。
図21は、本発明の第5実施形態に係るユニット形状記憶部106が記憶する第2のセットの例を示す図である。なお、第1のセットの例は、図5のものと同じである。この図において、括弧内の数字は、各々のセットにおける分割モードの識別情報を表す。なお、本実施形態では、カメラの配置を示す配置情報(水平又は垂直)に応じて、分割モードがある。なお、配置情報は、視差方向を示すものであっても良い。
この図において、縦軸は画像の縦方向を表し、横軸は画像の横方向を表す。この図は、符号化ユニットが2N個×2N個の画素から構成される場合を表す。
この図において、縦軸は画像の縦方向を表し、横軸は画像の横方向を表す。この図は、符号化ユニットが2N個×2N個の画素から構成される場合を表す。
形状C601〜C608は、配置情報が水平を示す場合のユニット形状(水平用ユニット形状とも称する)を表す。ユニット形状は、縦方向に長い形状の方を、横方向に長い形状よりも多く含む。一方、形状C701〜C708は、配置情報が垂直を示す場合のユニット形状を表す。ユニット形状は、横方向に長い形状の方を、縦方向に長い形状よりも多く含む。図21では、第2セットにおいて、選択される予測ユニットの形状は、視差予測における視差方向に対して垂直な方向に長い形状の方を、視差方向に長い形状よりも多く含む。
図22は、本実施形態に係るユニット形状記憶部106が記憶する予測ユニットの形状情報とレイヤ情報、予測モード、分割モード及び画面内分割フラグとの関係を示すテーブルである。このテーブルには、図21の第2のセットの例が含まれている。このテーブルには、配置情報(Camera arrengement)、レイヤ情報(Layer)、予測モード(PredMode)、分割モード(part_mode)、画面内分割フラグ(IntraSplitFlag)、予測ユニット形状情報(PartMode)が含まれている。
例えば、図22は、配置情報が「Horizontal」(水平)を示し、分割モードが画面間(MODE_INTER)を示し、レイヤ情報が基準視点画像を示すとき、分割モードが「4」を示す場合には、PartModeが「PART_n/2L×2L」が選択されることを表す。
例えば、図22は、配置情報が「Horizontal」(水平)を示し、分割モードが画面間(MODE_INTER)を示し、レイヤ情報が基準視点画像を示すとき、分割モードが「4」を示す場合には、PartModeが「PART_n/2L×2L」が選択されることを表す。
(第6実施形態)
以下、図面を参照しながら本発明の第6実施形態について詳しく説明する。
図23は、本発明の第6実施形態に係る符号化装置1aの構成を示す概略ブロック図である。符号化装置1a(図23)と符号化装置1(図2)とを比較すると、符号化装置1aは、符号化装置1のユニット形状記憶部106及び予測画像生成部107に代えてユニット形状記憶部106a及び予測画像生成部107aを備える点が異なる。
以下、図面を参照しながら本発明の第6実施形態について詳しく説明する。
図23は、本発明の第6実施形態に係る符号化装置1aの構成を示す概略ブロック図である。符号化装置1a(図23)と符号化装置1(図2)とを比較すると、符号化装置1aは、符号化装置1のユニット形状記憶部106及び予測画像生成部107に代えてユニット形状記憶部106a及び予測画像生成部107aを備える点が異なる。
ユニット形状記憶部106aは、符号化ユニットの形状として用いることができる情報を記憶している。
予測画像生成部107aは、符号化情報設定部100が入力した視点画像を、符号化ユニット(本実施形態では予測ユニットと同じ)に分割し、フレームメモリ105が記憶している参照画像を参照して、予測ユニット毎に予測画像を生成する。予測画像生成部107aは、生成した予測画像を減算部101及び加算部104に入力する。予測画像生成部107aの詳細は、後述する。
予測画像生成部107aは、符号化情報設定部100が入力した視点画像を、符号化ユニット(本実施形態では予測ユニットと同じ)に分割し、フレームメモリ105が記憶している参照画像を参照して、予測ユニット毎に予測画像を生成する。予測画像生成部107aは、生成した予測画像を減算部101及び加算部104に入力する。予測画像生成部107aの詳細は、後述する。
図24は、本実施形態に係る予測画像生成部107aの構成を示す概略ブロック図である。予測画像生成部107a(図24)と予測画像生成部107(図3)とを比較すると、予測画像生成部107aは、予測画像生成部107の符号化ユニット分割部172及び予測ユニット分割部173に代えて符号化ユニット分割部172a及び予測ユニット分割部173aを備える点が異なる。しかし、他の構成要素が持つ機能は、予測画像生成部107の構成要素と同じであるので、説明は省略する。
符号化ユニット分割部172aは、ツリーブロックを、符号化ユニットに分割する。ここで、符号化ユニット分割部172aは、レイヤ情報及びユニット形状記憶部106aが記憶する符号化ユニットの形状に基づいて、符号化ユニットに分割する。この符号化ユニットの形状には、4分割以外の形状が含まれている。例えば、符号化ユニットの形状には、正方形以外の形状が含まれている。符号化ユニット分割部172aは、分割した符号化ユニットを、予測ユニット分割部173に入力する。
予測ユニット分割部173aは、入力された符号化ユニットを予測ユニットとする。つまり、予測ユニット分割部173aは、符号化ユニットから予測ユニットへの分割は行わない。すなわち、小さいサイズの予測ユニットを取得させる場合には、符号化ユニット分割部172aが、そのサイズの符号化ユニットを生成することとなる。ただし、本発明はこれに限らず、符号化ユニットから予測ユニットへの分割を行っても良い。
予測ユニット分割部173aは、入力された符号化ユニットを予測ユニットとする。つまり、予測ユニット分割部173aは、符号化ユニットから予測ユニットへの分割は行わない。すなわち、小さいサイズの予測ユニットを取得させる場合には、符号化ユニット分割部172aが、そのサイズの符号化ユニットを生成することとなる。ただし、本発明はこれに限らず、符号化ユニットから予測ユニットへの分割を行っても良い。
図25は、本実施形態に係るツリーブロックから符号化ユニットへの分割の例を説明する説明図である。この図は、レイヤ情報が非基準視点画像を示す場合の分割を説明する説明図である。なお、図において、括弧内の数字は、分割モード(split mode)を表す。
この図に示すように、分割モード(split mode)は、その値が「3」の場合は、ツリーブロックTBが、4つの32画素×32画素のブロックC1〜C4に分割されていることを表している。逆に「0」の場合は、ツリーブロックTBが、そのまま符号化ユニットCU1となることを表している。さらに、ブロックC1〜C4の各々に符号化ユニット分割フラグがある。それらの符号化ユニット分割フラグは、その値が「2」の場合は、そのブロックが、2つの16画素×32画素のブロックC21、C22に分割されていることを表している。「0」の場合は、そのブロックが、そのまま符号化ユニットCU11となることを表している。
このように、符号化ユニットへの分割では、4分割以外の形状が含まれている。例えば、分割モードが「4」の分割の場合、形状SC25のように、横にのみ分割される。またこの場合、異なる大きさに分割される。なお、上記の符号化ユニットへの分割において、分割が2分割の場合を示したが、本発明はこれに限らず、3分割や5分割以上であってもよい。
なお、レイヤ情報が基準視点画像を示す場合には、図4に示すように、4分割のみを用いてツリーブロックを符号化ユニットへ分割する。
この図に示すように、分割モード(split mode)は、その値が「3」の場合は、ツリーブロックTBが、4つの32画素×32画素のブロックC1〜C4に分割されていることを表している。逆に「0」の場合は、ツリーブロックTBが、そのまま符号化ユニットCU1となることを表している。さらに、ブロックC1〜C4の各々に符号化ユニット分割フラグがある。それらの符号化ユニット分割フラグは、その値が「2」の場合は、そのブロックが、2つの16画素×32画素のブロックC21、C22に分割されていることを表している。「0」の場合は、そのブロックが、そのまま符号化ユニットCU11となることを表している。
このように、符号化ユニットへの分割では、4分割以外の形状が含まれている。例えば、分割モードが「4」の分割の場合、形状SC25のように、横にのみ分割される。またこの場合、異なる大きさに分割される。なお、上記の符号化ユニットへの分割において、分割が2分割の場合を示したが、本発明はこれに限らず、3分割や5分割以上であってもよい。
なお、レイヤ情報が基準視点画像を示す場合には、図4に示すように、4分割のみを用いてツリーブロックを符号化ユニットへ分割する。
図26は、本実施形態に係るユニット形状記憶部106が記憶する符号化ユニットの形状情報とレイヤ情報、予測モード、分割モード及び画面内分割フラグとの関係を示すテーブルである。このテーブルには、符号化ユニット分割フラグ(split coding unit flag)、分割モード(split mode)、符号化ユニット形状情報(PartMode)が含まれている。ここで、符号化ユニット形状情報は、符号化ユニットの形状を表す。
図27は、本実施形態に係る復号装置2aの構成を示す概略ブロック図である。復号装置2a(図27)と復号装置2(図9)とを比較すると、Nalユニット復号部200a、符号化ユニット情報復号部202a、変換ユニット情報復号部203a、ユニット形状記憶部207a、予測ユニット情報復号部21a、及び選択部22aが異なる。しかし、他の構成要素が持つ機能は、復号装置2の構成要素と同じであるので、説明は省略する。
Nalユニット復号部200aは、Nalユニット復号部200aの外部から入力される符号化データを、符号化データ生成部108が行った符号化方法(例えば、可変長符号化)と逆の処理(例えば、可変長復号)であるエントロピー復号する。Nalユニット復号部200aは、復号した情報をスライス情報復号部201に入力する。また、Nalユニット復号部200aは、復号した情報からレイヤ情報を生成し、生成したレイヤ情報を符号化ユニット情報復号部202aと選択部22aへ出力する。
ユニット形状記憶部207aは、ユニット形状記憶部106aと同じ情報を記憶する(例えば、図26参照)。具体的には、ユニット形状記憶部207aは、符号化ユニットの形状として用いることができる情報を記憶している。
符号化ユニット情報復号部202aは、スライス情報復号部201から入力された情報を、ユニット形状記憶部207aが記憶する情報に基づいて復号することで、符号化ユニットに関する情報を取得する。符号化ユニット情報復号部202aは、取得した情報を、選択部22aと予測ユニット情報復号部21aに入力する。
符号化ユニット情報復号部202aは、スライス情報復号部201から入力された情報を、ユニット形状記憶部207aが記憶する情報に基づいて復号することで、符号化ユニットに関する情報を取得する。符号化ユニット情報復号部202aは、取得した情報を、選択部22aと予測ユニット情報復号部21aに入力する。
選択部22aは、Nalユニット復号部200aから入力されたレイヤ情報に基づいて、変換ユニット情報復号部203aに入力する情報を選択する。具体的には、レイヤ情報が非基準視点画像を示す場合に、選択部22aは、スライス情報復号部201からツリーブロックに関する情報(ツリーブロック情報と称する)を取得し、変換ユニット情報復号部203aに入力する。一方、レイヤ情報が基準視点画像を示す場合に、選択部22aは、符号化ユニット情報復号部202aから符号化ユニットに関する情報を取得し、変換ユニット情報復号部203aに入力する。
変換ユニット情報復号部203aは、選択部22aから入力された情報を復号することで、変換ユニットに関する情報を取得する。例えば、変換ユニット情報復号部203aは、ユニット形状記憶部207aが記憶する情報に基づいて、正方形でない符号化ユニットがあるか否かを判定する。変換ユニット情報復号部203aは、この判定結果に基づいて、ツリーブロックから変換ユニットへの分割を行うようにしてもよい。符号化ユニット情報復号部202は、取得した情報を、逆量子化逆変換部205に入力する。
予測ユニット情報復号部21aは、入力された情報から予測ユニットに関する情報を取得し、取得した情報を予測画像生成部208に入力する。
予測ユニット情報復号部21aは、入力された情報から予測ユニットに関する情報を取得し、取得した情報を予測画像生成部208に入力する。
図28は、本実施形態に係るツリーブロックから変換ユニットへの分割を説明する説明図である。この図に示すように、変換分割フラグ(split transform unit flag)は、その値が「1」の場合は、ツリーブロックTBが、4つの32画素×32画素のブロックT1〜T4に分割されていることを表している。逆に「0」の場合は、ツリーブロックTBが、そのまま変換ユニットTU1となることを表している。さらに、ブロックT1〜T4の各々に変換分割フラグがある。それらの変換分割フラグは、その値が「1」の場合は、そのブロックが、4つの16画素×16画素のブロックT21〜T24に分割されていることを表している。「0」の場合は、そのブロックが、そのまま変換ユニットTU11となることを表している。
なお、図28において、変換ユニットへの分割は、符号化ユニット単位ではなく、ツリーブロック単位で行われている。例えば、レイヤ情報が非基準視点の場合に、図28の分割が行われる。また、正方形でない符号化ユニットがある場合にのみ、図28の分割を行うようにしてもよい。
なお、図28において、変換ユニットへの分割は、符号化ユニット単位ではなく、ツリーブロック単位で行われている。例えば、レイヤ情報が非基準視点の場合に、図28の分割が行われる。また、正方形でない符号化ユニットがある場合にのみ、図28の分割を行うようにしてもよい。
図29は、本実施形態に係る符号化ユニット情報復号部202aの構成を示す概略ブロック図である。符号化ユニット情報復号部202aは、選択部221a、分割フラグ復号部222a、分割モード復号部223a、及び、符号化ユニットサイズ決定部224aを含んで構成される。
選択部221aは、スライス情報復号部201からツリーブロック情報を取得する。選択部221aは、取得した情報を、Nalユニット復号部200aから入力されたレイヤ情報に基づいて、分割フラグ復号部222a又は分割モード復号部223aのいずれかに入力する。具体的には、レイヤ情報が基準視点画像を示す場合に、選択部221aは、取得した情報を、分割フラグ復号部222aに入力する。一方、レイヤ情報が非基準視点画像を示す場合に、選択部221aは、取得した情報を、分割モード復号部223aに入力する。
分割フラグ復号部222aは、入力されたツリーブロック情報を復号することで、符号化ユニット分割フラグを取得する。分割フラグ復号部222aは、取得した符号化ユニット分割フラグを、符号化ユニットサイズ決定部224aに入力する。
分割モード復号部223aは、入力されたツリーブロック情報を復号することで、分割モードを取得する。分割モード復号部223aは、取得した分割モードを、符号化ユニットサイズ決定部224aに入力する。
分割モード復号部223aは、入力されたツリーブロック情報を復号することで、分割モードを取得する。分割モード復号部223aは、取得した分割モードを、符号化ユニットサイズ決定部224aに入力する。
ツリーブロック分割部224aは、ユニット形状記憶部207aが記憶する情報と、分割フラグ復号部222aから入力された符号化ユニット分割フラグ又は分割モード復号部223aから入力された分割モードと、に基づいて、符号化ユニット各々のサイズを表すCUサイズ情報を取得する。なお、CUサイズ情報は、符号化ユニットの位置も表す情報を含んでいてもよい。符号化ユニットサイズ決定部224aは、取得したCUサイズ情報に基づいて、ツリーブロック情報を符号化ユニット情報に分割する。符号化ユニットサイズ決定部224aは、分割した符号化ユニット情報を出力する。
図30は、本実施形態に係る符号化ユニット情報復号部202aの動作の一例を示すフローチャートである。
符号化ユニット情報復号部202aには、レイヤ情報が入力され(ステップS201)、ツリーブロック情報が入力される(ステップS202)。符号化ユニット情報復号部202aは、ステップS201で入力されたレイヤ情報が非基準視点画像(Layer=Non−base_View)であるか否かを判定する(ステップS203)。
符号化ユニット情報復号部202aには、レイヤ情報が入力され(ステップS201)、ツリーブロック情報が入力される(ステップS202)。符号化ユニット情報復号部202aは、ステップS201で入力されたレイヤ情報が非基準視点画像(Layer=Non−base_View)であるか否かを判定する(ステップS203)。
レイヤ情報が非基準視点画像である場合(YES)、符号化ユニット情報復号部202aは、分割モードを復号する(ステップS204)。一方、レイヤ情報が非基準視点画像でない場合(NO)、つまり、レイヤ情報が基準視点画像である場合、符号化ユニット情報復号部202aは、符号化ユニット分割フラグを復号する(ステップS205)。
符号化ユニット情報復号部202aは、分割モード又は符号化ユニット分割フラグに基づいてツリーブロック情報を分割する(ステップS206)。
符号化ユニット情報復号部202aは、分割モード又は符号化ユニット分割フラグに基づいてツリーブロック情報を分割する(ステップS206)。
図31は、本実施形態に係るツリーブロックの分割情報を示す符号化ツリー(Coding Tree)のSyntax表の一例を表す概略図である。図31は、PartMode各々についての符号化ユニットの形状を表す。このSyntax表は、PartModeが「PART_N×N」のとき、ツリーブロック又は符号化ユニットが4つの符号化ユニット((x0,y0,・・・)、(x1,y0,・・・)、(x0,y1,・・・)、(x1,y1,・・・))に分割されることを表す。
このように、本実施形態によれば、符号化装置1a及び復号装置2aは、符号化ユニットを縦長や横長の形状に分割でき、正方形以外の形状に分割できる。
図32は、本実施形態の効果の一例を説明する説明図である。この図において、ツリーブロックTB1は、符号化ブロックへの分割を、正方形の形状のみで行った場合のものである。一方、ツリーブロックTB2は、符号化ブロックへの分割を、正方形以外の形状でも行った場合のものである。例えば、ツリーブロックの左側の1/4の領域がオクルージョン領域であり、この領域をイントラ予測を用いて符号化したい場合を考える。正方形の形状のみで分割を行う場合、ツリーブロックTB1に示すように、複数回分割しなければならない。一方、正方形以外の形状でも分割を行う場合、ツリーブロックTB2に示すように、1回の分割で符号化ブロックを得ることができる。これにより、符号化装置1及び復号装置2は、ツリーブロックを多数の符号化ユニットに分割することを防止でき、符号化ユニットに付随する情報が増えることを防止でき、符号量が増大することを防止できる。
図32は、本実施形態の効果の一例を説明する説明図である。この図において、ツリーブロックTB1は、符号化ブロックへの分割を、正方形の形状のみで行った場合のものである。一方、ツリーブロックTB2は、符号化ブロックへの分割を、正方形以外の形状でも行った場合のものである。例えば、ツリーブロックの左側の1/4の領域がオクルージョン領域であり、この領域をイントラ予測を用いて符号化したい場合を考える。正方形の形状のみで分割を行う場合、ツリーブロックTB1に示すように、複数回分割しなければならない。一方、正方形以外の形状でも分割を行う場合、ツリーブロックTB2に示すように、1回の分割で符号化ブロックを得ることができる。これにより、符号化装置1及び復号装置2は、ツリーブロックを多数の符号化ユニットに分割することを防止でき、符号化ユニットに付随する情報が増えることを防止でき、符号量が増大することを防止できる。
なお、上述した実施形態における符号化装置1及び復号装置2の一部をコンピュータで実現するようにしても良い。その場合、この制御機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現しても良い。なお、ここでいう「コンピュータシステム」とは、符号化装置1又は復号装置2に内蔵されたコンピュータシステムであって、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでも良い。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
また、上述した実施形態における符号化装置1及び復号装置2の一部、又は全部を、LSI(Large Scale Integration)等の集積回路として実現しても良い。符号化装置1及び復号装置2の各機能ブロックは個別にプロセッサ化してもよいし、一部、又は全部を集積してプロセッサ化しても良い。また、集積回路化の手法はLSIに限らず専用回路、又は汎用プロセッサで実現しても良い。また、半導体技術の進歩によりLSIに代替する集積回路化の技術が出現した場合、当該技術による集積回路を用いても良い。
また、上述した実施形態における符号化装置1及び復号装置2の一部、又は全部を、LSI(Large Scale Integration)等の集積回路として実現しても良い。符号化装置1及び復号装置2の各機能ブロックは個別にプロセッサ化してもよいし、一部、又は全部を集積してプロセッサ化しても良い。また、集積回路化の手法はLSIに限らず専用回路、又は汎用プロセッサで実現しても良い。また、半導体技術の進歩によりLSIに代替する集積回路化の技術が出現した場合、当該技術による集積回路を用いても良い。
以上、図面を参照してこの発明の一実施形態について詳しく説明してきたが、具体的な構成は上述のものに限られることはなく、この発明の要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。
1、1a・・・符号化装置、2、2a・・・復号装置、D1・・・表示装置、D11・・・表示部、100・・・符号化情報設定部、101・・・減算部、102・・・変換量子化部、103・・・逆量子化逆変換部、104・・・加算部、105・・・フレームメモリ、106、106a・・・ユニット形状記憶部、107、107a・・・予測画像生成部、108・・・符号化データ生成部、171・・・ツリーブロック分割部、172、172a・・・符号化ユニット分割部、173、173a・・・予測ユニット分割部、174・・・画面間予測部、175・・・画面内予測部、176・・・選択部、200、200a・・・Nalユニット復号部、201・・・スライス情報復号部、202、202a・・・符号化ユニット情報復号部、203・・・変換ユニット情報復号部、204・・・逆量子化逆変換部、205・・・加算部、206・・・フレームメモリ、207、207a・・・ユニット形状記憶部、21、21a・・・予測ユニット情報復号部、208・・・予測画像生成部、22a・・・選択部、221a・・・選択部、222a・・・分割フラグ復号部、223a・・・分割モード復号部、224a・・・符号化ユニットサイズ決定部
Claims (14)
- 画像を予測ユニットに分割し、前記予測ユニット毎に予測画像を生成して前記画像を符号化する画像符号化装置であって、
前記予測ユニット各々の形状を、予め決められた複数の形状の中から選択し、前記画像とは異なる視点を基準とした画像を参照して予測画像を生成する予測方法である視差予測を少なくとも含む複数の予測方法の中から選択した予測方法を用いて、該予測ユニットの予測画像を生成する予測画像生成部
を備え、
前記予め決められた複数の形状は、前記視差予測における視差方向に対して垂直な方向に長い形状の方を、前記視差方向に長い形状よりも多く含むこと
を特徴とする画像符号化装置。 - 前記予測ユニットの形状として用いることのできる形状のセットである、第1のセットと第2のセットとを記憶するユニット形状記憶部と、
前記画像が、視差予測を用いることのできない基準視点画像であるか、視差予測を用いることができる非基準視点画像であるかを判定する判定部と
を備え、
前記予測画像生成部は、前記判定部の判定結果に応じて、前記ユニット形状記憶部が記憶するセットのうち一つを選択し、前記予め決められた複数の形状として用い、
前記判定部が非基準視点画像であると判定したときに選択されるセットである前記第2のセットが、前記視差予測における視差方向に対して垂直な方向に長い形状の方を、前記視差方向に長い形状よりも多く含むこと
を特徴とする請求項1に記載の画像符号化装置。 - 前記第1のセットは、前記判定部が基準視点画像であると判定したときに選択されるセットであり、
前記第2のセットは、前記第1のセットのうちの一部を、前記視差予測における視差方向に対して垂直な方向に長い形状に入れ換えたものであること
を特徴とする請求項2に記載の画像符号化装置。 - 前記第1のセットは、前記判定部が基準視点画像であると判定したときに選択されるセットであり、
前記第2のセットは、前記第1のセットに、前記視差予測における視差方向に対して垂直な方向に長い形状を追加したものであること
を特徴とする請求項2に記載の画像符号化装置。 - 前記第2のセットのうち一部は、前記視差方向に対して垂直な方向に長い形状となるように、前記視差方向に応じて向きを変更すること
を特徴とする請求項2に記載の画像符号化装置。 - 予測ユニット毎に予測画像を生成して画像を復号する画像復号装置であって、
前記予測ユニット各々の形状を、予め決められた複数の形状の中から選択し、前記画像とは異なる視点を基準とした画像を参照して予測画像を生成する予測方法である視差予測を少なくとも含む複数の予測方法の中から選択した予測方法を用いて、該予測ユニットの予測画像を生成する予測画像生成部
を備え、
前記予め決められた複数の形状は、前記視差予測における視差方向に対して垂直な方向に長い形状の方を、前記視差方向に長い形状よりも多く含むこと
を特徴とする画像復号装置。 - 前記予測ユニットの形状として用いることのできる形状のセットである、第1のセットと第2のセットとを記憶するユニット形状記憶部と、
前記画像が、視差予測を用いることのできない基準視点画像であるか、視差予測を用いることができる非基準視点画像であるかを判定する判定部と
を備え、
前記予測画像生成部は、前記判定部の判定結果に応じて、前記ユニット形状記憶部が記憶するセットのうち一つを選択し、前記予め決められた複数の形状として用い、
前記判定部が非基準視点画像であると判定したときに選択されるセットである前記第2のセットが、前記視差予測における視差方向に対して垂直な方向に長い形状の方を、前記視差方向に長い形状よりも多く含むこと
を特徴とする請求項6に記載の画像復号装置。 - 前記第1のセットは、前記判定部が基準視点画像であると判定したときに選択されるセットであり、
前記第2のセットは、前記第1のセットのうちの一部を、前記視差予測における視差方向に対して垂直な方向に長い形状に入れ換えたものであること
を特徴とする請求項7に記載の画像復号装置。 - 前記第1のセットは、前記判定部が基準視点画像であると判定したときに選択されるセットであり、
前記第2のセットは、前記第1のセットに、前記視差予測における視差方向に対して垂直な方向に長い形状を追加したものであること
を特徴とする請求項7に記載の画像復号装置。 - 前記第2のセットのうち一部は、前記視差方向に対して垂直な方向に長い形状となるように、前記視差方向に応じて向きを変更すること
を特徴とする請求項7に記載の画像復号装置。 - 画像を予測ユニットに分割し、前記予測ユニット毎に予測画像を生成して前記画像を符号化する画像符号化装置における画像符号化方法であって、
前記予測ユニット各々の形状を、予め決められた複数の形状の中から選択し、前記画像とは異なる視点を基準とした画像を参照して予測画像を生成する予測方法である視差予測を少なくとも含む複数の予測方法の中から選択した予測方法を用いて、該予測ユニットの予測画像を生成する予測画像生成過程
を有し、
前記予め決められた複数の形状は、前記視差予測における視差方向に対して垂直な方向に長い形状の方を、前記視差方向に長い形状よりも多く含むこと
を特徴とする画像符号化方法。 - 予測ユニット毎に予測画像を生成して画像を復号する画像復号装置における画像復号方法であって、
前記予測ユニット各々の形状を、予め決められた複数の形状の中から選択し、前記画像とは異なる視点を基準とした画像を参照して予測画像を生成する予測方法である視差予測を少なくとも含む複数の予測方法の中から選択した予測方法を用いて、該予測ユニットの予測画像を生成する予測画像生成過程
を有し、
前記予め決められた複数の形状は、前記視差予測における視差方向に対して垂直な方向に長い形状の方を、前記視差方向に長い形状よりも多く含むこと
を特徴とする画像復号方法。 - 画像を予測ユニットに分割し、前記予測ユニット毎に予測画像を生成して前記画像を符号化する画像符号化装置のコンピュータに、
前記予測ユニット各々の形状を、予め決められた複数の形状の中から選択し、前記画像とは異なる視点を基準とした画像を参照して予測画像を生成する予測方法である視差予測を少なくとも含む複数の予測方法の中から選択した予測方法を用いて、該予測ユニットの予測画像を生成する予測画像生成手順
を実行させ、
前記予め決められた複数の形状は、前記視差予測における視差方向に対して垂直な方向に長い形状の方を、前記視差方向に長い形状よりも多く含む画像符号化プログラム。 - 予測ユニット毎に予測画像を生成して画像を復号する画像復号装置のコンピュータに、
前記予測ユニット各々の形状を、予め決められた複数の形状の中から選択し、前記画像とは異なる視点を基準とした画像を参照して予測画像を生成する予測方法である視差予測を少なくとも含む複数の予測方法の中から選択した予測方法を用いて、該予測ユニットの予測画像を生成する予測画像生成手段
を有し、
前記予め決められた複数の形状は、前記視差予測における視差方向に対して垂直な方向に長い形状の方を、前記視差方向に長い形状よりも多く含む画像復号プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012099118A JP2013229674A (ja) | 2012-04-24 | 2012-04-24 | 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法、画像符号化プログラム、及び画像復号プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012099118A JP2013229674A (ja) | 2012-04-24 | 2012-04-24 | 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法、画像符号化プログラム、及び画像復号プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2013229674A true JP2013229674A (ja) | 2013-11-07 |
Family
ID=49676932
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012099118A Pending JP2013229674A (ja) | 2012-04-24 | 2012-04-24 | 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法、画像符号化プログラム、及び画像復号プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2013229674A (ja) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015098827A1 (ja) * | 2013-12-27 | 2015-07-02 | 日本電信電話株式会社 | 映像符号化方法、映像復号方法、映像符号化装置、映像復号装置、映像符号化プログラム及び映像復号プログラム |
CN105934949A (zh) * | 2013-12-03 | 2016-09-07 | 日本电信电话株式会社 | 视频编码装置和方法、视频解码装置和方法、以及它们的程序 |
CN108464001A (zh) * | 2016-01-15 | 2018-08-28 | 高通股份有限公司 | 用于视频译码的多类型树框架 |
KR20190044629A (ko) * | 2016-09-07 | 2019-04-30 | 퀄컴 인코포레이티드 | 비디오 코딩을 위한 트리-타입 코딩 |
JPWO2018092870A1 (ja) * | 2016-11-21 | 2019-10-17 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法 |
JP2019536314A (ja) * | 2017-07-17 | 2019-12-12 | キム、ギベクKim, Ki Baek | 画像データ符号化/復号化方法及び装置 |
JP2020504506A (ja) * | 2017-01-06 | 2020-02-06 | クアルコム,インコーポレイテッド | ビデオコーディングのためのマルチタイプツリーフレームワーク |
US11350091B2 (en) | 2016-11-21 | 2022-05-31 | Panasonic Intellectual Property Corporation Of America | Encoder, decoder, encoding method, and decoding method |
US11399176B2 (en) | 2016-11-21 | 2022-07-26 | Panasonic Intellectual Property Corporation Of America | Encoder, decoder, encoding method, and decoding method |
US11412137B2 (en) | 2016-10-04 | 2022-08-09 | B1 Institute Of Image Technology, Inc. | Image data encoding/decoding method and apparatus |
-
2012
- 2012-04-24 JP JP2012099118A patent/JP2013229674A/ja active Pending
Cited By (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105934949A (zh) * | 2013-12-03 | 2016-09-07 | 日本电信电话株式会社 | 视频编码装置和方法、视频解码装置和方法、以及它们的程序 |
CN105830443A (zh) * | 2013-12-27 | 2016-08-03 | 日本电信电话株式会社 | 视频编码方法、视频解码方法、视频编码装置、视频解码装置、视频编码程序以及视频解码程序 |
JPWO2015098827A1 (ja) * | 2013-12-27 | 2017-03-23 | 日本電信電話株式会社 | 映像符号化方法、映像復号方法、映像符号化装置、映像復号装置、映像符号化プログラム及び映像復号プログラム |
WO2015098827A1 (ja) * | 2013-12-27 | 2015-07-02 | 日本電信電話株式会社 | 映像符号化方法、映像復号方法、映像符号化装置、映像復号装置、映像符号化プログラム及び映像復号プログラム |
JP7163183B2 (ja) | 2016-01-15 | 2022-10-31 | クゥアルコム・インコーポレイテッド | ビデオコード化のためのマルチタイプツリーフレームワーク |
CN108464001A (zh) * | 2016-01-15 | 2018-08-28 | 高通股份有限公司 | 用于视频译码的多类型树框架 |
JP2019506071A (ja) * | 2016-01-15 | 2019-02-28 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | ビデオコード化のためのマルチタイプツリーフレームワーク |
KR20190044629A (ko) * | 2016-09-07 | 2019-04-30 | 퀄컴 인코포레이티드 | 비디오 코딩을 위한 트리-타입 코딩 |
US11743508B2 (en) | 2016-09-07 | 2023-08-29 | Qualcomm Incorporated | Tree-type coding for video coding |
JP2019530316A (ja) * | 2016-09-07 | 2019-10-17 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | ビデオコード化のためのツリータイプコード化 |
KR102515487B1 (ko) | 2016-09-07 | 2023-03-28 | 퀄컴 인코포레이티드 | 비디오 코딩을 위한 트리-타입 코딩 |
JP7218287B2 (ja) | 2016-09-07 | 2023-02-06 | クゥアルコム・インコーポレイテッド | ビデオコード化のためのツリータイプコード化 |
US11533429B2 (en) | 2016-10-04 | 2022-12-20 | B1 Institute Of Image Technology, Inc. | Image data encoding/decoding method and apparatus |
US11706531B2 (en) | 2016-10-04 | 2023-07-18 | B1 Institute Of Image Technology, Inc. | Image data encoding/decoding method and apparatus |
US11412137B2 (en) | 2016-10-04 | 2022-08-09 | B1 Institute Of Image Technology, Inc. | Image data encoding/decoding method and apparatus |
US11910094B2 (en) | 2016-10-04 | 2024-02-20 | B1 Institute Of Image Technology, Inc. | Image data encoding/decoding method and apparatus |
US11843866B2 (en) | 2016-10-04 | 2023-12-12 | B1 Institute Of Image Technology, Inc. | Image data encoding/decoding method and apparatus |
US11539883B2 (en) | 2016-10-04 | 2022-12-27 | B1 Institute Of Image Technology, Inc. | Image data encoding/decoding method and apparatus |
US11539881B2 (en) | 2016-10-04 | 2022-12-27 | B1 Institute Of Image Technology, Inc. | Image data encoding/decoding method and apparatus |
US11546513B2 (en) | 2016-10-04 | 2023-01-03 | B1 Institute Of Image Technology, Inc. | Image data encoding/decoding method and apparatus |
US11792526B1 (en) | 2016-10-04 | 2023-10-17 | B1 Institute Of Image Technology, Inc. | Image data encoding/decoding method and apparatus |
US11792525B2 (en) | 2016-10-04 | 2023-10-17 | B1 Institute Of Image Technology, Inc. | Image data encoding/decoding method and apparatus |
US11606499B2 (en) | 2016-10-04 | 2023-03-14 | B1 Institute Of Image Technology, Inc. | Image data encoding/decoding method and apparatus |
US11736693B2 (en) | 2016-11-21 | 2023-08-22 | Panasonic Intellectual Property Corporation Of America | Encoder, decoder, encoding method, and decoding method |
US11399176B2 (en) | 2016-11-21 | 2022-07-26 | Panasonic Intellectual Property Corporation Of America | Encoder, decoder, encoding method, and decoding method |
JPWO2018092870A1 (ja) * | 2016-11-21 | 2019-10-17 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法 |
JP2021093766A (ja) * | 2016-11-21 | 2021-06-17 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 画像符号化装置及び画像復号装置 |
US11889078B2 (en) | 2016-11-21 | 2024-01-30 | Panasonic Intellectual Property Corporation Of America | Encoder, decoder, encoding method, and decoding method |
US11350091B2 (en) | 2016-11-21 | 2022-05-31 | Panasonic Intellectual Property Corporation Of America | Encoder, decoder, encoding method, and decoding method |
JP2020504506A (ja) * | 2017-01-06 | 2020-02-06 | クアルコム,インコーポレイテッド | ビデオコーディングのためのマルチタイプツリーフレームワーク |
JP2019536314A (ja) * | 2017-07-17 | 2019-12-12 | キム、ギベクKim, Ki Baek | 画像データ符号化/復号化方法及び装置 |
JP7224280B2 (ja) | 2017-07-17 | 2023-02-17 | ビー1、インスティテュート、オブ、イメージ、テクノロジー、インコーポレイテッド | 画像データ符号化/復号化方法及び装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112585966B (zh) | 以基于历史的运动向量为基础的帧间预测方法及其装置 | |
US20230037902A1 (en) | Video data stream, video encoder, apparatus and methods for hrd timing fixes, and further additions for scalable and mergeable bitstreams | |
JP2013229674A (ja) | 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法、画像符号化プログラム、及び画像復号プログラム | |
CN112823521B (zh) | 使用基于历史的运动信息的图像编码方法及其装置 | |
JP2020092457A (ja) | 画像予測方法および装置 | |
JP6591424B2 (ja) | Hevcマルチレイヤ拡張における非hevcベースレイヤのサポート | |
CN110800303A (zh) | 用于360度视频译码的参考图片推导及运动补偿 | |
CN117857785A (zh) | 图像解码和编码方法、数据的发送方法及存储介质 | |
JP2017517185A (ja) | マルチレイヤコーディングにおける適合ウィンドウ情報 | |
US9681126B2 (en) | Motion vector coding apparatus, method and program for coding motion vector, motion vector decoding apparatus, and method and program for decoding motion vector | |
US11563937B2 (en) | Method and apparatus for processing image signal | |
CN112913233B (zh) | 基于hmvp构造预测候选的方法和设备 | |
US11606566B2 (en) | Method for processing image on basis of inter-prediction mode and apparatus therefor | |
JP2017507539A (ja) | マルチレイヤコーディングにおいて回復点補足エンハンスメント情報(sei)メッセージと領域リフレッシュ情報seiメッセージとをコーディングするための方法 | |
JP6312838B2 (ja) | マルチレイヤコード化においてレイヤ間参照ピクチャセット(RPS)をコード化し、ビットストリーム終端(EoB)ネットワークアクセスレイヤ(NAL)単位をコード化するための方法 | |
CN114556931B (zh) | 基于调色板模式的图像或视频编码 | |
CN111373753A (zh) | 变换因子级别编码方法及其装置 | |
JP5281623B2 (ja) | 画像符号化方法,画像復号方法,画像符号化装置,画像復号装置およびそれらのプログラム | |
KR101360279B1 (ko) | 매크로블록 단위의 변이 예측을 이용한 움직임 정보 공유방법 및 장치 및 그리고 이를 이용한 다시점 비디오 영상부호화/복호화 방법 및 장치 | |
US20230239563A1 (en) | Transform-based image coding method and device therefor | |
CN114556933A (zh) | 基于调色板转义编码的图像或视频编码 | |
US9219926B2 (en) | Image encoding apparatus, image encoding method and program, image decoding apparatus, image decoding method and program | |
CN111869211B (zh) | 图像编码装置和方法 | |
KR20200004348A (ko) | 타겟 영역 수정을 통해 비디오 신호를 처리하는 방법 및 장치 | |
US9769481B2 (en) | Method and apparatus for encoding of video using depth information |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20150514 |