JP4475643B2 - 画像符号化装置及び方法 - Google Patents

画像符号化装置及び方法 Download PDF

Info

Publication number
JP4475643B2
JP4475643B2 JP2004191462A JP2004191462A JP4475643B2 JP 4475643 B2 JP4475643 B2 JP 4475643B2 JP 2004191462 A JP2004191462 A JP 2004191462A JP 2004191462 A JP2004191462 A JP 2004191462A JP 4475643 B2 JP4475643 B2 JP 4475643B2
Authority
JP
Japan
Prior art keywords
image
encoding
region
blocks
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2004191462A
Other languages
English (en)
Other versions
JP2006014174A (ja
Inventor
充 前田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2004191462A priority Critical patent/JP4475643B2/ja
Publication of JP2006014174A publication Critical patent/JP2006014174A/ja
Application granted granted Critical
Publication of JP4475643B2 publication Critical patent/JP4475643B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、全方位画像、特に複数の平面領域画像により構成される全方位画像を符号化するための技術に関する。
近年、特殊な光学レンズを使用したり、複数のカメラを使用したりして全方位の画像データを取得し、任意視点の画像や臨場感の高い画像を提供することが提案されている。
例えば、全方位ビデオを取得するカメラとして、特許文献1(特開2001−298652号公報)の図1に全天球カメラが開示されており、特許文献2(米国特許5,023,725号公報)には正十二面体の各面に配置されたカメラを用いる撮影システムが開示されている。
しかしながら、全方位ビデオはその撮影面積が大きくなることから符号化による情報の圧縮が不可欠である。従来の符号化方式として、特許文献1においては、その図5、図6に示されるように、矩形でない領域を矩形に補間し、矩形符号化であるJPEGやMPEG符号化方式で符号化する方式が開示されている。
さらには、非特許文献1(波部,山澤,野村,松山「多面体モデルを用いた全方位ビデオの圧縮」(2003年画像符号化シンポジウム(PCSJ2003)−4.01,pp.57-58))に記載されているように、球面状に撮影される全方位ビデオを正20面体モデルに投影し、正20面体を構成する平面三角形状領域をMPEG−4の任意形状オブジェクト符号化を利用して符号化することも開示されている。また、非特許文献1においては、正20面体を構成する三角形領域を複数集めて矩形状となるよう変換し(57ページ図1(d))、矩形符号化により符号化することも示されている。
特開2001−298652号公報 米国特許5,023,725号公報 波部,山澤,野村,松山、「多面体モデルを用いた全方位ビデオの圧縮」(2003年画像符号化シンポジウム(PCSJ2003) P−4.01,pp57-58)
しかしながら、特許文献1記載の方式では画像の補間が行われるため、本来の画像データに歪みが生じてしまうことになる。また、特許文献1は矩形の符号化方式を適用するため、正5角形で構成されるような画像を直接符号化することができなかった。また、非特許文献1においては、任意形状オブジェクト符号化に際し、境界を含んだマクロブロックの領域外画素部分に補填する画素について領域内画素値の複写で行っており、実際の画像のつながりについては留意していないため、全方位画像を構成した場合に継ぎ目が目立つ虞がある。
従って、本発明はこのような課題を考慮して、画像に補間などの加工を施すことなく、また継ぎ目を目立たせることなく、全方位画像を効率よく符号化する画像符号化装置及び方法を提供することを目的とする。
上述の目的は、複数の平面画像が多面体を構成してなる全方位画像を入力する画像入力手段と、全方位画像を平面に展開した有効領域を含んだ展開画像を生成する展開手段と、展開画像を複数のブロックに分割するブロック形成手段と、複数のブロックのうち、有効領域の境界を含むブロックの、有効領域以外の領域の画素を、有効領域で多面体を構成した場合に隣接する領域内の画素により補填する補填手段と、複数のブロックを符号化して符号化データを生成する符号化手段と、符号化データを出力する出力手段を有することを特徴とする画像符号化装置によって達成される。
また、上述の目的は、複数の平面画像が多面体を構成してなる全方位画像を入力する画像入力工程と、全方位画像を平面に展開した有効領域を含んだ展開画像を生成する展開工程と、展開画像を複数のブロックに分割するブロック形成工程と、複数のブロックのうち、有効領域の境界を含むブロックの、有効領域以外の領域の画素を、有効領域で多面体を構成した場合に隣接する領域内の画素により補填する補填工程と、複数のブロックを符号化して符号化データを生成する符号化工程と、符号化データを出力する出力工程を有することを特徴とする画像符号化方法によっても達成される。
また、上述の目的は、本発明の画像符号化方法の各工程を実行させるためのプログラム、及びこのプログラムを記録したコンピュータ読み取り可能な記録媒体によっても達成される。
このような構成により、本発明によれば、全方位画像をつなぎ目に関して自然にかつ効率よく符号化することが可能になる。
以下、図面を参照して本発明のその好適な実施形態に基づき詳細に説明する。
●〈第1の実施形態〉
(符号化装置)
図1は本発明の第1の実施形態に係る画像符号化装置の構成例を示すブロック図である。
図1において、1―1から1−12は画像を撮像するカメラであり、個々のカメラは正十二面体を構成する正五角形領域の1つを含む矩形領域を撮像するように配置、構成されている。つまり、12台のカメラが撮像する画像から、正十二面体状の全方位画像を構成することができる。このようなカメラ及びその配置方法については任意であるが、例えば米国特許5,023,725号に記載される方法を用いて実現することができる。また、本実施形態に係る符号化装置においてこれらカメラは必須でなく、予め撮影して記憶しておいた画像を用いても良い。
なお、第1の実施形態では、画像符号化装置およびその符号化データを復号する画像復号化装置の両方において、全方位画像の構成がわかっているものとする。すなわち、全方位画像を構成するぞれぞれの正五角形の形状と大きさ及び位置関係についての情報が予め画像符号化装置及び画像復号化装置に設定されているものとする。
画像合成器2は、全方位画像を構成する個々の画像(単位画像)を1枚の画像にまとめる。フレームメモリ3は合成された画像を蓄積する。メモリ制御器4はフレームメモリ3の書き込み、読み出しを画素単位で制御する。領域フレームメモリ5は画像の有効領域を表す形状情報を蓄積する。ブロック形成器6は領域フレームメモリ5からブロック単位で画素を読み出す。領域判定器7はブロック形成器6で形成されたブロックにおける有効領域の状態を判定する。8、9はセレクタであり、入出力を領域判定器7の出力に基づいて切換える。画素補填器10については後述する。
符号化器11は生成されたブロックを符号化する。ここでは説明を簡単にするため、MPEG―4符号化方式のテクスチャ符号化を例にとって説明するが、他の符号化方式を利用することも可能である。また、説明を容易にするため、イントラ符号化のみを使用するものとする。領域符号化器12は有効領域の形状情報を符号化する。多重化器13は符号化器11と領域符号化器12の出力を多重化し、必要なヘッダを付加して符号化データを生成する。制御部100は、画像符号化装置の構成要素を制御し、符号化処理を実現する。
このように構成された画像符号化装置における符号化動作を以下で説明する。
カメラ1−1〜1−12は矩形の画像情報を撮像し、そこから予め設定された正五角形の領域画像(単位画像)を切り出して画像合成器2に入力する。画像合成器2は各カメラから入力された正五角形状の画像を正十二面体を展開した画像として合成する。この際の各領域画像の大きさ、合成の位置関係は予め決められている。図2にその合成の様子を示す。カメラ1−1〜1−12から入力された画像を201−1〜201−12とすると、合成した画像は画像200のようになる。位置関係としては予め図2の画面201−3を頂面とし、画面201−10が底面とし、画面201−5と画面201−7の接線の中心を正面の点と定義しておく。合成された画像はフレームメモリ3に蓄積される。なお、フレームメモリ3は処理を開始する際に全ての値を0にリセットされている。
また、画像合成器2は領域画像を生成する。画像200において、画像201−1〜201−12の画素で構成される部分(有効領域)と、それ以外の部分を分離して、領域画像を生成する。図3はこの領域画像を表した図である。領域画像202において白で示される部分が画像201−1〜201−12の画素で合成される部分(有効領域内)、残りの黒で示される部分が有効領域外を表している。生成された領域画像は領域フレームメモリ5に格納される。
ブロック形成器6はメモリ制御器4の指示に従って、フレームメモリ3に記憶される画像データから、MPEG−4符号化方式の符号化単位であるマクロブロック(例えば縦横16画素)を切り出し、領域判定器7及びセレクタ8に出力する。
領域判定器7は領域フレームメモリ5に蓄積された領域画像202と、ブロック形成器6からのマクロブロックとから、マクロブロックが完全に有効領域外(以下、単に領域外という)、完全に有効領域内(以下、単に領域内という)、境界を含むの何れの状態であるかを判定する。ここでは説明のため、完全に領域外であれば0を、完全に領域内であれば1を、境界を含む場合を2を、それぞれ判定結果としてメモリ制御器4、セレクタ8、9、画素補填器10及び符号化器11に出力する。
セレクタ8、9は領域判定器7の出力が0(領域外)であれば全く動作せず、1(領域内)であればセレクタ8の出力がセレクタ9に直接入力されるように動作する。領域判定器7の出力が2(境界を含む)であるとき、セレクタ8の出力先とセレクタ9の入力先が画素補填器10となるように動作する。
画素補填器10は、マクロブロック内に有効領域の境界が存在する場合に動作する。画素補填器10はセレクタ8からブロック形成器6が出力したマクロブロックを入力する。入力されたマクロブロックでは、領域外の画素には0が入っている。
一方、メモリ制御器4は領域判定器7からの出力を受けて、境界を含むマクロブロックにおける領域外の部分に対応する画素データをフレームメモリ3から読み出し、画素補填器10に入力する。ここで、補填に用いられる画素は、全方位画像を構成した際に隣接する領域から読み出される。つまり、本実施形態では、図2に示す展開状態の合成画像から正十二面体の全方位画像を構成したときに隣接する画素群から選択される。図4は、補填が必要なマクロブロックが存在すると考えられる境界部の画素群(灰色の領域(小文字)で示されている)と、補填に用いる画素を取得する領域(境界部の画素群の外側に隣接して示した領域(大文字で示される))の位置関係を示した図である。図において、大文字で示される領域(有効領域外)の画素群は対応する小文字で示される領域(有効領域内)の画素群から補填される。すなわち、Aの領域はaの領域から補填される。同様に、B〜Z、Δ、Φ、Γ、Ψ、Λ、Σ、Π、Μ、Ξ、Ν、Τの領域はb〜z、δ、φ、γ、ψ、λ、σ、π、μ、ξ、η、τの領域から補填される。
符号化器11は入力されたマクロブロックに対して、MPEG−4符号化のテクスチャ符号化を行う。すなわち、入力されたマクロブロックをブロックに分割して、DCT変換を施し、その係数を量子化し、ハフマン符号を用いて符号化する。符号化されたデータは多重化器13に入力される。また、領域符号化器12でもMPEG−4符号化の形状符号化が行われ、多重化器13に入力される。多重化器13は必要なヘッダを付加して、MPEG−4符号化方式の書式に整えて、出力する。
次に、符号化の処理の簡単な流れを説明する。
図5は、第1実施形態に係る画像符号化装置における符号化処理を示すフローチャートである。
まずステップS1にて、制御部100は、MPEG−4符号化方式に準拠したヘッダを生成して出力する。この時、従来のMPEG−4形状オブジェクト符号化方式と区別するため、プロファイルまたはオブジェクトを新たに定義したものとする。例えば、プロファイルで識別する場合はMPEG−4ビジュアルオブジェクトビットストリームのVOS階層におけるprofile_and_level_indicaion符号やvideo_object_type符号について予備とされていた値を使用し、オブジェクトで識別する場合はvisual_object_type符号について予備とされていた値を使用する。
ステップS2にて、制御部100は、全てのフレームの処理が終了したか否かの終了判定を行う。全てのフレームの処理が終了したと判断された場合は、動作を終了する。そうでなければステップS3に進む。
ステップS3にて、各カメラが出力するビデオ画像(正五角形)を画像合成部2へ入力する。
ステップS4にて、画像合成部2が、入力された各単位画像を予め決められた位置関係で合成し、符号化画像(図2の画像200)を生成する。
ステップS5にて、フレーム(VOP:Video Object Plane)の符号化データのヘッダデータを生成して出力する。
ステップS6にて、制御部100は、フレーム内の全てのブロックについて処理が終了したか否かの終了判定を行う。全てのブロックの処理が終了したと判断された場合は、ステップS2に進み、次のフレームの処理を行う。そうでなければステップS7に進む。
ステップS7にて、フレーム画像から所定サイズのブロックデータ(この場合はマクロブロックである)を切り出す。
ステップS8にて、領域判定部7は、領域画像202を用い、切出したブロックが領域の外か否かを判定する。領域の外と判断された場合は、ステップS9に進み、そうでなければステップS10に進む。
ステップS9にて、領域符号化器12は、形状符号化の符号化モードを表すデータとして、領域外(透明)を表すBAB(Binary Alpha Block) Typeの値「2」を符号化して出力し、次のブロックの処理を行うため、ステップS6に戻る。
ステップS10にて、ブロックに領域の境界が含まれるか否かを判定し、含まれる場合はステップS12に進み、そうでなければステップS11に進む。
ステップS11にて、領域内(不透明)を表すBAB Typeの値「3」を符号化して出力し、切出されたブロックを符号化するためにステップS15に進む。
ステップS12にて、領域符号化器12は、符号化モードとして画面内CAE符号化(Intra CAE)を表すBAB Typeの値「4」を符号化し、その境界の形状を算術符号化して出力する。
ステップS13にて、画素補填器10は、図4に示す位置関係に基づき、境界を含むマクロブロックの領域外画素に補填する画素の位置をフレームメモリ上のアドレスとして計算する。
ステップS14にて、画素補填器10は、ステップS13にて計算されたアドレスに従って、補填に用いる画素を読み込み、領域外画素として補填する。
ステップS15にて、符号化器11は、領域内のマクロブロック又は境界を含むマクロブロック(画素補填済み)の画素をDCT変換と量子化とエントロピー符号化によるテクスチャ符号化して出力して、次のブロックの処理を行うためにステップS6に進む。
このようにして、全方位画像の符号化データを得ることができる。
(復号化装置)
図6は本発明の第1の実施形態に係る画像復号化装置の構成例を示すブロック図である。
図6において、分離器601は図1における多重化器13の逆の動作を行い、符号化データストリームのヘッダを解析して、テクスチャ符号化データと形状符号化データとを分離して出力する。領域復号器602は形状符号化データを復号してマクロブロックが領域内のブロック、領域外のブロック、境界を含むブロックであるかを判別し、境界を含むブロックの場合には境界の形状を復号して、領域フレームメモリ603に蓄積する。復号器604は領域復号器602の判別結果を用いてテクスチャ符号化データを復号し、復号結果をフレームメモリ605に蓄積する。
画像分離器606は画像合成器2の逆の動作を行い、合成画像(展開画像)から予め決められた合成の位置関係と大きさに基づいて単位画像を分割し、フレームメモリ607−1〜607−12の対応する位置に格納する。視線指示器608は例えばジョイスティックなどで構成され、全方位画像の中から表示する方向を指示し、レンダラ609はその視線方向と所定の視野(もしくは表示画素数)とから、表示に必要な単位画像を判別し、対応するフレームメモリから単位画像を読み出し、合成してディスプレイ610に表示する。制御部600は、画像復号化装置の各構成要素を制御し、復号化処理を実現させる。
次に、復号化処理の簡単な流れを説明する。
図16は、第1実施形態に係る画像復号化装置における復号化処理を示すフローチャートである。
まずステップS1601にて、制御部600は、MPEG−4ビデオオブジェクトビットストリームとして与えられる符号化データのヘッダを解析して、装置内の初期化を行う。
ステップS1602にて、制御部600は、全てのフレームの処理が終了したか否かの終了判定を行う。全てのフレームの処理が終了したと判断された場合は、動作を終了する。そうでなければステップS1603に進む。
ステップS1603にて、制御部600は、フレーム単位の符号化データを分離部601へ入力する。
ステップS1604にて、分離部601は、フレームごとのヘッダを復号・解析する。
ステップS1605にて、分離部601は、フレーム内の全マクロブロックの処理が終了したか否かの終了判定を行う。全てのマクロブロックの処理が終了したと判断された場合は、ステップS1611に進む。そうでなければステップS1606に進む。
ステップS1606にて、領域復号器602は、形状符号化の符号化モードを表すBAB Typeの符号化データを復号して、その値から復号化対象のマクロブロックが領域外か、領域内か、境界を含むかを判定する。
ステップS1607にて、ステップS1606の復号結果が領域外(BAB Typeの値が2)であるか否かを判定し、値が2であれば、ステップS1605に進み、次のマクロブロックの処理を行う。そうでなければステップS1608に進む。
ステップS1608にて、ステップS1606の復号結果が領域内(BAB Typeの値が3)であるか否かを判定し、値が3であれば、ステップS1610に進み、そうでなければステップS1609に進む。
ステップS1609にて、領域復号器602は境界の形状を復号して領域画像を得て、領域フレームメモリ603に格納する。
ステップS1610にて、復号器604はテクスチャ符号化を復号して画素値を得て、フレームメモリ605に格納する。
ステップS1611にて、画像分離器606は、領域フレームメモリ603に格納された領域画像と、復号器604が復号した画素値とを用いて合成画像(図2、200)を得、さらに12個の正五角形状の単位画像に分離して、全方位画像構成時に占める位置が同じ単位画像が同じフレームメモリに格納されるようにフレームメモリ607−1〜607−12へ格納する。
ステップS1612にて、レンダラ609は、視線指示器608から指示された視線に対応する表示画像を生成するために必要な単位画像をフレームメモリ607−1〜607−12から読み出す。予め図2の画面201−3を頂面とし、画面201−10が底面とし、画面201−5と画面201−7の接線の中心を正面の点と定義しておく。その位置関係から視線の方向を計算して読み出しを行い、合成し、ディスプレイ610の表示領域に合わせてレンダリングし、ディスプレイ610に表示する。その後、次のフレームの処理を行うため、ステップS1602に戻る。
以上説明したように、本実施形態に係る画像符号化装置においては、多面体で表される全方位画像を構成する複数の単位画像を平面に展開し、展開画像をブロック単位で符号化するとともに、境界を含むブロックに対しては全方位画像を構成した際に隣接する領域の画素を補填して符号化を行う。そのため、従来のMPEG−4符号化におけるパディングとは異なり、実際に隣接する領域の画像データを補填するためつなぎが自然になるといった効果がある。また、画像と異なる画素データを補填して符号化するのに比べ、領域内の画像と相関が高い隣接領域の画像データを補填するため、符号化効率の改善が見込まれる。
なお、本実施形態においては、領域符号化器をマクロブロックごとに動作させて形状符号化を行ったが、同一位置のマクロブロックにおける有効領域形状は常に同じであるため、1度符号化した結果をマクロブロック毎にバッファに格納しておき、その符号化結果を適宜読み出して利用する構成であってもよい。
なお、本実施形態においては、MPEG−4符号化方式のイントラ符号化のみを使用したが、フレーム間符号化を用いてももちろんかまわないし、他の符号化方式、たとえば、JPEG符号化方式やJPEG2000符号化方式でももちろんかまわない。
また、本実施形態における画像符号化装置や画像復号化装置の一部または全部の機能を汎用的なマイクロプロセッサとソフトウェアの組合せによって実現してもよい。
●(第2の実施形態)
図7は、本発明の第2の実施形態に係る画像符号化装置の構成例を示すブロック図である。図2において、第1の実施形態(図1)と同様の機能を果たす部分に関しては同じ参照数字を付与し、説明を省略する。
図2において、画像補填器701は、境界を含むマクロブロックに補填するデータが第1の実施形態の画像補填器10と異なる。符号化器702は動き補償を行う点で第1の実施形態の符号化器11と異なる。復号器703は、動き補償のための局所復号画像を生成する。フレームメモリ704は局所復号画像を格納し、メモリ制御器705はフレームメモリ704を制御する。領域判定器706は、マクロブロックが領域内、領域外又は境界を含むかを判定するとともに、境界を含むマクロブロックについて、そのマクロブロックの補填に用いる画素を含む同一フレーム中の領域が既に符号化済みであるか否かを判定する点で第1の実施形態の領域判定器7と異なる。セレクタ707は領域判定器706の出力に応じて、フレームメモリ3またはフレームメモリ704の何れかを入力として選択する。符号バッファ708は、領域符号化器12の出力をマクロブロック単位で蓄積する。
このように構成された画像符号化装置における符号化動作について説明する。
第1の実施形態と同様に、カメラ1−1〜1−12は矩形の画像情報を撮像し、矩形画像中の所定位置の正五角形状領域を出力する。画像合成器2で各カメラからの画像を、多面体(ここでは正十二面体)で表される全方位画像を平面に展開した画像として、第1の実施形態と同様に予め決められた位置関係と大きさで合成し、領域画像も生成する。生成された合成画像はフレームメモリ3に、領域画像は領域フレームメモリ5に蓄積される。
ブロック形成器6でフレームメモリ3の画像からマクロブロックを切り出し、領域判定器706、セレクタ8に出力する。
領域判定器706は、第1実施形態と同様に、領域フレームメモリ5に格納された領域画像を用い、マクロブロックが完全に有効領域外、完全に有効領域内、境界を含むの何れの状態にあるかを判定する。さらに、境界を含む場合に、その境界の外側の領域(領域外の部分)に補填すべき画素を含んだ領域、換言すれば全方位画像を構成した際に隣接する領域が符号化済みか否かを判定する。図8において、斜線で表わされた領域は、符号化を左上のマクロブロックからラスタスキャン順に行った場合に、その対応する領域が既に符号化済みと考えられる領域である。
従って、領域判定器706は、各マクロブロックについての判定結果を、完全に領域外であれば0を、完全に領域内であれば1を、境界を含む場合で隣接領域の符号化が終わっていない場合を2、境界を含む場合で隣接領域の符号化が終わっている場合を3として、メモリ制御器4、セレクタ8、9、画素補填器701、符号化器702、メモリ制御器705、セレクタ707に出力する。
第1実施形態と同様に、セレクタ8、9は領域判定器706の出力が0であれば全く動作せず、出力が1であればセレクタ8の出力が直接セレクタ9の入力になるように動作する選択する。領域判定器706の出力が2または3であるとき、セレクタ8の出力とセレクタ9の入力に画素補填器701を選択する。
画素補填器701は、第1実施形態と同様にマクロブロックに境界が存在する場合に動作する。画素補填器701は、ブロック形成器6が出力したマクロブロックをセレクタ8を介して取得する。
一方、メモリ制御器4は第1実施形態と同様に、領域判定器706からの出力を受けて、境界を含むマクロブロックにおける領域外の部分に対応する画素データをフレームメモリ3から読み出し、画素補填器707に入力する。
さらにメモリ制御器705は領域判定器706の出力が3である場合(マクロブロックが境界を含み、隣接領域の符号化が済んでいる場合)に動作する。領域判定器706からの出力を受けて、境界を含むマクロブロックにおける領域外の部分に対応する画素データを局所復号画像が格納されているフレームメモリ704から読み出し、セレクタ707に入力する。
セレクタ707は領域判定器706の出力が2(隣接領域が未符号化)であればフレームメモリ3の出力を、出力が3(隣接領域が符号化済)であればフレームメモリ704の出力を選択して、画素補填器701に出力する。
画素補填器701はセレクタ707から入力された画素データで、セレクタ8から入力されたマクロブロック画像の領域外の画素を補填する。従って、境界を含むマクロブロックにおいて、領域外の画素は、隣接領域の符号化が済んでいない場合にはフレームメモリ3から、符号化が済んでいる場合にはフレームメモリ704からの画素が補填される。
符号化器702は入力されたマクロブロックに対して、MPEG−4符号化のテクスチャ符号化を行う。イントラ符号化の場合は、第1実施形態と同様に符号化する。フレーム間予測を行う符号化では、入力されたマクロブロックとフレームメモリ704の画像(局所復号画像)を比較して動き予測を行い、動き予測誤差(予測した動きベクトルと実際の動きベクトルの差MVDS)を求め、予測誤差をブロックに分割して、DCT変換を施し、その係数を量子化し、ハフマン符号化で符号化する。符号化されたデータは多重化器13と復号器703に入力される。復号器703では符号化データを復号してその結果をフレームメモリ704に蓄積する。
また、領域符号化器12でも第1実施形態と同様にMPEG−4符号化方式における形状符号化が行われ、符号化データは符号バッファ708にマクロブロックごとに蓄積され、適宜、読み出される。
多重化器13は形状符号化データとテクスチャ符号化データを多重化し、必要なヘッダを付加し、MPEG−4符号化方式の書式に整えて、出力する。
このようにして符号化された全方位画像データの復号化は、第1の実施形態で説明した図6の復号化装置と同じ構成によって実現できる。但し、図6における復号器604には動き補償復号化を行う機能と動き補償復号化に必要な参照画像を蓄積するフレームメモリが追加される。
次に、符号化処理の簡単な流れを説明する。
図9は、第2の実施形態に係る画像符号化装置における符号化処理を示すフローチャートである。図9において第1の実施形態で説明した図5と同様の機能を果たすステップに関しては同じ参照番号を付与し、説明を省略する。
第1の実施形態と同様に、ステップS1にて、制御部600は、MPEG−4符号化方式に準拠したヘッダを生成して出力する。
ステップS901にて、領域符号化器12は、領域フレームメモリ5に格納された領域画像をMPEG−4符号化の形状符号化を用いてイントラ符号化する。形状符号化された符号化データはマクロブロック単位で符号バッファ708に蓄積される。
第1の実施形態と同様に、ステップS2からS8にて、フレームデータを読み込み、ヘッダを生成してブロックに切出し、該当するマクロブロックが領域外にあるか否かを判定する。
ステップS9にて、領域符号化器12は、領域外のマクロブロックの形状符号化データとして、領域外(透明)を表すBAB(Binary Alpha Block) Typeの値「2」を符号化して出力し、次のブロックの処理を行うため、ステップS6に戻る。
ステップS10にて、境界の有無を判定し、境界を含まない場合にはステップS11に進み、ここで領域符号化器12は、領域内に完全に含まれるマクロブロックの形状符号化データとしてBAB Typeの値3を符号化して出力する。
ステップS10で境界を含むと判定された場合、ステップS902にて、符号化するマクロブロックがイントラ符号化か否かを判定し、イントラ符号化であればステップS903に、そうでなければステップS904に進む。
ステップS903にて、イントラ符号化を行うので、BAB Typeの値を4(Intra CAE:Context-based Arithmetic Encoding)とし、ステップS901で生成した形状符号化データの該当するマクロブロックの符号化データを符号バッファ708から読み出し、多重化器13へ出力する。
ステップS904にて、フレーム間符号化(インター符号化)を行うが、形状に変化は無いので、BAB Typeの値0(形状の動きベクトルの予測誤差が0)を符号化する。
ステップS905にて、領域外を補填するための画素位置を計算し、その画素位置が符号化済みか否かを判定する。符号化済みであれば、ステップS906に進み、そうでなければステップS13に進む。
ステップS906にて、補填に用いる画素の位置を、復号画像を格納したフレームメモリ704上のアドレスとして計算する。
ステップS907にて、ステップS906にて計算されたアドレスに従って、フレームメモリ704内の復号画像から画素を読み出し、マクロブロック内の領域外画素を補填する。
ステップS13、14では、第1の実施形態と同様に、符号化していない補填用画素をフレームメモリ3から読み出し、マクロブロック内の領域外画素を補填する。
ステップS15にて、符号化器12が、領域内のマクロブロック又は境界を含むマクロブロックをテクスチャ符号化して出力して、次のブロックの処理を行うためにステップS6に進む。
本実施形態によっても、第1の実施形態と同様、従来のMPEG−4符号化におけるパディングとは異なり、実際に隣接する領域の画像データを補填するためつなぎが自然になるといった効果がある。また、画像と異なる画素データを補填して符号化するのに比べ、領域内の画像と相関が高い隣接領域の画像データを補填するため、符号化効率の改善が見込まれる。
なお、本実施形態における形状符号化において、BAB Typeが2、3(領域外、領域内)はそのままの値を符号化して出力するが、BAB Typeが4(境界を含む)であったものはBAB Typeを0(形状の動きベクトルの予測誤差無し)として符号化することも可能である。つまり、イントラ符号化された形状符号化結果を用いてどのように符号化を行うかを判断しても構わない。すなわち、フレーム間符号化により形状符号化した場合でも各ブロックの符号化結果は変わらないので、ステップS901にてフレーム間符号化時の形状情報を符号化した結果を同様に保持しておき、読み出すだけにしてもかまわない。
なお、本実施形態で符号化方式としてMPEG−4符号化方式を例にとって説明したが、これに限定されず、テクスチャの符号化方式にMotion JPEGやMPEG−2などの他の符号化方式を採用してもかまわない。形状情報の符号化方式もこれに限定されず、2値符号化方式の他の符号化方式を用いてももちろんかまわない。
また、本実施形態における符号化装置及び復号化装置の一部または全部の機能を汎用的なマイクロプロセッサとソフトウェアの組合せによって実現してもよい。
●(第3の実施形態)
図10は、本発明の第3の実施形態に係る画像符号化復号化装置の構成例を示すブロック図である。図10において、300は装置全体の制御、及び種々の処理を行う中央演算装置(CPU)、301は本装置の制御に必要なオペレーティングシステム(OS)、ソフトウェア、演算に必要な記憶領域を提供するメモリである。302は種々の装置をつなぎ、データ、制御信号をやり取りするバスである。303は装置の起動、各種条件の設定、再生の指示を行うための端末(キーボード、マウス等の入力装置)である。304はソフトウェアを蓄積する記憶装置である。305はデータストリームを蓄積する記憶装置である。
記憶装置304および305は、装置から取り外して移動できるメディア(リムーバブルメディア)とその読み書きを行うドライブとの組合せによって構成することもできる。306は多眼カメラであり、ここでは第1の実施形態で使用した正十二面体全方位画像を撮影可能なカメラシステムであるとする。307は画像を表示するディスプレイであり、309は通信回路であり、LAN、公衆回線、無線回線、放送電波等で構成されている。308は通信回路309を介してデータストリームを送受信する通信インターフェースである。
メモリ301には、図12に示すように、中央演算装置300が実行することによって装置全体を制御し、符号化復号化処理を実現するためのOSやアプリケーションソフトウェアを格納するエリア、画像データを格納する画像エリア、生成した符号化データを格納する符号エリア、各種演算や符号化の際のパラメータ等や透かしに関するデータ等を格納しておくワーキングエリアが存在する。
(符号化処理)
このような構成を有する画像符号化復号化装置における符号化処理と、符号化データの通信回路309への送出処理について説明する。
処理に先立ち、端末303から装置全体に対して起動が指示され、各部が初期化される。すると記憶装置304に格納されているソフトウェアがバス302を介してメモリ301に展開され、ソフトウェアが起動される。
本実施形態に係る画像符号化装置の動作時におけるメモリ301の使用状況例を図12に示す。
メモリ301には装置全体を制御し、各種ソフトウェアを動作させるためのOS、多面体で表される全方位画像を後述する方法で符号化する多面画像符号化ソフトウェア、多面画像符号化ソフトウェアにより符号化された画像を復号する多面画像復号ソフトウェア、多眼カメラ306を制御する多眼カメラ制御ソフトウェア、端末303からの入力に従って視線方向を変化させ、視線方向を画像合成ソフトウェアに与える視線指示ソフトウェア、単位画像を合成して多面体全方位画像を生成する画像合成ソフトウェア、生成した符号化データを通信する通信ソフトウェア、符号化データを多重化する多重化ソフトウェアが格納されている。
このような構成において、まず、多眼カメラ制御ソフトウェアは多眼カメラ306を構成する各カメラのホワイトバランス等の調整を行い、同期を取って(正十二面体を構成する正五角形の)単位画像データの出力を開始する。また、通信ソフトウェアを起動し、メモリ301上の符号エリアのデータを適宜読み出し、データを読み出した符号エリアをリセットして開放するように動作させる。その後、多面画像符号化ソフトウェアを起動する。
CPU300による符号化処理動作について図11に示すフローチャートに従って説明する。図11において第1の実施形態で説明した図5のステップと同様の処理を行うステップには同じ参照番号を付与し、説明を省略する。
第1の実施形態と同様に、ステップS1にて、ヘッダを生成して出力して、メモリ301上の符号エリアに格納する。
ステップS1101にて多面体の構成情報を符号化する。本実施形態では第1の実施形態と同様、正五角形の単位画像が正十二面体になるように構成されている。このような多面体の展開図(図2の画像200もしくは図3の領域画像202)、すなわち形状情報は、多面体を構成する面の形状(又は単位画像の形状)、面の数(又は単位画像の数)、面のサイズ(又は単位画像のサイズ)、展開方法といった構成情報がわかれば一意に決めることができ、形状符号化を行わなくても構成情報があれば形状情報を計算によって得ることができる。
展開方法は多面体を構成する面の形状と面の数の組合せで展開方法を限定できる。例えば、第1実施形態の図2において画面201−3を頂面とし、画面201−10を底面とすることと決めておく。画面201−5と画面201−7が接した位置関係を0とする。この接した線の中心を正面と決めておく。図17にその他の位置関係を示す。図17(a)の画面201−5と画面201−7が接した位置関係を1、図17(b)の画面201−2と画面201−11が接した位置関係を2とする。同様にこのような構成では10通りの展開方法が存在する。その展開方法を4ビットの符号で表して展開方法を送ることができる。さらにはこの組合せを限定することで伝送ビット数を減じることができる。
そこで、本実施形態におけるMPEG−4ビジュアルオブジェクトのビットストリームでは、図14に示すようにVOS階層ではProfile&Level符号で立体ビデオ(全方位画像)の符号化であることを指定し、ObjectType符号で立体ビデオのオブジェクトであることを指定する。それに続く、3D-V階層では立体ビデオスタートコード(3D-V_start_code(3D-V_ST))、面の形状(本実施形態では正五角形)を表すShapeType符号、面の数(12)を表すNo.ofPlane符号、面のサイズを表すPlaneSize符号、面の展開方法を表すExpandMethod符号が続き、各フレームを表すVOP符号が続く。
このような構成を有するビットストリームとして生成された構成情報の符号化データをメモリ301上の符号エリアに格納する。生成されたヘッダと構成情報の符号化データは通信ソフトウェアが読み出し、通信インターフェース308を介して通信回路309に送出する。
ステップS1102にて、形状情報を構成情報から計算して、ワーキングエリアに格納する。
以下、第1の実施形態と同様にステップS2〜S4にて、フレームデータの読込みと展開方法に従ったビデオフレームの合成が行われ、メモリ301上の画像エリアに格納される。ステップS5にて生成されたフレームのヘッダもメモリ301上の符号エリアに格納される。
ステップS7にて、ブロックを切り出し、ステップS8にて領域の内外の判定を行う。メモリ301上のワーキングエリア内に格納した形状情報を参照して、領域外であれば、何も出力せず、ステップS6に進み、次のマクロブロックの処理を行う。領域外で無ければ、ステップS10に進み、メモリ301上の形状情報を参照して、境界を含むか否かを判定し、含む場合はステップS13に進み、含まない場合はステップS1103に進む。ステップS13及びS14では第1の実施形態と同様にして画素の補填を行い、ステップS1103に進む。
ステップS1103にて、イントラ符号化またはフレーム間符号化によるテクスチャ符号化を行い、生成された符号化データをメモリ301上の符号エリアに格納する。そしてステップS6へ戻る。
ステップS6にて、1フレーム分の符号化処理が終了したら、通信ソフトウェアはメモリ301上の符号エリアの符号を読み出して、通信インターフェース308を介して通信回路309に送出する。
全てのフレームの符号化が終了したら、多面画像符号化ソフトウェア、多眼カメラ制御ソフトウェア、通信ソフトウェアを終了し、全てのソフトウェアを停止する。
本実施形態によれば、上述の実施形態と同様、多面体全方位画像を構成する画像を効率よく符号化することが可能になる。また、形状情報を符号化せずに、形状情報を生成するために必要な多面体の構成情報を符号化することで、符号化効率を大幅に向上させる効果がある。
本実施形態では通信インターフェース308を介して通信回線309に送信する例について説明したが、符号エリア内の符号化データを、記憶装置304又は305に蓄積してももちろんかまわない。
なお、本実施形態では多面体の構成情報である面の形状、数、サイズ、展開方法を個別に符号化したが、これに限定されず、例えばこれらの特定の組合せ毎にコードを割り当て、コードを符号化してもかまわないし、これ以外の情報を構成情報として付加してももちろんかまわない。
また、本実施形態では、多面体構成情報から形状情報を生成してマクロブロックの状態(領域内外、境界の有無)の判定を行ったが、ブロックの位置から逐一計算して状態を求めてももちろんかまわない。
また、本実施形態に係る符号化装置の一部又は全部の機能を専用のハードウェアで構成してももちろんかまわない。
また、本実施形態においては、予め底面と頂面と正面の位置を決定しておいたが、これに限定されず、それぞれを符号化して送ることも可能である。例えば、左上から番号付けを行い、その番号を符号化することで自由に設定できる。例えば、図2において画面201−1を番号1、画面201−2を番号2、画面201−3を番号3、画面201−4を番号4、画面201−5を番号5、画面201−8を番号6、画面201−6を番号7、画面201−7を番号8、画面201−9を番号9、画面201−10を番号10、画面201−11を番号11、画面201−12を番号12として、底面、頂面、正面の接点を含む面の番号をそれぞれ3ビットずつの情報として伝送することで実現できる。図2の場合は10、3、5を伝送する。
(復号化処理)
次に、本実施形態の画像符号化復号化装置において、上述の符号化処理で得られた符号化データを通信回路309から読み込み、復号して、ディスプレイ307に表示する処理について説明する。
まず、符号化時と同様、端末303から装置全体に対して起動が指示され、各部が初期化される。すると記憶装置304に格納されているソフトウェアがバス302を介してメモリ301に展開され、ソフトウェアが起動される。
復号化処理に先立ち、通信ソフトウェアを起動し、通信回路309から通信インターフェース308を介して受信されるデータをメモリ301上の符号エリアのデータを適宜書き込むように動作させ、符号化エリアに復号化対象の符号化データが書き込まれているものとする。
また、視線指示ソフトウェアを起動し、端末303のジョイスティックなどで指示される視線の方向を取得する。その後、復号化処理を行う多面画像復号ソフトウェアを起動する。
この、多面画像復号ソフトウェアによる復号化処理について、図13に示すフローチャートに従って説明する。まず、ステップS1301にて、メモリ301の符号エリアに格納された符号化データのヘッダを解析し、処理するオブジェクトを確認する。本実施形態では図14のObjectType符号までの復号をこのステップで行い、解析結果から各部に所定の値を設定する。
ステップS1302にて、3D-V_start_code符号(3D-V_ST)以下を復号する。
そして、多面体の構成情報、本実施形態では多面体を構成する面(単位画像)の形状を表すShapeType符号、面の数を表すNo.ofPlane符号、面のサイズを表すPlaneSize符号、面の展開方法を表すExpandMethod符号を読み込む。これを復号し、メモリ301上のワーキングエリアに格納する。
ステップS1303にて、形状情報をメモリ301上のワーキングエリア内に格納された構成情報から計算して、やはりメモリ301上のワーキングエリアに格納する。
ステップS1304にて、全てのフレームの処理が終了したか否かの終了判定を行う。全てのフレームの処理が終了したと判断された場合は、動作を終了する。そうでなければステップS1305に進む。
ステップS1305にて、メモリ301上の符号エリアから1フレーム分の符号化データを読み出す。
ステップS1306にて、フレーム(VOP)の符号化データのヘッダデータを復号して各種のパラメータを設定する。
ステップS1307にて、フレーム内の全てのマクロブロックについて処理が終了したか否かの終了判定を行う。全てのマクロブロックの処理が終了したと判断された場合は、ステップS1310に進む。そうでなければステップS1308に進む。
ステップS1308にて、復号するブロックが領域外か否かをメモリ301上の形状情報を参照して判定し、領域外と判断された場合は、何もせずにステップS1307に進み、次のブロックの処理を行う。そうでなければステップS1309に進む。
ステップS1309にて、イントラ符号化またはフレーム間符号化されたテクスチャデータを復号し、生成された画像データをメモリ301上の画像エリアに格納する。
1フレーム分のマクロブロックの復号が終了したら(ステップS1307がYes)、ステップS1310にて、展開方法に従って、復号画像(展開画像)を単位画像に分離する。展開方法は例えば上述した4ビットの情報で表される方法から図2の関係を復号し、その位置関係に従って、分離した単位画像を、全方位画像構成時に占める位置が同じ単位画像を関連付けてメモリ301上の画像エリアもしくは記憶装置304又は305に格納する。
ステップS1311にて、端末303のジョイスティックが指示する方向を視線として、表示すべき画像を作成するのに必要な単位画像を決定し、読み出して合成、レンダリングして、ディスプレイ307に表示する。
全てのフレームの復号・表示が終了したら、多面画像復号ソフトウェア、視線指示ソフトウェア、通信ソフトウェアを終了し、全てのソフトウェアを停止する。
このような一連の選択動作により、効率よく符号化された多面画像を復号化することが可能になる。
また、本実施形態では、多面構成情報から形状情報を生成して領域内外、境界の有無の判定を行ったが、マクロブロックの位置から逐一計算で求めてももちろんかまわない。
本実施形態では通信インターフェース308を介して通信回線309に受信する例について説明したが、記憶装置305に格納された符号化データを復号してももちろんかまわない。
また、本実施形態の画像復号化装置の一部または全部の機能をハードウェアで構成してももちろんかまわない。
(他の実施形態)
上述の実施形態においては、複数の単位画像が全方位画像を構成した際の多面体形状として、正十二面体を例として説明を行ったが、本発明はこれに限定されず、図15(a)に示すように正三角形の単位画像から正二十面体形状の全方位画像を構成してもよい。このときの形状情報(領域画像)は図15(b)のようになる。さらにその他の構成、例えば単位画像の形状や大きさが複数種存在してもよい。これらの情報を表す符号を定義することで同様の符号化・復号化が可能であることは当業者において自明である。
また、上述の実施形態においては、復号化時に展開画像を単位画像に分割して保存し、視線方向に応じて合成する構成についてのみ説明したが、展開画像から全方位画像を生成し、全方位画像の状態で保存しておいて、視線方向に応じて切り出すように構成しても良い。
上述の実施形態においては、1つの機器から構成される符号化装置、復号化装置についてのみ説明したが、同等の機能を複数の機器から構成されるシステムによって実現しても良い。
尚、前述した実施形態の機能を実現するソフトウェアのプログラムを、記録媒体から直接、或いは有線/無線通信を用いて当該プログラムを実行可能なコンピュータを有するシステム又は装置に供給し、そのシステム或いは装置のコンピュータが該供給されたプログラムを実行することによって同等の機能が達成される場合も本発明に含む。
従って、本発明の機能処理をコンピュータで実現するために、該コンピュータに供給、インストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明の機能処理を実現するためのコンピュータプログラム自体も本発明に含まれる。
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等、プログラムの形態を問わない。
プログラムを供給するための記録媒体としては、例えば、フレキシブルディスク、ハードディスク、磁気テープ等の磁気記録媒体、MO、CD−ROM、CD−R、CD−RW、DVD−ROM、DVD−R、DVD−RW等の光/光磁気記憶媒体、不揮発性の半導体メモリなどがある。
有線/無線通信を用いたプログラムの供給方法としては、コンピュータネットワーク上のサーバに本発明を形成するコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイル等、クライアントコンピュータ上で本発明を形成するコンピュータプログラムとなりうるデータファイル(プログラムデータファイル)を記憶し、接続のあったクライアントコンピュータにプログラムデータファイルをダウンロードする方法などが挙げられる。この場合、プログラムデータファイルを複数のセグメントファイルに分割し、セグメントファイルを異なるサーバに配置することも可能である。
つまり、本発明の機能処理をコンピュータで実現するためのプログラムデータファイルを複数のユーザに対してダウンロードさせるサーバ装置も本発明に含む。
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布し、所定の条件を満たしたユーザに対して暗号化を解く鍵情報を、例えばインターネットを介してホームページからダウンロードさせることによって供給し、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行ない、その処理によっても前述した実施形態の機能が実現され得る。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行ない、その処理によっても前述した実施形態の機能が実現され得る。
本発明の第1の実施形態に係る画像符号化装置の構成例を示すブロック図である。 第1の実施形態における多面画像の合成状態を表す図である。 第1の実施形態における領域画像を表す図である。 第1の実施形態において境界を含むマクロブロックとそこに補填する画素の位置関係を説明する図である。 第1の実施形態に係る画像符号化装置の符号化動作を示すフローチャートである。 第1の実施形態に係る画像復号化装置の構成例を示すブロック図である。 本発明の第2の実施形態に係る画像符号化装置の構成例を示すブロック図である。 第2の実施形態において境界を含むマクロブロックとそこに補填する画素の位置関係を説明する図である。 第2の実施形態に係る画像符号化装置の符号化動作を示すフローチャートである。 本発明の第3の実施形態に係る画像符号化復号化装置の構成例を示すブロック図である。 第3の実施形態に係る画像符号化復号化装置の符号化動作を示すフローチャートである。 第3の実施形態に係る画像符号化復号化装置の使用時におけるメモリ301の状況を表す図である。 第3の実施形態に係る画像符号化復号化装置の復号化動作を示すフローチャートである。 第3の実施形態における符号化データの構成例を示す図である。 本発明を適用可能な他の多面体とその領域画像の例を表す図である。 第1の実施形態に係る画像復号化装置の復号化動作を示すフローチャートである。 第3の実施形態における展開方法の例を表す図である。

Claims (8)

  1. 複数の平面画像が多面体を構成してなる全方位画像を入力する画像入力手段と、
    前記全方位画像を平面に展開した有効領域を含んだ展開画像を生成する展開手段と、
    前記展開画像を複数のブロックに分割するブロック形成手段と、
    前記複数のブロックのうち、前記有効領域の境界を含むブロックの、前記有効領域以外の領域の画素を、前記有効領域で前記多面体を構成した場合に隣接する領域内の画素により補填する補填手段と、
    前記複数のブロックを符号化して符号化データを生成する符号化手段と、
    前記符号化データを出力する出力手段を有することを特徴とする画像符号化装置。
  2. 前記補填に用いる画素を含むブロックが符号化済みであるかどうかを判定する判定手段をさらに有するとともに、前記符号化手段が局所復号画像を用いた予測符号化を行い、
    前記補填手段が、前記判定手段により符号化済みであると判定されたブロックから画素を補填する場合には、前記局所復号画像から前記補填に用いる画素を取得し、前記判定手段により符号化済みでないと判定されたブロックから画素を補填する場合には、前記展開画像から前記補填に用いる画素を取得することを特徴とする請求項1記載の画像符号化装置。
  3. 前記符号化手段が、前記複数のブロックの各々に含まれる画素情報を符号化する第1の符号化器と、前記複数のブロックの各々と前記有効領域の関係についての情報に関する符号化を行う第2の符号化器とを有することを特徴とする請求項1又は請求項2記載の画像符号化装置。
  4. 前記第2の符号化器が、前記複数のブロックの各々と前記有効領域の関係についての情報として、前記ブロック全体が前記有効領域内にある、前記ブロック全体が前記有効領域外にある、前記ブロックに前記有効領域の境界が含まれるのいずれかの情報と、前記ブロックに前記有効領域の境界が含まれる場合には、さらに当該境界の形状情報とを符号化することを特徴とする請求項3記載の画像符号化装置。
  5. 前記符号化手段が、前記複数のブロックの各々に含まれる画素情報を符号化する第1の符号化器と、前記展開画像から前記多面体を構成するために必要な構成情報とを符号化する第3の符号化器とを有することを特徴とする請求項1又は請求項2記載の画像符号化装置。
  6. 複数の平面画像が多面体を構成してなる全方位画像を入力する画像入力工程と、
    前記全方位画像を平面に展開した有効領域を含んだ展開画像を生成する展開工程と、
    前記展開画像を複数のブロックに分割するブロック形成工程と、
    前記複数のブロックのうち、前記有効領域の境界を含むブロックの、前記有効領域以外の領域の画素を、前記有効領域で前記多面体を構成した場合に隣接する領域内の画素により補填する補填工程と、
    前記複数のブロックを符号化して符号化データを生成する符号化工程と、
    前記符号化データを出力する出力工程を有することを特徴とする画像符号化方法。
  7. 複数の平面画像が多面体を構成してなる全方位画像を入力する画像入力工程と、
    前記全方位画像を平面に展開した有効領域を含んだ展開画像を生成する展開工程と、
    前記展開画像を複数のブロックに分割するブロック形成工程と、
    前記複数のブロックのうち、前記有効領域の境界を含むブロックの、前記有効領域以外の領域の画素を、前記有効領域で前記多面体を構成した場合に隣接する領域内の画素により補填する補填工程と、
    前記複数のブロックを符号化して符号化データを生成する符号化工程と、
    前記符号化データを出力する出力工程を有することを特徴とする画像符号化方法の各工程をコンピュータに実行させるためのプログラム。
  8. 複数の平面画像が多面体を構成してなる全方位画像を入力する画像入力工程と、
    前記全方位画像を平面に展開した有効領域を含んだ展開画像を生成する展開工程と、
    前記展開画像を複数のブロックに分割するブロック形成工程と、
    前記複数のブロックのうち、前記有効領域の境界を含むブロックの、前記有効領域以外の領域の画素を、前記有効領域で前記多面体を構成した場合に隣接する領域内の画素により補填する補填工程と、
    前記複数のブロックを符号化して符号化データを生成する符号化工程と、
    前記符号化データを出力する出力工程を有することを特徴とする画像符号化方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2004191462A 2004-06-29 2004-06-29 画像符号化装置及び方法 Expired - Lifetime JP4475643B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004191462A JP4475643B2 (ja) 2004-06-29 2004-06-29 画像符号化装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004191462A JP4475643B2 (ja) 2004-06-29 2004-06-29 画像符号化装置及び方法

Publications (2)

Publication Number Publication Date
JP2006014174A JP2006014174A (ja) 2006-01-12
JP4475643B2 true JP4475643B2 (ja) 2010-06-09

Family

ID=35780821

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004191462A Expired - Lifetime JP4475643B2 (ja) 2004-06-29 2004-06-29 画像符号化装置及び方法

Country Status (1)

Country Link
JP (1) JP4475643B2 (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007318597A (ja) * 2006-05-29 2007-12-06 Opt Kk 広角レンズによる撮像データの圧縮方法、圧縮装置、広角カメラ装置およびモニタシステム
JP6688469B2 (ja) 2015-03-05 2020-04-28 ソニー株式会社 画像処理装置および画像処理方法
WO2016140060A1 (ja) 2015-03-05 2016-09-09 ソニー株式会社 画像処理装置および画像処理方法
CN107409231B (zh) 2015-03-05 2021-05-11 索尼公司 图像处理装置和图像处理方法
GB2548358A (en) * 2016-03-15 2017-09-20 Nokia Technologies Oy A method, an apparatus and a computer program product for coding a 360-degree panoramic images and video
WO2017195881A1 (ja) 2016-05-13 2017-11-16 ソニー株式会社 ファイル生成装置およびファイル生成方法、並びに、再生装置および再生方法
US11138784B2 (en) 2016-07-29 2021-10-05 Sony Corporation Image processing apparatus and image processing method
CN109478347A (zh) 2016-07-29 2019-03-15 索尼公司 图像处理装置和图像处理方法
WO2018021067A1 (ja) 2016-07-29 2018-02-01 ソニー株式会社 画像処理装置および画像処理方法
JP6944137B2 (ja) 2016-07-29 2021-10-06 ソニーグループ株式会社 画像処理装置および画像処理方法
CN109588055A (zh) 2016-07-29 2019-04-05 索尼公司 图像处理设备和图像处理方法
US10999498B2 (en) 2016-07-29 2021-05-04 Sony Corporation Image processing apparatus and image processing method
US10943373B2 (en) 2016-07-29 2021-03-09 Sony Corporation Image processing apparatus and image processing method
CN109643467B (zh) 2016-07-29 2023-06-02 索尼公司 图像处理设备和图像处理方法
US11087480B2 (en) 2016-08-03 2021-08-10 Sony Corporation Image processing apparatus and image processing method
WO2018025660A1 (ja) 2016-08-05 2018-02-08 ソニー株式会社 画像処理装置および画像処理方法
CN109076215A (zh) 2016-08-23 2018-12-21 深圳市大疆创新科技有限公司 用于提高对弯曲视图视频进行编码/解码的效率的系统和方法
EP3565260A1 (en) * 2016-12-28 2019-11-06 Sony Corporation Generation device, identification information generation method, reproduction device, and image generation method
WO2018123645A1 (ja) * 2016-12-28 2018-07-05 ソニー株式会社 生成装置、識別情報生成方法、再生装置および画像再生方法
US11317114B2 (en) 2018-03-19 2022-04-26 Sony Corporation Image processing apparatus and image processing method to increase encoding efficiency of two-dimensional image

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3169783B2 (ja) * 1995-02-15 2001-05-28 日本電気株式会社 動画像の符号化・復号システム
JP2003141562A (ja) * 2001-10-29 2003-05-16 Sony Corp 非平面画像の画像処理装置及び画像処理方法、記憶媒体、並びにコンピュータ・プログラム

Also Published As

Publication number Publication date
JP2006014174A (ja) 2006-01-12

Similar Documents

Publication Publication Date Title
JP4475643B2 (ja) 画像符号化装置及び方法
TWI690201B (zh) 全方位視訊之解碼方法、編碼方法及電子設備
JP4575447B2 (ja) パノラマ画像の動き推定及び補償のために仮想画像領域を生成する方法及び装置
KR100732958B1 (ko) 20면체 파노라마 영상의 부호화 및 복호화를 위한 방법 및장치
CN101002471B (zh) 对图像编码的方法和设备及对图像数据解码的方法和设备
KR102014240B1 (ko) 공간적 구조 정보를 이용한 동기화된 다시점 영상의 선택적 복호화 방법, 부호화 방법 및 그 장치
CN103329543B (zh) 用于组合与三维内容有关的图像的方法
JP4421940B2 (ja) 動画像符号化装置および方法、並びに動画像復号化装置および方法
KR101906686B1 (ko) 화상 부호화 장치, 화상 부호화 방법, 화상 복호화 장치, 화상 복호화 방법, 및 컴퓨터 판독가능 저장 매체
CN110383843A (zh) 用于360度视频的有效压缩的球体赤道投影
JP2008211417A (ja) 多視点動画像伝送システム
EP3434021B1 (en) Method, apparatus and stream of formatting an immersive video for legacy and immersive rendering devices
US20190082183A1 (en) Method and Apparatus for Video Coding of VR images with Inactive Areas
JP2014039219A (ja) 映像復号装置、映像送受信システム、映像復号方法及び映像送受信方法
JP2008510357A (ja) 画像のエンコーディング方法、エンコーディング装置、画像のデコーディング方法及びデコーディング装置
US20150071362A1 (en) Image encoding device, image decoding device, image encoding method, image decoding method and program
KR101910286B1 (ko) 360도 영상 부호화 방법, 이를 수행하기 위한 기록 매체 및 장치
US11973981B2 (en) Coding and decoding of an omnidirectional video
JP6979290B2 (ja) 画像符号化装置および画像復号化装置、並びに、画像符号化プログラムおよび画像復号化プログラム
JP6835177B2 (ja) 画像復号化装置、画像復号化方法及び画像復号化プログラム
JP2001145020A (ja) 画像編集装置及び方法
KR20190113655A (ko) 비디오 신호 처리 방법 및 장치
KR20200052763A (ko) 영상의 삼차원 구체 움직임 정보 기반 부호화/복호화 방법 및 그 장치
JP6834039B2 (ja) 画像符号化装置、画像符号化方法、画像復号装置、画像復号方法、及び、プログラム
JP6656335B2 (ja) 画像符号化装置、画像符号化方法、画像復号装置、画像復号方法、及び、プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070625

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20070625

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091218

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100209

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100305

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100308

R150 Certificate of patent or registration of utility model

Ref document number: 4475643

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130319

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140319

Year of fee payment: 4