JP2018107683A - 動画像符号化装置及び動画像復号装置 - Google Patents

動画像符号化装置及び動画像復号装置 Download PDF

Info

Publication number
JP2018107683A
JP2018107683A JP2016253533A JP2016253533A JP2018107683A JP 2018107683 A JP2018107683 A JP 2018107683A JP 2016253533 A JP2016253533 A JP 2016253533A JP 2016253533 A JP2016253533 A JP 2016253533A JP 2018107683 A JP2018107683 A JP 2018107683A
Authority
JP
Japan
Prior art keywords
image
encoding
encoding target
panorama image
panoramic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016253533A
Other languages
English (en)
Other versions
JP6922215B2 (ja
Inventor
章弘 屋森
Akihiro Yamori
章弘 屋森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2016253533A priority Critical patent/JP6922215B2/ja
Priority to US15/825,277 priority patent/US10893290B2/en
Publication of JP2018107683A publication Critical patent/JP2018107683A/ja
Application granted granted Critical
Publication of JP6922215B2 publication Critical patent/JP6922215B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/521Processing of motion vectors for estimating the reliability of the determined motion vectors or motion vector field, e.g. for smoothing the motion vector field or for correcting motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/527Global motion vector estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Studio Devices (AREA)

Abstract

【課題】パノラマ映像の符号化効率を向上させる。
【解決手段】記憶部411は、符号化対象パノラマ画像を符号化するために用いられる参照パノラマ画像421を記憶する。符号化対象パノラマ画像は、撮像装置が撮影したパノラマ映像に含まれるパノラマ画像を展開したパノラマ画像である。決定部412は、参照パノラマ画像421に対する符号化対象パノラマ画像のずれ量を表すベクトルを決定する。補正部413は、符号化対象パノラマ画像内における複数の符号化対象領域それぞれの位置を、ずれ量を表すベクトルに基づいて補正することで、補正された符号化対象パノラマ画像を生成する。符号化部414は、補正された符号化対象パノラマ画像内の複数の符号化対象領域それぞれの画像を、参照パノラマ画像421を用いて符号化する。
【選択図】図4

Description

本発明は、動画像符号化装置及び動画像復号装置に関する。
動画像符号化においては、矩形領域の画像をブロックに分割して、ブロック単位で動き補償及び周波数変換を行うことが多い。代表的な動画像符号化方式としては、ISO/IEC 23008−2 High Efficiency Video Coding(HEVC)が挙げられる。
近年、映像を撮影するカメラの機能拡張が進み、矩形領域の撮影からより広角のパノラマ撮影に移行する傾向が見られる。さらに、魚眼レンズを用いた全周囲パノラマ映像の撮影、及び複数のカメラを用いた360°パノラマ映像の撮影も可能となりつつある(例えば、非特許文献1〜非特許文献3を参照)。
360°全方向映像情報を含むパノラマ映像の動き推定方法も知られている(例えば、特許文献1を参照)。画像間におけるグローバルベクトルを用いて動きベクトル探索エリアを決定する方法、及びパノラマ画像を分割して動体を監視しやすいパノラマ画像を生成する方法も知られている(例えば、特許文献2及び特許文献3を参照)。
特表2008−510359号公報 特開2010−109917号公報 特開2013−218432号公報
"Entaniya Fisheyeサポートブログ"、[online]、[平成28年11月16日検索]、インターネット<URL:https://www.entapano.com/blog/360-degree-panoramic-video-camera/> "THETA"、[online]、[平成28年11月16日検索]、インターネット<URL:https://theta360.com/ja/about/theta/> "Professional Plug&Play 360o Video Camera"、[online]、[平成28年11月16日検索]、インターネット<URL:http://www.sphericam.com/sphericam2/>
動きが大きいパノラマ映像を符号化する場合、多くの動きベクトルが発生して符号化効率(圧縮率)が低下することがある。
1つの側面において、本発明は、パノラマ映像の符号化効率を向上させることを目的とする。
1つの案では、動画像符号化装置は、記憶部、決定部、補正部、及び符号化部を含む。
記憶部は、符号化対象パノラマ画像を符号化するために用いられる参照パノラマ画像を記憶する。符号化対象パノラマ画像は、撮像装置が撮影したパノラマ映像に含まれるパノラマ画像を展開したパノラマ画像である。
決定部は、参照パノラマ画像に対する符号化対象パノラマ画像のずれ量を表すベクトルを決定する。補正部は、符号化対象パノラマ画像内における複数の符号化対象領域それぞれの位置を、ずれ量を表すベクトルに基づいて補正することで、補正された符号化対象パノラマ画像を生成する。
符号化部は、補正された符号化対象パノラマ画像内の複数の符号化対象領域それぞれの画像を、参照パノラマ画像を用いて符号化する。
実施形態によれば、パノラマ映像の符号化効率を向上させることができる。
第1の展開パノラマ画像を示す図である。 第2の展開パノラマ画像を示す図である。 第3の展開パノラマ画像を示す図である。 第1の動画像符号化装置の機能的構成図である。 第1の動画像符号化処理のフローチャートである。 第2の動画像符号化装置の機能的構成図である。 第2の動画像符号化処理のフローチャートである。 動画像復号装置の機能的構成図である。 動画像復号処理のフローチャートである。 パノラマ映像符号化システムの構成図である。 動画像符号化装置の具体例を示す機能的構成図である。 補正処理を示す図である。 全周囲パノラマ映像を示す図である。 全周囲パノラマ映像に対する補正処理を示す図である。 第1の動画像符号化処理の具体例を示すフローチャートである。 動きベクトルの発生数に基づく補正処理のフローチャートである。 ME効率に基づく補正処理のフローチャートである。 符号化効率に基づく動画像符号化処理のフローチャートである。 符号化効率に基づく補正処理のフローチャートである。 動画像復号装置の具体例を示す機能的構成図である。 動画像復号処理の具体例を示すフローチャートである。 第2の動画像符号化処理の具体例を示すフローチャートである。 情報処理装置の構成図である。
以下、図面を参照しながら、実施形態を詳細に説明する。
パノラマ映像に含まれる各時刻のパノラマ画像を符号化する場合、撮影されたパノラマ画像は歪んだ状態であるため、そのまま符号化すると符号化効率が低下する。そこで、パノラマ画像の歪みを補正して、矩形のパノラマ画像に展開した上で、展開されたパノラマ画像を符号化単位の所定領域に分割し、所定領域単位で符号化を行うのが効果的である。
各時刻における矩形のパノラマ画像は、フレーム又はピクチャと呼ばれることがあり、符号化単位の所定領域は、ブロックと呼ばれることがある。
矩形のパノラマ画像をブロックに分割する際の基準位置が、撮影されたパノラマ画像に対して固定された位置である場合、カメラのパニング、位置ずれ、又は移動によって、フレーム間で全ブロックが一定方向に移動したような映像が生成されることがある。基準位置を固定したままでこのようなパノラマ画像を符号化すると、不必要に多くの動きベクトルが発生して符号化効率が低下する。
特許文献1の動き推定方法では、360°全方向映像情報を含むパノラマ映像の相関性の高さを利用しており、画面右側境界のさらに右側の領域の画素として、画面左側境界部分の画素が読み込まれる。また、画面左側境界のさらに左側の領域の画素として、画面右側境界部分の画素が読み込まれる。これにより、画面の右側境界部分及び左側境界部分の画質を改善することができる。
この動き推定方法では、撮影される全方向のパノラマ映像について、カメラの位置が固定されており、大きく移動しないことが前提となっている。つまり、所定の点を中心として、周囲を360°見渡すパノラマ映像が対象となっている。
ところが、近年では、非特許文献1〜非特許文献3に示されるような、ハンディ型又は車載型の全周囲カメラが使用されるようになっている。
図1は、非特許文献1のカメラで撮影したパノラマ画像を展開することで生成される、第1の展開パノラマ画像の例を示している。このカメラは、単一の凸レンズ(魚眼レンズ)を用いて、円形のパノラマ画像101を撮影することができる。
例えば、屋外で凸レンズを真上に向けてパノラマ画像101を撮影した場合、パノラマ画像101の中央部分には空が写るため、その中央部分を除いた領域を利用して展開パノラマ画像103を生成することができる。この場合、パノラマ画像101を境界線102で切断して矩形状に変換することで、展開パノラマ画像103が生成される。
図2は、非特許文献2の360°カメラで撮影したパノラマ画像を展開することで生成される、第2の展開パノラマ画像の例を示している。この360°カメラは、背中合わせに配置された2台のカメラを用いて、円形のパノラマ画像201及びパノラマ画像202を撮影することができる。
例えば、車両に乗車しているユーザが一方のカメラを進行方向の前方に向けて撮影した場合、パノラマ画像201には前方の風景が写り、パノラマ画像202には後方の風景が写る。この場合、パノラマ画像201及びパノラマ画像202をそれぞれ矩形状に変換することで、前方の展開パノラマ画像203及び後方の展開パノラマ画像204が生成される。さらに、展開パノラマ画像203及び展開パノラマ画像204を繋ぎ合わせることで、全周囲パノラマ画像205を生成することも可能である。
図3は、非特許文献3の360°カメラで撮影したパノラマ画像を展開することで生成される、第3の展開パノラマ画像の例を示している。この360°カメラは、球状に配置された6台のカメラを用いて、水平全周囲だけでなく、天と地も含めた全空間のパノラマ画像301を撮影することができる。
例えば、この360°カメラを車両の屋根に搭載して撮影した場合、パノラマ画像301内の領域311には、進行方向の前方の風景が写り、領域312には左後方の風景が写り、領域313及び領域314には右後方の風景が写る。この場合、領域311及び領域312の画像をそれぞれ矩形状に変換することで、前方の展開パノラマ画像321及び左後方の展開パノラマ画像322が生成される。また、領域313及び領域314の画像を矩形状に変換することで、右後方の展開パノラマ画像323が生成される。
さらに、展開パノラマ画像321〜展開パノラマ画像323を含む複数の展開パノラマ画像を繋ぎ合わせることで、全周囲パノラマ画像を生成することも可能である。
図1のパノラマ画像101、図2のパノラマ画像201、パノラマ画像202、及び図3のパノラマ画像301は、広い視野を撮影した画像であるため、歪んでいることが多い。一方、展開パノラマ画像103、展開パノラマ画像203、展開パノラマ画像204、全周囲パノラマ画像205、及び展開パノラマ画像321〜展開パノラマ画像323は、矩形状に変換されており、歪みがない画像である。
動画像符号化においては、歪みのあるパノラマ映像よりも、歪みのないパノラマ映像を符号化する方が、動き推定(ME)等の効率が良くなる。したがって、パノラマ映像を符号化する際には、展開パノラマ画像を用いる機会が多くなると予想される。
ME効率は、例えば、符号化対象パノラマ画像内の各ブロックの画像と、動きベクトルによって決定される予測ブロックの画像との差分の絶対値で表される。この場合、差分の絶対値が小さいほど、ME効率が良くなる。
動画像符号化はブロック単位の動き補償及び周波数変換を含むため、生成される情報は、主として、動きベクトル情報と周波数変換された差分情報である。このため、ME効率がほぼ同等である場合は、動きベクトル情報の情報量が符号化効率に大きな影響を与える。また、動きがほとんどないパノラマ画像と動きが大きいパノラマ画像とでは、後者の方が多くの動きベクトル情報が発生する。つまり、動きが大きいパノラマ画像ほど発生する符号量が多くなり、符号化効率が低下する。
発生する符号量を抑えて符号化効率を一定に保つために、量子化スケールを大きくすることも可能であるが、その場合、符号化パノラマ画像から復元されたパノラマ画像の画質が劣化する。
上述したように、カメラのパニング、位置ずれ、又は移動によって、フレーム間で全ブロックが一定方向に移動したような映像が生成される場合、特許文献1の動き推定方法では、多くの動きベクトルが発生して符号化効率が低下する。
図4は、実施形態の第1の動画像符号化装置の機能的構成例を示している。図4の動画像符号化装置401は、記憶部411、決定部412、補正部413、及び符号化部414を含む。記憶部411は、符号化対象パノラマ画像を符号化するために用いられる参照パノラマ画像421を記憶する。符号化対象パノラマ画像は、撮像装置が撮影したパノラマ映像に含まれるパノラマ画像を展開したパノラマ画像である。決定部412、補正部413、及び符号化部414は、参照パノラマ画像421を用いて動画像符号化処理を行う。
図5は、図4の動画像符号化装置401が行う第1の動画像符号化処理の例を示すフローチャートである。まず、決定部412は、参照パノラマ画像421に対する符号化対象パノラマ画像のずれ量を表すベクトルを決定する(ステップ501)。
次に、補正部413は、符号化対象パノラマ画像内における複数の符号化対象領域それぞれの位置を、ずれ量を表すベクトルに基づいて補正することで、補正された符号化対象パノラマ画像を生成する(ステップ502)。そして、符号化部414は、補正された符号化対象パノラマ画像内の複数の符号化対象領域それぞれの画像を、参照パノラマ画像421を用いて符号化する(ステップ503)。
このような動画像符号化装置401によれば、パノラマ映像の符号化効率を向上させることができる。
図6は、実施形態の第2の動画像符号化装置の機能的構成例を示している。図6の動画像符号化装置601は、記憶部611、決定部612、補正部613、及び符号化部614を含む。記憶部611は、符号化対象パノラマ画像を符号化するために用いられる参照画像621を記憶する。符号化対象パノラマ画像は、複数の撮像装置が撮影した複数の映像を組み合わせたパノラマ映像に含まれるパノラマ画像である。決定部612、補正部613、及び符号化部614は、参照画像621を用いて動画像符号化処理を行う。
図7は、図6の動画像符号化装置601が行う第2の動画像符号化処理の例を示すフローチャートである。まず、決定部612は、複数の映像それぞれの撮影範囲が移動することによって、符号化対象パノラマ画像内の符号化対象領域が参照画像621に対してずれた場合、参照画像621に対する符号化対象領域のずれ量を表すベクトルを決定する(ステップ701)。
次に、補正部613は、符号化対象パノラマ画像内における符号化対象領域の位置を、ずれ量を表すベクトルに基づいて補正することで、補正された符号化対象領域を生成する(ステップ702)。そして、符号化部614は、補正された符号化対象領域の画像を、参照画像621を用いて符号化する(ステップ703)。
このような動画像符号化装置601によれば、パノラマ映像の符号化効率を向上させることができる。
図8は、実施形態の動画像復号装置の機能的構成例を示している。図8の動画像復号装置801は、記憶部811、抽出部812、復号部813、及び補正部814を含む。図4の動画像符号化装置401は、符号化対象パノラマ画像を符号化することで、符号化パノラマ画像を生成する。動画像復号装置801は、動画像符号化装置401が生成する符号化パノラマ画像を含む、符号化パノラマ映像を復号する。
記憶部811は、符号化パノラマ画像を復号するために用いられる参照パノラマ画像821を記憶する。抽出部812、復号部813、及び補正部814は、参照パノラマ画像821を用いて動画像復号処理を行う。
図9は、図8の動画像復号装置801が行う動画像復号処理の例を示すフローチャートである。まず、抽出部812は、参照パノラマ画像821に対する符号化対象パノラマ画像のずれ量を表すベクトルを、符号化パノラマ映像から抽出する(ステップ901)。
次に、復号部813は、符号化パノラマ画像内の複数の復号対象領域それぞれを参照パノラマ画像821を用いて復号して、復号パノラマ画像を生成する(ステップ902)。そして、補正部814は、復号パノラマ画像内における複数の復号対象領域それぞれの位置を、ずれ量を表すベクトルに基づいて補正することで、符号化対象パノラマ画像を復元する(ステップ903)。
このような動画像復号装置801によれば、パノラマ映像の符号化効率を向上させることができる。
図10は、パノラマ映像符号化システムの構成例を示している。図10のパノラマ映像符号化システム1001は、撮影部1011、合成部1012、展開部1013、及び動画像符号化装置1014を含む。
撮影部1011は、1台又は複数台の撮像装置を含む。1台の撮像装置を含む撮影部1011としては、例えば、非特許文献1のカメラを用いることができる。また、複数台の撮像装置を含む撮影部1011としては、例えば、非特許文献2の360°カメラ又は非特許文献3の360°カメラを用いることができる。
撮影部1011が1台の撮像装置を含む場合、合成部1012は、その撮像装置が撮影したパノラマ映像に含まれる各時刻の全周囲パノラマ画像を出力する。展開部1013は、全周囲パノラマ画像を複数の領域に分割し、領域単位で平面射影変換を繰り返すことで、展開パノラマ画像を生成する。この場合、動画像符号化装置1014は、図4の動画像符号化装置401に対応し、各時刻の展開パノラマ画像を符号化して、符号化パノラマ映像のビットストリームを生成する。
一方、撮影部1011が複数台の撮像装置を含む場合、合成部1012は、それぞれの撮像装置が撮影した映像に含まれる画像を合成して、全周囲パノラマ画像を生成し、展開部1013は、全周囲パノラマ画像を変換して展開パノラマ画像を生成する。この場合、動画像符号化装置1014は、図6の動画像符号化装置601に対応し、各時刻の展開パノラマ画像を符号化して、符号化パノラマ映像のビットストリームを生成する。
撮影部1011が静止している場合、全周囲パノラマ画像全体としては、常に、撮影部1011を中心として周囲を360°見渡す同じ撮影範囲が撮影されている。ただし、撮影部1011のパニング等によって、各時刻における全周囲パノラマ画像の起点がずれることで、写っている被写体の位置がずれる可能性がある。一方、撮影部1011が移動している場合、時間の経過とともに撮影範囲が変化し、写っている被写体も変化することが想定される。
図11は、図10の動画像符号化装置1014の具体例を示している。図11の動画像符号化装置1014は、変更部1101、判定部1102、決定部1103、変更部1104、減算部1105、変換及び量子化部(T/Q)1106、及びエントロピー符号化部(ENT)1107を含む。さらに、動画像符号化装置1014は、逆量子化及び逆変換部(IQ/IT)1108、加算部1109、動き補償部1110、予測画像生成部1111、及びフレームメモリ1112を含む。
まず、動画像符号化装置1014が図4の動画像符号化装置401に対応する場合の動作について説明する。この場合、変更部1101及び判定部1102は、補正部413に対応し、決定部1103は、決定部412に対応する。減算部1105、T/Q1106、ENT1107、IQ/IT1108、加算部1109、動き補償部1110、及び予測画像生成部1111は、符号化部414に対応し、フレームメモリ1112は、記憶部411に対応する。
展開部1013が生成する展開パノラマ画像は、符号化対象パノラマ画像として、動画像符号化装置1014に入力される。動画像符号化装置1014は、符号化対象パノラマ画像を符号化し、符号化パノラマ画像をビットストリームとして出力する。符号化対象パノラマ画像は、複数のブロックに分割され、各ブロックが符号化対象ブロックとして、減算部1105及び動き補償部1110に入力される。符号化対象ブロックは、符号化対象領域に対応する。
決定部1103は、動き補償部1110から出力される動きベクトルを用いて、フレームメモリ1112が記憶する参照パノラマ画像に対する、符号化対象パノラマ画像のずれ量を表すグローバルベクトルを決定する。そして、決定部1103は、決定したグローバルベクトルを判定部1102、変更部1104、及びENT1107へ出力する。
決定部1103は、既に符号化済みのパノラマ画像のグローバルベクトルを、符号化対象パノラマ画像のグローバルベクトルとして用いてもよく、処理量の小さな縮小パノラマ画像を用いた動き推定の結果に基づいて、グローバルベクトルを決定してもよい。
判定部1102は、グローバルベクトルに基づいて、符号化対象パノラマ画像内の各符号化対象ブロックの位置を変更するか否かを判定し、グローバルベクトル及び判定結果を変更部1101へ出力する。
判定結果が各符号化対象ブロックの位置を変更することを示す場合、変更部1101は、グローバルベクトルに基づいて各符号化対象ブロックの位置を変更し、変更した符号化対象ブロックを減算部1105及び動き補償部1110へ出力する。一方、判定結果が各符号化対象ブロックの位置を変更しないことを示す場合、変更部1101は、各符号化対象ブロックをそのまま減算部1105及び動き補償部1110へ出力する。
減算部1105は、符号化対象ブロックと、予測画像生成部1111から出力される予測ブロック画像との差分を表す予測誤差信号を、T/Q1106へ出力する。T/Q1106は、直交変換によって予測誤差信号を周波数信号に変換し、周波数信号を量子化して係数情報を生成する。直交変換としては、例えば、離散コサイン変換、離散ウェーブレット変換等が用いられる。そして、T/Q1106は、生成した係数情報をENT1107及びIQ/IT1108へ出力する。
IQ/IT1108は、T/Q1106から出力される係数情報を逆量子化して、周波数信号を生成し、逆直交変換によって周波数信号を再構成予測誤差信号に変換する。そして、IQ/IT1108は、再構成予測誤差信号を加算部1109へ出力する。
加算部1109は、予測画像生成部1111から出力される予測ブロック画像と、再構成予測誤差信号とを加算することで、復号ブロック画像を生成し、生成した復号ブロック画像をフレームメモリ1112へ出力する。符号化対象ブロックの位置が変更されている場合、変更部1104は、グローバルベクトルに基づいて、復号ブロック画像の位置を変更前の符号化対象ブロックの位置に戻す。
フレームメモリ1112は、復号ブロック画像を蓄積し、蓄積した復号ブロック画像を参照画像として、動き補償部1110及び予測画像生成部1111へ出力する。符号化対象パノラマ画像内の複数の符号化対象ブロックそれぞれから生成された複数の復号ブロック画像は、参照パノラマ画像に対応する。
動き補償部1110は、参照画像を用いて符号化対象ブロックに対する動き推定を行うことで、動きベクトルを生成し、生成した動きベクトルを決定部1103へ出力する。動き推定では、例えば、1枚の参照パノラマ画像を用いた片方向予測、又は2枚以上の参照パノラマ画像を用いた双方向予測が行われる。そして、動き補償部1110は、参照パノラマ画像から動きベクトルが示す参照画像を取得して、予測画像生成部1111へ出力する。
予測画像生成部1111は、参照画像を用いて、符号化対象パノラマ画像内の既に符号化された周辺画素の画素値から、符号化対象ブロックのイントラ予測ブロック画像を生成する。また、予測画像生成部1111は、動き補償部1110から出力される参照画像をインター予測ブロック画像として使用する。そして、予測画像生成部1111は、イントラ予測ブロック画像又はインター予測ブロック画像のいずれか一方を選択し、選択した予測ブロック画像を減算部1105及び加算部1109へ出力する。
ENT1107は、T/Q1106から出力される係数情報、イントラ予測又はインター予測の予測モードの情報、及び決定部1103から出力されるグローバルベクトルの情報をエントロピー符号化する。エントロピー符号化では、信号中の各シンボルの出現頻度に応じて、可変長符号が割り当てられる。そして、ENT1107は、可変長符号を含むビットストリームを出力する。
図12は、変更部1101が行う補正処理の例を示している。この例では、全周囲パノラマ画像内の複数の位置を区別するために、0〜9の番号が用いられている。全周囲パノラマ画像の場合、図1に示したように、左端の位置0の画像と右端の位置9の画像とが連続しているため、この連続性を利用して補正処理を行うことができる。
参照パノラマ画像1201内の各被写体の位置に対して、符号化対象パノラマ画像1202内の各被写体の位置が一斉に右へずれた場合、位置0〜位置7のブロックに対して同じ動きベクトル1211が生成される。しかし、このままでは、位置8及び位置9のブロックに対して、動きベクトル1211とは全く異なる動きベクトルが生成される。
そこで、決定部1103は、動きベクトル1211をグローバルベクトルに決定し、変更部1101は、符号化対象パノラマ画像1202内の各ブロックの位置を、動きベクトル1211に従って左へずらす。そして、変更部1101は、符号化対象パノラマ画像1202からはみ出した位置8及び位置9のブロックの画像を、符号化対象パノラマ画像1202の右端に付け加えることで、符号化対象パノラマ画像1203を生成する。この場合、符号化対象パノラマ画像1203の起点が位置8から位置0に変更され、参照パノラマ画像1201の起点に一致する。
これにより、参照パノラマ画像1201内の各被写体に対する、符号化対象パノラマ画像1203内の各被写体の動きがほぼ0になるため、生成される動きベクトルを最小限に抑えることが可能になる。
図13は、人物を含む全周囲パノラマ映像の例を示している。パノラマ画像1301、パノラマ画像1302、及びパノラマ画像1303は、それぞれ、時刻T、時刻T+1、及び時刻T+2における符号化対象パノラマ画像を表す。これらの3枚のパノラマ画像に写っている人物の位置は変化しておらず、代わりに、背景の被写体の位置が時間の経過とともに右へずれている。この場合、動きのある背景の面積の方が静止している人物の面積よりも大きいため、背景が静止するように、各パノラマ画像の起点を左へずらすことが好ましい。
図14は、図13の全周囲パノラマ映像に対する補正処理の例を示している。パノラマ画像1302の動き推定において、パノラマ画像1301が参照パノラマ画像として用いられる場合、決定部1103は、パノラマ画像1301の背景に対するパノラマ画像1302の背景の動きを表わす動きベクトルを、グローバルベクトルに決定する。
そして、変更部1101は、パノラマ画像1302内の各ブロックの位置を、グローバルベクトルに従って左へずらし、パノラマ画像1302からはみ出したブロックの画像を右端に付け加えることで、パノラマ画像1401を生成する。パノラマ画像1302の代わりにパノラマ画像1401を符号化すれば、面積の大きな背景に対する動きベクトルはほとんど発生せず、面積の小さな人物に集中して動きベクトルが発生する。したがって、発生する動きベクトル情報を抑制することができ、符号化効率が向上する。
パノラマ画像1303の動き推定において、パノラマ画像1302が参照パノラマ画像として用いられる場合も、同様の補正処理が行われる。この場合、決定部1103は、パノラマ画像1302の背景に対するパノラマ画像1303の背景の動きを表わす動きベクトルを、グローバルベクトルに決定する。
そして、変更部1101は、パノラマ画像1303内の各ブロックの位置を、グローバルベクトルに従って左へずらし、パノラマ画像1303からはみ出したブロックの画像を右端に付け加えることで、パノラマ画像1402を生成する。パノラマ画像1303の代わりにパノラマ画像1401を符号化することで、符号化効率が向上する。
動画像符号化装置1014が生成した符号化パノラマ画像を復号する際は、グローバルベクトルに基づいて、符号化パノラマ画像内の各ブロックの位置を逆方向にずらすことで、パノラマ画像1302及びパノラマ画像1303を復元することができる。
このように、グローバルベクトルに基づいて符号化対象パノラマ画像の起点を変更することで、全周囲パノラマ画像を切断する境界線の位置を、画像の動きに合わせて適応的に変更することが可能になる。起点の変更は、前方向予測の動きに応じて実施することが好ましい。例えば、前方向予測ピクチャ(Pピクチャ)のみを対象として起点を変更してもよい。
ENT1107は、グローバルベクトルの情報をヘッダ情報としてビットストリームに挿入することができる。この場合、ビットストリームを受信した動画像復号装置は、ヘッダ情報を参照することでグローバルベクトルを取得し、符号化パノラマ画像内の各ブロックの位置を元の位置に戻すことができる。
図15は、図11の動画像符号化装置1014が行う動画像符号化処理の具体例を示すフローチャートである。動画像符号化装置1014は、符号化対象映像に含まれる各時刻の画像を符号化対象画像として、符号化対象画像をブロック毎に符号化する。
まず、変更部1101は、符号化対象映像が全周囲パノラマ映像であるか否かをチェックする(ステップ1501)。
符号化対象映像が全周囲パノラマ映像ではない場合(ステップ1501,No)、変更部1101は、符号化対象ブロックの位置を変更することなく、そのまま減算部1105及び動き補償部1110へ出力する。そして、動画像符号化装置1014は、符号化対象ブロックを符号化する(ステップ1502)。
一方、符号化対象映像が全周囲パノラマ映像である場合(ステップ1501,Yes)、決定部1103は、符号化対象パノラマ画像のグローバルベクトルを決定する(ステップ1505)。
例えば、決定部1103は、符号化対象パノラマ画像内で発生する動きベクトルのうち、他の動きベクトルよりも多く発生する動きベクトルをグローバルベクトルに決定することができる。他の動きベクトルよりも多く発生する動きベクトルは、符号化対象パノラマ画像内で最も多く発生する動きベクトルであってもよい。この場合、動き補償部1110は、事前に符号化対象パノラマ画像内のすべてのブロックに対する動き推定を実施し、各ブロックの動きベクトルを求めて、決定部1103へ出力する。そして、決定部1103は、発生数が最も多い動きベクトルを選択して、グローバルベクトルに決定する。
発生数が最も多い動きベクトルを選択することで、符号化対象パノラマ画像全体の動きを表わすベクトルをグローバルベクトルに決定することができる。例えば、背景の面積が前景の面積よりも大きく、背景に一定の動きが見られる場合、背景の動きを表わすベクトルがグローバルベクトルとして採用される。また、前景がクローズアップされており、前景の面積が背景の面積よりも大きい場合は、前景の動きを表わすベクトルがグローバルベクトルとして採用される。
次に、変更部1101は、符号化対象ブロックが前方向予測ピクチャのブロックであるか否かをチェックする(ステップ1506)。符号化対象ブロックが前方向予測ピクチャのブロックではない場合(ステップ1506,No)、動画像符号化装置1014は、ステップ1502以降の処理を行う。
一方、符号化対象ブロックが前方向予測ピクチャのブロックである場合(ステップ1506,Yes)、変更部1101及び判定部1102は、グローバルベクトルに基づいて補正処理を行う(ステップ1507)。
この補正処理において、判定部1102が符号化対象ブロックを補正しないと判定した場合、動画像符号化装置1014は、ステップ1502以降の処理を行う。一方、判定部1102が符号化対象ブロックを補正すると判定した場合、変更部1101は、符号化対象ブロックの位置を、グローバルベクトルの向きにグローバルベクトルの大きさだけずらすことで、補正された符号化対象ブロックを生成する。
次に、ENT1107は、グローバルベクトルの情報を含むヘッダ情報を生成し(ステップ1508)、動画像符号化装置1014は、補正された符号化対象ブロックを符号化する(ステップ1509)。そして、変更部1104は、グローバルベクトルに基づいて、復号ブロック画像の位置を元の位置に戻す(ステップ1510)。このとき、変更部1104は、復号ブロック画像の位置を、グローバルベクトルとは逆の向きにグローバルベクトルの大きさだけずらすことで、補正された復号ブロック画像を生成して、フレームメモリ1112に書き込む。
次に、変更部1101は、符号化対象画像内のすべてのブロックを符号化したか否かをチェックする(ステップ1503)。符号化していないブロックが残っている場合(ステップ1503,No)、動画像符号化装置1014は、次のブロックを符号化対象ブロックとして、ステップ1501以降の処理を繰り返す。
すべてのブロックを符号化した場合(ステップ1503,Yes)、変更部1101は、符号化対象映像に含まれるすべての画像を符号化したか否かをチェックする(ステップ1504)。符号化していない画像が残っている場合(ステップ1504,No)、動画像符号化装置1014は、次の画像を符号化対象画像として、ステップ1501以降の処理を繰り返す。そして、すべての画像を符号化した場合(ステップ1504,Yes)、動画像符号化装置1014は、処理を終了する。
例えば、動画像符号化方式がHEVCである場合、ステップ1508において、ENT1107は、ヘッダ情報に含まれるユーザデータを用いて、グローバルベクトルの情報を送信することができる。
具体的には、Supplemental Enhancement Information(SEI)のpayloadType=5のuser_data_unregistered(payloadSize)を用いることができる。この場合、グローバルベクトルのX成分及びY成分のビット数として、それぞれ、log2_max_mv_length_horizontal及びlog2_max_mv_length_verticalで示されるビット数を確保すればよい。あるいは、そのsyntax elementの最大値である16ビットを確保してもよい。
ユーザデータが他の目的で使用されることを考慮して、グローバルベクトルを示す所定の識別情報をグローバルベクトルの前に挿入したSEI(ユーザデータ)を用いることも好ましい。所定の識別情報としては、例えば、グローバルベクトルを表わす所定の文字列に対応するAmerican Standard Code for Information Interchange(ASCII)コードを用いることができる。
図15の動画像符号化処理によれば、全周囲パノラマ映像に含まれる前方向予測ピクチャを符号化する際に、符号化対象パノラマ画像全体の動きに応じて、その符号化対象パノラマ画像の起点を変更することができる。これにより、符号化対象ブロックに対して生成される動きベクトル情報を抑制することが可能になるとともに、符号化対象パノラマ画像内の全ブロックに対して適切な動き推定を行うことが可能になる。したがって、ME効率及び符号化効率が向上する。
図16は、図15のステップ1507において、符号化対象ブロックを補正するか否かを動きベクトルの発生数を用いて判定する補正処理の例を示すフローチャートである。まず、判定部1102は、符号化対象パノラマ画像内における動きベクトルの総数Num_AllMVに対するグローバルベクトルの発生数Num_GMVの比率Rを、閾値TH1と比較する(ステップ1601)。
RがTH1以上である場合(ステップ1601,Yes)、判定部1102は、符号化対象ブロックを補正すると判定する。そして、変更部1101は、グローバルベクトルを用いて符号化対象ブロックの位置をずらすことで、補正された符号化対象ブロックを生成し(ステップ1602)、動画像符号化装置1014は、ステップ1508以降の処理を行う。
一方、RがTH1未満である場合(ステップ1601,No)、判定部1102は、符号化対象ブロックを補正しないと判定し、動画像符号化装置1014は、ステップ1502以降の処理を行う。
図16の補正処理によれば、決定部1103が決定したグローバルベクトルが符号化対象パノラマ画像内において所定値以上の比率で発生している場合に、符号化対象ブロックの位置が変更される。これにより、符号化対象パノラマ画像全体に発生している一定の動きに応じて、符号化対象ブロックの位置をずらすことができる。
図17は、図15のステップ1507において、符号化対象ブロックを補正するか否かをME効率を用いて判定する補正処理の例を示すフローチャートである。
まず、判定部1102は、符号化対象パノラマ画像を補正しない場合の動き推定を、動き補償部1110に対して要求する(ステップ1701)。動き補償部1110は、符号化対象パノラマ画像内のすべてのブロックに対する動き推定を実施して、各ブロックの動きベクトルを求める。そして、動き補償部1110は、参照パノラマ画像と符号化対象パノラマ画像との間の差分絶対値和(SAD)を計算し、計算したSADをSAD1として判定部1102へ出力する。
次に、判定部1102は、符号化対象パノラマ画像を補正した場合の動き推定を、動き補償部1110に対して要求する(ステップ1702)。動き補償部1110は、グローバルベクトルを用いて符号化対象ブロックの位置をずらすことで、補正された符号化対象ブロックを生成する。次に、動き補償部1110は、補正された符号化対象パノラマ画像内のすべてのブロックに対する動き推定を実施して、各ブロックの動きベクトルを求める。そして、動き補償部1110は、参照パノラマ画像と補正された符号化対象パノラマ画像との間のSADを計算し、計算したSADをSAD2として判定部1102へ出力する。
次に、判定部1102は、SAD1とSAD2を比較する(ステップ1703)。SAD2がSAD1よりも小さい場合(ステップ1703,Yes)、判定部1102は、符号化対象ブロックを補正すると判定する。そして、変更部1101は、グローバルベクトルを用いて符号化対象ブロックの位置をずらすことで、補正された符号化対象ブロックを生成し(ステップ1704)、動画像符号化装置1014は、ステップ1508以降の処理を行う。
一方、SAD2がSAD1以上である場合(ステップ1703,No)、判定部1102は、符号化対象ブロックを補正しないと判定し、動画像符号化装置1014は、ステップ1502以降の処理を行う。
図17の補正処理によれば、決定部1103が決定したグローバルベクトルに基づいて符号化対象ブロックの位置をずらすことで、ME効率が向上する場合に、符号化対象ブロックの位置が変更される。これにより、符号化対象パノラマ画像のME効率を向上させることができる。
図18は、符号化対象パノラマ画像を補正するか否かを符号化効率を用いて判定する動画像符号化処理の例を示すフローチャートである。ステップ1801〜ステップ1806の処理は、図15のステップ1501〜ステップ1506の処理と同様である。
符号化対象ブロックが前方向予測ピクチャのブロックである場合(ステップ1806,Yes)、動画像符号化装置1014は、ステップ1807の処理と、ステップ1808〜ステップ1811の処理とを行う。ステップ1807の処理は、符号化対象ブロックを補正しない場合のステップ1802の処理と同様である。
ステップ1808において、変更部1101は、グローバルベクトルを用いて符号化対象ブロックの位置をずらすことで、補正された符号化対象ブロックを生成する。ステップ1809〜ステップ1811の処理は、図15において符号化対象ブロックを補正する場合のステップ1508〜ステップ1510の処理と同様である。
次に、変更部1101は、符号化対象画像内のすべてのブロックを符号化したか否かをチェックする(ステップ1812)。符号化していないブロックが残っている場合(ステップ1812,No)、動画像符号化装置1014は、次のブロックを符号化対象ブロックとして、ステップ1801以降の処理を繰り返す。
すべてのブロックを符号化した場合(ステップ1812,Yes)、変更部1101及び判定部1102は、符号化効率に基づく補正処理を行う(ステップ1813)。そして、動画像符号化装置1014は、ステップ1804以降の処理を行う。
図19は、図18のステップ1813における補正処理の例を示すフローチャートである。判定部1102は、T/Q1106が周波数信号を量子化する際に用いる量子化スケールと、ENT1107が生成するビットストリームの情報量とを用いて符号化効率を計算する。例えば、符号化対象パノラマ画像内のすべてのブロックに対する量子化スケールの平均値と、その符号化対象パノラマ画像から生成される符号の総ビット数との積を、その符号化対象パノラマ画像の符号化効率として用いることができる。
まず、判定部1102は、符号化対象パノラマ画像内のすべてのブロックに対するステップ1807の処理の結果から、符号化対象パノラマ画像を補正しない場合の符号化効率CE1を計算する(ステップ1901)。符号化効率CE1は、符号化対象パノラマ画像を補正しない場合の量子化スケールの平均値QP1と符号の総ビット数I1との積として求められる。
次に、判定部1102は、符号化対象パノラマ画像内のすべてのブロックに対するステップ1808〜ステップ1811の処理の結果から、符号化対象パノラマ画像を補正した場合の符号化効率CE2を計算する(ステップ1902)。符号化効率CE2は、符号化対象パノラマ画像を補正した場合の量子化スケールの平均値QP2と符号の総ビット数I2との積として求められる。
次に、判定部1102は、CE1とCE2を比較する(ステップ1903)。CE2がCE1よりも小さい場合(ステップ1903,Yes)、判定部1102は、符号化対象パノラマ画像を補正すると判定する。そして、動画像符号化装置1014は、ステップ1808〜ステップ1811の処理の結果を採用する(ステップ1905)。
一方、CE2がCE1以上である場合(ステップ1903,No)、判定部1102は、符号化対象パノラマ画像を補正しないと判定し、動画像符号化装置1014は、ステップ1807の処理の結果を採用する(ステップ1904)。
図19の補正処理によれば、決定部1103が決定したグローバルベクトルに基づいて符号化対象ブロックの位置をずらすことで、符号化効率が向上する場合に、符号化対象ブロックの位置が変更される。これにより、符号化対象パノラマ画像の符号化効率を向上させることができる。
図20は、図8の動画像復号装置801の具体例を示している。図20の動画像復号装置2001は、抽出部2011、変更部2012、ブロック復号部2013、加算部2014、動き補償部2015、予測画像生成部2016、及びフレームメモリ2017を含む。
抽出部2011は、図8の抽出部812に対応し、変更部2012は、補正部814に対応し、ブロック復号部2013、加算部2014、動き補償部2015、及び予測画像生成部2016は、復号部813に対応し、フレームメモリ2017は、記憶部811に対応する。
図11の動画像符号化装置1014が出力するビットストリームは、符号化パノラマ映像として、動画像復号装置2001に入力される。動画像復号装置2001は、符号化パノラマ映像に含まれる各時刻の符号化パノラマ画像を復号して、符号化対象パノラマ映像を復元する。
抽出部2011は、符号化パノラマ映像に含まれるヘッダ情報からグローバルベクトルの情報を抽出して、変更部2012へ出力する。
ブロック復号部2013は、符号化パノラマ画像内の各復号対象ブロックの係数情報を逆量子化して周波数信号を生成し、逆直交変換によって周波数信号を再構成予測誤差信号に変換する。そして、ブロック復号部2013は、再構成予測誤差信号を加算部2014へ出力する。
加算部2014は、予測画像生成部2016から出力される予測ブロック画像と、再構成予測誤差信号とを加算することで、復号ブロック画像を生成し、生成した復号ブロック画像をフレームメモリ2017へ出力する。抽出部2011から符号化パノラマ画像に対するグローバルベクトルが出力された場合、変更部2012は、グローバルベクトルに基づいて、復号ブロック画像の位置を変更前の符号化対象ブロックの位置に戻す。
フレームメモリ2017は、復号ブロック画像を蓄積し、蓄積した復号ブロック画像を参照画像として、動き補償部2015及び予測画像生成部2016へ出力する。符号化パノラマ画像内の複数の復号対象ブロックそれぞれから生成された複数の復号ブロック画像は、復号パノラマ画像に対応する。そして、変更部2012によって位置を変更された後の複数の復号ブロック画像は、復元された符号化対象パノラマ画像を表し、参照パノラマ画像に対応する。
動き補償部2015は、参照パノラマ画像から動きベクトルが示す参照画像を取得して、予測画像生成部2016へ出力する。
予測画像生成部2016は、参照画像を用いて、符号化パノラマ画像内の既に復号された周辺画素の画素値から、復号対象ブロックのイントラ予測ブロック画像を生成する。また、予測画像生成部2016は、動き補償部2015から出力される参照画像をインター予測ブロック画像として使用する。そして、予測画像生成部2016は、イントラ予測ブロック画像又はインター予測ブロック画像のいずれか一方を選択し、選択した予測ブロック画像を加算部2014へ出力する。
図21は、図20の動画像復号装置2001が行う動画像復号処理の具体例を示すフローチャートである。動画像復号装置2001は、符号化映像に含まれる各時刻の画像を復号対象画像として、復号対象画像をブロック毎に符号化する。
まず、動画像復号装置2001は、復号対象映像が全周囲パノラマ映像であるか否かをチェックする(ステップ2101)。復号対象映像が全周囲パノラマ映像ではない場合(ステップ2101,No)、動画像復号装置2001は、復号対象ブロックをそのまま復号する(ステップ2102)。
一方、復号対象映像が全周囲パノラマ映像である場合(ステップ2101,Yes)、抽出部2011は、ヘッダ情報からグローバルベクトルの情報を抽出する(ステップ2105)。
次に、動画像復号装置2001は、復号対象ブロックが前方向予測ピクチャのブロックであるか否かをチェックする(ステップ2106)。復号対象ブロックが前方向予測ピクチャのブロックではない場合(ステップ2106,No)、動画像復号装置2001は、ステップ2102以降の処理を行う。
一方、復号対象ブロックが前方向予測ピクチャのブロックである場合(ステップ2106,Yes)、動画像復号装置2001は、復号対象ブロックを復号する(ステップ2107)。そして、変更部2012は、グローバルベクトルに基づいて、復号ブロック画像の位置を変更前の符号化対象ブロックの位置に戻す(ステップ2108)。このとき、変更部2012は、復号ブロック画像の位置を、グローバルベクトルとは逆の向きにグローバルベクトルの大きさだけずらすことで、補正された復号ブロック画像を生成して、フレームメモリ2017に書き込む。
次に、動画像復号装置2001は、復号対象画像内のすべてのブロックを復号したか否かをチェックする(ステップ2103)。復号していないブロックが残っている場合(ステップ2103,No)、動画像復号装置2001は、次のブロックを復号対象ブロックとして、ステップ2101以降の処理を繰り返す。
すべてのブロックを復号した場合(ステップ2103,Yes)、動画像復号装置2001は、復号対象映像に含まれるすべての画像を復号したか否かをチェックする(ステップ2104)。復号していない画像が残っている場合(ステップ2104,No)、動画像復号装置2001は、次の画像を復号対象画像として、ステップ2101以降の処理を繰り返す。そして、すべての画像を復号した場合(ステップ2104,Yes)、動画像復号装置2001は、処理を終了する。
次に、図11の動画像符号化装置1014が図6の動画像符号化装置601に対応する場合の動作について説明する。この場合、変更部1101及び判定部1102は、補正部613に対応し、決定部1103は、決定部612に対応する。減算部1105、T/Q1106、ENT1107、IQ/IT1108、加算部1109、動き補償部1110、及び予測画像生成部1111は、符号化部614に対応し、フレームメモリ1112は、記憶部611に対応する。
図10の撮影部1011が移動している場合、時間の経過とともに全周囲パノラマ映像の撮影範囲が変化し、写っている被写体も変化することが想定される。この場合、全周囲パノラマ映像に含まれる各パノラマ画像の全体を展開パノラマ画像に変換しても、1つの動画として捉えることは難しい。そこで、図3に示したように、各パノラマ画像から一部の領域を抽出して矩形状に変換することで、抽出した部分領域の動画を生成することが効果的である。
この場合、合成部1012は、撮影部1011に含まれる複数の撮像装置が撮影した複数の映像を組み合わせることで、符号化対象パノラマ映像を生成することができる。展開部1013が生成する展開パノラマ画像は、符号化対象パノラマ画像として、動画像符号化装置1014に入力される。
決定部1103は、動き補償部1110から出力される動きベクトルを用いて、フレームメモリ1112が記憶する参照画像に対する符号化対象ブロックのずれ量を表すグローバルベクトルを決定する。そして、決定部1103は、決定したグローバルベクトルを変更部1101へ出力する。
例えば、決定部1103は、符号化対象パノラマ画像内の特定のブロックの動きベクトルをグローバルベクトルに決定することができる。この場合、動き補償部1110は、事前に符号化対象パノラマ画像内のすべてのブロックに対する動き推定を実施し、各ブロックの動きベクトルを求めて、決定部1103へ出力する。そして、決定部1103は、特定のブロックの動きベクトルを選択して、グローバルベクトルに決定する。
特定のブロックの動きベクトルをグローバルベクトルとして用いることで、そのブロックの動きに合わせて、符号化対象パノラマ画像から抽出される部分領域の位置をずらすことができる。これにより、特定のブロックに写っている被写体が常に画面内の同じ位置に写るように、画面に表示される部分領域の画像が補正されるため、特定の被写体を追従する映像を生成することが可能になる。
例えば、動画像符号化装置1014がタッチパネルを搭載した表示装置を含む場合、決定部1103は、画面内でユーザがタッチした位置が属するブロックのアドレスを求め、そのアドレスを用いて特定のブロックを決定することができる。動画像符号化装置1014がタッチパネルを含まない場合は、画面内の位置を示す座標からブロックのアドレスを計算し、計算したアドレスを用いて特定のブロックを指定することができる。
例えば、ブロックサイズが16×16であり、画面内で指定する画素の座標が(x,y)である場合、ブロックのアドレスは[x/16,y/16]となる。また、ブロックサイズが64×64であり、画面内で指定する画素の座標が(x,y)である場合、ブロックのアドレスは[x/64,y/64]となる。
図22は、動画像符号化装置1014が動画像符号化装置601に対応する場合の動画像符号化処理の具体例を示すフローチャートである。動画像符号化装置1014は、符号化対象映像に含まれる各時刻の画像を符号化対象画像として、符号化対象画像をブロック毎に符号化する。
符号化対象映像が全周囲パノラマ映像である場合、動画像符号化装置1014は、符号化対象パノラマ画像から抽出される1つ又は複数の部分領域を対象として、その部分領域の画像をブロック毎に符号化する。
まず、変更部1101は、符号化対象映像が全周囲パノラマ映像であるか否かをチェックする(ステップ2201)。
符号化対象映像が全周囲パノラマ映像ではない場合(ステップ2201,No)、変更部1101は、符号化対象ブロックをそのまま減算部1105及び動き補償部1110へ出力する。そして、動画像符号化装置1014は、符号化対象ブロックを符号化する(ステップ2202)。
一方、符号化対象映像が全周囲パノラマ映像である場合(ステップ2201,Yes)、決定部1103は、符号化対象パノラマ画像のグローバルベクトルを決定する(ステップ2205)。
次に、変更部1101は、符号化対象パノラマ画像内において、符号化対象ブロックの位置を、グローバルベクトルとは逆の向きにグローバルベクトルの大きさだけずらすことで、新たな符号化対象ブロックを設定する(ステップ2206)。そして、動画像符号化装置1014は、設定された新たな符号化対象ブロックを符号化する(ステップ2207)。部分領域内の各ブロックの位置をグローバルベクトルとは逆の向きにずらすことにより、部分領域の起点を変更して、補正された部分領域を生成することができる。
次に、変更部1101は、符号化対象画像又は部分領域内のすべてのブロックを符号化したか否かをチェックする(ステップ2203)。符号化していないブロックが残っている場合(ステップ2203,No)、動画像符号化装置1014は、次のブロックを符号化対象ブロックとして、ステップ2201以降の処理を繰り返す。
すべてのブロックを符号化した場合(ステップ2203,Yes)、変更部1101は、符号化対象映像に含まれるすべての画像を符号化したか否かをチェックする(ステップ2204)。符号化していない画像が残っている場合(ステップ2204,No)、動画像符号化装置1014は、次の画像を符号化対象画像として、ステップ2201以降の処理を繰り返す。そして、すべての画像を符号化した場合(ステップ2204,Yes)、動画像符号化装置1014は、処理を終了する。
図22の動画像符号化処理では、図15の動画像符号化処理とは異なり、グローバルベクトルに基づいて復号ブロック画像の位置を元の位置に戻す処理は行われない。また、動画像復号装置においても、復号ブロック画像の位置を元の位置に戻す処理は行われないため、動画像符号化装置1014は、グローバルベクトルの情報を動画像復号装置へ送信する必要はない。
図22の動画像符号化処理によれば、撮影部1011が移動することで複数の撮像装置それぞれの映像の撮影範囲が変化した場合であっても、特定のブロックの動きに応じて、符号化対象パノラマ画像から抽出される部分領域の起点を変更することができる。これにより、部分領域内の各ブロックに対して生成される動きベクトル情報を抑制することが可能になるとともに、各ブロックに対して適切な動き推定を行うことが可能になる。したがって、ME効率及び符号化効率が向上する。
図4、図6、及び図11の動画像符号化装置の構成は一例に過ぎず、動画像符号化装置の用途又は条件に応じて一部の構成要素を省略又は変更してもよい。例えば、図11の動画像符号化装置1014において、エントロピー符号化を行わない場合、ENT1107を省略することができる。
図8及び図20の動画像復号装置の構成は一例に過ぎず、動画像復号装置の用途又は条件に応じて一部の構成要素を省略又は変更してもよい。図10のパノラマ映像符号化システムの構成は一例に過ぎず、パノラマ映像符号化システムの用途又は条件に応じて一部の構成要素を省略又は変更してもよい。例えば、撮影部1011が1台の撮像装置のみを含む場合、合成部1012を省略することができる。
図5、図7、図9、図15〜図19、図21、及び図22に示したフローチャートは一例に過ぎず、動画像符号化装置又は動画像復号装置の構成又は条件に応じて、一部の処理を省略又は変更してもよい。例えば、図15の動画像符号化処理において、入力される符号化対象映像が全周囲パノラマ映像に限られる場合、ステップ1501及びステップ1502の処理を省略することができる。決定部1103は、ステップ1505の処理をブロック毎に毎回行う必要はなく、1枚の符号化対象パノラマ画像に対して1回のみ、ステップ1505の処理を行ってもよい。
図17の補正処理において、動き補償部1110は、SADの代わりに、参照パノラマ画像と符号化対象パノラマ画像との差分を表す別の指標を計算し、判定部1102は、その指標を用いて符号化対象ブロックを補正するか否かを判定してもよい。
図18の動画像符号化処理において、入力される符号化対象映像が全周囲パノラマ映像に限られる場合、ステップ1801及びステップ1802の処理を省略することができる。決定部1103は、ステップ1805の処理をブロック毎に毎回行う必要はなく、1枚の符号化対象パノラマ画像に対して1回のみ、ステップ1805の処理を行ってもよい。
図19の補正処理において、判定部1102は、量子化スケールの平均値の代わりに、中央値、最大値等の別の統計値を用いて、符号化効率を計算してもよい。
図21の動画像復号処理において、入力される復号対象映像が全周囲パノラマ映像に限られる場合、ステップ2101及びステップ2102の処理を省略することができる。抽出部2011は、ステップ2105の処理をブロック毎に毎回行う必要はなく、1枚の復号対象画像に対して1回のみ、ステップ2105の処理を行ってもよい。
図22の動画像符号化処理において、入力される符号化対象映像が全周囲パノラマ映像に限られる場合、ステップ2201及びステップ2202の処理を省略することができる。決定部1103は、ステップ2205の処理をブロック毎に毎回行う必要はなく、1枚の符号化対象パノラマ画像に対して1回のみ、ステップ2205の処理を行ってもよい。
図1〜図3の展開パノラマ画像は一例に過ぎず、パノラマ映像符号化システムの構成又は条件に応じて、別の展開パノラマ画像を用いてもよい。
図12〜図14の全周囲パノラマ画像は一例に過ぎず、撮影範囲に存在する被写体に応じて全周囲パノラマ画像は変化する。符号化対象パノラマ画像に写った被写体の移動方向は、水平方向に限られず、垂直方向又は斜め方向である場合もある。符号化対象パノラマ画像全体の動きが垂直方向又は斜め方向であっても、図5、図7、図15、図18、及び図22の動画像符号化処理と図9及び図21の動画像復号処理を適用することができる。符号化対象パノラマ画像の直前の時刻における符号化済みのパノラマ画像の代わりに、別の時刻における符号化済みのパノラマ画像を、参照パノラマ画像として用いてもよい。
図23は、図4、図6、又は図11の動画像符号化装置、図8又は図20の動画像復号装置として用いられる情報処理装置(コンピュータ)の構成例を示している。図23の情報処理装置は、Central Processing Unit(CPU)2301、メモリ2302、入力装置2303、出力装置2304、補助記憶装置2305、媒体駆動装置2306、及びネットワーク接続装置2307を備える。これらの構成要素はバス2308により互いに接続されている。
メモリ2302は、例えば、Read Only Memory(ROM)、Random Access Memory(RAM)、フラッシュメモリ等の半導体メモリであり、動画像符号化処理又は動画像復号処理に用いられるプログラム及びデータを記憶する。メモリ2302は、図4の記憶部411、図6の記憶部611、図8の記憶部811、図11のフレームメモリ1112、及び図20のフレームメモリ2017として用いることができる。
CPU2301(プロセッサ)は、例えば、メモリ2302を利用してプログラムを実行することにより、図4の決定部412、補正部413、及び符号化部414として動作する。CPU2301は、メモリ2302を利用してプログラムを実行することにより、図6の決定部612、補正部613、及び符号化部614としても動作する。CPU2301は、メモリ2302を利用してプログラムを実行することにより、図8の抽出部812、復号部813、及び補正部814としても動作する。
CPU2301は、メモリ2302を利用してプログラムを実行することにより、図11の変更部1101、判定部1102、決定部1103、変更部1104、減算部1105、T/Q1106、及びENT1107としても動作する。CPU2301は、IQ/IT1108、加算部1109、動き補償部1110、及び予測画像生成部1111としても動作する。
CPU2301は、メモリ2302を利用してプログラムを実行することにより、図20の抽出部2011、変更部2012、ブロック復号部2013、加算部2014、動き補償部2015、及び予測画像生成部2016としても動作する。
入力装置2303は、例えば、キーボード、ポインティングデバイス等であり、ユーザ又はオペレータからの指示や情報の入力に用いられる。出力装置2304は、例えば、表示装置、プリンタ、スピーカ等であり、ユーザ又はオペレータへの問い合わせや処理結果の出力に用いられる。情報処理装置が動画像復号装置である場合、処理結果は、復元された符号化対象パノラマ映像であってもよい。
補助記憶装置2305は、例えば、磁気ディスク装置、光ディスク装置、光磁気ディスク装置、テープ装置等である。補助記憶装置2305は、ハードディスクドライブ又はフラッシュメモリであってもよい。情報処理装置は、補助記憶装置2305にプログラム及びデータを格納しておき、それらをメモリ2302にロードして使用することができる。
媒体駆動装置2306は、可搬型記録媒体2309を駆動し、その記録内容にアクセスする。可搬型記録媒体2309は、メモリデバイス、フレキシブルディスク、光ディスク、光磁気ディスク等である。可搬型記録媒体2309は、Compact Disk Read Only Memory(CD−ROM)、Digital Versatile Disk(DVD)、又はUniversal Serial Bus(USB)メモリであってもよい。ユーザ又はオペレータは、この可搬型記録媒体2309にプログラム及びデータを格納しておき、それらをメモリ2302にロードして使用することができる。
このように、処理に用いられるプログラム及びデータを格納するコンピュータ読み取り可能な記録媒体には、メモリ2302、補助記憶装置2305、及び可搬型記録媒体2309のような、物理的な(非一時的な)記録媒体が含まれる。
ネットワーク接続装置2307は、Local Area Network(LAN)、インターネット等の通信ネットワークに接続され、通信に伴うデータ変換を行う通信インタフェースである。情報処理装置が動画像符号化装置である場合、ネットワーク接続装置2307は、符号化パノラマ映像のビットストリームを動画像復号装置へ送信することができる。情報処理装置が動画像復号装置である場合、ネットワーク接続装置2307は、符号化パノラマ映像のビットストリームを動画像符号化装置から受信することができる。
情報処理装置は、プログラム及びデータを外部の装置からネットワーク接続装置2307を介して受け取り、それらをメモリ2302にロードして使用することもできる。
なお、情報処理装置が図23のすべての構成要素を含む必要はなく、用途又は条件に応じて一部の構成要素を省略することも可能である。例えば、ユーザ又はオペレータとのインタフェースが不要の場合は、入力装置2303及び出力装置2304を省略してもよい。また、情報処理装置が可搬型記録媒体2309にアクセスしない場合は、媒体駆動装置2306を省略してもよい。
開示の実施形態とその利点について詳しく説明したが、当業者は、特許請求の範囲に明確に記載した本発明の範囲から逸脱することなく、様々な変更、追加、省略をすることができるであろう。
図1乃至図23を参照しながら説明した実施形態に関し、さらに以下の付記を開示する。
(付記1)
撮像装置が撮影したパノラマ映像に含まれるパノラマ画像を展開した符号化対象パノラマ画像を符号化するために用いられる参照パノラマ画像を記憶する記憶部と、
前記参照パノラマ画像に対する前記符号化対象パノラマ画像のずれ量を表すベクトルを決定する決定部と、
前記符号化対象パノラマ画像内における複数の符号化対象領域それぞれの位置を前記ずれ量を表すベクトルに基づいて補正することで、補正された符号化対象パノラマ画像を生成する補正部と、
前記補正された符号化対象パノラマ画像内の前記複数の符号化対象領域それぞれの画像を、前記参照パノラマ画像を用いて符号化する符号化部と、
を備えることを特徴とする動画像符号化装置。
(付記2)
前記決定部は、補正前の前記複数の符号化対象領域それぞれの動きベクトルのうち、他の動きベクトルよりも多く発生する動きベクトルを、前記ずれ量を表すベクトルに決定することを特徴とする付記1記載の動画像符号化装置。
(付記3)
前記補正部は、補正前の前記符号化対象パノラマ画像内における動きベクトルの総数に対する前記ずれ量を表すベクトルの個数の比率が、所定値よりも大きい場合、前記補正前の前記複数の符号化対象領域それぞれの位置を前記ずれ量を表すベクトルに基づいて補正することを特徴とする付記2記載の動画像符号化装置。
(付記4)
前記補正部は、前記参照パノラマ画像と補正前の前記符号化対象パノラマ画像とを用いた第1動き推定に基づく第1差分を求め、前記参照パノラマ画像と前記補正された前記符号化対象パノラマ画像とを用いた第2動き推定に基づく第2差分を求め、前記第2差分が前記第1差分よりも小さい場合、前記補正前の前記複数の符号化対象領域それぞれの位置を前記ずれ量を表すベクトルに基づいて補正することを特徴とする付記2記載の動画像符号化装置。
(付記5)
前記補正部は、前記参照パノラマ画像と補正前の前記符号化対象パノラマ画像とを用いた第1動き推定に基づく量子化スケールと、前記第1動き推定に基づく符号の情報量とを求め、前記参照パノラマ画像と前記補正された前記前記符号化対象パノラマ画像とを用いた第2動き推定に基づく量子化スケールと、前記第2動き推定に基づく符号の情報量とを求め、前記第2動き推定に基づく量子化スケールと前記第2動き推定に基づく符号の情報量との積が、前記第1動き推定に基づく量子化スケールと前記第1動き推定に基づく符号の情報量との積よりも小さい場合、前記補正前の前記複数の符号化対象領域それぞれの位置を前記ずれ量を表すベクトルに基づいて補正することを特徴とする付記2記載の動画像符号化装置。
(付記6)
複数の撮像装置が撮影した複数の映像を組み合わせたパノラマ映像に含まれる符号化対象パノラマ画像を符号化するために用いられる参照画像を記憶する記憶部と、
前記複数の映像それぞれの撮影範囲が移動することによって、前記符号化対象パノラマ画像内の符号化対象領域が前記参照画像に対してずれた場合、前記参照画像に対する前記符号化対象領域のずれ量を表すベクトルを決定する決定部と、
前記符号化対象パノラマ画像内における前記符号化対象領域の位置を前記ずれ量を表すベクトルに基づいて補正することで、補正された符号化対象領域を生成する補正部と、
前記補正された符号化対象領域の画像を、前記参照画像を用いて符号化する符号化部と、
を備えることを特徴とする動画像符号化装置。
(付記7)
撮像装置が撮影したパノラマ映像に含まれるパノラマ画像を展開した符号化対象パノラマ画像を符号化することで生成される符号化パノラマ画像を含む、符号化パノラマ映像を復号する動画像復号装置であって、
前記符号化パノラマ画像を復号するために用いられる参照パノラマ画像を記憶する記憶部と、
前記参照パノラマ画像に対する前記符号化対象パノラマ画像のずれ量を表すベクトルを、前記符号化パノラマ映像から抽出する抽出部と、
前記符号化パノラマ画像内の複数の復号対象領域それぞれを前記参照パノラマ画像を用いて復号して、復号パノラマ画像を生成する復号部と、
前記復号パノラマ画像内における前記複数の復号対象領域それぞれの位置を前記ずれ量を表すベクトルに基づいて補正することで、前記符号化対象パノラマ画像を復元する補正部と、
を備えることを特徴とする動画像復号装置。
(付記8)
撮像装置が撮影したパノラマ映像に含まれるパノラマ画像を展開した符号化対象パノラマ画像を符号化するために用いられる参照パノラマ画像を用いて、前記参照パノラマ画像に対する前記符号化対象パノラマ画像のずれ量を表すベクトルを決定し、
前記符号化対象パノラマ画像内における複数の符号化対象領域それぞれの位置を前記ずれ量を表すベクトルに基づいて補正することで、補正された符号化対象パノラマ画像を生成し、
前記補正された符号化対象パノラマ画像内の前記複数の符号化対象領域それぞれの画像を、前記参照パノラマ画像を用いて符号化する、
処理をコンピュータに実行させる動画像符号化プログラム。
(付記9)
前記コンピュータは、補正前の前記複数の符号化対象領域それぞれの動きベクトルのうち、他の動きベクトルよりも多く発生する動きベクトルを、前記ずれ量を表すベクトルに決定することを特徴とする付記8記載の動画像符号化プログラム。
(付記10)
複数の撮像装置が撮影した複数の映像それぞれの撮影範囲が移動することによって、前記複数の映像を組み合わせたパノラマ映像に含まれる符号化対象パノラマ画像を符号化するために用いられる参照画像に対して、前記符号化対象パノラマ画像内の符号化対象領域がずれた場合、前記参照画像に対する前記符号化対象領域のずれ量を表すベクトルを決定し、
前記符号化対象パノラマ画像内における前記符号化対象領域の位置を前記ずれ量を表すベクトルに基づいて補正することで、補正された符号化対象領域を生成し、
前記補正された符号化対象領域の画像を、前記参照画像を用いて符号化する、
処理をコンピュータに実行させる動画像符号化プログラム。
(付記11)
撮像装置が撮影したパノラマ映像に含まれるパノラマ画像を展開した符号化対象パノラマ画像を符号化することで生成される符号化パノラマ画像を含む、符号化パノラマ映像を復号するコンピュータに、
前記符号化パノラマ画像を復号するために用いられる参照パノラマ画像に対する、前記符号化対象パノラマ画像のずれ量を表すベクトルを、前記符号化パノラマ映像から抽出し、
前記符号化パノラマ画像内の複数の復号対象領域それぞれを前記参照パノラマ画像を用いて復号して、復号パノラマ画像を生成し、
前記復号パノラマ画像内における前記複数の復号対象領域それぞれの位置を前記ずれ量を表すベクトルに基づいて補正することで、前記符号化対象パノラマ画像を復元する、
処理を実行させる動画像復号プログラム。
(付記12)
コンピュータが、
撮像装置が撮影したパノラマ映像に含まれるパノラマ画像を展開した符号化対象パノラマ画像を符号化するために用いられる参照パノラマ画像を用いて、前記参照パノラマ画像に対する前記符号化対象パノラマ画像のずれ量を表すベクトルを決定し、
前記符号化対象パノラマ画像内における複数の符号化対象領域それぞれの位置を前記ずれ量を表すベクトルに基づいて補正することで、補正された符号化対象パノラマ画像を生成し、
前記補正された符号化対象パノラマ画像内の前記複数の符号化対象領域それぞれの画像を、前記参照パノラマ画像を用いて符号化する、
ことを特徴とする動画像符号化方法。
(付記13)
前記コンピュータは、補正前の前記複数の符号化対象領域それぞれの動きベクトルのうち、他の動きベクトルよりも多く発生する動きベクトルを、前記ずれ量を表すベクトルに決定することを特徴とする付記12記載の動画像符号化方法。
(付記14)
コンピュータが、
複数の撮像装置が撮影した複数の映像それぞれの撮影範囲が移動することによって、前記複数の映像を組み合わせたパノラマ映像に含まれる符号化対象パノラマ画像を符号化するために用いられる参照画像に対して、前記符号化対象パノラマ画像内の符号化対象領域がずれた場合、前記参照画像に対する前記符号化対象領域のずれ量を表すベクトルを決定し、
前記符号化対象パノラマ画像内における前記符号化対象領域の位置を前記ずれ量を表すベクトルに基づいて補正することで、補正された符号化対象領域を生成し、
前記補正された符号化対象領域の画像を、前記参照画像を用いて符号化する、
ことを特徴とする動画像符号化方法。
(付記15)
撮像装置が撮影したパノラマ映像に含まれるパノラマ画像を展開した符号化対象パノラマ画像を符号化することで生成される符号化パノラマ画像を含む、符号化パノラマ映像を復号するコンピュータが、
前記符号化パノラマ画像を復号するために用いられる参照パノラマ画像に対する、前記符号化対象パノラマ画像のずれ量を表すベクトルを、前記符号化パノラマ映像から抽出し、
前記符号化パノラマ画像内の複数の復号対象領域それぞれを前記参照パノラマ画像を用いて復号して、復号パノラマ画像を生成し、
前記復号パノラマ画像内における前記複数の復号対象領域それぞれの位置を前記ずれ量を表すベクトルに基づいて補正することで、前記符号化対象パノラマ画像を復元する、
ことを特徴とする動画像復号方法。
101、201、202、301、1301〜1303、1401、1402 パノラマ画像
102 境界線
103、203、204、321〜323 展開パノラマ画像
205 全周囲パノラマ画像
311〜314 領域
401、601、1014 動画像符号化装置
411、611、811 記憶部
412、612、1103 決定部
413、613、814 補正部
414、614 符号化部
421、821、1201 参照パノラマ画像
621 参照画像
801、2001 動画像復号装置
812、2011 抽出部
813 復号部
1001 パノラマ映像符号化システム
1011 撮影部
1012 合成部
1013 展開部
1101、1104、2012 変更部
1102 判定部
1105 減算部
1109、2014 加算部
1110、2015 動き補償部
1111、2016 予測画像生成部
1112、2017 フレームメモリ
1202、1203 符号化対象パノラマ画像
1211 動きベクトル
2013 ブロック復号部
2301 CPU
2302 メモリ
2303 入力装置
2304 出力装置
2305 補助記憶装置
2306 媒体駆動装置
2307 ネットワーク接続装置
2308 バス
2309 可搬型記録媒体

Claims (13)

  1. 撮像装置が撮影したパノラマ映像に含まれるパノラマ画像を展開した符号化対象パノラマ画像を符号化するために用いられる参照パノラマ画像を記憶する記憶部と、
    前記参照パノラマ画像に対する前記符号化対象パノラマ画像のずれ量を表すベクトルを決定する決定部と、
    前記符号化対象パノラマ画像内における複数の符号化対象領域それぞれの位置を前記ずれ量を表すベクトルに基づいて補正することで、補正された符号化対象パノラマ画像を生成する補正部と、
    前記補正された符号化対象パノラマ画像内の前記複数の符号化対象領域それぞれの画像を、前記参照パノラマ画像を用いて符号化する符号化部と、
    を備えることを特徴とする動画像符号化装置。
  2. 前記決定部は、補正前の前記複数の符号化対象領域それぞれの動きベクトルのうち、他の動きベクトルよりも多く発生する動きベクトルを、前記ずれ量を表すベクトルに決定することを特徴とする請求項1記載の動画像符号化装置。
  3. 前記補正部は、補正前の前記符号化対象パノラマ画像内における動きベクトルの総数に対する前記ずれ量を表すベクトルの個数の比率が、所定値よりも大きい場合、前記補正前の前記複数の符号化対象領域それぞれの位置を前記ずれ量を表すベクトルに基づいて補正することを特徴とする請求項2記載の動画像符号化装置。
  4. 前記補正部は、前記参照パノラマ画像と前記補正された符号化対象パノラマ画像とを用いた第1動き推定に基づく第1差分を求め、前記参照パノラマ画像と補正前の前記符号化対象パノラマ画像とを用いた第2動き推定に基づく第2差分を求め、前記第1差分が前記第2差分よりも小さい場合、前記補正前の前記複数の符号化対象領域それぞれの位置を前記ずれ量を表すベクトルに基づいて補正することを特徴とする請求項2記載の動画像符号化装置。
  5. 前記補正部は、前記参照パノラマ画像と前記補正された符号化対象パノラマ画像とを用いた第1動き推定に基づく量子化スケールと、前記第1動き推定に基づく符号の情報量とを求め、前記参照パノラマ画像と補正前の前記符号化対象パノラマ画像とを用いた第2動き推定に基づく量子化スケールと、前記第2動き推定に基づく符号の情報量とを求め、前記第1動き推定に基づく量子化スケールと前記第1動き推定に基づく符号の情報量との積が、前記第2動き推定に基づく量子化スケールと前記第2動き推定に基づく符号の情報量との積よりも小さい場合、前記補正前の前記複数の符号化対象領域それぞれの位置を前記ずれ量を表すベクトルに基づいて補正することを特徴とする請求項2記載の動画像符号化装置。
  6. 複数の撮像装置が撮影した複数の映像を組み合わせたパノラマ映像に含まれる符号化対象パノラマ画像を符号化するために用いられる参照画像を記憶する記憶部と、
    前記複数の映像それぞれの撮影範囲が移動することによって、前記符号化対象パノラマ画像内の符号化対象領域が前記参照画像に対してずれた場合、前記参照画像に対する前記符号化対象領域のずれ量を表すベクトルを決定する決定部と、
    前記符号化対象パノラマ画像内における前記符号化対象領域の位置を前記ずれ量を表すベクトルに基づいて補正することで、補正された符号化対象領域を生成する補正部と、
    前記補正された符号化対象領域の画像を、前記参照画像を用いて符号化する符号化部と、
    を備えることを特徴とする動画像符号化装置。
  7. 撮像装置が撮影したパノラマ映像に含まれるパノラマ画像を展開した符号化対象パノラマ画像を符号化することで生成される符号化パノラマ画像を含む、符号化パノラマ映像を復号する動画像復号装置であって、
    前記符号化パノラマ画像を復号するために用いられる参照パノラマ画像を記憶する記憶部と、
    前記参照パノラマ画像に対する前記符号化対象パノラマ画像のずれ量を表すベクトルを、前記符号化パノラマ映像から抽出する抽出部と、
    前記符号化パノラマ画像内の複数の復号対象領域それぞれを前記参照パノラマ画像を用いて復号して、復号パノラマ画像を生成する復号部と、
    前記復号パノラマ画像内における前記複数の復号対象領域それぞれの位置を前記ずれ量を表すベクトルに基づいて補正することで、前記符号化対象パノラマ画像を復元する補正部と、
    を備えることを特徴とする動画像復号装置。
  8. 撮像装置が撮影したパノラマ映像に含まれるパノラマ画像を展開した符号化対象パノラマ画像を符号化するために用いられる参照パノラマ画像を用いて、前記参照パノラマ画像に対する前記符号化対象パノラマ画像のずれ量を表すベクトルを決定し、
    前記符号化対象パノラマ画像内における複数の符号化対象領域それぞれの位置を前記ずれ量を表すベクトルに基づいて補正することで、補正された符号化対象パノラマ画像を生成し、
    前記補正された符号化対象パノラマ画像内の前記複数の符号化対象領域それぞれの画像を、前記参照パノラマ画像を用いて符号化する、
    処理をコンピュータに実行させる動画像符号化プログラム。
  9. 複数の撮像装置が撮影した複数の映像それぞれの撮影範囲が移動することによって、前記複数の映像を組み合わせたパノラマ映像に含まれる符号化対象パノラマ画像を符号化するために用いられる参照画像に対して、前記符号化対象パノラマ画像内の符号化対象領域がずれた場合、前記参照画像に対する前記符号化対象領域のずれ量を表すベクトルを決定し、
    前記符号化対象パノラマ画像内における前記符号化対象領域の位置を前記ずれ量を表すベクトルに基づいて補正することで、補正された符号化対象領域を生成し、
    前記補正された符号化対象領域の画像を、前記参照画像を用いて符号化する、
    処理をコンピュータに実行させる動画像符号化プログラム。
  10. 撮像装置が撮影したパノラマ映像に含まれるパノラマ画像を展開した符号化対象パノラマ画像を符号化することで生成される符号化パノラマ画像を含む、符号化パノラマ映像を復号するコンピュータに、
    前記符号化パノラマ画像を復号するために用いられる参照パノラマ画像に対する、前記符号化対象パノラマ画像のずれ量を表すベクトルを、前記符号化パノラマ映像から抽出し、
    前記符号化パノラマ画像内の複数の復号対象領域それぞれを前記参照パノラマ画像を用いて復号して、復号パノラマ画像を生成し、
    前記復号パノラマ画像内における前記複数の復号対象領域それぞれの位置を前記ずれ量を表すベクトルに基づいて補正することで、前記符号化対象パノラマ画像を復元する、
    処理を実行させる動画像復号プログラム。
  11. コンピュータが、
    撮像装置が撮影したパノラマ映像に含まれるパノラマ画像を展開した符号化対象パノラマ画像を符号化するために用いられる参照パノラマ画像を用いて、前記参照パノラマ画像に対する前記符号化対象パノラマ画像のずれ量を表すベクトルを決定し、
    前記符号化対象パノラマ画像内における複数の符号化対象領域それぞれの位置を前記ずれ量を表すベクトルに基づいて補正することで、補正された符号化対象パノラマ画像を生成し、
    前記補正された符号化対象パノラマ画像内の前記複数の符号化対象領域それぞれの画像を、前記参照パノラマ画像を用いて符号化する、
    ことを特徴とする動画像符号化方法。
  12. コンピュータが、
    複数の撮像装置が撮影した複数の映像それぞれの撮影範囲が移動することによって、前記複数の映像を組み合わせたパノラマ映像に含まれる符号化対象パノラマ画像を符号化するために用いられる参照画像に対して、前記符号化対象パノラマ画像内の符号化対象領域がずれた場合、前記参照画像に対する前記符号化対象領域のずれ量を表すベクトルを決定し、
    前記符号化対象パノラマ画像内における前記符号化対象領域の位置を前記ずれ量を表すベクトルに基づいて補正することで、補正された符号化対象領域を生成し、
    前記補正された符号化対象領域の画像を、前記参照画像を用いて符号化する、
    ことを特徴とする動画像符号化方法。
  13. 撮像装置が撮影したパノラマ映像に含まれるパノラマ画像を展開した符号化対象パノラマ画像を符号化することで生成される符号化パノラマ画像を含む、符号化パノラマ映像を復号するコンピュータが、
    前記符号化パノラマ画像を復号するために用いられる参照パノラマ画像に対する、前記符号化対象パノラマ画像のずれ量を表すベクトルを、前記符号化パノラマ映像から抽出し、
    前記符号化パノラマ画像内の複数の復号対象領域それぞれを前記参照パノラマ画像を用いて復号して、復号パノラマ画像を生成し、
    前記復号パノラマ画像内における前記複数の復号対象領域それぞれの位置を前記ずれ量を表すベクトルに基づいて補正することで、前記符号化対象パノラマ画像を復元する、
    ことを特徴とする動画像復号方法。
JP2016253533A 2016-12-27 2016-12-27 動画像符号化装置 Active JP6922215B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2016253533A JP6922215B2 (ja) 2016-12-27 2016-12-27 動画像符号化装置
US15/825,277 US10893290B2 (en) 2016-12-27 2017-11-29 Apparatus for moving image coding, apparatus for moving image decoding, and non-transitory computer-readable storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016253533A JP6922215B2 (ja) 2016-12-27 2016-12-27 動画像符号化装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2020173828A Division JP7047878B2 (ja) 2020-10-15 2020-10-15 動画像符号化装置

Publications (2)

Publication Number Publication Date
JP2018107683A true JP2018107683A (ja) 2018-07-05
JP6922215B2 JP6922215B2 (ja) 2021-08-18

Family

ID=62630857

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016253533A Active JP6922215B2 (ja) 2016-12-27 2016-12-27 動画像符号化装置

Country Status (2)

Country Link
US (1) US10893290B2 (ja)
JP (1) JP6922215B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3739880A1 (en) 2019-05-14 2020-11-18 Axis AB Method, device and computer program product for encoding a distorted image frame

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0799663A (ja) * 1993-04-09 1995-04-11 Daewoo Electron Co Ltd 動きベクトル検出装置
JPH08275049A (ja) * 1995-03-31 1996-10-18 Hitachi Ltd 撮像装置
JP2002112274A (ja) * 2000-10-03 2002-04-12 Nippon Telegr & Teleph Corp <Ntt> 処理時間適応画像符号化方法およびそのプログラムの記録媒体
JP2004187298A (ja) * 2002-12-03 2004-07-02 Docomo Communications Laboratories Usa Inc パノラマ画像および全方位画像の描画および符号化
JP2009200939A (ja) * 2008-02-22 2009-09-03 Sony Corp 画像処理装置と画像処理方法および画像処理システム

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3065633B2 (ja) 1990-03-24 2000-07-17 株式会社東芝 衝撃波治療装置及び温熱治療装置
US7627194B2 (en) * 2004-08-13 2009-12-01 Samsung Electronics Co., Ltd. Method and device for making virtual image region for motion estimation and compensation of panorama image
KR100688383B1 (ko) 2004-08-13 2007-03-02 경희대학교 산학협력단 파노라마 영상의 움직임 추정 및 보상
US7623682B2 (en) * 2004-08-13 2009-11-24 Samsung Electronics Co., Ltd. Method and device for motion estimation and compensation for panorama image
JP2006270676A (ja) * 2005-03-25 2006-10-05 Fujitsu Ltd パノラマ画像生成プログラム、パノラマ画像生成装置、パノラマ画像生成方法
US7570309B2 (en) * 2005-09-27 2009-08-04 Samsung Electronics Co., Ltd. Methods for adaptive noise reduction based on global motion estimation
WO2009019848A1 (ja) * 2007-08-03 2009-02-12 Panasonic Corporation 撮影装置、撮影方法、およびプログラム
JP5338174B2 (ja) * 2008-07-28 2013-11-13 富士通株式会社 パノラマ撮影装置及び方法、パノラマ撮影装置を搭載したカメラユニット
JP5517436B2 (ja) 2008-10-31 2014-06-11 キヤノン株式会社 動きベクトル検出装置及びプログラム
JP5409577B2 (ja) * 2010-10-05 2014-02-05 株式会社ソニー・コンピュータエンタテインメント パノラマ画像生成装置およびパノラマ画像生成方法
JP2012151796A (ja) * 2011-01-21 2012-08-09 Sony Corp 画像処理装置と画像処理方法およびプログラム
US9305240B2 (en) * 2011-12-07 2016-04-05 Google Technology Holdings LLC Motion aligned distance calculations for image comparisons
CA2866121C (en) * 2012-03-06 2018-04-24 Panasonic Intellectual Property Corporation Of America Moving picture coding method, moving picture decoding method, moving picture coding apparatus, moving picture decoding apparatus, and moving picture coding and decoding apparatus
JP2013218432A (ja) 2012-04-05 2013-10-24 Dainippon Printing Co Ltd 画像処理装置、画像処理方法、画像処理用プログラム、および、記録媒体
TWI542201B (zh) * 2013-12-26 2016-07-11 智原科技股份有限公司 降低視訊畫面抖動的方法與裝置
US9807411B2 (en) * 2014-03-18 2017-10-31 Panasonic Intellectual Property Management Co., Ltd. Image coding apparatus, image decoding apparatus, image processing system, image coding method, and image decoding method
CN106797495B (zh) * 2014-08-20 2020-12-22 弗劳恩霍夫应用研究促进协会 视频合成系统、视频合成方法及计算机可读存储介质
AU2015202937A1 (en) * 2015-05-29 2016-12-15 Canon Kabushiki Kaisha Systems and methods for registration of images
KR102267922B1 (ko) * 2015-09-23 2021-06-22 노키아 테크놀로지스 오와이 360도 파노라마 비디오를 코딩하는 방법, 장치 및 컴퓨터 프로그램 제품
US20170118475A1 (en) * 2015-10-22 2017-04-27 Mediatek Inc. Method and Apparatus of Video Compression for Non-stitched Panoramic Contents
US20170214937A1 (en) * 2016-01-22 2017-07-27 Mediatek Inc. Apparatus of Inter Prediction for Spherical Images and Cubic Images
US20170230668A1 (en) * 2016-02-05 2017-08-10 Mediatek Inc. Method and Apparatus of Mode Information Reference for 360-Degree VR Video
US10291910B2 (en) * 2016-02-12 2019-05-14 Gopro, Inc. Systems and methods for spatially adaptive video encoding
FI20165256L (fi) * 2016-03-24 2017-09-25 Nokia Technologies Oy Laitteisto, menetelmä ja tietokoneohjelma videokoodaukseen ja -dekoodaukseen
KR20180000279A (ko) * 2016-06-21 2018-01-02 주식회사 픽스트리 부호화 장치 및 방법, 복호화 장치 및 방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0799663A (ja) * 1993-04-09 1995-04-11 Daewoo Electron Co Ltd 動きベクトル検出装置
JPH08275049A (ja) * 1995-03-31 1996-10-18 Hitachi Ltd 撮像装置
JP2002112274A (ja) * 2000-10-03 2002-04-12 Nippon Telegr & Teleph Corp <Ntt> 処理時間適応画像符号化方法およびそのプログラムの記録媒体
JP2004187298A (ja) * 2002-12-03 2004-07-02 Docomo Communications Laboratories Usa Inc パノラマ画像および全方位画像の描画および符号化
JP2009200939A (ja) * 2008-02-22 2009-09-03 Sony Corp 画像処理装置と画像処理方法および画像処理システム

Also Published As

Publication number Publication date
US10893290B2 (en) 2021-01-12
JP6922215B2 (ja) 2021-08-18
US20180184112A1 (en) 2018-06-28

Similar Documents

Publication Publication Date Title
KR102387363B1 (ko) 영상 코딩 시스템에서 인터 예측에 따른 영상 디코딩 방법 및 장치
CN110741640B (zh) 用于视频代码化中的运动补偿预测的光流估计
WO2010035733A1 (ja) 画像処理装置および方法
TWI463878B (zh) Image processing apparatus and method
JP5303754B2 (ja) 多視点映像符号化方法、多視点映像復号方法、多視点映像符号化装置、多視点映像復号装置、及びプログラム
JPWO2018047668A1 (ja) 画像処理装置および画像処理方法
WO2010035730A1 (ja) 画像処理装置および方法
JP5581688B2 (ja) 画像処理装置および方法、並びにプログラム
CN107852500B (zh) 运动矢量场编码方法和解码方法、编码和解码装置
JPWO2014050830A1 (ja) 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、画像符号化プログラム、画像復号プログラム及び記録媒体
US20180343470A1 (en) Method of using cube mapping and mapping metadata for encoders
US10425656B2 (en) Method of inter-frame prediction for video encoding and decoding
WO2014156648A1 (ja) 複数の入力画像をエンコーディングする方法、プログラムを格納する記憶媒体および装置
JP2011135184A (ja) 画像処理装置および方法、並びにプログラム
WO2015056712A1 (ja) 動画像符号化方法、動画像復号方法、動画像符号化装置、動画像復号装置、動画像符号化プログラム、及び動画像復号プログラム
JP7047878B2 (ja) 動画像符号化装置
JP4944046B2 (ja) 映像符号化方法,復号方法,符号化装置,復号装置,それらのプログラムおよびコンピュータ読み取り可能な記録媒体
JP4874578B2 (ja) 画像符号化装置
JP6922215B2 (ja) 動画像符号化装置
JP6539580B2 (ja) インター予測装置、インター予測方法、動画像符号化装置、動画像復号装置及びコンピュータ可読記録媒体
WO2014156647A1 (ja) 複数の入力画像をエンコーディングする方法、プログラムを格納する記憶媒体および装置
JP2016127372A (ja) 動画像符号化装置、動画像復号装置、動画像処理システム、動画像符号化方法、動画像復号方法、およびプログラム
JP2006295521A (ja) 動画像圧縮装置および動画像撮像装置
JP2016076758A (ja) 再生装置、符号化装置、および再生方法
JP7380435B2 (ja) 映像処理装置、及び映像処理システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190910

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200806

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200818

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201015

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20201015

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20201015

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20210302

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210514

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20210514

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20210524

C21 Notice of transfer of a case for reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C21

Effective date: 20210525

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210629

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210712

R150 Certificate of patent or registration of utility model

Ref document number: 6922215

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150