JP2001502504A - 立体視ビデオを符号化及び複号する装置及び方法 - Google Patents

立体視ビデオを符号化及び複号する装置及び方法

Info

Publication number
JP2001502504A
JP2001502504A JP10518671A JP51867198A JP2001502504A JP 2001502504 A JP2001502504 A JP 2001502504A JP 10518671 A JP10518671 A JP 10518671A JP 51867198 A JP51867198 A JP 51867198A JP 2001502504 A JP2001502504 A JP 2001502504A
Authority
JP
Japan
Prior art keywords
image
channel
affine
decoder
disparity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
JP10518671A
Other languages
English (en)
Inventor
チャン,ティハオ
ヅァン,ヤ―チン
Original Assignee
サーノフ コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by サーノフ コーポレイション filed Critical サーノフ コーポレイション
Publication of JP2001502504A publication Critical patent/JP2001502504A/ja
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/004Predictors, e.g. intraframe, interframe coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/167Synchronising or controlling image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/161Encoding, multiplexing or demultiplexing different image signal components
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/189Recording image signals; Reproducing recorded image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/194Transmission of image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/204Image signal generators using stereoscopic image cameras
    • H04N13/239Image signal generators using stereoscopic image cameras using two 2D image sensors having a relative position equal to or related to the interocular distance
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/286Image signal generators having separate monoscopic and stereoscopic modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N2013/0074Stereoscopic image analysis
    • H04N2013/0081Depth or disparity estimation from stereoscopic image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N2013/0074Stereoscopic image analysis
    • H04N2013/0085Motion estimation from stereoscopic image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N2013/0074Stereoscopic image analysis
    • H04N2013/0092Image segmentation from stereoscopic image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N2013/0074Stereoscopic image analysis
    • H04N2013/0096Synchronisation or controlling aspects

Abstract

(57)【要約】 ビデオの立体視符号化を達成するためにアフィン変換(245、255)を適用する装置と方法。

Description

【発明の詳細な説明】 立体視ビデオを符号化及び複号する装置及び方法 本出願は、1996年10月11日出願の米国出願第60/027,934号 の利益を主張する。 本発明は、ディジタルビデオを符号化し、また複号するための装置及び付随の 方法に関する。更に詳細には、本発明は、ビデオの立体視符号化を達成するため にアフィン変換を適用する装置及び方法に関する。 発明の背景 ビデオの圧縮方式と標準化努力とVLSI実現とにおける最近の進展に伴って 、立体視ディジタルビデオの符号化が注目を集めている。立体視ビデオに関して は幾つかの用途がある。例えば立体視情報源に基づいて3次元の動きと形の情報 を評価することは、コンピュータビジョンでは一般的である。立体視画像表現は また、ロボットの遠隔誘導にとっても有利である。医療用画像形成に関しては、 CT(コンピュータ断層撮影)とMRI(磁気共鳴イメージング)とを使って奥 行き情報の立体視表現を持つことが望ましい。ヨーロッパではDISTIMA( Digital Stereoscopic Imaging & Applications:ディジタル立体視画像の形成 と応用)プロジェクトが、現在、衛星放送に基づく立体視ビデオの互換可能な伝 送方式を調査している(国際標準化機構(ISO),「多視点映像へのMPEG 2適用に関する特別グループの報告」,ISO/IEC JTC/SC29/W GII No.861,1995年3月)。立体視RADARイメージングもま た、重要な用途であることが分かってきた。 立体視ビデオの適用の重要性の観点から、動画像専門家グループ(Motion Pic tures Experts Group:MPEG)委員会は、マルチビュープロファイル(MV P)と呼ばれる新しいプロファイルを定義するために特別グループの結成を決定 した(国際標準化機構(ISO),「多視点映像の検討に関する状況報告」,I SO/IEC JTC/SC29/WGII No.906,1995年3月) 。その目的は、現在の単視点MPEG圧縮方式に、後方互換性を保持しながら多 視 点能力を有する圧縮方式を提供することである。 発明の要約 本発明は、ビデオの立体視符号化を達成するためにアフィン変換を適用する。 図面の簡単な説明 本発明の教示内容は、以下の添付図面と合わせて下記の詳細な説明を考察する ことによって容易に理解することができる。 図1は、ディスパリティ(パリティ外れ)分析を用いる立体視ビデオ符号化の ブロック図である。 図2は、本発明の一実施形態を用いる立体視ビデオ符号化のブロック図である 。 図3Aと3Bは、アフィンパラメータを得るための一実施形態の説明図である 。 図4は、アフィンパラメータを評価する方法の流れ図を図示している。 理解を容易にするために、各図に共通な同じ要素を示すためには、できるだけ 同じ参照符号を用いた。 詳細な説明 立体視ビデオ符号化のために一般に使われる手法は、ディスパリティと動きと の分析を含んでおり、図1に図示する。符号化のシンタックス(論理構成)は、 MPEG2の中の時間的にスケーラブルなプロファイルシンタックスに基づいて いる。 立体視ビデオ列は、二つのビデオ列から構成されており、その一方は左チャネ ル100を表し、他方は右チャネル110を表す。各チャネルからのフレームは 同時に捕捉され、また異なる観察角を有している。従ってこれら二つのチャネル は同じ瞬間における同じ物体のスナップ撮影を異なる透視(perspective)によ って表しているので、これら二つのチャネル間には固有の冗長性が存在する。こ うしてわれわれは、スケーラブルな手法を使って、立体視ビデオ列を層構造で表 現する。ベース層の符号器105は、左チャネルだけを圧縮する。符号化された 左チャネル列は、一連の画像フレームからなっており、ベース層のビットストリ ームとしてマルチプレクサ(MUX)120に入力される。符号化方式には、通 常、離散コサイン変換(DCT)と量子化とランレングス符号化(RLC)とが 含まれる。各符号化済み左チャネル画像はまた、符号器105によって複号され 、 複号済みビットストリームは、ディスパリテイ評価器(disparity estimator) 115に与えられる。右ビデオ列110も一連の画像からなっており、またディ スパリティ評価器115に入力される。ディスパリティ評価器115は、対応す る右チャネル画像内のブロックと対をなす左チャネル複号済み画像内のブロック を探して、左チャネル符号器105によってディスパリティ評価器115に入力 された左チャネル複号済み画像を探索する。ディスパリティ評価器115は、右 チャネル画像内のブロックと、これと対をなす左チャネル画像内のブロックとの 間の相対的変位またはディスパリティを定義するディスパリティベクトルを生成 する。ディスパリティ評価器115は、ディスパリティベクトルと左チャネル複 号済み画像とを右チャネル符号器125に入力する。符号器125は、これらの ディスパリティベクトルを複号済み左チャネル画像に与えることによってディス パリティ補償された基準画像を生成する。この符号器は、差分画像あるいは残余 画像を得るために右チャネル画像からこのディスパリティ補償された左チャネル 画像を減算する。符号器125は、この残余画像とディスパリティベクトル(「 補助信号」)とを符号化して送信する。符号化は、通常DCTと、量子化と、R LCとが含まれる。代替の実施形態では、ディスパリティ評価器は、ディスパリ ティ補償画像と差分画像とを生成する。 受信側では、デマルチプレクサ(DMUX)130が符号化された左チャネル 画像を受信して、それを左チャネル複号器135に与える。左チャネル複号器1 35は、複号済み左チャネル画像を出力し、一連のこの複号済み左チャネル画像 が複号済み左チャネル列140を画成する。この複号済み左チャネル列はまた、 複号器150に入力される。複号器150は、DMUX130から符号化された ディスパリティベクトル(「補助信号」)を受信する。複号器150は、符号化 されたディスパリティベクトルと残余画像とを複号する。これら複号済みディス パリティベクトルは、ディスパリティ補償された左チャネル画像を供給するため に複号済み左チャネル画像に与えられる。符号器125によって行われた減算と は実質的に反対の処理で、複号器150は、複号済み右チャネル画像を提供する ためにディスパリティ補償済み左チャネル画像に残余画像を加算し、一連のこの 複号済み右チャネル画像列が右チャネル列160を画成する。 このような層構造は、異なる表示能力と帯域幅とを有する種々のユーザにサー ビスを提供する際に非常に望ましいものである。例えばスケーラビリティは、異 なる空間解像度間及び走査フォーマット間での互換性を提供することができる。 上述の手法では、観察角の変化は、ディスパリティ分析を用いて補償されるゼ ロ時間のカメラの動きと見なされる。動き補償を使って閉塞状態が拡大される。 このような表現は、2チャネルには十分であるが、多数のチャネルと視点とに対 してこの手法を一般化することは不便で非効率である。例えば変形と奥行き短縮 とが考慮されていない。立体視ビデオ列が利用可能であるから、より良い予測モ デルを得る際に、両チャネルに基づく3次元の動きの評価が可能である。本発明 の一実施形態のディジタル画像変形手法を使って透視点の動きをこの評価器に含 ませることができる。アフィン変換又は2次変換のいずれかを使う実施形態があ る。 図2は、本発明の一実施形態の立体視符号器と立体視複号器のブロック図であ る。一連の左チャネル画像からなる左チャネル列200は、左チャネル符号器2 05に与えられる。通常、符号化には離散コサイン変換(DCT)と量子化とR LCとが含まれる。符号化された左チャネル列は、MUX220に入力される。 符号器205からの複号された画像は、ディスパリティ評価器215とアフィ ン変換器255とに与えられる。ディスパリティ評価器215は、例えば従来技 術のディスパリティベクトルの代わりに一組のアフィンパラメータを生成する。 生成されたアフィンパラメータは、立体視チャネル列の左画像と右画像間との透 視点の見かけの変化を精確にモデル化する。 アフィンパラメータを生成するためにディスパリティ評価器215に与えられ る左チャネル列200からの複号済み左チャネル画像は、右チャネル列210か らの画像と比較される。特に、左チャネル画像からの非正方四辺形ブロックは、 右チャネル画像内の正方形ブロックに整合させられる。通常、ブロックマッチン グ法(BMM)を使って非正方四辺形ブロックへの変形のために最初に正方形の 左チャネルブロックが得られる。 このブロックの選択の後では、非正方形ブロックへの変形は、どの辺に沿って でも発生することが可能であり、また勾配型ガウスニュートン最適化手法を使っ て監視することができる。変形が終了した後に、望ましくは右画像内の選択され たブロックに最もよくマッチする変形ブロックは、一組6個のアフィンパラメー タを提供する。これら6個のアフィンパラメータは、そのブロックの形状を定義 する。各ブロック毎にこの一組のアフィンパラメータがアフィン変換器255に 与えられる。各ブロックのアフィンパラメータは、符号器225によって、ある いはアフィン変換器255内で符号化されてMUX220に送られる。 アフィン変換器255は、一つの変換済み画像を互いに共同して形成する複数 の変形済みブロックを与えるために、各ブロックについてアフィンパラメータを 処理する。変形済み画像は、差分画像あるいは残余画像を与えるために、右チャ ネル画像から減算される。この減算は、アフィン変換器255あるいは符号器2 25内で行うことができる。残余画像は、DCT圧縮、量子化圧縮、RLC圧縮 などにより符号器225によって符号化されて、MUX220に送られる。 受信側ではDEMUX230が、符号化された左チャネル画像を受信して、そ れらを複号器235に伝送する。複号器235は、その左チャネル画像を複号し て左チャネル列240を生成する。 補助信号、すなわちアフィンパラメータは、DMUX230から受け取られ、 複号器235等によって複号され、そしてアフィン変換器245に入力される。 複号済み左チャネル画像はまた、複号器235からアフィン変換器245に入力 される。アフィン変換器245は、送信側のアフィン変換器255の処理機能と 同等の処理機能を含んでいる。これらのアフィンパラメータを使ってアフィン変 換器245は、複号器235から入力された複号済み左チャネル画像を1ブロッ クずつ変換して、変換済み左チャネル画像を生成する。この変換済み左チャネル 画像は、アフィン変換器245または複号器250内で組み立てることができる 。いずれの場合にも複号器250は、変換済み左チャネル画像を得る。 複号器250は、DMUX230から残余画像を受け取る。残余画像は、複号 器250によって複号され、変換済み左チャネル画像に加算されて右チャネル画 像を生成する。当業者は、一連の画像フレームについて上述の処理を繰り返した 結果、右チャネル列260が生成されるということを理解するであろう。 前述の実施形態は、左チャネルと右チャネルとの間の透視視点差を更によく再 生するものである。符号器は視点の変化が考慮されるようにベース層列を操作す る。 アフィンパラメータの定式化を以下に説明する。より一般的な場合、12個の パラメータと回転を表す3x3マトリックスと平行移動を表す3x1ベクトルと が必要とされる。 例えば3次元空間では視点の変化は、回転と平行移動との組合せとしてモデル 化できる。 ここで変数rは回転を定義し、変数tは平行移動を定義するものである。対応点 は下記のように求められる。 X,Yは、元の座標。 zは、奥行き情報。 このような表現は、奥行き情報zの精確な評価を必要とする。もし奥行き情 報が見つかれば、完全なモデルを使うことができる。しかしながらこの定式化は 、もし12個のパラメータの、あるパターンが仮定されると、あまり巧妙でない 手法になってしまうことがある。特にこれは、r7とr8とt1とt2とt3を ゼロに設定し、r9を1に設定すること等により、ある条件下でのアフィン透視 変換になってしまうことがある。これは、平行移動が無視されるようにカメラが あまり動かなかったということを仮定している。これは一般に、二つのカメラ間 の 距離が小さい場合の立体視アプリケーションでは真である。アフィン変換を使用 することの利点は、他の一般的な方法に比べて複雑さが最も小さいということで ある。こうして、この定式化は下記の方程式で記述されるようなアフィン変換に することができる。 ここでr1とr2とr4とr5は画像平面内での回転であり、r3とr6は画像 平面内での平行移動である(物理的には奥行き変化として明示される)。 対応関係は下記の通りである これは例えばアフィン変換器255、245内に格納される。 この定式化は、もしt1とt2とt3とがゼロに設定されれば、透視変換に一 般化できる。各パラメータの適切な設定によって、同じ定式化が示される。 この対応関係は、次のようになっている。 しかしながらこの透視変換に関する計算上の負荷と複雑さは、アフィン変換に関 するものよりも遙かに大きい。 アフィンパラメータを取得するときは、最初によい開始点を見つけることが重 要である。反復勾配型手法は、もしこの開始点が正しく選択されないと、簡単に 発散してしまうことがある。アフィンパラメータを評価する際によい開始点を見 つけるためのピラミッド方式を以下に論ずる。もし収束解が見つからなければ、 評価器はディスパリティ分析に戻るであろう。こうして、われわれはディスパリ ティ分析によって、少なくとも性能がより低く制限されることができることを保 証することができる。 6個のアフィンパラメータを評価する精確で効率的な方法について説明する。 この方法は、アフィン変換に限定されるものではない。計算上の複雑さを低減す るためにこの評価用に空間的なピラミッドを使うことが望ましい。このピラミッ ド手法はまた、評価処理がローカル最小値あるいは発散に陥ることを防止するこ とができる。前述のようにこの手法は、ブロックマッチング法(BMM)と勾配 型ガウスニュートン最適化探索との考えを巧く組み合わせたものである。このよ うなハイブリッド手法の利点は、計算をあまり複雑にすることなしにグローバル 最小値を得ることができるということである。 左画像と右ビデオ列の両者が先ず、水平垂直両方向に半分だけ解像度を減らさ れた4層にサブサンプル化される。これらの画像は4層にサンプル化されるが、 本発明はこの層数に限定されないことを理解すべきである。特定の実施形態によ っては、追加の層を追加あるいは削除することができる。 各層に対して、評価器は、図4に示す下記のステップに従う。右チャネル画像 内の事前設定ブロックに最もよくマッチするブロックを識別するブロックマッチ ング法を使って左チャネル画像内の所定の領域を探索することによって、開始点 が決定される。最もよくマッチするブロックは、2乗誤差和(SSE)を最小に するであろう。従って選択された右チャネルブロックにマッチする左チャネルブ ロックを見つけることができる。これは、アフィンパラメータを評価するための 安定な開始点を与える。この処理を図3Aに示す。 更に明確に、アフィンパラメータを評価する方法400の流れ図を図4に示す 。アフィンパラメータは、ガウスニュートン最適化法を用いて評価される。すな わ ち、前の開始点に基づいてこの方法は、例えば左チャネル信号を右チャネル信号 に向けて変形させるように新しい開始ブロックを更に又は異なるように変形させ ることによって、新しいアフィンパラメータを与える差分増分を見つけることが できる。これを図3Bに示す。 この繰り返しを続行すべきかどうかを決定するために、2乗誤差和(SSE) の評価が行われる。もしSSEの減少が観察されれば、ガウスニュートン法の繰 り返しがもう一回行われる。SSEが有意に減少しなくなるか、SSEが発散し はじめるかどちらかの時点でこの反復は停止される。発散の場合は、これらのパ ラメータは発散する反復の直前のパラメータ値にリセットすることができる。こ うしてピラミッドの一つのレベルの評価は完了する。各層で取得されたすべての 情報は、最適化のための最初の開始点としてその次の層に渡される。 ピラミッド手法が使われることによって、計算の負荷はかなり減少する。有用 な収束解を見つける可能性は高い。発散解の場合は評価器は常に、BMM手法を 用いて取得した解に戻ることができる。これは、対象とする領域が遙かに小さな サイズに縮小される場合には特に重要である。このような場合、ガウスニュート ン反復は、領域サイズが16x16ピクセルから32x32ピクセルの領域範囲 に縮小される時のように、良好な開始点が必要である。 図4を参照すれば、方法400はステップ405から始めて、ステップ410 に進み、ここではブロックマッチング法を使って、例えばフレーム全体について 1マクロブロックずつ平行移動パラメータr3とr6とを評価する。最初にこれ らのパラメータは、次のように設定される。 図4は単一の層のアフィンパラメータを評価する方法を示していることに注目す べきである。こうして方法400は、空間的ピラミッドの各層に適用される。ブ ロックマッチング法の結果として得られた2乗誤差和(SSEBMM)は、後の使 用のために格納される。 ステップ420で、カウンタは初期化される。すなわち“i”は、ゼロ(0) に等しく設定されるが、ここでiはガウスニュートン評価法を適用する反復の回 数を表す。 ウスニュートン評価法を適用する。2乗誤差和(SSEi)が計算されて格納さ れる。 ステップ430で方法400は、i=1であるかどうかを問い合わせる。もし この問合せが肯定的に応答されれば、方法400は第2の評価を行うためにステ ップ425に戻る。もしこの問合せが否定的に応答されれば、方法400はステ ップ435に進む。 ステップ435で方法400は、SSEi-1がSSEiよりも大きいかどうかを 問い合わせる。もしこの問合せが肯定的に応答されれば、方法400はステップ 440に進む。もしこの問合せが否定的に応答されれば、方法400はステップ 445に進む。すなわちガウスニュートン評価法からの結果は、発散しており、 追加の反復は行われない。 ステップ445で方法400は、SSEBMMがSSEGN よりも小さいかどう かを問い合わせる。ここでSSEGNはSSEi-1に等しく設定される。すなわち ガウスニュートン評価法からの結果がブロックマッチング法と比較される。もし この問合せが肯定的に応答されれば、方法400はステップ455に進む。こ もしこの問合せが否定的に応答されれば、方法400はステップ450に進む 。ここでガウスニュートン法で評価されたアフィンパラメータが渡される。ステ ップ460で本方法は、その次の層に進む。 ステップ440で方法400は、(SSEi-1)−SSEiがしきい値εよりも 小さいかどうかを問い合わせる。このしきい値は好ましくは10-4に設定され る。しかしながら、異なる用途では他のしきい値を使うこともできる。もしこの 問合せが否定的に応答されれば、方法400はステップ425に進む。ここで ガウスニュートン評価法が再び実行される。もしこの問合せが肯定的に応答され れば、方法400はステップ470に進む。 またSSEGNはSSEiに等しく設定される。 ステップ475、480、485、490で方法400は再びガウスニュート ン評価法からの結果をブロックマッチング法と比較する。ここで、ステップ47 5、480、485、490はそれぞれ、ステップ445、450、455、4 60と同じである。このようにステップ475、480、485、490に関す る説明は、上述した。 従来技術のディスパリティ分析か、本発明の一実施形態のディスパリティ分析 とアフィン変換とのハイブリッドかのどちらかに基づいて評価器を比較するため に実験が実施された。実験の結果を下記の表2に示す。ここで各値は、信号対雑 音比のピークをdBで示している。左チャネルから来る予測は、「マネージ」列 と「トンネル」列についてそれぞれ0.66dBと0.77dBだけ改善されて いることが見られる。ガウスニュートン法についての最大反復回数は、各16x 16マクロブロックについて単に4回だけであった。このように計算の負荷は最 小である。もしアフィン変換の評価が発散するならば、この評価器は、平均2乗 誤差測定を使ってそれを観測してディスパリティ分析モードに戻るであろう。こ うして予測性能は、ディスパリティ分析手法によって、より低く限定される。 本発明は、これらの処理を実用化するためにコンピュータ化された処理と装置 の形で実現することができる。本発明はまた、フロッピーディスケット、CD− ROM、ハードドライブ、その他どのようなものでもコンピュータ読取り可能な 記憶媒体といった具体的な媒体において実現されるコンピュータプログラムコー ドの形で実現することができる。この場合、コンピュータプログラムコードがコ ンピュータにロードされて実行されるときには、このコンピュータが本発明を実 施する装置となる。本発明はまた例えば、記憶媒体に格納され、コンピュータに ロードされ、そして/またはコンピュータによって実行されるか、あるいは電線 や電気ケーブルの上を、あるいは光ファイバを通って、または電磁放射を介して といった何らかの伝送媒体上を伝送されるといったコンピュータプログラムコー ドの形でも実現可能である。この場合、コンピュータプログラムコードがコンピ ュータにロードされて実行されるときには、このコンピュータが本発明を実施す る装置となる。 汎用マイクロプロセッサ上に実現されたときに、このコンピュータプログラムコ ードセグメントは、所定の論理回路を生成するようにそのマイクロプロセッサを 構成する。 本発明の本質を説明するために記述し図示してきた部分の細部と素材と配置と に関する種々の変更が、本発明の原理と範囲とから逸脱することなく、本技術に 精通する人々によって可能であるということは理解されるべきである。

Claims (1)

  1. 【特許請求の範囲】 1. 第1のチャネルの画像を受信するための第1の符号器と、 第2のチャネルの画像を受信するための第2の符号器と、 前記第1及び第2の符号器に連結された、アフィンパラメータを生成するため のディスパリティ評価器と、 前記ディスパリティ評価器に連結された、変換された画像を生成するためのア フィン変換器と、 を含む立体視符号器。 2. 前記変換された画像の各々は、前記第1のチャネルからの前記画像の各々 を減算して残余画像を形成する請求項1に記載の立体視符号器。 3. 前記一方のチャネルは右チャネルであって、前記第2のチャネルは左チャ ネルである請求項1に記載の立体視符号器。 4. 前記アフィンパラメータはガウスニュートン評価を用いて生成される請求 項1に記載の立体視符号器。 5. 第1のチャネルの、符号化された残余画像を受信するための第1の複号器 と、 第2のチャネルの、符号化された画像を複号するための第2の複号器と、 前記複号器に連結された、複号された変換済み画像を生成するためのアフィン 変換器と、 を含む立体視複号器。 6. 二つのチャネルの画像を符号化する方法であって、 (a)第1の複号器によって第1のチャネルの画像を受信するステップと、 (b)第2の複号器によって第2のチャネルの画像を受信するステップと、 (c)前記複号器からの画像を使ってアフィンパラメータを生成するステップ と、 (d)変換された画像を生成するためにアフィン変換器を使用するステップと 、 を含む方法。
JP10518671A 1996-10-11 1997-10-10 立体視ビデオを符号化及び複号する装置及び方法 Ceased JP2001502504A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US2793496P 1996-10-11 1996-10-11
US60/027,934 1996-10-11
PCT/US1997/019458 WO1998017068A1 (en) 1996-10-11 1997-10-10 Stereoscopic video coding and decoding apparatus and method

Publications (1)

Publication Number Publication Date
JP2001502504A true JP2001502504A (ja) 2001-02-20

Family

ID=21840605

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10518671A Ceased JP2001502504A (ja) 1996-10-11 1997-10-10 立体視ビデオを符号化及び複号する装置及び方法

Country Status (4)

Country Link
US (1) US6144701A (ja)
EP (1) EP0931420A4 (ja)
JP (1) JP2001502504A (ja)
WO (1) WO1998017068A1 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007069487A1 (ja) * 2005-12-15 2007-06-21 The University Of Tokyo 多視点画像の圧縮符号化方法及び復号化方法
JP2009512316A (ja) * 2005-10-11 2009-03-19 サムスン エレクトロニクス カンパニー リミテッド カメラパラメータを利用した多視点動画符号化及び復号化装置並びに方法と、これを行うためのプログラムの記録された記録媒体
JP2013523038A (ja) * 2010-03-22 2013-06-13 トムソン ライセンシング 立体的三次元画像の圧縮を維持する低帯域コンテンツのための方法及び装置
JP2015092700A (ja) * 2014-12-12 2015-05-14 トムソン ライセンシングThomson Licensing 立体的三次元画像の圧縮を維持する低帯域コンテンツのための方法及び装置
JP2015111833A (ja) * 2008-12-19 2015-06-18 コーニンクレッカ フィリップス エヌ ヴェ 3dビデオ上に3dグラフィックスをオーバレイするための方法及び装置
JP2019510593A (ja) * 2016-01-18 2019-04-18 メディカル ワイヤレス センシング リミテッド マイクロ波トモグラフィシステム

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5652616A (en) * 1996-08-06 1997-07-29 General Instrument Corporation Of Delaware Optimal disparity estimation for stereoscopic video coding
AU1941797A (en) * 1997-03-17 1998-10-12 Mitsubishi Denki Kabushiki Kaisha Image encoder, image decoder, image encoding method, image decoding method and image encoding/decoding system
US6993201B1 (en) 1997-07-08 2006-01-31 At&T Corp. Generalized scalability for video coder based on video objects
US6233356B1 (en) * 1997-07-08 2001-05-15 At&T Corp. Generalized scalability for video coder based on video objects
US7286724B2 (en) * 1999-12-06 2007-10-23 Hyundai Curitel, Inc. Method and apparatus for searching, browsing and summarizing moving image data using fidelity for tree-structure moving image hierarchy
AUPQ887100A0 (en) * 2000-07-19 2000-08-10 Dynamic Digital Depth Research Pty Ltd Image processing and encoding techniques
US6911995B2 (en) * 2001-08-17 2005-06-28 Mitsubishi Electric Research Labs, Inc. Computer vision depth segmentation using virtual surface
JP3951695B2 (ja) * 2001-12-11 2007-08-01 ソニー株式会社 画像配信システムおよび方法、画像配信装置および方法、画像受信装置および方法、記録媒体、並びにプログラム
JP3923898B2 (ja) * 2002-01-18 2007-06-06 株式会社東芝 画像符号化方法及び装置
US7319720B2 (en) * 2002-01-28 2008-01-15 Microsoft Corporation Stereoscopic video
KR100481732B1 (ko) * 2002-04-20 2005-04-11 전자부품연구원 다 시점 동영상 부호화 장치
WO2004004350A1 (ja) * 2002-06-28 2004-01-08 Sharp Kabushiki Kaisha 画像データ配信システムならびにその画像データ送信装置および画像データ受信装置
KR100751422B1 (ko) 2002-12-27 2007-08-23 한국전자통신연구원 스테레오스코픽 비디오 부호화 및 복호화 방법, 부호화 및복호화 장치
US7286689B2 (en) * 2003-06-07 2007-10-23 Hewlett-Packard Development Company, L.P. Motion estimation for compression of calibrated multi-view image sequences
US7463778B2 (en) * 2004-01-30 2008-12-09 Hewlett-Packard Development Company, L.P Motion estimation for compressing multiple view images
WO2005083636A1 (es) * 2004-02-27 2005-09-09 Td Vision Corporation, S.A. De C.V. Método y sistema de codificación digital de imágenes de video 3d estereoscópicas
JP2007525907A (ja) * 2004-02-27 2007-09-06 ティディヴィジョン コーポレイション エス.エー. デ シー.ヴィ. 立体3dビデオイメージディジタルデコーディングのシステムおよび方法
KR100716992B1 (ko) * 2005-02-04 2007-05-10 삼성전자주식회사 스테레오 영상 부호화 및 복호화 방법과 그 장치
KR100636785B1 (ko) * 2005-05-31 2006-10-20 삼성전자주식회사 다시점 입체 영상 시스템 및 이에 적용되는 압축 및 복원방법
EP1929783B1 (en) * 2005-09-29 2017-06-21 Samsung Electronics Co., Ltd. Method and apparatus for encoding a multi-view picture using disparity vectors, and computer readable recording medium storing a program for executing the method
KR101276720B1 (ko) * 2005-09-29 2013-06-19 삼성전자주식회사 카메라 파라미터를 이용하여 시차 벡터를 예측하는 방법,그 방법을 이용하여 다시점 영상을 부호화 및 복호화하는장치 및 이를 수행하기 위한 프로그램이 기록된 기록 매체
WO2007043775A1 (en) * 2005-10-07 2007-04-19 Electronics And Telecommunications Research Institute Method and apparatus for encoding and decoding hopping default view for multiple cameras system
US8937997B2 (en) * 2006-03-16 2015-01-20 Apple Inc. Scalable video coding/multiplexing compatible with non-scalable decoders
US7643748B2 (en) * 2006-06-02 2010-01-05 James Cameron Platform for stereoscopic image acquisition
US7456760B2 (en) * 2006-09-11 2008-11-25 Apple Inc. Complexity-aware encoding
EP2077038B1 (en) * 2006-10-18 2013-01-30 Apple Inc. Scalable video coding with filtering of lower layers
US20080095464A1 (en) * 2006-10-20 2008-04-24 Quvis, Inc. System and Method for Representing Motion Imagery Data
CN101420609B (zh) * 2007-10-24 2010-08-25 华为终端有限公司 视频编码、解码方法及视频编码器、解码器
US20090304086A1 (en) * 2008-06-06 2009-12-10 Apple Inc. Method and system for video coder and decoder joint optimization
CN102160387B (zh) * 2008-09-23 2016-03-02 杜比实验室特许公司 棋盘式多路复用图像数据的编码和解码架构
US20100172318A1 (en) 2009-01-05 2010-07-08 Intel Corporation Handling Hybrid Automatic Repeat Requests in Wireless Systems
CN105472369B (zh) 2009-01-29 2017-09-12 杜比实验室特许公司 视频装置
JP5562408B2 (ja) 2009-04-20 2014-07-30 ドルビー ラボラトリーズ ライセンシング コーポレイション 指揮された補間およびデータの後処理
CN102726046B (zh) 2010-01-27 2015-09-09 杜比实验室特许公司 用于图像和视频编解码中的参考处理的方法和系统
KR101645465B1 (ko) * 2010-07-23 2016-08-04 삼성전자주식회사 휴대용 단말기에서 입체 영상 데이터를 생성하기 위한 장치 및 방법
KR20120020627A (ko) * 2010-08-30 2012-03-08 삼성전자주식회사 3d 영상 포맷을 이용한 영상 처리 장치 및 방법
US9973742B2 (en) * 2010-09-17 2018-05-15 Adobe Systems Incorporated Methods and apparatus for preparation of casual stereoscopic video
US8976856B2 (en) 2010-09-30 2015-03-10 Apple Inc. Optimized deblocking filters
ITTO20110414A1 (it) * 2011-05-11 2012-11-12 St Microelectronics Pvt Ltd Procedimento ed apparecchiatura per elaborare segnali video, prodotto informatico e segnale codificato relativi
US10008002B2 (en) * 2012-02-28 2018-06-26 NXP Canada, Inc. Single-camera distance estimation
US20140348416A1 (en) * 2013-05-23 2014-11-27 Himax Media Solutions, Inc. Stereo image rectification apparatus and method

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2563298B2 (ja) * 1987-01-28 1996-12-11 株式会社東芝 3次元画像処理装置
JPH0669448B2 (ja) * 1989-10-09 1994-09-07 株式会社東芝 ステレオ視観察のためのx線画像取得表示方法及びその装置
US5559728A (en) * 1990-10-09 1996-09-24 University Of Washington Calibration transfer for second order analytical instruments
US5179441A (en) * 1991-12-18 1993-01-12 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Near real-time stereo vision system
US5557527A (en) * 1993-08-31 1996-09-17 Shima Seiki Manufacturing Ltd. Knit design system and a method for designing knit fabrics
TW269094B (en) * 1994-11-11 1996-01-21 Nitendo Kk Three dimensional visual image display device and electric game apparatus, memory device thereof
US5619256A (en) * 1995-05-26 1997-04-08 Lucent Technologies Inc. Digital 3D/stereoscopic video compression technique utilizing disparity and motion compensated predictions
JP3055438B2 (ja) * 1995-09-27 2000-06-26 日本電気株式会社 3次元画像符号化装置
US5652616A (en) * 1996-08-06 1997-07-29 General Instrument Corporation Of Delaware Optimal disparity estimation for stereoscopic video coding
GB2317525B (en) * 1996-09-20 2000-11-08 Nokia Mobile Phones Ltd A video coding system

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009512316A (ja) * 2005-10-11 2009-03-19 サムスン エレクトロニクス カンパニー リミテッド カメラパラメータを利用した多視点動画符号化及び復号化装置並びに方法と、これを行うためのプログラムの記録された記録媒体
WO2007069487A1 (ja) * 2005-12-15 2007-06-21 The University Of Tokyo 多視点画像の圧縮符号化方法及び復号化方法
JP2015111833A (ja) * 2008-12-19 2015-06-18 コーニンクレッカ フィリップス エヌ ヴェ 3dビデオ上に3dグラフィックスをオーバレイするための方法及び装置
JP2013523038A (ja) * 2010-03-22 2013-06-13 トムソン ライセンシング 立体的三次元画像の圧縮を維持する低帯域コンテンツのための方法及び装置
US9143758B2 (en) 2010-03-22 2015-09-22 Thomson Licensing Method and apparatus for low-bandwidth content-preserving encoding of stereoscopic 3D images
JP2015092700A (ja) * 2014-12-12 2015-05-14 トムソン ライセンシングThomson Licensing 立体的三次元画像の圧縮を維持する低帯域コンテンツのための方法及び装置
JP2019510593A (ja) * 2016-01-18 2019-04-18 メディカル ワイヤレス センシング リミテッド マイクロ波トモグラフィシステム
JP7018024B2 (ja) 2016-01-18 2022-02-09 メディカル ワイヤレス センシング リミテッド マイクロ波トモグラフィシステム

Also Published As

Publication number Publication date
WO1998017068A1 (en) 1998-04-23
EP0931420A1 (en) 1999-07-28
US6144701A (en) 2000-11-07
EP0931420A4 (en) 2002-06-26

Similar Documents

Publication Publication Date Title
JP2001502504A (ja) 立体視ビデオを符号化及び複号する装置及び方法
EP0823826B1 (en) Optimal disparity estimation for stereoscopic video coding
Tzovaras et al. Evaluation of multiresolution block matching techniques for motion and disparity estimation
WO1997004404A1 (en) Multi-viewpoint digital video encoding
Tzovaras et al. Disparity field and depth map coding for multiview 3D image generation
Morvan et al. System architecture for free-viewpoint video and 3D-TV
Maugey et al. Graph-based representation for multiview image geometry
Kauff et al. Functional coding of video using a shape-adaptive DCT algorithm and an object-based motion prediction toolbox
KR100775871B1 (ko) 영상합성기반 다시점 동영상 부호화 및 복호화를 수행하기위한 방법 및 장치
KR20210003809A (ko) 멀티뷰 비디오 디코딩 방법 및 장치와 이미지 처리 방법 및 장치
Yan et al. Stereo video coding based on frame estimation and interpolation
Aydinoglu et al. Compression of multi-view images
Vishwanath et al. Motion compensated prediction for translational camera motion in spherical video coding
van Beek et al. Object-based video coding using forward-tracking 2D mesh layers
Iyer et al. Multiview video coding using depth based 3D warping
Fujii et al. Data compression and interpolation of multi-view image set
Papadopoulos et al. Motion compensation using second-order geometric transformations
US6968009B1 (en) System and method of finding motion vectors in MPEG-2 video using motion estimation algorithm which employs scaled frames
Tzovaras et al. Disparity field and depth map coding for multiview image sequence compression
GB2285359A (en) Disparity coding images for bandwidth reduction
Wong et al. Horizontal scaling and shearing-based disparity-compensated prediction for stereo video coding
Chiang et al. Stereoscopic video coding
Tzovaras et al. Object-based coding of stereo image sequences using joint 3D motion/disparity segmentation
KR101138921B1 (ko) 다중 시점 기반의 비디오 인코딩 장치 및 방법
Micallef et al. Exploiting depth information for efficient multi-view video coding

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040830

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071016

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071030

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080130

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080317

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080229

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080414

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080331

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080519

A313 Final decision of rejection without a dissenting response from the applicant

Free format text: JAPANESE INTERMEDIATE CODE: A313

Effective date: 20080624

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080805