JP3055438B2 - 3次元画像符号化装置 - Google Patents

3次元画像符号化装置

Info

Publication number
JP3055438B2
JP3055438B2 JP24996195A JP24996195A JP3055438B2 JP 3055438 B2 JP3055438 B2 JP 3055438B2 JP 24996195 A JP24996195 A JP 24996195A JP 24996195 A JP24996195 A JP 24996195A JP 3055438 B2 JP3055438 B2 JP 3055438B2
Authority
JP
Japan
Prior art keywords
image
images
input
parallax
reference image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP24996195A
Other languages
English (en)
Other versions
JPH0993614A (ja
Inventor
三郎 甲藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP24996195A priority Critical patent/JP3055438B2/ja
Priority to US08/720,378 priority patent/US5696551A/en
Publication of JPH0993614A publication Critical patent/JPH0993614A/ja
Application granted granted Critical
Publication of JP3055438B2 publication Critical patent/JP3055438B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N11/00Colour television systems
    • H04N11/04Colour television systems using pulse code modulation
    • H04N11/042Codec means
    • H04N11/046DPCM
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/187Segmentation; Edge detection involving region growing; involving region merging; involving connected component labelling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/167Synchronising or controlling image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • G06T2207/10012Stereo images
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/189Recording image signals; Reproducing recorded image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N2013/0074Stereoscopic image analysis
    • H04N2013/0081Depth or disparity estimation from stereoscopic image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N2013/0074Stereoscopic image analysis
    • H04N2013/0092Image segmentation from stereoscopic image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N2013/0074Stereoscopic image analysis
    • H04N2013/0096Synchronisation or controlling aspects

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は3次元画像の高能率
符号化装置に関する。
【0002】
【従来の技術】図14に、ステレオ画像からの視差検出
の様子を示す。ステレオ画像の符号化方式として良く知
られているのが、ブロックマッチングを用いた視差補償
予測符号化方式である。これは、左眼画像と右眼画像が
与えられ、一方の画像から他方の画像を予測する際に、
ブロック単位に類似する領域を探索し、最も誤差の小さ
くなる視差ベクトルを選択し、この視差ベクトルによっ
て指示されるブロックを用いて予測画像を作成し、その
予測誤差信号と視差ベクトルを符号化する方式である。
たとえば、W.A.Schupp,安田:“視差補償お
よび動き補償を用いたステレオ動画像のデータ圧縮”,
1988年画像符号化シンポジウム予稿集,5−1(1
988)には、左右画像間、時間軸方向それぞれでブロ
ックマッチングを行い、予測誤差を最小にする視差ベク
トル、もしくは動きベクトルを適応的に選択して、予測
画像の作成を行う方式が示されている。また、野垣:
“MPEG−2によるステレオ画像符号化の検討”,1
994年画像符号化シンポジウム予稿集,3−10(1
994)では、ブロックマッチングを採用している動画
像符号化の国際標準であるMPEG−2を活用したステ
レオ画像符号化方式に関する報告が行われている。これ
らの方式によって、視差方向の予測を行わない場合より
も符号化効率が大幅に改善されると報告されている。
【0003】しかし、ブロックマッチング方式では、予
測画像に不自然なブロック状のひずみが発生する。これ
が、ブロックマッチングによって与えられるベクトルが
予め定められたブロック単位のものであるために、必ず
しも画面中の物体の視差を正しく反映していないためで
ある。これは、立体視した場合には不自然な奥行き間と
なり、臨場感の低下を引き起こす。また、その予測誤差
の低減効果にも問題が残される。
【0004】これに対し、画像を任意の形状の領域に分
割し、その領域単位にベクトルを求めることで、より自
然な予測画像を作成しようとする試みが報告されてい
る。具体的な領域分割手法としては、色輝度のヒストグ
ラムを用いる方式、エッジ検出に基づく方式、クラスタ
リングに基づく方式、などがあるが、特にクラスタリン
グ手法として代表的なのが、泉、森川、原島:“色情報
と位置情報とを併用したセグメンテーション手法の一検
討”,1991年電子情報通信学会春季全国大会D−6
80(1991)に示されている5次元クラスタリング
方式である。これは、特徴量空間としてRGBの3次元
色空間とxyの2次元位置空間との5次元空間を考え、
着目画素の色情報を(R、G、B)、位置情報を(x、
y)、インデクスnのクラスタの色情報の平均を
【0005】
【外1】
【0006】、位置の重心を
【0007】
【外2】
【0008】とした場合に、着目画素とn番目のクラス
タの距離dn
【0009】
【数1】
【0010】で定義する。そして、着目画素周辺の複数
のクラスタに対して距離dn の計算を行い、その距離d
n が最小となるクラスタnに着目画素が属する、と判定
する。ただし、w0 、w1 はそれぞれ重み係数である。
これによって、局所的な情報を失わず、かつ雑音にも強
い画像信号の領域分割が実現できる、と報告されてい
る。
【0011】さらに、横山、宮本:“動き情報を利用し
た動画像符号化用の領域分割方式”,1994年電子情
報通信学会秋季全国大会D−150(1994)では、
上記のクラスタリングアルゴリズムを動画像符号化に拡
張した報告を行っている。これは、特徴量空間としてY
CrCbの3次元色輝度空間とxyの2次元位置空間に
2次元動きベクトル空間を加えた7次元空間を考え、画
素単位に求められた動きベクトルを(vx 、vy )、ク
ラスタnに対して求められた動きベクトルを(vn,x
n,y )とし、着目画素とn番目のクラスタの距離dn
【0012】
【数2】
【0013】で定義する。そして、着目画素周辺の複数
のクラスタに対して距離dn の計算を行い、その距離d
n が最小となるクラスタnに着目画素が属すると判定す
る。ただし、w0 、w1 、w2 はそれぞれ重み係数であ
り、また前述のRGB空間をYCrCb空間に変更して
いるが、これは領域分割結果に大きな影響を与える問題
ではない。これによって、動きベクトル情報を用いない
クラスタリング方式に対して、動き補償予測符号化効率
が改善されると報告されている。この方式を視差方向に
応用すれば、そのまま領域分割に基づく視差補償予測が
実現できる。
【0014】しかし、上記の領域分割方式を用いた場合
には、予測誤差の低減という観点からは、ブロックマッ
チング方式に比しても、十分な予測画像が得られていな
いのが現状である。このために、得られる予測画像は非
常に歪んだものとなる。
【0015】一方、これまでの2次元画像を対象とする
符号化方式では、一般的に非合焦領域は観察者にとって
重要ではない領域とみなされてきた。非合焦領域の圧縮
は容易であり、圧縮効率の改善という観点からもこの選
択は妥当である。しかし、3次元画像の場合には、観察
者の視点がしばしば奥行き方向に移動する状況が予想さ
れる。この場合の非合焦領域の存在は、観察者にとって
臨場感を損なう一つの要因となる。
【0016】ここで、焦点の異なる複数枚の画像を用い
て、対象物体が異なる奥行きを持つ領域で同時に鮮鋭な
画像を再構成する検討が進められている。図15は、そ
の鮮鋭画像の獲得の問題を、概念的に示したものであ
る。たとえば、児玉、内藤、相澤、羽鳥:“複数の異な
る焦点画像からの全焦点画像の再構成”,1995年テ
レビジョン学会年次大会9−2(1995)では、ぼけ
の発生のモデルとしての点拡がり関数を与え、これに従
って順次劣化画像を生成し、他画像と比較し、より劣化
している部分を推定することで合焦領域の判定を行って
いる。これによって、エッジに隣接した画素での判定精
度が向上し、細部まで鮮鋭な統合画像を生成できた、と
報告されている。
【0017】しかし、上記の手法は画素単位の線形フィ
ルタ処理を施すために雑音に弱く、そのような場合には
十分な鮮鋭画像が得られない、という欠点があった。
【0018】また、公開特許公報平3−80676“電
子バンフォーカス装置”には、焦点の異なる画像を入力
とし、各画像をブロックに分割し、ブロック単位に高周
波成分情報を比較し、最も高周波成分情報が大きいブロ
ックを選択することで全体に焦点の合った画像を得る方
式が報告されている。
【0019】しかし、上記の手法ではブロック単位の処
理を行っているために、合焦領域と非合焦領域の混在す
る不自然なブロックが発生するという欠点があった。
【0020】
【発明が解決しようとする課題】従来のブロックマッチ
ングを用いた視差検出方式、および領域分割手法を用い
た視差検出方式では、共に予測誤差の低減という観点か
ら、十分な結果が得られていない。従来の異なる焦点画
像の鮮鋭化方式では、従来手法では画素単位のフィルタ
演算の安定性が問題となり、雑音に弱いという欠点があ
る。
【0021】本発明の目的は、視差方向に対しては、予
測誤差が小さく、かつ圧縮の容易な視差情報(視差ベク
トル)の検出を実現し、奥行き方向に対しては、雑音に
強い画像の鮮鋭化を実現し、臨場感の優れた3次元画像
符号化方式を提供することにある。
【0022】
【課題を解決するための手段】第1の発明の視差情報検
出装置は、視差を有する複数枚の画像を入力とし、前記
複数枚の画像の中の1枚を基準画像とし、前記基準画像
を除く複数枚の画像毎に、その入力画像と、統計情報
と、予測画像を用いて前記入力画像の領域分割を行う領
域分割手段と、前記入力画像と、前記領域分割手段によ
って与えられる領域分割情報を用いて前記領域毎の画素
値平均、画素値分散、重心位置等の前記統計情報を計算
する統計情報計算手段と、前記基準画像と、前記入力画
像と、前記領域分割情報を用いて前記領域単位に視差ベ
クトルを求める視差検出手段と、前記基準画像と、前記
視差ベクトルを用いて、前記入力画像の前記予測画像を
作成する視差補償予測手段とを備えることを特徴とす
る。
【0023】第2の発明の3次元画像符号化装置は、視
差を有する複数枚の画像を入力とし、前記複数枚の画像
の中の1枚を基準画像とし、前記基準画像を除く複数枚
の画像毎に、その入力画像と、統計情報と、予測画像を
用いて前記入力画像の領域分割を行う領域分割手段と、
前記入力画像と、前記領域分割手段によって与えられる
領域分割情報を用いて前記領域毎の画素値平均、画素値
分散、重心位置等の前記統計情報を計算する統計情報計
算手段と、前記基準画像と、前記入力画像と、前記領域
分割情報を用いて前記領域単位に視差ベクトルを求める
視差検出手段と、前記基準画像と、前記視差ベクトルを
用いて、前記入力画像の前記予測画像を作成する視差補
償予測手段と、前記基準画像を圧縮する手段と、前記視
差ベクトルを圧縮する手段とを備えることを特徴とす
る。
【0024】第3の発明の3次元画像符号化装置は、視
差を有する複数枚の画像を入力とし、前記複数枚の画像
の中の1枚を基準画像とし、前記基準画像を除く複数枚
の画像毎に、その入力画像と、統計情報と、予測画像を
用いて前記入力画像の領域分割を行う領域分割手段と、
前記入力画像と、前記領域分割手段によって与えられる
領域分割情報を用いて前記領域毎の画素値平均、画素値
分散、重心位置等の前記統計情報を計算する統計情報計
算手段と、前記基準画像と、前記入力画像と、前記領域
分割情報を用いて前記領域単位に視差ベクトルを求める
視差検出手段と、前記基準画像と、前記視差ベクトルを
用いて、前記入力画像の前記予測画像を作成する視差補
償予測手段と、前記基準画像を圧縮する手段と、前記視
差ベクトルの検出された画像毎に前記基準画像と前記視
差ベクトルを用いて予測画像を作成する視差補償予測手
段と、前記視差ベクトルの検出された画像と前記予測画
像との差分を取る手段と、前記視差ベクトルを圧縮する
手段と、前記差分情報を圧縮する手段を備えることを特
徴とする。
【0025】第4の発明の視差情報検出装置は、第1の
発明において、視差を有する複数枚の画像に対して、前
記複数枚の画像の中の1枚を基準画像として入力し、前
記基準画像を除く複数枚の画像を長方形、もしくはライ
ン単位にグループ化して入力する手段を更に備え、前記
グループを領域分割の最小単位として視差ベクトルを得
ることを特徴とする。
【0026】第5の発明の3次元画像符号化装置は、第
2の発明において、視差を有する複数枚の画像に対し
て、前記複数枚の画像の中の1枚を基準画像として入力
し、前記基準画像を除く複数枚の画像を長方形、もしく
はライン単位にグループ化して入力する手段を更に備
え、前記グループを領域分割の最小単位として視差ベク
トルを得ることを特徴とする。
【0027】第6の発明の3次元画像符号化装置は、第
3の発明において、視差を有する複数枚の画像に対し
て、前記複数枚の画像の中の1枚を基準画像として入力
し、前記基準画像を除く複数枚の画像を長方形、もしく
はライン単位にグループ化して入力する手段を更に備
え、前記グループを領域分割の最小単位として視差ベク
トルを得ることを特徴とする。
【0028】第7の発明の画像鮮鋭化装置は、合焦位置
の異なる複数枚の画像を入力とし、前記複数枚の画像の
中の1枚を基準画像とし、前記基準画像と、第1の統計
情報を用いて前記基準画像の領域分割を行う領域分割手
段と、前記基準画像と、前記領域分割手段によって与え
られる領域分割情報を用いて前記領域毎の画素値平均、
画素値分散、重心位置等の前記第1の統計情報を計算す
る第1の統計情報計算手段と、前記基準画像を除く複数
枚の画像毎に、その入力画像と、前記領域分割情報を用
いて、前記入力画像における前記領域毎の画素値平均、
画素値分散等を計算する第2の統計情報計算手段と、前
記領域分割情報と、前記第1の統計情報と、前記第2の
統計情報を用いて前記領域毎に合焦画像を決定する合焦
判定手段と、前記合焦位置の異なる複数枚の画像と、前
記領域分割情報と、前記合焦画像を用いて鮮鋭画像を出
力する画像合成手段とを備えることを特徴とする。
【0029】第8の発明の3次元画像符号化装置は、第
2の発明において、第7の発明の画像鮮鋭化装置を視差
を有する位置に複数個備え、視差を有する複数枚の鮮鋭
画像を入力とすることを特徴とする。
【0030】第9の発明の3次元画像符号化装置は、第
3の発明において、第7の発明の画像鮮鋭化装置を視差
を有する位置に複数個備え、視差を有する複数枚の鮮鋭
画像を入力とすることを特徴とする。
【0031】第10の発明の3次元画像符号化装置は、
第5の発明において、第7の発明の画像鮮鋭化装置を視
差を有する位置に複数個備え、視差を有する複数枚の鮮
鋭画像を入力とすることを特徴とする。
【0032】第11の発明の3次元画像符号化装置は、
第6の発明において、第7の発明の画像鮮鋭化装置を視
差を有する位置に複数個備え、視差を有する複数枚の鮮
鋭画像を入力とすることを特徴とする。
【0033】第12の発明の3次元画像復号装置は、第
2,5,8又は10の発明において、圧縮情報から基準
画像と複数枚の視差ベクトルを復号する手段と、前記視
差ベクトルの検出された画像毎に前記基準画像と前記視
差ベクトルを用いて予測画像を作成する視差補償予測手
段を備えることを特徴とする。
【0034】第13の発明の3次元画像復号装置は、第
3,6,9又は11の発明において、圧縮情報から基準
画像と複数枚の視差ベクトルと複数枚の差分情報を復号
する手段と、前記視差ベクトルの検出された画像毎に前
記基準画像と前記視差ベクトルを用いて予測画像を作成
する視差補償予測手段と、前記予測画像と前記差分情報
を加算する手段を備えることを特徴とする。
【0035】
【発明の実施の形態】本発明に従って構成した実施例を
示す。
【0036】ステレオ画像の領域分割に際し、従来の技
術に述べた泉、森川、原島による5次元クラスタリング
方式に視差検出の予測誤差を加えた8次元の空間を考
え、着目画素とn番目のクラスタの距離dn
【0037】
【数3】
【0038】で定義する。ただし、(Y,Cr,Cb)
は着目画素の色輝度情報、(x,y)は着目画素の位置
情報、
【0039】
【外3】
【0040】はクラスタnの色輝度の平均値、
【0041】
【外4】
【0042】はクラスタnの重心位置、
【0043】
【外5】
【0044】はクラスタnに対して検出された視差ベク
トル
【0045】
【外6】
【0046】によって指し示される参照画像の画素値、
(wo,1,2 )は重み係数である。そして、着目画素
周辺の複数のクラスタに対して距離計算を行い、距離が
最小となるクラスタnに着目画素が属する、と判定す
る。以上の操作を繰り返すことで、最終的な領域分割結
果を得る。
【0047】従来の技術に述べた横山、宮本の方式で
は、画素単位に求めた動きベクトルと領域単位に求めた
動きベクトルとの差分値を距離の評価式に加えることで
7次元のクラスタリングを行っているが、画素単位に検
出したベクトル値はばらつきが大きく、必ずしも大幅な
予測誤差の低減には寄与せず、また得られたベクトルも
空間的にばらつくことになる。
【0048】これに対して、本発明では、ベクトル値の
差分ではなく、ベクトルによって指示される予測画素値
と着目画素との差分を距離の評価式に組み込む。これに
よって、まず予測誤差が大幅に低減され、自然な視差再
生も行われ、優れた視差補償予測画像が得られる。ま
た、ベクトルのばらつきも抑えられているため、画素毎
に求まった視差ベクトルを1枚の画像として圧縮を施し
ても、高い圧縮効率が期待される。さらに、動画像の2
次元の動きベクトルの場合とは異なり、視差ベクトルの
場合には通常水平1次元を考えればいいので、画素毎に
求まった視差ベクトルの圧縮に対しても、2次元画像の
圧縮アルゴリズムがそのまま適用できる。また、主観的
かつ客観的にブロックマッチング方式よりも優れた予測
画像が得られるため、ブロックマッチングを用いた従来
の視差補償予測符号化方式とは異なり、視差情報のみで
予測誤差情報を符号化しなくとも、十分高画質な復元画
像が得られる。
【0049】図1は第1の発明の視差情報検出装置の一
実施例を示すブロック図である。n枚の視差を有する画
像を入力とし、その中の1枚を基準画像#1とし、残り
の画像に対しては以下の視差検出を実行する。領域分割
回路101は、画像#2の画素値と、統計情報計算回路
102によって与えられる統計情報と、視差補償予測回
路104によって与えられる視差補償予測画像を用い
て、(3)式の距離計算を行い、クラスタリングに基づ
く画像#2の領域分割を実現する。統計情報計算回路1
02は、画像#2の画素値と、領域分割回路101によ
って与えられる領域分割情報を用いて、領域毎の画素値
平均、画素値分散、重心位置等の計算を行う。視差検出
回路103は、基準画像#1の画素値と、入力画像の画
素値と、領域分割回路101によって与えられる領域分
割情報を用いて、視差補償予測画像の誤差が最小となる
ような水平1次元の領域単位の視差ベクトルを求める。
視差補償予測回路104は、基準画像#1の画素値と、
視差ベクトル検出回路103によって与えられる視差ベ
クトルを用いて、画像#2に対する視差補償予測画像を
作成する。以上の処理を数回繰り返すことで、画像#2
に対して、視差補償予測誤差を十分に低減し、かつ圧縮
の容易な滑らかな視差情報を得ることができる。領域分
割回路105、109、統計情報計算回路106、11
0、視差検出回路107、111、視差補償予測回路1
08、112の動作は、それぞれ領域分割回路101、
統計情報計算回路102、視差ベクトル検出回路10
3、視差補償予測回路104の動作に等しい。以下、点
線で囲んだ回路100を、視差情報検出回路と呼ぶ。こ
の視差情報検出回路100により、n枚の多眼画像から
の効率的な視差検出が実現できる。
【0050】図17は、領域分割回路101の構成例の
詳細を示している。差分自乗回路1は、画像#2の輝度
値と、統計情報計算回路102によって与えられるクラ
スタ毎の輝度の平均値を入力とし、それらの差分の自乗
を計算する。差分自乗回路2、3は、画像#2の色差値
と、統計情報計算回路102によって与えられるクラス
タ毎の色差の平均値を入力とし、それらの差分の自乗を
計算する。差分自乗回路4、5は、画像#2の画素の位
置情報と、統計情報計算回路102によって与えられる
クラスタ毎の重心位置を入力とし、それらの差分の自乗
を計算する。重み付き加算器9は、(3)式に従って、
差分自乗回路1〜8から与えられる差分自乗値の重み付
き加算を行う。メモリ10は、重み付き加算器9の出力
結果を保持する。比較器11は、メモリ10に保持され
た周辺クラスタ毎の重み付き加算値の比較を行い、この
値を最小にするクラスタのインデクスを領域分割情報と
して出力する。
【0051】図18は、統計情報計算回路102の構成
例の詳細を示している。加算器20は、画像#2の画素
の輝度値と、メモリ25から与えられる輝度の累算値の
加算を行う。加算器21、22は、画像#2の画素の色
差値と、メモリ25から与えられる色差の累算値の加算
を行う。加算器23、24は、画像#2の画素の位置座
標と、メモリ25から与えられる位置座標の累算値の加
算を行う。メモリ25は、領域分割回路101から与え
られる領域分割情報に従って、領域毎の輝度の累算値を
保持し、また入力画素の含まれるクラスタの輝度の累算
値を加算器20への入力とする。メモリ26、27は、
領域分割回路101から与えられる領域分割情報に従っ
て、領域毎の色差の累算値を保持し、また入力画素の含
まれるクラスタの色差の累算値を加算器21、22への
入力とする。メモリ28、29は、領域分割回路101
から与えられる領域分割情報に従って、領域毎の位置座
標の累算値を保持し、また入力画素の含まれるクラスタ
の位置座標の累算値を加算器23、24への入力とす
る。カウンタ30は、領域分割回路101から与えられ
る領域分割情報に従って、各クラスタに含まれる画素数
をカウントする。除算器31は、メモリ25から与えら
れるクラスタ毎の輝度の累算値の、カウンタ30から与
えられるクラスタ毎の画素数による除算を実行し、クラ
スタ毎の輝度の平均値を出力する。除算器32、33
は、メモリ26、27から与えられるクラスタ毎の色差
の累算値の、カウンタ30から与えられるクラスタ毎の
画素数による除算を実行し、クラスタ毎の色差の平均値
を出力する。除算器34、35は、メモリ28、29か
ら与えられるクラスタ毎の位置座標の累算値の、カウン
タ30から与えられるクラスタ毎の画素数による除算を
実行し、クラスタ毎の重心位置を出力する。
【0052】図19は、視差検出回路103の構成例の
詳細を示している。画素シフト回路40は、画像#1の
画素の輝度値の水平方向のシフトを実行する。画素シフ
ト回路41、42は、画像#1の画素の色差値の水平方
向のシフトを実行する。差分自乗計算回路43は、画素
シフト回路40によって水平方向にシフトされた画像#
1の画素の輝度値と、画像#2の画素の輝度値の差分の
自乗を出力する。差分自乗計算回路44、45は、画素
シフト回路41、42によって水平方向にシフトされた
画像#1の画素の色差値と、画像#2の画素の色差値の
差分の自乗を出力する。加算器46は、差分自乗計算回
路43、44、45の出力と、メモリ47から与えられ
る累算値の加算を実行する。メモリ47は、領域分割回
路101から与えられる領域分割情報に従って、クラス
タ毎に、水平方向のシフト量に応じた差分自乗値の累算
値を保持し、また画像#2の入力画素の含まれるクラス
タの累算値を加算器46への入力とする。比較器48
は、クラスタ毎に、メモリ47に保持された水平方向の
シフト量に応じた差分自乗値の累算値の比較を行い、こ
の値を最小にする水平方向のシフト量を視差ベクトルと
して出力する。
【0053】図20は、視差補償予測回路103の構成
例の詳細を示している。画素シフト回路50は、視差検
出回路103から与えられる視差ベクトルに従って、画
像#1の画素の輝度値の水平方向のシフトを実行する。
画素シフト回路51、52は、視差検出回路103から
与えられる視差ベクトルに従って、画像#1の画素の色
差値の水平方向のシフトを実行する。
【0054】次に、図2は、第2の発明の3次元画像符
号化装置の一実施例を示すブロック図である。図2で
は、基準画像と視差情報を圧縮する。視差情報検出回路
120の機能は、前述の視差情報検出回路100の機能
に等しい。圧縮回路121は基準画像の圧縮を実行し、
圧縮回路122〜124は視差情報の圧縮を実行する。
圧縮アルゴリズムは任意であり、MPEG、H.261
等の既存の国際標準方式を適用してもよい。
【0055】図3は、第3の発明の3次元画像符号化装
置の一実施例を示すブロック図である。図3では、基準
画像、視差情報、視差補償予測誤差を圧縮する。視差情
報検出回路130の機能は、前述の視差情報検出回路1
00の機能に等しい。圧縮回路131〜134の機能
は、それぞれ前述の圧縮回路121〜124の機能に等
しい。視差補償予測回路135〜137は、それぞれ基
準画像と視差情報を用いて、視差補償予測画像を作成す
る。差分器138〜140は、それぞれ視差検出された
入力画像と対応する視差補償予測画像との差分である視
差補償予測誤差を出力する。圧縮回路141〜143
は、それぞれ視差補償予測誤差の圧縮を実行する。圧縮
アルゴリズムは任意であり、MPEG、H.261等の
既存の国際標準方式を適用してもよい。以上の構成によ
る3次元画像符号化装置により、n枚の多眼画像の効率
的な圧縮が実現できる。
【0056】ただし、前記のような任意形状の領域分割
を行う場合には、領域形状が未知のため、すべての画素
の視差ベクトルを符号化対象としなければならない。こ
れに対して、ブロックマッチングの場合には、ブロック
形状が既知のため、符号化対象となる視差ベクトルはブ
ロック単位に一つでよい。このために、任意形状の領域
分割によって視差検出を行う場合、視差情報の圧縮によ
る発生情報量が非常に大きくなる場合がある。そこで、
発生情報量を削減する目的で、長方形、もしくはライン
を領域分割の最小単位として視差検出を行う方式が考え
られる。すなわち、第1の発明に述べた領域分割手段、
統計情報計算手段、視差検出手段、視差補償予測手段に
おける分割領域の最小単位を、画素ではなく長方形、も
しくはラインとして、領域分割、視差検出を実行する。
これによって、一つの長方形、もしくはラインに含まれ
る画素数分の視差情報を間引くことが可能であり、かつ
ブロックマッチング程の予測誤差の増大は招くことな
く、前述の発生情報量の増加の問題を緩和できる。
【0057】図4は、第4の発明の視差情報検出装置の
一実施例を示すブロック図であり、上記の長方形、もし
くはラインを領域分割の最小単位とする視差情報検出方
式の実施例を示している。画素グループ化回路150〜
152は、入力画像を長方形、もしくはライン単位にグ
ループ化し、視差情報検出回路153への入力とする。
視差情報検出回路153の機能は、前述の視差情報検出
回路100の機能に等しい。この回路構成により、n枚
の多眼画像からの効率的な視差検出が実現できる。
【0058】図5は、第5の発明の3次元画像符号化装
置の一実施例を示すブロック図である。図5は、基準画
像と視差情報を圧縮する。画素グループ化回路160〜
162の機能は、それぞれ前述の画素グループ化回路1
50〜152の機能に等しい。視差情報検出回路163
の機能は、前述の視差情報検出回路100の機能に等し
い。圧縮回路164〜167の機能は、それぞれ前述の
圧縮回路121〜124の機能に等しい。
【0059】図6は、第6の発明の3次元画像符号化装
置の一実施例を示すブロック図である。図6では、基準
画像、視差情報、視差補償予測誤差を圧縮する。画素グ
ループ化回路170〜172の機能は、それぞれ前述の
画素グループ化回路150〜152の機能に等しい。視
差情報検出回路173の機能は、前述の視差情報検出回
路100の機能に等しい。圧縮回路174〜177の機
能は、それぞれ前述の圧縮回路121〜124の機能に
等しい。視差補償予測回路178〜180の機能は、そ
れぞれ前述の視差補償予測回路135〜137の機能に
等しい。差分器181〜183の機能は、それぞれ前述
の差分器138〜140の機能に等しい。圧縮回路18
4〜186の機能は、それぞれ前述の圧縮回路141〜
143の機能に等しい。以上の構成による3次元画像符
号化装置により、n枚の多眼画像の効率的な圧縮が実現
できる。
【0060】一方、異なる焦点画像の鮮鋭化の問題は、
従来は、ぼけの生成過程を点拡がり関数としてモデル化
する線形フィルタを用いた方式が報告されてきた。しか
し、線形フィルタ方式は、一般的に、雑音の影響を受け
やすい、という欠点がある。これに対して、クラスタリ
ングは雑音にロバストな方式として知られており、上記
画像の鮮鋭化の問題に対しても、クラスタリングに基づ
く領域分割手法の応用を考えることができる。例えば1
枚の基準画像を決め、それに対して従来の技術に述べた
5次元クラスタリング等を用いて領域分割を行い、確定
した領域分割結果をその他の画像に適用し、対応する領
域で色輝度の平均、分散等の統計情報を計算し、それら
の統計情報を利用して合焦領域を確定する方式が考えら
れる。
【0061】具体的な合焦領域判定アルゴリズムとして
は、例えば、
【0062】
【外7】
【0063】を着目クラスタnの色輝度の平均値、Nを
着目クラスタnの隣接クラスタの集合とし、焦点の異な
る画像毎に着目クラスタ
【0064】
【数4】
【0065】の値を計算し、この値を最大にするクラス
タを合焦領域と判断する方式が考えられる。これは、ク
ラスタリングによって色輝度の類似した画素が統合され
るため、合焦時にコントラストが最大になると考えれ
ば、隣接クラスタ間の差分も最大になるであろう、とい
う推測を背景にしている。あるいは、着目クラスタnの
分散値の大小によって合焦判断を行う方式も考えられ
る。これは、従来の技術に述べたブロック単位の方式
を、任意形状であるクラスタ単位に拡張した方式であ
る。いずれにせよ、クラスタリングは線形フィルタ方式
よりも雑音に対する耐性が強く、安定した合焦判断を行
うことができる。
【0066】図7は第7の発明の画像鮮鋭化装置の一実
施例を示すブロック図である。m枚の焦点の異なる画像
を入力とし、その中の1枚を基準画像#1とする。領域
分割回路191は、基準画像#1の画素値と統計情報計
算回路192によって与えられる統計情報を用いて、
(1)式の距離計算を行い、クラスタリングに基づく基
準画像#1の領域分割を実現する。統計情報計算回路1
92は、基準画像#1の画素値と、領域分割回路191
によって与えられる領域分割情報を用いて、領域毎の基
準画像#1の画素値平均、画素値分散、重心位置等の計
算を行う。統計情報計算回路193は、画像#2の画素
値と、領域分割回路191によって与えられる基準画像
#1の領域分割情報を用いて、基準画像#1に対して求
められた領域毎の画像#2の画素値平均、画素値分散、
重心位置等の計算を行う。統計情報計算回路194、1
95の機能は、対象画像が画像#3、画像#mとなるこ
とを除いて、前述の統計情報計算回路193の機能と同
じである。合焦判定回路196は、統計情報計算回路1
93〜195によって与えられる画像#1〜#mの統計
情報を用いて、(4)式の計算を行い、クラスタリング
に基づく合焦判定を実現する。画像合成回路197は、
領域分割回路191によって与えられる基準画像#1の
領域分割情報と、合焦判定回路196によって与えられ
る合焦判定情報に従って、m枚の焦点の異なる画像から
鮮鋭領域を選択するスイッチとして機能する。領域分割
回路191と統計情報計算回路192による領域分割処
理を繰り返すことで、画像#1の安定した領域分割を実
現することができる。以下、点線で囲んだ回路190
を、画像鮮鋭化回路と呼ぶ。この画像鮮鋭化回路190
により、m枚の焦点の異なる画像から効率的な鮮鋭画像
の作成を実現できる。
【0067】図21は、領域分割回路191の構成性の
詳細を示している。差分自乗回路60は、画像#1の輝
度値と、統計情報計算回路192によって与えられるク
ラスタ毎の輝度の平均値を入力とし、それらの差分の自
乗を計算する。差分自乗回路61、62は、画像#1の
色差値と、統計情報計算回路によって与えられるクラス
タ毎の色差の平均値を入力とし、それらの差分の自乗を
計算する。差分自乗回路63、64は、画像#1の画素
の位置情報と、統計情報計算回路192によって与えら
れるクラスタ毎の重心位置を入力とし、それらの差分の
自乗を計算する。重み付き加算器65は、(4)式に従
って、差分自乗回路60〜64から与えられる差分自乗
値の重み付き加算を行う。メモリ66は、重み付き加算
器65の出力結果を保持する。比較器67は、メモリ6
6に保持された周辺クラスタ毎の重み付き加算値の比較
を行い、この値を最小にするクラスタのインデクスを領
域分割情報として出力する。
【0068】統計情報計算回路192〜195の詳細
は、既に述べた統計情報計算回路102の詳細に等し
い。
【0069】図22は、合焦判定回路196の構成例の
詳細を示している。平均差分自乗回路70は、統計情報
計算回路192によって与えられる画像#1の着目クラ
スタの輝度の平均値と周辺クラスタの輝度の平均値の差
分の自乗を計算する。平均差分自乗回路71、72は、
統計情報計算回路192によって与えられる画像#1の
着目クラスタの色差の平均値と周辺クラスタの色差の平
均値の差分の自乗を計算する。平均差分自乗回路73〜
81の機能は、平均差分自乗回路70〜72の機能に等
しい。加算器82は、平均差分自乗回路70〜72によ
って与えられる値と、メモリ86から与えられるクラス
タ毎の累積値の加算を行う。加算器83〜85の機能
は、加算器82の機能に等しい。メモリ86は、加算器
82から与えられる累積値を保持し、またその累積値を
加算器82への入力とする。メモリ87〜89の機能
は、メモリ86の機能に等しい。比較器90は、メモリ
86〜89に保持された累積値の比較を行い、その累積
値を最大にするクラスタを含む画像のインデクスを合焦
情報として出力する。
【0070】さらに、視差検出技術と画像鮮鋭化技術の
組合せとして、図16に示す方式を考えることもでき
る。焦点の異なる画像に対する画像鮮鋭化手段を視差を
有する位置に複数個備え、視差を有する複数枚の鮮鋭画
像を新たな入力として3次元画像符号化を実行する。こ
れによって、奥行き方向の焦点の異なる画像m枚が、視
差方向にn組存在する、総計mn枚の画像情報が、1枚
の基準鮮鋭画像と(n−1)枚の視差の圧縮情報に集約
される。
【0071】図8は、第8の発明の3次元画像符号化装
置の一実施例を示すブロック図である。画像鮮鋭化回路
200〜202の機能は、それぞれ前述の画像鮮鋭化回
路190の機能に等しい。視差情報検出回路203の機
能は、前述の視差情報検出回路100の機能に等しい。
圧縮回路204は基準鮮鋭画像を圧縮し、圧縮回路20
5、206は視差情報を圧縮する。圧縮アルゴリズムは
任意であり、MPEG、H.261等の既存の国際標準
方式を適用してもよい。
【0072】図9は、第9の発明の3次元画像符号化装
置の一実施例を示すブロック図である。画像鮮鋭化回路
210〜212の機能は、それぞれ前述の画像鮮鋭化回
路190の機能に等しい。視差情報検出回路213の機
能は、前述の視差情報検出回路100の機能に等しい。
圧縮回路214〜216の機能は、それぞれ前述の圧縮
回路204〜206の機能に等しい。視差補償予測回路
217、218は、基準鮮鋭画像と視差情報を用いて視
差補償予測画像を作成する。差分器219、220は、
視差検出された鮮鋭画像と対応する視差補償予測画像と
の差分である視差補償予測誤差を出力する。圧縮回路2
21、222は、視差補償予測誤差の圧縮を実行する。
圧縮アルゴリズムは任意であり、MPEG、H.261
等の既存の国際標準方式を適用してもよい。
【0073】図10は、第10の発明の3次元画像符号
化装置の一実施例を示すブロック図である。画像鮮鋭化
回路230〜232の機能は、それぞれ前述の画像鮮鋭
化回路190の機能に等しい。画素グループ化回路23
3、234の機能は、前述の画素グループ化回路150
の機能に等しい。視差情報検出回路235の機能は、前
述の視差情報検出回路100の機能に等しい。圧縮回路
236〜238の機能は、それぞれ前述の圧縮回路20
4〜206の機能に等しい。
【0074】図11は、第11の発明の3次元画像符号
化装置の一実施例を示すブロック図である。画像鮮鋭化
回路240〜242の機能は、それぞれ前述の画像鮮鋭
化回路190の機能に等しい。画素グループ化回路24
3、244の機能は、前述の画素グループ化回路150
の機能に等しい。視差情報検出回路245の機能は、前
述の視差情報検出回路100の機能に等しい。圧縮回路
246〜248の機能は、それぞれ前述の圧縮回路20
4〜206の機能に等しい。視差補償予測回路249、
250の機能は、前述の視差補償予測回路217、21
8の機能に等しい。差分器251、252の機能は、前
述の差分器219、220の機能に等しい。圧縮回路2
53、254の機能は、前述の圧縮回路221、222
の機能に等しい。
【0075】以上、図8〜図11の構成によって、奥行
き方向m枚、視差方向n組の総計mn枚の画像情報が、
1枚の基準鮮鋭画像と(n−1)枚の視差情報に効率良
く集約され、さらには効率良く圧縮される。
【0076】図12は、第12の発明の3次元画像復号
装置の一実施例を示すブロック図であり、第2の発明、
第5の発明、第8の発明、もしくは第10の発明によっ
て生成される圧縮情報を復号する実施例を表す。図12
において、復号回路260〜263は圧縮情報の復号を
実行する。復号回路260によって復号される基準画像
と、復号回路261〜263によって復号される視差情
報を用いて、視差補償予測回路264〜266は視差補
償予測画像を復元する。これにより、1枚の基準画像と
複数枚の視差補償予測画像の復号が完了する。
【0077】図13は、第13の発明の3次元画像復号
装置の一実施例を示すブロック図であり、第3の発明、
第6の発明、第9の発明、もしくは第11の発明によっ
て生成される圧縮情報を復号する実施例を表す。図13
では、復号回路270〜276は圧縮情報の復号を実行
する。復号回路270によって復号される基準画像と、
復号回路271〜273によって復号される視差情報を
用いて、視差補償予測回路277〜279は視差補償予
測画像を生成する。復号回路274〜276によって復
号される差分情報と、視差補償予測回路277〜279
によって生成される視差補償予測画像を用いて、加算器
280〜282は基準画像以外の画像を復元する。これ
により、1枚の基準画像とそれを除く複数枚の画像の復
号が完了する。
【0078】
【発明の効果】以上説明したように、本発明により、視
差方向については予測誤差を大幅に低減する視差検出を
実現でき、奥行き方向については雑音に強い画像の鮮鋭
化を実現することができる。これによって、臨場感の優
れた3次元画像符号化を提供できる。
【図面の簡単な説明】
【図1】第1の発明の視差情報検出装置の一実施例を示
すブロック図である。
【図2】第2の発明の3次元画像符号化装置の一実施例
を示すブロック図である。
【図3】第3の発明の3次元画像符号化装置の一実施例
を示すブロック図である。
【図4】第4の発明の視差情報検出装置の一実施例を示
すブロック図である。
【図5】第5の発明の3次元画像符号化装置の一実施例
を示すブロック図である。
【図6】第6の発明の3次元画像符号化装置の一実施例
を示すブロック図である。
【図7】第7の発明の画像鮮鋭化装置の一実施例を示す
ブロック図である。
【図8】第8の発明の3次元画像符号化装置の一実施例
を示すブロック図である。
【図9】第9の発明の3次元画像符号化装置の一実施例
を示すブロック図である。
【図10】第10の発明の3次元画像符号化装置の一実
施例を示すブロック図である。
【図11】第11の発明の3次元画像符号化装置の一実
施例を示すブロック図である。
【図12】第12の発明の3次元画像復号装置の一実施
例を示すブロック図である。
【図13】第13の発明の3次元画像復号装置の一実施
例を示すブロック図である。
【図14】ステレオ画像からの視差検出を示す図であ
る。
【図15】焦点の異なる複数の画像の鮮鋭化を示す図で
ある。
【図16】画像の鮮鋭化と視差検出の組み合わせを示す
図である。
【図17】領域分割回路の詳細を示すブロック図であ
る。
【図18】統計情報計算回路の詳細を示すブロック図で
ある。
【図19】視差検出回路の詳細を示すブロック図であ
る。
【図20】視差補償予測回路の詳細を示すブロック図で
ある。
【図21】領域分割回路の詳細を示すブロック図であ
る。
【図22】合焦判定回路の詳細を示すブロック図であ
る。
【符号の説明】
100 視差情報検出装置 101 領域分割回路 102 統計情報計算回路 103 視差検出回路 104 視差補償予測回路 105 領域分割回路 106 統計情報計算回路 107 視差検出回路 108 視差補償予測回路 109 領域分割回路 110 統計情報計算回路 111 視差検出回路 112 視差補償予測回路 120 視差情報検出回路
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) H04N 13/02

Claims (13)

    (57)【特許請求の範囲】
  1. 【請求項1】視差を有する複数枚の画像を入力とし、前
    記複数枚の画像の中の1枚を基準画像とし、前記基準画
    像を除く複数枚の画像毎に、その入力画像と、統計情報
    と、予測画像を用いて画素ごとに複数のクラスタとの距
    離計算を行ってクラスタリング行い前記入力画像の領域
    分割を行う領域分割手段と、前記入力画像と、前記領域
    分割手段によって与えられる領域分割情報を用いて前記
    領域毎の画素値平均、画素値分散、重心位置を含む前記
    統計情報を計算する統計情報計算手段と、前記基準画像
    と、前記入力画像と、前記領域分割情報を用いて前記領
    域単位に視差ベクトルを求める視差検出手段と、前記基
    準画像と、前記視差ベクトルを用いて、前記入力画像の
    前記予測画像を作成する視差補償予測手段とを備えるこ
    とを特徴とする視差情報検出装置。
  2. 【請求項2】視差を有する複数枚の画像を入力とし、前
    記複数枚の画像の中の1枚を基準画像とし、前記基準画
    像を除く複数枚の画像毎に、その入力画像と、統計情報
    と、予測画像を用いて画素ごとに複数のクラスタとの距
    離計算を行ってクラスタリングを行い前記入力画像の領
    域分割を行う領域分割手段と、前記入力画像と、前記領
    域分割手段によって与えられる領域分割情報を用いて前
    記領域毎の画素値平均、画素値分散、重心位置を含む
    記統計情報を計算する統計情報計算手段と、前記基準画
    像と、前記入力画像と、前記領域分割情報を用いて前記
    領域単位に視差ベクトルを求める視差検出手段と、前記
    基準画像と、前記視差ベクトルを用いて、前記入力画像
    の前記予測画像を作成する視差補償予測手段と、前記基
    準画像を圧縮する手段と、前記視差ベクトルを圧縮する
    手段とを備えることを特徴とする3次元画像符号化装
    置。
  3. 【請求項3】視差を有する複数枚の画像を入力とし、前
    記複数枚の画像の中の1枚を基準画像とし、前記基準画
    像を除く複数枚の画像毎に、その入力画像と、統計情報
    と、予測画像を用いて画素ごとに複数のクラスタとの距
    離計算を行ってクラスタリングを行い前記入力画像の領
    域分割を行う領域分割手段と、前記入力画像と、前記領
    域分割手段によって与えられる領域分割情報を用いて前
    記領域毎の画素値平均、画素値分散、重心位置を含む
    記統計情報を計算する統計情報計算手段と、前記基準画
    像と、前記入力画像と、前記領域分割情報を用いて前記
    領域単位に視差ベクトルを求める視差検出手段と、前記
    基準画像と、前記視差ベクトルを用いて、前記入力画像
    の前記予測画像を作成する視差補償予測手段と、前記基
    準画像を圧縮する手段と、前記視差ベクトルの検出され
    た画像毎に前記基準画像と前記視差ベクトルを用いて予
    測画像を作成する視差補償予測手段と、前記視差ベクト
    ルの検出された画像と前記予測画像との差分を取る手段
    と、前記視差ベクトルを圧縮する手段と、前記差分情報
    を圧縮する手段を備えることを特徴とする3次元画像符
    号化装置。
  4. 【請求項4】視差を有する複数枚の画像に対して、前記
    複数枚の画像の中の1枚を基準画像として入力し、前記
    基準画像を除く複数枚の画像を長方形、もしくはライン
    単位にグループ化して入力する手段を更に備え、前記グ
    ループを領域分割の最小単位として視差ベクトルを得る
    ことを特徴とする請求項1記載の視差情報検出装置。
  5. 【請求項5】視差を有する複数枚の画像に対して、前記
    複数枚の画像の中の1枚を基準画像として入力し、前記
    基準画像を除く複数枚の画像を長方形、もしくはライン
    単位にグループ化して入力する手段を更に備え、前記グ
    ループを領域分割の最小単位として視差ベクトルを得る
    ことを特徴とする請求項2記載の3次元画像符号化装
    置。
  6. 【請求項6】視差を有する複数枚の画像に対して、前記
    複数枚の画像の中の1枚を基準画像として入力し、前記
    基準画像を除く複数枚の画像を長方形、もしくはライン
    単位にグループ化して入力する手段を更に備え、前記グ
    ループを領域分割の最小単位として視差ベクトルを得る
    ことを特徴とする請求項3記載の3次元画像符号化装
    置。
  7. 【請求項7】合焦位置の異なる複数枚の画像を入力と
    し、前記複数枚の画像の中の1枚を基準画像とし、前記
    基準画像と、第1の統計情報を用いて画素ごとに複数の
    クラスタとの距離計算を行ってクラスタリングを行い
    記基準画像の領域分割を行う領域分割手段と、前記基準
    画像と、前記領域分割手段によって与えられる領域分割
    情報を用いて前記領域毎の画素値平均、画素値分散、重
    心位置を含む前記第1の統計情報を計算する第1の統計
    情報計算手段と、前記基準画像を除く複数枚の画像毎
    に、その入力画像と、前記領域分割情報を用いて、前記
    入力画像における前記領域毎の画素値平均、画素値分
    計算する第2の統計情報計算手段と、前記領域分割情
    報と、前記第1の統計情報と、前記第2の統計情報を用
    いて前記領域毎に合焦画像を決定する合焦判定手段と、
    前記合焦位置の異なる複数枚の画像と、前記領域分割情
    報と、前記合焦画像を用いて鮮鋭画像を出力する画像合
    成手段とを備えることを特徴とする画像鮮鋭化装置。
  8. 【請求項8】請求項7記載の画像鮮鋭化装置を視差を有
    する位置に複数個備え、視差を有する複数枚の鮮鋭画像
    を入力とする請求項2記載の3次元画像符号化装置。
  9. 【請求項9】請求項7記載の画像鮮鋭化装置を視差を有
    する位置に複数個備え、視差を有する複数枚の鮮鋭画像
    を入力とする請求項3記載の3次元画像符号化装置。
  10. 【請求項10】請求項7記載の画像鮮鋭化装置を視差を
    有する位置に複数個備え、視差を有する複数枚の鮮鋭画
    像を入力とする請求項5記載の3次元画像符号化装置。
  11. 【請求項11】請求項7記載の画像鮮鋭化装置を視差を
    有する位置に複数個備え、視差を有する複数枚の鮮鋭画
    像を入力とする請求項6記載の3次元画像符号化装置。
  12. 【請求項12】圧縮情報から基準画像と複数枚の視差ベ
    クトルを復号する手段と、前記視差ベクトルの検出され
    た画像毎に前記基準画像と前記視差ベクトルを用いて予
    測画像を作成する視差補償予測手段を備えることを特徴
    とする請求項2,5,8又は10記載の3次元画像復号
    装置。
  13. 【請求項13】圧縮情報から基準画像と複数枚の視差ベ
    クトルと複数枚の差分情報を復号する手段と、前記視差
    ベクトルの検出された画像毎に前記基準画像と前記視差
    ベクトルを用いて予測画像を作成する視差補償予測手段
    と、前記予測画像と前記差分情報を加算する手段を備え
    ることを特徴とする請求項3,6,9又は11記載の3
    次元画像復号装置。
JP24996195A 1995-09-27 1995-09-27 3次元画像符号化装置 Expired - Fee Related JP3055438B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP24996195A JP3055438B2 (ja) 1995-09-27 1995-09-27 3次元画像符号化装置
US08/720,378 US5696551A (en) 1995-09-27 1996-09-27 Three-dimension picture coding system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP24996195A JP3055438B2 (ja) 1995-09-27 1995-09-27 3次元画像符号化装置

Publications (2)

Publication Number Publication Date
JPH0993614A JPH0993614A (ja) 1997-04-04
JP3055438B2 true JP3055438B2 (ja) 2000-06-26

Family

ID=17200771

Family Applications (1)

Application Number Title Priority Date Filing Date
JP24996195A Expired - Fee Related JP3055438B2 (ja) 1995-09-27 1995-09-27 3次元画像符号化装置

Country Status (2)

Country Link
US (1) US5696551A (ja)
JP (1) JP3055438B2 (ja)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6192145B1 (en) * 1996-02-12 2001-02-20 Sarnoff Corporation Method and apparatus for three-dimensional scene processing using parallax geometry of pairs of points
JP2001502504A (ja) * 1996-10-11 2001-02-20 サーノフ コーポレイション 立体視ビデオを符号化及び複号する装置及び方法
US6414994B1 (en) * 1996-12-18 2002-07-02 Intel Corporation Method and apparatus for generating smooth residuals in block motion compensated transform-based video coders
JP3931392B2 (ja) * 1997-08-25 2007-06-13 ソニー株式会社 立体画像用ビデオ信号生成装置、立体画像用ビデオ信号送出装置および立体画像用ビデオ信号受信装置
WO2000027132A1 (en) * 1998-11-02 2000-05-11 Sukuld Enterprise Yuugen Kaisha Encoding/decoding of video signal
US6297844B1 (en) * 1999-11-24 2001-10-02 Cognex Corporation Video safety curtain
US8711217B2 (en) 2000-10-24 2014-04-29 Objectvideo, Inc. Video surveillance system employing video primitives
US8564661B2 (en) 2000-10-24 2013-10-22 Objectvideo, Inc. Video analytic rule detection system and method
US9892606B2 (en) 2001-11-15 2018-02-13 Avigilon Fortress Corporation Video surveillance system employing video primitives
US6625310B2 (en) * 2001-03-23 2003-09-23 Diamondback Vision, Inc. Video segmentation using statistical pixel modeling
US7424175B2 (en) 2001-03-23 2008-09-09 Objectvideo, Inc. Video segmentation using statistical pixel modeling
KR100751422B1 (ko) 2002-12-27 2007-08-23 한국전자통신연구원 스테레오스코픽 비디오 부호화 및 복호화 방법, 부호화 및복호화 장치
TW200806040A (en) * 2006-01-05 2008-01-16 Nippon Telegraph & Telephone Video encoding method and decoding method, apparatuses therefor, programs therefor, and storage media for storing the programs
JP2009533778A (ja) 2006-04-17 2009-09-17 オブジェクトビデオ インコーポレイテッド 統計的画素モデリングを使った映像セグメント化
JP2008106185A (ja) * 2006-10-27 2008-05-08 Shin Etsu Chem Co Ltd 熱伝導性シリコーン組成物の接着方法、熱伝導性シリコーン組成物接着用プライマー及び熱伝導性シリコーン組成物の接着複合体の製造方法
WO2009005658A2 (en) * 2007-06-28 2009-01-08 Thomson Licensing Single loop decoding of multi-vieuw coded video
JP2011124822A (ja) * 2009-12-11 2011-06-23 Fujitsu Ltd 半導体集積回路、符号化方法及び撮像装置
EP2550807A1 (en) 2010-03-22 2013-01-30 Thomson Licensing Method and apparatus for low bandwidth content preserving compression of stereoscopic three dimensional images
US20140044347A1 (en) * 2011-04-25 2014-02-13 Sharp Kabushiki Kaisha Mage coding apparatus, image coding method, image coding program, image decoding apparatus, image decoding method, and image decoding program
US20130163880A1 (en) * 2011-12-23 2013-06-27 Chao-Chung Cheng Disparity search methods and apparatuses for multi-view videos
US20150201215A1 (en) * 2012-07-27 2015-07-16 Mediatek Inc. Method of constrain disparity vector derivation in 3d video coding
JP6074404B2 (ja) * 2014-12-12 2017-02-01 トムソン ライセンシングThomson Licensing 立体的三次元画像の圧縮を維持する低帯域コンテンツのための方法及び装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8430980D0 (en) * 1984-12-07 1985-01-16 Robinson M Generation of apparently three-dimensional images
JPS61206395A (ja) * 1985-03-11 1986-09-12 Nippon Hoso Kyokai <Nhk> 立体テレビジョン画像信号の伝送方法
US5142642A (en) * 1988-08-24 1992-08-25 Kabushiki Kaisha Toshiba Stereoscopic television system
JP2664955B2 (ja) * 1988-10-07 1997-10-22 日本電信電話株式会社 ステレオ画像符号化方法
JPH0380676A (ja) * 1989-08-23 1991-04-05 Ricoh Co Ltd 電子パンフォーカス装置
FR2659816B1 (fr) * 1990-03-19 1994-01-28 France Etat Procede de reglage de la convergence stereoscopique dans un equipement de prise de vue stereoscopique.
CA2083203C (en) * 1991-11-19 1996-10-29 Riichi Nagura Image data transmission system capable of obtaining a high resolution stereo image with reduced transmission data
JP2957800B2 (ja) * 1992-04-17 1999-10-06 三菱電機株式会社 自動焦点調節装置
JPH0698312A (ja) * 1992-09-16 1994-04-08 Fujitsu Ltd 画像高能率符号化方式
JP3194258B2 (ja) * 1992-11-12 2001-07-30 日本電気株式会社 画像の符号化方式
US5329365A (en) * 1993-07-07 1994-07-12 Rca Thomson Licensing Corporation Method and apparatus for providing compressed non-interlaced scanned video signal
US5612735A (en) * 1995-05-26 1997-03-18 Luncent Technologies Inc. Digital 3D/stereoscopic video compression technique utilizing two disparity estimates

Also Published As

Publication number Publication date
JPH0993614A (ja) 1997-04-04
US5696551A (en) 1997-12-09

Similar Documents

Publication Publication Date Title
JP3055438B2 (ja) 3次元画像符号化装置
JP2891159B2 (ja) 多眼画像からの物体検出方式
CN107430782B (zh) 用于利用深度信息的全视差压缩光场合成的方法
Battisti et al. Objective image quality assessment of 3D synthesized views
JP4644669B2 (ja) マルチビュー画像の生成
EP2850835B1 (en) Estimation, encoding and decoding of motion information in multidimensional signals through motion zones, and of auxiliary information through auxiliary zones
US9159136B2 (en) Temporal smoothing apparatus and method for synthesizing intermediate image
KR20090071624A (ko) 이미지 개선
Stefanoski et al. Automatic view synthesis by image-domain-warping
Lee et al. Discontinuity-adaptive depth map filtering for 3D view generation
US9451233B2 (en) Methods and arrangements for 3D scene representation
Pearson et al. Plenoptic layer-based modeling for image based rendering
KR20100008677A (ko) 깊이맵 추정장치와 방법, 이를 이용한 중간 영상 생성 방법및 다시점 비디오의 인코딩 방법
Mieloch et al. Overview and efficiency of decoder-side depth estimation in MPEG immersive video
Wang et al. An asymmetric edge adaptive filter for depth generation and hole filling in 3DTV
Mancini et al. Robust quadtree-based disparity estimation for the reconstruction of intermediate stereoscopic images
Muller et al. Compressing time-varying visual content
da Silva et al. Fast intra prediction algorithm based on texture analysis for 3D-HEVC encoders
Amado Assuncao et al. Spatial error concealment for intra-coded depth maps in multiview video-plus-depth
US9787980B2 (en) Auxiliary information map upsampling
Liu et al. Stereoscopic view synthesis based on region-wise rendering and sparse representation
Wegner et al. Novel depth-based blending technique for improved virtual view synthesis
Purica et al. Using region-of-interest for quality evaluation of DIBR-based view synthesis methods
Lin et al. Sprite generation for hole filling in depth image-based rendering
Perugia Objective Image Quality Assessment of 3D Synthesized Views

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080414

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090414

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100414

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110414

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120414

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120414

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130414

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130414

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140414

Year of fee payment: 14

LAPS Cancellation because of no payment of annual fees