JP3023961B2

JP3023961B2 - 符号化器及び復号化器

Info

Publication number: JP3023961B2
Application number: JP25947689A
Authority: JP
Inventors: 隆浩福原; 篤道村上
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 1989-10-04
Filing date: 1989-10-04
Publication date: 2000-03-21
Anticipated expiration: 2015-03-21
Also published as: US5057940A; KR910009093A; JPH03121688A; KR930006535B1

Description

【発明の詳細な説明】〔産業上の利用分野〕この発明は、画像情報を高能率に伝送する符号化器及
び復号化器に関するものである。

〔従来の技術〕

第７図は例えば特開平１−162492号公報に示された従
来の画像伝送方式の概念図であり、図において、101は
被写体として、例えば人物の顔画像を扱った場合に口部
分の幾何学的形状を示す１組の口形パラメータによって
定義される口形モデル画像を記憶したメモリ、100は該
口形モデル画像のパラメータ値を全音素符号に対して記
憶したコードブック、102は送信側からの音声情報中の
音素符号により該コードブック100から対応する口形パ
ラメータを選択し、該口形パラメータに基づいて該メモ
リ101中の口形モデル画像を変形し、送信側からの口部
分以外の顔画像と合成して画像再生する合成部、10は入
力情報としての口以外の顔画像、11は同じく入力情報と
しての音声情報中の音素符号、12はコードブック100か
ら出力された口形パラメータ、13はメモリ101から出力
された口画像、14は最初の口画像、20は合成部102から
出力された再生顔画像である。

また、第８図は伝送方式の実施例を示すブロック図で
あり、112は送信部で符号化情報を生成して送信するた
め画像処理部110および音声符号化部111を要素として備
えている。また、113は受信部で、初期化装置114、前記
コードブック100、口形モデル変形部116、音声認識部11
7および音声復号化部118を備えている。50は顔画像入
力、60は音声入力、51は画像処理部110から出力される
口以外の顔画像情報、61は音声符号化部111から出力さ
れる音声符号、52は顔画像出力、53は口形モデル画像、
54は最初の口画像、62は音声出力である。

次に第８図を参照して動作について説明する。まず、
画像処理部110に顔画像入力50を入力すると該画像処理
部110では口以外の顔画像情報51を抽出して受信部113に
入力する。他方、音声符号化部111では音声入力60を入
力信号として取込むと音声符号61を出力して受信部113
内の音声復号化部118で復号し、音声認識部117で音素符
号に変換する。一方、コードブック100からは音声認識
部117から出力された各音素符号に対する該口形モデル
画像のパラメータ値が出力され、該パラメータ値を取込
んだ口形モデル変形部116からは該パラメータ値に基づ
いて該口形モデル画像53が変形、出力される。さらに口
以外の顔画像情報51と該口形モデル画像53とを合成して
顔画像出力52を出力する。他方、音声復号化部118では
音声符号61を復号し、音声出力62を受信部113より出力
する。

〔発明が解決しようとする課題〕

従来の画像信号の符号化・復号化器における画像伝送
方式は以上のように構成されているので、顔画像の中で
口以外の部分については未符号化のままで伝送している
ため低ビット・レートでの画像伝送は困難であるという
課題があった。

また、口形モデル画像出力はすべて音声符号化、復号
化部および音声認識部に依存しているため、誤りが発生
すると本来の口以外の顔画像情報と口形モデル画像とが
一致せず、違和感のある画像を提供するという課題があ
った。

この発明は上記のような課題を解消するためになされ
たもので、被写体画像に対し３次元形状モデルを整合
後、モデルの構成要素であるパッチ内の有限個の特徴点
の画素値によってベクトル量子化を行い、対象画像中に
動きの大きなものが出現した場合、もしくは照明条件の
変化等により対象画像の濃淡情報が変化した場合におい
ても大きな影響を受けることなく、低レートの画像伝送
を実現することができる符号化器及び符号化器を得るこ
とを目的とする。

〔課題を解決するための手段〕

この発明に係る符号化器は、３角形パッチで構成され
る３次元モデルを記憶する第１の記憶手段と、この第１
の記憶手段により記憶された３次元モデルを、入力した
被写体画像に対して整合させ、この整合された３次元モ
デルを構成する各３角形パッチの座標と、前記整合され
た３次元モデルを構成する各３角形パッチに対応づけら
れた前記被写体画像とを出力する整合手段と、この整合
手段より出力された前記被写体画像の各３角形パッチに
対応する各部分に対し、その３角形パッチを構成する一
つまたは複数の３角形の頂点を特徴点として設定すると
ともにその特徴点の画素値より多次元ベクトルを生成
し、その多次元ベクトルを量子化して出力するパッチ量
子化手段とを備えたものである。

またこの発明に係る復号化器は、３角形パッチで構成
される３次元モデルを記憶する第１の記憶手段と、量子
化された多次元ベクトルを逆量子化して多次元ベクトル
を求め、この多次元ベクトルから３角形の頂点における
画素値を求め、求められた画素値に基づき３角形内部の
補間を行い、この補間された３角形で３角形パッチを構
成して得られるパッチ整合画像を出力するパッチ逆量子
化手段と、各３角形パッチの座標を入力し、この各３角
形パッチの座標と、前記第１の記憶手段に記憶された３
次元モデルと、前記パッチ逆量子化手段から出力される
前記パッチ整合画像と、から被写体画像を合成する被写
体画像合成手段とを備えたものである。

〔作用〕

この発明における被写体画像は、３次元形状モデルを
整合させた後、該３次元形状モデルの構成要素であるパ
ッチ内部に有限個の特徴点を取り、該特徴点の画素値に
より多次元ベクトルを生成する。この多次元ベクトルを
量子化して送るため、対象物の動きに伴い濃淡情報が大
きく変化した場合においても同様にパッチ量子化部を経
てパッチ単位に量子化された情報を送信すればよく、常
に低レートでの画像伝送を可能にする。

〔発明の実施例〕

以下、この発明の一実施例を図について説明する。図
中、第８図と同一の部分は同一の符号をもって図示した
第１図において、120は顔（被写体）画像抽出部（画像
抽出手段）、121は３次元形状モデル整合部（整合手
段）、122は３次元形状モデル・データベース（第１の
記憶手段）、123は背景画メモリ（背景画記憶手段）、1
24は背景画符号化部、125は第１のセレクタ、126aはパ
ッチ量子化部（パッチ量子化手段）、127はコードブッ
ク（第２の記憶手段）、128aは第１の多重化部であり、
これらを接続して符号化器としたものである。他方、第
２図において、128bは第２の多重化部、129は背景画復
号化部（背景画復号化手段）、130は顔（被写体）画像
合成部（被写体画像合成手段）、131は画像合成部（画
像合成手段）、132bは第２のセレクタ（選択手段）、12
6bはパッチ逆量子化部（パッチ逆量子化手段）で、これ
らを接続して復号化器を構成している。

次に上記の実施例の動作について説明する。まず第１
図において、入力画像信号50が例えば第３図のような人
物の顔画像であった場合、顔（被写体）画像抽出部120
では背景画情報80（第３図の200に相当）と、顔（被写
体）画像70（第３図の201に相当）とに分離する。次に
予め３次元形状モデル・データベース122に登録された
３次元形状モデル情報（第４図参照）を前記顔画像70に
整合する操作を３次元形状モデル整合部121において行
う。この整合操作により整合後の顔（被写体）画像72は
パッチ量子化部126aでパッチ単位に（第４図210が１個
のパッチを表す）ベクトル量子化され、最小歪みd_sを与
えるベクトルのインデックス番号73が出力される。いま
パッチを有限個（4ⁿ個の合同３角形;n＝0,1,2,…）に分
割し、該３角形群の頂点（頂点数は3/2×（3ⁿ＋１）
個）上の画素値を多次元ベクトルとして表す。すなわ
ち、輝度値をＹ、色差値をCb,Crとして表せば、パッチ
の内部に取った3/2×（3ⁿ＋１）個の特徴点の画素値情
報ベクトルは以下の式で表される。

Y_n＝（y1,y2,……,y_m） …… Cb_n＝（cb1,cb2,……,cb_m） …… Cr_n＝（cr1,cr2,……,cr_m） …… 但し、特徴点の数ｍ＝3/2×（3ⁿ＋１）とした。

第５図は、ｎ＝0,1,2の場合のパッチとその内部に取
った特徴点を図示したものである。

次にパッチ内の特徴点上の画素値の平均をμy,μcb,
μcrとし、Ｙ値の分散をσで表すと、輝度値Ｙの平均値
分離正規化出力y_jaは、 y_ja＝（y_j−μｙ）／σ …… 他方、色差値cb,crの平均値分離出力cb_ja,cr_jaは、 cb_ja＝（cb_j−μcb） …… cr_ja＝（cr_j−μcr） …… として表される。（但し、ｊ＝1,2,…,m）従って、これらｍ次元ベクトルが３個生成され、コー
ドブック中のベクトルと２重歪み計算を行う。すなわ
ち、さらに、 d_i＝1/m×［Σ｛（y_j）_ｉ−（y_ja）_ｉ｝^２＋Σ｛（cb_j）_ｉ−（cb_ja）_ｉ｝^２＋Σ｛（cb_j）_ｉ−（cb_ja）_ｉ｝^２ …… ｛d|d_s＜d_i（for all i≠ｓ）｝なる最小歪みd_sを与えるベクトルのインデックス番号73
をベクトル量子化出力とする。また、パッチ内の特徴点
上の画素値の平均μy,μcb,μcrおよびσは各パッチ単
位に、平均値、分散値情報77として第１の多重化部128a
の入力となる。他方、前記３次元形状モデル整合部121
によって整合された３次元形状モデル情報71は第４図の
各パッチの頂点座標の形で表され、第１の多重化部128a
の入力となる。最後に、分離された背景画情報80は一度
背景画メモリ123に記録され、背景画符号化部124でスカ
ラ量子化等の符号化を施工され、背景画符号情報82とな
り、第１のセレクタ125aの入力となる。第１のセレクタ
125aでは、ON,OFFを切替えて、入力した背景画符号情報
82を伝送する場合はヘッダ・ビット“1"を背景画符号情
報82に付加して出力信号83とするが、受信側の背景画メ
モリ123中の任意の背景画を用いる場合はヘッダ・ビッ
トとして“0"、続いて背景画の指定番号を表すビットを
付加して、これらのビット列を出力信号83とする。以上
が符号化器の動作となる。

一方、多重化信号74を受信した復号化器側は第２図で
示すように、まず第２の多重化部128bで各信号に分離す
る。さらにパッチ逆量子化部126bでは、インデックス情
報73に書き込まれたアドレス番号を読み取り、ｍ次元ベ
クトルY,Cb,Crをモードブック127から抽出する。そして
平均値、分散値情報77を用いて同パッチ内部の画素値の
補間を行う。画素値の補間には勾配法を用い、各合同３
角形のｚ座標を画素値に設定し、３次元空間における任
意点に対応するｚ値を算出することにより補間を行う。

第６図は補間法の概要の説明図であり、あるパッチを
16分割した後の同図（ａ）におけるパッチ220の拡大図
が同図（ｂ）の３角形である。該３角形は画素値をｚ値
に設定した３次元空間に存在する平面の一部であり、点
300,310,320上のそれぞれの画素値をz₀,z₁,z₂、x,y座標
を（x₀,y₀），（x₁,y₁），（x₂,y₂）とすれば、 ax₀＋by₀＋cz₀＋ｄ＝０ …… ax₁＋by₁＋cz₁＋ｄ＝０ …… ax₂＋by₂＋cz₂＋ｄ＝０ …… の３式を連立して解くことにより、a,b,c,dの値が求ま
る。すなわち、３点300,310,320を通過する平面の方程
式が決定することになる。さらに、ｚ＝−（ｄ＋ax＋by）/c …… によりｚ値を算出すれば、点Ｐ（x,y）上の画素値が求
まることになる。

以上の処理をすべてのパッチ内の画素に対して行い、
パッチ整合顔画像75が出力され、３次元形状モデル情報
71から実際の画面上の座標値を入力することにより、顔
画像合成部130において１フレーム分の顔（被写体）画
像情報76が出力される。また該顔画像情報76は、第２の
セレクタ132bによって選択された送信側からの出力であ
る背景画符号情報82の符号化画像もしくは背景画メモリ
123中の背景画情報の出力（両者をまとめて背景画出力
情報85とする）のどちらかと画像合成部131において合
成され、最終的な出力画86を得る。

また、上記の実施例では、パッチ量子化部126aにおい
て入力ベクトルとコードブック中のベクトルとの２乗歪
み計算を行い、最小歪みを与えるベクトルのインデック
スを量子化出力としたが、該最小歪みを閾値処理し、あ
る閾値よりも最小歪みが大きい場合は前記インデックス
を出力とせず、ベクトル情報をスカラ量子化して受信側
に伝送することも可能であり、上記実施例と同様の効果
を奏する。さらに、上記の実施例では、被写体として例
えば人物の顔画像について述べたが、その他の被写体に
ついて適応することも可能であり、上記実施例と同様の
効果を奏する。

〔発明の効果〕

以上のように、この発明によれば、３次元モデルを入
力した被写体画像に対して整合させ、この整合された３
次元モデルを構成する各３角形パッチの座標と、前記整
合された３次元モデルを構成する各３角形パッチに対応
づけられた前記被写体画像とを出力する整合手段と、こ
の整合手段より出カされた前記被写体画像の各３角形パ
ッチに対応する各部分に対し、その３角形パッチを構成
する一つまたは複数の３角形の頂点を特徴点として設定
するとともにその特徴点の画素値より多次元ベクトルを
生成し、その多次元ベクトルを量子化して出力するバッ
チ量子化手段とを符号器に備え、また復号器に、多次元
ベクトルから３角形の頂点における画素値を求め、その
３角形内部の補間を行って３角形パッチを構成し、得ら
れたパッチ整合画像を出力するパッチ逆量子化手段と、
各３角形パッチの座標と、３次元モデルと、前記パッチ
整合画像とから被写体画像を合成する被写体画像合成手
段を備えたので、対象物の大きな動きや照明条件の変化
に対しても、違和感なく、かつビットレートを抑えた画
像伝送が可能となる効果がある。

また３角形パッチの特徴点として３角形パッチ内の３
角形の頂点をとるため、その３角形の数に対応して特徴
点を加減できることから、画像の解像度や伝送ビットレ
ートに合わせて３角形の数を変えることで容易に特徴点
の数を調整することができる。

また３角形パッチの特徴点として３角形パッチ内の３
角形の頂点をとっているので、３角形パッチ内部に分散
して特徴点が設定されるので、画素値のかたよりが少な
い。

【図面の簡単な説明】

第１図はこの発明の一実施例による画像符号化器の構成
を示すブロック図、第２図はこの発明の一実施例による
復号化器の構成を示すブロック図、第３図は入力画像中
より抽出された背景画および顔画像の説明図、第４図は
３次元形状モデルの説明図、第５図はｎ＝0,1,2の場合
のパッチ内特徴点についての説明図、第６図は３頂点上
の画像値から３角形内の他の点上の画素値を算出する勾
配法の原理図、第７図は従来の画像伝送方式を概念的に
示したブロック図、第８図は従来の画像伝送方式の一実
施例によるブロック図である。図において、120は顔（被写体）画像抽出部（画像抽出
手段）、121は３次元形状モデル整合部（整合手段）、1
22は３次元形状モデル・データベース（第１の記憶手
段）、123は背景画メモリ（背景画記憶手段）、124は背
景画符号化部、125aは第１のセレクタ、126aはパッチ量
子化部（パッチ量子化手段）、126bはパッチ逆量子化部
（パッチ逆量子化手段）、127はコードブック（第２の
記憶手段）、128a,128bは第1,第２の多重化部、129は背
景画復号化部（背景画復号化手段）、130は顔（被写
体）画像合成部（被写体画像合成手段）、131は画像合
成部（画像合成手段）、132bは第２のセレクタ（選択手
段）である。なお、図中、同一符号は同一、又は相当部分を示す。

フロントページの続き (56)参考文献特開平１−198884（ＪＰ，Ａ) 電子情報通信学会論文誌Ｊ72−Ｂ１［３］（1989−３−25）ｐ200−207 電子情報通信学会論文誌Ｊ71−Ｂ１［12］（1988−12−25）ｐ1554−1563

Claims

(57)【特許請求の範囲】

【請求項１】３角形パッチで構成される３次元モデルを
記憶する第１の記憶手段と、この第１の記憶手段により記憶された３次元モデルを、
入力した被写体画像に対して整合させ、この整合された
３次元モデルを構成する各３角形パッチの座標と、前記
整合された３次元モデルを構成する各３角形パッチに対
応づけられた前記被写体画像とを出力する整合手段と、この整合手段より出力された前記被写体画像の各３角形
パッチに対応する各部分に対し、その３角形パッチを構
成する一つまたは複数の３角形の頂点を特徴点として設
定するとともにその特徴点の画素値より多次元ベクトル
を生成し、その多次元ベクトルを量子化して出力するパ
ッチ量子化手段とを備えた符号化器。
【請求項２】３角形パッチで構成される３次元モデルを
記憶する第１の記憶手段と、量子化された多次元ベクトルを逆量子化して多次元ベク
トルを求め、この多次元ベクトルから３角形の頂点にお
ける画素値を求め、求められた画素値に基づき３角形内
部の補間を行ない、この補間された３角形で３角形パッ
チを構成して得られるパッチ整合画像を出力するパッチ
逆量子化手段と、各３角形パッチの座標を入力し、この各３角形パッチの
座標と、前記第１の記憶手段に記憶された３次元モデル
と、前記パッチ逆量子化手段から出力される前記パッチ
整合画像とから被写体画像を合成する被写体画像合成手
段とを備えた復号化器。