JPH02159893A - 動画像符号化装置 - Google Patents

動画像符号化装置

Info

Publication number
JPH02159893A
JPH02159893A JP63316034A JP31603488A JPH02159893A JP H02159893 A JPH02159893 A JP H02159893A JP 63316034 A JP63316034 A JP 63316034A JP 31603488 A JP31603488 A JP 31603488A JP H02159893 A JPH02159893 A JP H02159893A
Authority
JP
Japan
Prior art keywords
background
distance
image
sent
camera
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63316034A
Other languages
English (en)
Other versions
JP2701393B2 (ja
Inventor
Hidenobu Harasaki
原崎 秀信
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP31603488A priority Critical patent/JP2701393B2/ja
Publication of JPH02159893A publication Critical patent/JPH02159893A/ja
Application granted granted Critical
Publication of JP2701393B2 publication Critical patent/JP2701393B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、低ビツトレートの動画像符号化装置に関する
(従来の技術) 国際電信電話諮問委員会(CCITT)において、nX
384kbpsの動画像符号化方式の標準案が検討され
ている。この方式は、画像を8×8もしくは16X16
程度のブロックに分割し、それぞれのブロック毎に動き
補償フレーム間予測により時間変化に関わる冗長度を取
り除き、その後、直交変換符号化によりフレーム内の空
間的変化に関わる冗・長度を取り除き、各ブロックの動
き補償から得られる動静判定、直交変換後の量子化から
得られる有効無効判定結果を基に、ブロック単位に付加
情報を付けて符号化するものである。また、より低いビ
ットレートを対象としてm X 64kbpsの符号化
方式も同様な方式で検討されている。この様なフレーム
間符号化方式では、背景は静止したものであり、符号化
対象である人物のみが動きを伴うと仮定している。子な
わち、対象物体と背景は動き情報をキーとして判定して
いる。
従来動画像に対して、対象物体と背景とを識別する手法
としては、クロマキーが広く知られている。クロマキー
とは、対象物体に無い色を背景全面に描くことによって
、人力された動画信号のから背景の色度成分をキー情報
として識別するものである。例えば、鮮やかなブルーの
壁の前に立つ人物が、壁のブルーとは異なる色の服を着
ていれば、カメラから人力された信号の各画素毎にその
色度を測定し、背景の壁か、対象の人物かを識別できる
またロボッ!・視覚の分野では、複数のカメラから取り
込まれた画像情報から三角測量によって、実世界上での
カメラから対象物体までの距離情報を抽出する手法とし
て、ステレオスコープと呼ばれる技術がある。左右に配
置された2台のカメラから入力された左右画像から特徴
点どうしの対応づけや、画素毎の対応づけを行なうこと
によりカメラからの距離を得ることができる。カメラ位
置は既知であるため、画面上のずれを計算した後、三角
測量の容量でカメラから物体のエツジまでの距離を算出
することができる。
(発明が解決しようとする課題) 従来の動画符号化装置は、テレビ会議室内で背景の管理
された環境下で使用されることを想定している。すなわ
ち、人力される画像内で動きのある部分は、人物等の動
きによって発生したものであり、符号化の対象であると
考えている。しがしながら、より低ビツトレートの動画
像符号化装置はオフィスやホーム等で用いられることに
なるため、背景の管理はできない。そのため、符号化対
象でない人物が通話者の後を通り過ぎたりすることが起
こり得る。従来の符号化装置では、この様な場合は想定
されていないため、符号化対象の人物と同様に背後を通
り過ぎるものも符号化してしまい、実際に送りたい人物
の信号対雑音比や符号化フレームレートが低下するとい
う問題がある。
クロマキー技術は、背景を特殊な色にすることによって
はじめて適用できることがら、符号化対象の人物と背景
とを分離する手法として用いることができない。また、
ステレオスコープでは、左右画像の特徴点対応づけや画
素毎の対応づけがむずかしく、実用化されていない。
(課題を解決するための手段) 第1の本発明は2つの視点から画像を入力する手段と、
前記入力手段から得られた2枚の画像に対して、一方を
主画像として小領域に分割し、他方の副画像に対して前
記主画像の小領域毎に最大の相関がある小領域を副画像
内から探索することによって得られる画面上でのずれか
ら、前記主画像の小領域に映る物体までのカメラからの
距離を求める手段と、前記距離情報により、前記入力手
段の一方から得られた主画像に対して、背景マスク処理
を施す手段とを有し、前記マスク処理出力をフレーム間
符号化装置の入力信号とし、カメラからの距離情報によ
って得られた背景部分を符号化しないことを特徴とする
また第2の発明は、第1の発明における背景マスク処理
を施す手段を、背景フィルタリング処理に置き換え、前
記フィルタリング処理出力をフレーム間符号化装置の入
力信号とし、カメラからの距離情報によって得られた背
景部分の空間解像度もしくは、時間方向解像度を落とし
て符号化することを特徴とする。
第3の発明は、第1の発明における背景マスク処理を施
す手段を、別途設けられた背景メモリをスーパーインポ
ーズする手段に置き換え、前記スーパーインポーズされ
た画像をフレーム間符号化装置の入力信号とし、カメラ
からの距離情報によって得られた背景部分を前記背景メ
モリの内容と置き換えた画像を符号化することを特徴と
す′る。
(作用) 2枚の入力画像をもとに、カメラから対象物体までの距
離を算出する手法を、まず説明する。第2図に示すよう
に、2つの性能の等しいカメラをレンズ中心間隔を2a
、中心軸がPOで交わるように置く。
その時POでの交角は2αとする。
レンズ中心CL、 CRの中点を原点0として、PQ−
CL。
PO−CRがXY平面′にのるようにxYz軸をとる。
両カメラの像面とレンズの距離をLとし、像面と中心軸
との交点をOL、ORとする。OL、ORを原点として
像面にrlx、rly、ζ工、ξ、座標をとる。像面の
座標とテレビ画面上の量子化されたスクリーン座標とは
、(1)式で関係付けられる。
r1x=Mx(hL−ho) 諏= M、(Vo−VL) 娠=Mx(hR−ho) ξy= My(VO−VR)・・・・・・・・・・・・
・・・・・・・・・・・・・・(1)ここで、(hL、
 VL)は点Pの左画面でのスクリーン座標、(hR,
VR)は点Pの右が面でのスクリーン座標、(ho、v
。)は、CL、CRのスクリーン座標、Mx、Myは変
換係数である。次に、任意の点Pの(x、 y、 z)
座標と像座標(rlx、rly)、島、ξ、)との関係
を考えると、カメラの視野の関係で、x、 z、 rl
、ξ、座標は無視できる。
従ってPの左画像をrlxとすると、xY座標ではPL
(−a + Lsina +rlxCO8CI、 Lc
osa −rlxsina)となる。同様にPRは(−
a−Lsina+ξxcosa、 Lcosa−F、x
sin(−a))となる。
両交軸CI、−PL、 CR−PRの交点としてPのY
座標を求めると、(2)式になる。
Y=2a−(L−11x tana)・(L+ξxta
na)/(2−(L +rlxF、x) tana+L
−(ξx  ”1x)tan a−1))  (2)こ
れがスクリーン座標と物体の距離情報を結び付けており
、α=0、すなわちa<<Yとすればカメラ光軸が平行
なモデルとなり、(3)式になる。
Y=2aL/(rlx−ξx)=2aL/Mx(hL−
hR) 、−0−、、−、(3)すなわち、スクリーン
の位置に関係なく、左画像と右画像のずれ(hL−hR
)のみに依存することになる。
次に、左画像と右画像のずれを求める手法について説明
する。従来のロボット視覚の研究では、各画素毎に距離
情報を抽出しようと試みられていた。このため、左右画
像の対応をとるのが非常に困難であった。ところで、動
画像符号化では画面を8画素×8ラインや16画素X1
6ラインの小ブロックに分割しブロック単位で符号化を
行なっている。このことに注目すると、画素毎に距離情
報を求める必要はなく、小ブロックの平均距離が算出で
きれば、背景分離が可能となる。そこで、左画像を主画
像、右画像を副画像と考え、主画像を小領域のブロック
に分割する。主画像での物体の像と、副画像での物体の
像は一般的には異なり、主画像で正方形のブロックが副
画像で必ずしも同じ大きさの正方形ブロックとならない
が、カメラ中心の距離がかなり近くなれば、主画像上の
ブロックを物体の距離に応じて平行移動したものが副画
像の対応する小領域と仮定できる。そこで、主画像のブ
ロックに最も距離が小さい領域を副画像内から探索する
ことで、その副画像内での位置からずれを求めることが
できる。このずれは、主画像のブロック毎に求まるので
、そのずれから(2)式あるいは(3)式を用いてカメ
ラからの距離が算出される。そこで、符号化対象となる
人物がカメラ前の1m以内に存在すると仮定すると、そ
のブロック毎の距離から1m以上の距離をもつブロック
は背景としてマスク処理を施した後、フレーム間符号化
装置の入力とする。
また第2の発明では、符号化対象となる人物がカメラ前
の1m以内に存在すると仮定すると、そのブロック毎の
距離から1m以上の距離をもつブロックは背景として空
間的な低域通過フィルタリングを行なったのち、フレー
ム間符号化装置の入力とする。もしくは、背景となった
ブロックについては、時間軸フィルタリングを行ない、
時間方向の低域通過特性を持たせた後、フレーム間符号
化装置の入力とする。
また第3の発明では、符号化対象となる人物がカメラ前
の1m以内に存在すると仮定すると、そのブロック毎の
距離から1m以上の距離をもつブロックは背景として、
別途設けられた背景記憶用メモリの内容に置き換える処
理を行なった後、フレーム間符号化装置の入力とする。
(実施例) 本発明の特許請求の範囲1の対応する一実施例を図面を
参照しながら説明する。第1図において、100は主画
像入力部、101は副画像入力部、102は距離計測部
、103は背景マスク部、104はフレーム間符号化部
である。カメラは10cm程離れて2つあり、4m程度
前方の壁で光軸が一致するように設定されているとする
。カメラから壁に向かって左にあるカメラ出力が主画像
入力部100へ、右にあるカメラ出力が副画像入力部1
01へ接続されている。主画像人力部100では、左カ
メラ出力を入力しん0変換、色輝度分離を行なう。同様
に、副画像入力部101では、右カメラ出力を人力しA
/D変換、色輝度分離を行なう。主画像入力部100お
よび副画像入力部101の出力のうち輝度成分はそれぞ
れ距離計測部102へ送られる。また、主画像入力部1
00の出力である色・輝度成分はそれぞれ背景マスク部
103へ送られる。
距離計測部102では、主画像入力部100から送られ
てきた輝度成分PL(x、 y)を、また、副画像入力
部101から送られてきた輝度成分PR(x、 y)を
それぞれのメモリに格納する。その後、主画像輝度成分
PL(x、y)を16画素×16ライン毎のブロックに
分割し、水平方向i番目、垂直方向j番目のブロックと
して以後参照する。いま、カメラの光軸が一致する壁よ
り手前にのみ対象物体が存在し、両カメラの視野内に促
えられていると仮定できるので、主画像が左に置かれた
カメラ人力であることから、それに対応する副画像(右
カメラ)は同じ水平垂直位置のブロックよりも左側にし
か現れない。このことを利用し、ijブロックのずれU
での距離Dij(u)を(4)式で計算する。
−PL(16i+X、16j+Yi   (4)この時
、−16i< =u< =0が探索範囲である。この探
索範囲内で最も距離Dij(u)が小さかったUがずれ
として算出される。本実施例では、カメラ間距離に較べ
て光軸が一致する点までのカメラ距離が十分大きいため
、複雑な(2)式を用いる必要なく、(3)式で計算が
できる。算出されたずれUから先に示した(3)式を用
い、カメラからの距離Y=2aLluMxトする。ここ
で、aはレンズ中心の距離の半分、Lはレンズ焦点距離
、Mxはスクリーン座標と像座標との変換係数である。
この様に各ブロック毎に求まった距離情報は背景マスク
部103に送られる。
背景マスク部103では、距離計測部102から送られ
たブロック毎のカメラ距離を用いて、予め定められた一
定値を越える距離ブロックについては0、その他は1の
マスクを生成し、主画像入力部100から送られてくる
輝度および色信号の各対応するブロックが0の場合は通
さず、1の場合のみ通し、フレーム間符号化部104に
送出する。
フレーム間符号化装置104では、背景マスク部103
が送出した、背景が消去された輝度、色信号を入力し、
動き補償フレーム間予測信号に対して、8×8の直交変
換(離散コサイン変換)を行ない、ブロック内の低シー
ケンシ−データから順次量子化、可変長符号割当てを行
ない伝送路に5送出する。
以上説明した様に、第1の本発明が実施される。
尚、距離計測部102は毎符号化フレーム毎に行なうの
が好ましいが、処理が間に合わない場合は、距離計算は
複数符号化フレームに1回とすることが、可能である。
但、この場合の背景との分離精度は、劣化を生じる。
同様に、第2の発明に対応する一実施例を図面を参照し
て説明する。第3図において、100は主画像人力部、
101は副画像入力部、102は距離計測部、203は
背景フィルタリング部、104はフレーム間符号化部で
ある。まず、主画像の各ブロックに対応したカメラ距離
を算出する仮定までは、第1図での説明と重複するため
、省略する。距離計測部120で求まったブロック毎の
距離情報は、背景フィルタリング部203へ送られ、背
景フィルタリング部203では、主画像人力部100よ
り送られた入力画像に対して距離計測部102か送られ
たブロック毎の距離情報により、予め定められた距離以
上をもったブロックに対しては3×3画素の空間フィル
タリング・を行なう。この時のフィルタリング係数は中
央が0.25、上下左右4近傍が0.125、残りの斜
方向4近傍が0.0625である。このフィルタリング
により、入力信号内の背景ブロックの空間方向の高周波
数成分を除去し、ぼかしを行ない、フレーム間符号化装
置104に送出する。
また、背景フィルタリング部203では、フレームメモ
リを持つことにより、時間軸フィルタリングに変更して
も良い。この場合、低域通過特性を持つ時間軸フィルタ
リングを行なうことにより、空間方向の解像度は劣化さ
せずに、動きに対しては大きな帯域制限を行なうことが
できる。
フレーム間符号化装置104では、背景フィルタリング
部203が送出した、背景が空間的もしくは時間的に帯
域制限された輝度、色信号を入力し、動き補償フレーム
間予測信号に対して、8X8の直交変換(離散コサイン
変換)を行ない、ブロック内の低シーケンシ−データか
ら順次量子化、可変長符号割当てを行ない伝送路に送出
する。以上説明したように、第2の本発明が実施される
同様に第3のに対応する一実施例を図面を参照して説明
する。第4図において、100は主画像入力部、201
は副画像入力部、102は距離計測部、303は背景メ
モリ、304はスーパーインポーズ部、104はフレー
ム間符号化部である。まず、主画像の各ブロックに対応
したカメラ距離を算出する仮定までは、第1図での説明
と重複するため、省略する。距離計測部102で求まっ
たブロック毎の距離情報は、スーパーインポーズ部30
4へ送られ、スーパーインポーズ処理部304では、主
が像入力部100から人力された信号に対し、距離計測
部102から送られたブロック毎の距離情報に従い、背
景に相当する部分は背景メモリ303からの出力に置き
換える。背景メモリ303からの入力はディジタル表現
された静止画であるため、後段のフレーム間符号化装置
104では、初期のシーンチェンジ時のみ符号化するこ
とにより、通常動作時は差分が現れずに符号化対象にな
らない。
フレーム間符号化装置104では、スーパーインポーズ
部304が送出した、背景部分を背景メモリ303の内
容に置き換えた輝度、色信号を人力し、動き補償フレー
ム間予測信号に対して、8×8の直交変換(離散コサイ
ン変換)を行ない、ブロック内の低シーケンシ−データ
から順次量子化、可変長符号割当てを行ない伝送路に送
出する。以上説明したように、本発明の特許請求の範囲
3が実施できる。
(発明の効果) 本発明を用いることによって、テレビ電話や、テレビ会
議の対象人物と背景を分離することができ、第1の発明
を用いれば、たとえ背景に動く物体が存在した場合でも
、符号化効率の劣化を生じない。また、第2の発明を用
いれば、背景部分の空間的あるいは時間的な帯域制限が
行なわれることから、背景よりも符号化対象部により符
号が割当てられた符号化装置を提供できる。また、第3
の発明を用いれば、第1の発明の効果の上に、ユーザの
好みに合わせた背景を復号側に提示することが可能とな
る。
【図面の簡単な説明】
第1図、第3図、第4図は本発明の実施例を示す図。第
2図は本発明の詳細な説明する図である。第1図におい
て、100は主画像入力部、101は副画像入力部、1
02は距離計測部、103は背景マスク部、104はフ
レーム間符号化部である。第3図において、100は主
画像入力部、101は副画像入力部、102は距離計測
部、203は背景フィルタリング部、104はフレーム
間符号化部である。第4図において、100は主画像入
力部、101は副画像入力部、102は距離計測部、3
03は背景メモリ部、304はスーパーインポーズ部、
104はフレーム間符号化部である。

Claims (3)

    【特許請求の範囲】
  1. (1)2つの視点から画像を入力する手段と、前記入力
    手段から得られた2枚の画像に対して、一方を主画像と
    して小領域に分割し、他方の副画像に対して前記主画像
    の小領域毎に最大の相関がある小領域を副画像内から探
    索することによって得られる画面上でのずれから、前記
    主画像の小領域に映る物体までのカメラからの距離を求
    める手段と、前記距離情報により、前記主画像に対して
    、背景マスク処理を施す手段とを有し、前記マスク処理
    出力をフレーム間符号化装置の入力信号とし、カメラか
    らの距離情報によって得られた背景部分を符号化しない
    ことを特徴とする動画像符号化装置。
  2. (2)特許請求の範囲1に記載の背景マスク処理を施す
    手段を、背景フィルタリング処理に置き換え、前記フィ
    ルタリング処理出力をフレーム間符号化装置の入力信号
    とし、カメラからの距離情報によって得られた背景部分
    の空間解像度もしくは、時間方向解像度を落として符号
    化することを特徴とする動画像符号化装置。
  3. (3)特許請求の範囲1に記載の背景マスク処理を施す
    手段を、別途設けられた背景メモリをスーパーインポー
    ズする手段に置き換え、前記スーパーインポーズされた
    画像をフレーム間符号化装置の入力信号とし、カメラか
    らの距離情報によって得られた背景部分を前記背景メモ
    リの内容と置き換えた画像を符号化することを特徴とす
    る動画符号化装置。
JP31603488A 1988-12-13 1988-12-13 動画像符号化装置 Expired - Fee Related JP2701393B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP31603488A JP2701393B2 (ja) 1988-12-13 1988-12-13 動画像符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP31603488A JP2701393B2 (ja) 1988-12-13 1988-12-13 動画像符号化装置

Publications (2)

Publication Number Publication Date
JPH02159893A true JPH02159893A (ja) 1990-06-20
JP2701393B2 JP2701393B2 (ja) 1998-01-21

Family

ID=18072522

Family Applications (1)

Application Number Title Priority Date Filing Date
JP31603488A Expired - Fee Related JP2701393B2 (ja) 1988-12-13 1988-12-13 動画像符号化装置

Country Status (1)

Country Link
JP (1) JP2701393B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6111979A (en) * 1996-04-23 2000-08-29 Nec Corporation System for encoding/decoding three-dimensional images with efficient compression of image data
JP2008505522A (ja) * 2004-07-02 2008-02-21 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ビデオ処理

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6111979A (en) * 1996-04-23 2000-08-29 Nec Corporation System for encoding/decoding three-dimensional images with efficient compression of image data
JP2008505522A (ja) * 2004-07-02 2008-02-21 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ビデオ処理

Also Published As

Publication number Publication date
JP2701393B2 (ja) 1998-01-21

Similar Documents

Publication Publication Date Title
Jozawa et al. Two-stage motion compensation using adaptive global MC and local affine MC
US5764803A (en) Motion-adaptive modelling of scene content for very low bit rate model-assisted coding of video sequences
KR100209793B1 (ko) 특징점 기반 움직임 추정을 이용하여 비디오 신호를 부호화 및 복호화하는 장치
EP0579319B1 (en) Tracking moving objects
CA2896810C (en) Method and apparatus for bi-prediction of illumination compensation
CN109379594B (zh) 视频编码压缩方法、装置、设备和介质
KR20090023977A (ko) 스테레오 비전 시스템 및 그 처리 방법
KR20000049031A (ko) 3차원 깊이 정보를 이용한 디지털 이미지와 비디오 세그먼테이션과 압축을 수행하기 위한 방법 및 장치
KR20000017775A (ko) Mpeg 데이터를 이용한 입체영상생성방법 및 그 장치
Kim et al. Zoom motion estimation using block-based fast local area scaling
Tzovaras et al. Disparity field and depth map coding for multiview 3D image generation
JPH11112989A (ja) 動きベクトル符号化方法及び符号化装置
CN110324627A (zh) 色度的帧内预测方法及装置
Hartung et al. Object-oriented H. 263 compatible video coding platform for conferencing applications
Zhong et al. Light field image compression using depth-based CNN in intra prediction
JPH06153239A (ja) 画像の符号化方式
KR100649654B1 (ko) 모션 벡터의 송신 비용 절감을 위한 모션 추정 방법
Aydinoglu et al. Compression of multi-view images
KR20030034271A (ko) 저전송율 동영상 부호화에 적합한 움직임 추정 방법
US6771823B2 (en) Coding and decoding of moving pictures based on sprite coding
JPH02159893A (ja) 動画像符号化装置
Chang et al. Compositing motion-compensated video within the network
JPH07240944A (ja) ステレオ画像符号化装置
Tzovaras et al. Disparity field and depth map coding for multiview image sequence compression
JP2022120891A (ja) 画像フィルタリング装置およびそのプログラム、ならびに、画像符号化装置およびそのプログラム

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees