JP2002531020A - 立体画像符号化処理におけるフォアグラウンド情報抽出方法 - Google Patents

立体画像符号化処理におけるフォアグラウンド情報抽出方法

Info

Publication number
JP2002531020A
JP2002531020A JP2000584695A JP2000584695A JP2002531020A JP 2002531020 A JP2002531020 A JP 2002531020A JP 2000584695 A JP2000584695 A JP 2000584695A JP 2000584695 A JP2000584695 A JP 2000584695A JP 2002531020 A JP2002531020 A JP 2002531020A
Authority
JP
Japan
Prior art keywords
foreground
information
pair
encoding
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2000584695A
Other languages
English (en)
Inventor
チャラパリ,キラン
ワイ チェン,リチャード
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Philips Electronics NV filed Critical Philips Electronics NV
Publication of JP2002531020A publication Critical patent/JP2002531020A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/174Segmentation; Edge detection involving the use of two or more images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/194Transmission of image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • G06T2207/10012Stereo images
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/189Recording image signals; Reproducing recorded image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/204Image signal generators using stereoscopic image cameras
    • H04N13/239Image signal generators using stereoscopic image cameras using two 2D image sensors having a relative position equal to or related to the interocular distance
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/286Image signal generators having separate monoscopic and stereoscopic modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N2013/0074Stereoscopic image analysis
    • H04N2013/0081Depth or disparity estimation from stereoscopic image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N2013/0074Stereoscopic image analysis
    • H04N2013/0092Image segmentation from stereoscopic image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N2013/0074Stereoscopic image analysis
    • H04N2013/0096Synchronisation or controlling aspects

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Abstract

(57)【要約】 フォアグラウンド情報を抽出し、それをバックグラウンド情報よりも高いビットレートで符号化処理することにより、低帯域幅のネットワークにおける画像データの送信を向上する画像処理装置。

Description

【発明の詳細な説明】
【0001】 [発明の属する技術分野] 本発明は、画像処理に係り、より詳しくは、テレビ会議アプリケーション用の
一対の立体画像からのフォアグラウンド及びバックグラウンド情報の抽出及び可
変転送レート方式に関する。
【0002】 [従来の技術] 通常、テレビ会議アプリケーションにおいて、出席者間の通信帯域は、電話回
線では64Kbps程度に限定されている。低いビットレートの音声及び画像デ
ータを効率良く圧縮するためのデータ圧縮の方式、例えばH.263やMPEG
4などが数年にわたって開発されてきた。しかし、通常のテレビ会議アプリケー
ションでは、ほとんどの画像データに不必要な情報、例えばバックグラウンド(
背景)に存在する物体などが含まれている。圧縮アルゴリズムでは、必要な物と
不必要な物との区別をつけることができないため、すべての情報を低帯域チャン
ネルで送信することになる。その結果、ビデオ会議出席者の映像は、実際よりも
遅れた、途切れた感じの映像になってしまう。
【0003】 先行技術として、ドイツ国特許番号DE3608489(A1)に示すように
、テレビ会議出席者を写すために一対のカメラを用いたシステムがある。まず2
つの画像の比較を行い、様々なディスプレイスメント技術を用いてフォアグラウ
ンド(前景)情報の輪郭を検出する(この点については、上記の独国特許及び「
Depth Discontinuities by Pixel-to-pixel Stereo」Birchfield 及び Tomasiに
よる、インド・ボンベイでの1998年IEEEのComputer Visionについての
国際会議議事録(以下、「Birchfield」とする)にも記述がある。)。フォアグ
ラウンド情報の輪郭を検出すれば、バックグラウンド情報も自動的に検出できる
。その後、単一の静止バックグラウンド画像を受信器に対して送信し、メモリ内
に保存する。そのフォアグラウンド画像を符号化し、保存されたバックグラウン
ド画像内におけるフォアグラウンド画像の位置情報を示すアドレスデータと共に
送信する。
【0004】 このシステムの問題点は、動きが全く無いためにバックグラウンドが人工的に
見えてしまう点と、テレビ会議出席者の輪郭をある程度の精度で決定しなければ
ならない点である。更に、DCT係数の8×8ブロックのような四角の画像に対
して最適化されている符号器で、テレビ会議出席者の輪郭を表すような不規則な
形の画像を符号化しなければならない。この不規則な形の情報を別々に送信しな
ければならず、帯域にとっても、符号器側・復号器側の計算資源にとっても、負
荷となってしまう。
【0005】 [発明の開示] したがって、本発明は、テレビ会議画像のフォアグラウンド情報を抽出し、そ
れを第1のビットレートで符号化し、バックグラウンド情報を第1よりも低い第
2のビットレートで符号化することを目的とする。この目的は、わずかに異なる
視界を有するように配置した一対のカメラを使用することで達成される。2つの
画像を得た後、各画像内で一致する対応画素の位置差を計算し、これらの画素の
位置差を判定する。2つの同一画素の位置差が小さい場合は、これらの画素がバ
ックグラウンド情報であることを示し、位置差が大きい場合は、これらの画素が
フォアグラウンド情報であることを示している。フォアグラウンド画素は、高い
ビットレートで送信され、バックグラウンド画素は、それよりも低いビットレー
トで送信される。
【0006】 本発明の更なる目的は、テレビ会議出席者の輪郭線を正確に表す必要性をなく
すことである。この目的は、輪郭線を決定する際、係数の8×8DCTブロック
を用いることで達成される。所定の数のフォアグラウンド画素を含むブロックは
、高いビットレートで符号化され、この所定の数より少ない数しかフォアグラウ
ンド画素を含んでいないブロックは、それより低いビットレートで符号化される
【0007】 本発明の更に別の目的は、係数の8×8DCTブロックを符号化する標準型符
号器を用いてデータの符号化を行うことである。この目的も、テレビ会議出席者
の正確な輪郭線よりも、DCTデータのブロックの基づいてフォアグラウンド情
報を決定することによって達成される。
【0008】 したがって、本発明は、以下に説明する実施例から明らかになるように、構成
要素の様々な組み合わせ、配置等を含んだ方法及び特徴に関する。本発明の請求
範囲は独立の請求項にて示す。従属の請求項においては、好ましい実施態様を定
義する。
【0009】 [発明の好ましい実施の形態] 図1は、本発明によるテレビ会議機構を示す。テレビ会議出席者30は少し間
隔を置いて設置された2つのカメラ10、20の前のデスク32に着席する。図
中のバックグラウンドには、コンピュータ40、人が出入りするためのドア50
、時計60がある。カメラ10からの視界を図2に示す。テレビ会議出席者30
は、カメラ10から見て右側に位置し、コンピュータ40は、カメラから距離が
あるため、そのまま画像のほぼ中央に位置する。ドア50は画像の右側であり、
時計60は画像の左側に位置する。
【0010】 カメラ20からの視界を図2Bに示す。テレビ会議出席者30は、画像の左に
位置し、時計60は、テレビ会議出席者30のさらに左に位置する。コンピュー
タ40は、テレビ会議出席者30の右側に位置するものの、やはりほぼ中央に位
置する。ドア50は、画像の右上方に位置する。
【0011】 これら2つのカメラから受信される画像を比較し、フォアグラウンド情報の画
素の位置決定を行う。(DE3608489及び birchfield に開示されている
ような、フォアグラウンド情報の位置決定を行うためのアルゴリズムが多数ある
。)本発明の好ましい実施態様によると、左側のカメラ10からの画像(画像A
)を、右側のカメラ20からの画像(画像B)とを比較する。スキャンラインは
一直線に集結されており、画像Aのスキャンライン19と画像Bのスキャンライ
ン19とは一致する。画像Aのスキャンライン19上の各画素は、画像Bのスキ
ャンライン19上の各対応画素と一致する。例えば、画像Aのスキャンライン1
9の画素28が画像Bのスキャンライン19の画素13と一致する場合、両者の
差は、28−13=15のように計算できる。カメラが接近して配置されている
ため、フォアグラウンド情報の画素は、バックグラウンド情報の画素よりも、両
者の差が大きくなる。ここで、両者の差のしきい値として、例えば7を選択し、
差が7より大きい場合は、その画素がフォアグラウンド情報であることを示し、
7より小さい場合は、その画素がバックグラウンド情報であることを示す。これ
らの計算はすべて、図4に示すフォアグラウンド検知器50で行われる。このフ
ォアグラウンド検知器は、例えば画像Bなどの画像と、画像データと同じサイズ
で、どの画素がフォアグラウンド画素(例えば「1」)で、どの画素がバックグ
ラウンド画素(例えば「0」)なのかを示すデータブロックとを出力する。これ
ら2つの出力は、8×8のDCT画像ブロックと、どのDCTブロックがフォア
グラウンド情報でありバックグラウンド情報であるかを示すバイナリブロックを
作成するDCTブロック選別器52に供給される。予め設定されたしきい値であ
るか、またはそのチャネルのビットレート限界の変化にともなって変化する、フ
ォアグラウンド情報である特定のDCTブロック内の画素の数に従って、そのブ
ロックは、フォアグラウンドブロック(高ビットレート符号化処理部56Aを始
動)あるいはバックグラウンド(低ビットレート符号化処理部56Bを始動)と
して、符号器56に対して識別される。
【0012】 図3Aは、本発明に従って、フォアグラウンド情報として符号化された情報を
破線で表した画像Bを示す。各マス目は、8×8のDCTブロックを表すものと
する。8×8のDCTブロック内のいずれかの画素がフォアグラウンド情報であ
る場合、そのブロック内全体の画素もフォアグラウンド情報として符号化される
ように、フォアグラウンドしきい値を設定する。図3Aの破線は、フォアグラウ
ンド情報として識別されたDCTブロックを示す。これらのブロックは、より精
密な量子化レベルで符号化される。
【0013】 図3Bは、DCTブロック識別器52の出力である、バイナリDCT差ブロッ
クを示す。符号器56は、画像B及びバイナリDCT差ブロックを受け取る。論
理値「1」のDCT差ブロックに対応するDCTブロックは、細かく符号化され
る。論理値「0」のDCT差ブロックに対応するDCTブロックは、粗く符号化
される。その結果、チャンネルの帯域幅のほとんどがフォアグラウンド情報に割
当てられ、ほんのわずかな部分のみがバックグラウンド情報に割当てられる。復
号器58(図4に図示)はビットストリームを受け取り、そのビットストリーム
内に設定されている量子化レベルに従って、復号化する。
【0014】 本発明は、ネットワーク上で動画を送信する場合に適応可能であり、例えば、
インターネット、電話、ビデオメール、テレビ電話、デジタルテレビジョン受信
機などに適用可能である。
【0015】 本発明の好ましい態様では、本発明は、処理用トリメディアプロセッサ及び表
示用テレビジョンモニタを用いたデジタルテレビジョンプラットフォームにも適
用可能である。本発明はまた、パーソナルコンピュータにも適用可能である。
【0016】 図5は、本発明を適用したコンピュータシステム7の代表的な実施例を示す。
図5に示すように、パーソナルコンピュータ(PC)8は、可変帯域ネットワー
クやインターネットなどのネットワークへのインタフェース機能を持つネットワ
ーク接続部11と、ビデオカメラ(図示せず)などの他の離れた装置とのインタ
フェース機能を持つFAX/モデム接続部12を有する。PC8はさらに、ユー
ザに対して情報(画像情報も含む)を表示するための表示スクリーン14と、テ
キストやユーザコマンドを入力するためのキーボード15と、表示スクリーン1
4上のカーソルの位置決め及びユーザコマンドの入力を行うためのマウス13と
、挿入されたフロッピー(登録商標)ディスクからの読出し及び書込みを行うた めのディスクドライブ16と、CD―ROMに保存された情報にアクセスするた めのCD−ROMドライブ17とを有する。これに加えて、PC8は、画像等を 入力するための一対のテレビ会議用カメラや、画像やテキストなどを出力するた めのプリンタ19などの周辺機器を備える。
【0017】 図6は、PC8の内部構造を示す。図6に示すように、PC8は、コンピュー
タハードディスクなどのコンピュータで読取り可能な媒体を備えるメモリ25を
有する。メモリ25は、データ23、アプリケーション25、プリントドライバ
24、オペレーションシステム26を保存する。本発明の好ましい態様において
は、オペエーションシステム26は、マイクロソフトのWindows95(商
標名)などのウインドウ型オペレーションシステムであるが、本発明は他のオペ
レーションシステムを使用する場合でも適用可能である。メモリ25のアプリケ
ーション領域51に保存されたアプリケーションには、フォアグラウンド情報検
知器/DCTブロック選別器/画像符号器21(以下、画像符号器21)及び画
像復号器22がある。画像符号器21は、上述した方法で画像データの符号化処
理を行い、画像復号器22は、ビデオ符号器21に予め設定した方法で符号化さ
れた画像データを復号化する。これらのアプリケーションの処理動作は、既に詳
細な説明を行っているので、ここでは省略する。
【0018】 さらにPC8は、表示インタフェース29、キーボードインタフェース41、
マウスインタフェース31、ディスクドライブインタフェース42、CD−RO
Mドライブインタフェース34、コンピュータバス36、RAM37、プロセッ
サ38、プリンタインタフェース43を有する。プロセッサ38は、上述したよ
うなアプリケーションをRAM37から実行するためのマイクロプロセッサなど
を備えるのが好ましい。画像符号器21及び画像復号器22を含むこれらのアプ
リケーションは、メモリ25に(上述のように)保存されているか、あるいはデ
ィスクドライブ内のフロッピーディスクまたはCD−ROMドライブ17内のC
D―ROMに保存されている。プロセッサ38は、フロッピーディスク上に保存
されたアプリケーションに対しては、ディスクドライブインタフェース32を介
してアクセスし、CD−ROMに保存されたアプリケーションに対しては、CD
−ROMドライブインタフェース34を介してアクセスする。
【0019】 アプリケーションの実行及びPC8のその他の機能は、キーボード15または
マウス13を使って、キーボードインタフェース41及びマウスインタフェース
31を介してそれぞれプロセッサ38に送信されたコマンドを用いて、開始され
る。PC8において作動するアプリケーションからの出力結果は、表示インタフ
ェース29によって処理され、表示機14上にユーザに対して表示されるか、あ
るいは、ネットワーク接続部11を介して出力される。例えば、画像符号器21
によって符号化された入力画像データは通常ネットワーク接続部11を介して出
力される。それに対して、可変帯域ネットワークなどから受信した符号化された
画像データは、画像復号器22によって復号化された後、表示器14上に表示さ
れる。このことから、表示インタフェース29は、プロセッサ38によってコン
ピュータバス36を通して供給された復号化画像データに基づいて画像を形成し
、及び、それらの画像を表示器14に出力するための表示プロセッサを備えるこ
とが好ましい。文章作成プログラムなど、PC8で作動する他のアプリケーショ
ンの出力結果は、プリンタインタフェース43を介してプリンタ19に供給され
る。プロセッサ38は、プリントドライバ24を駆動し、プリンタ19への送信
の前に、各プリントジョブに対して適切な書式作成を行う。
【0020】 以上によって、前述した本発明の目的は効率的に達成される。また、本発明の
請求の範囲から反れない限りは様々な変更や変形が可能なことから、添付の図面
を参考に説明した実施態様は単なる例であり、これに限定されるものではない。
【0021】 本発明はまた、本発明の特徴を示す要素を有するハードウェアや、適切にプロ
グラミングされたコンピュータによっても実行可能である。複数の手段を有する
装置では、これらの手段を単一のハードウェアで実現してもよい。
【図面の簡単な説明】
【図1】 図1は、一対の立体カメラを用いたテレビ会議機構を示す。
【図2】 図2A、2Bは、図1のカメラからの画像を示す。
【図3】 図3Aは、フォアグラウンド情報の識別を示し、図3Bは、高ビットレートで
送信されるDCTブロックを示す。
【図4】 図4は、本発明によるテレビ会議装置を示すブロック図である。
【図5】 図5は、本発明を実行するPCの概略図である。
【図6】 図6は、図5のPCの内部構造を示す。
───────────────────────────────────────────────────── フロントページの続き (71)出願人 Groenewoudseweg 1, 5621 BA Eindhoven, Th e Netherlands Fターム(参考) 5C059 MA23 MC11 PP13 SS07 5C061 AA29 AB04 AB08 AB12 AB17 AB24 5C064 AA02 AB04 AC04 AC09 AC12 AC22 AD02 AD03 AD06 AD14 AD18 5J064 AA03 BA16 BB01 BC01 BD03 5K041 AA09 BB06 CC04 CC07 EE38 HH25

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 画像処理装置において、 一対の立体画像を受け取る入力部と、 該一対の立体画像からフォアグラウンド画素情報を検知するフォアグラウンド
    抽出部と、 第1の高い量子化レベルで該フォアグラウンド画素情報を符号化し、第2の低
    い量子化レベルでバックグラウンド画素情報を符号化する、該フォアグラウンド
    抽出部に連結する符号化処理部とを有する画像処理装置。
  2. 【請求項2】 前記フォアグラウンド抽出部は、各画像内の同一画素の位置
    差を計算し、位置差がしきい距離よりも長い画素をフォアグラウンド画素として
    選択する請求項1記載の画像処理装置。
  3. 【請求項3】 前記フォアグラウンド画素情報はブロック全体を考慮して設
    定される請求項1記載の画像処理装置。
  4. 【請求項4】 画像処理システムにおいて、 一対の立体画像を撮る一対の立体カメラと、 該一対の立体画像からフォアグラウンド画素情報を検知するフォアグラウンド
    抽出部と、 第1の高い量子化レベルで該フォアグラウンド画素情報を符号化し、第2の低
    い量子化レベルでバックグラウンド画素情報を符号化する、該フォアグラウンド
    抽出部に連結する符号化処理部とを有する画像処理装置。
  5. 【請求項5】 一つの立体画像を符合化する方法において、 一対の立体画像を受け取る工程と 該一対の立体画像からフォアグラウンド情報を抽出する工程、 第1の高い量子化レベルで該フォアグラウンド情報を符号化し、第2の低い量
    子化レベルでバックグラウンド情報を符号化する工程とを含む方法。
  6. 【請求項6】 前記抽出工程は、 前記一対の立体画像のそれぞれにおける同一画素の位置を識別する工程と、 該同一画素の位置差を計算する工程と、 該位置差がしきい値を越えているか否かを判定し、超えている場合にはそれら
    の画素をフォアグラウンド情報として識別する工程とを含むことを特徴とする請
    求項5記載の方法。
  7. 【請求項7】 コンピュータで読取り可能な媒体に保存され、一対の立体画
    像からの画像データを処理するための、コンピュータで実行可能な処理工程にお
    いて、 該一対の立体画像からフォアグラウンド画素情報を検出するフォアグラウンド
    抽出工程と、 第1の高い量子化レベルで少なくとも1つの画像のフォアグラウンド画素情報
    を符号化し、第2の低い量子化レベルで少なくとも1つの画像のバックグラウン
    ド画素情報を符号化する符号化工程とを含む処理工程。
  8. 【請求項8】 前記フォアグラウンド抽出工程において、どの8×8のDC
    Tブロックが少なくとも所定の量のフォアグラウンド画素情報を含んでいるかを
    判定し、 前記符号化工程において、少なくとも所定の量のフォアグラウンド画素情報含
    んでいるDCT係数の8×8ブロックについて、前記第1の高い量子化レベルで
    該DCT係数の8×8ブロック全体を符号化することを特徴とする請求項7記載
    のコンピュータで実行可能な処理工程。
  9. 【請求項9】 一対の立体画像を処理する装置において、 処理工程を保存するメモリと、 該一対の立体画像からフォアグラウンド情報を抽出し、第1の高い量子化レベ
    ルで該フォアグラウンド情報を符号化し、第2の低い量子化レベルでバックグラ
    ウンド情報を符号化するように、該メモリに保存された処理工程を実行するプロ
    セッサとを含む装置。
JP2000584695A 1998-11-20 1999-10-27 立体画像符号化処理におけるフォアグラウンド情報抽出方法 Withdrawn JP2002531020A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/196,574 1998-11-20
US09/196,574 US20020051491A1 (en) 1998-11-20 1998-11-20 Extraction of foreground information for video conference
PCT/EP1999/008243 WO2000031981A1 (en) 1998-11-20 1999-10-27 Extraction of foreground information for stereoscopic video coding

Publications (1)

Publication Number Publication Date
JP2002531020A true JP2002531020A (ja) 2002-09-17

Family

ID=22725937

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000584695A Withdrawn JP2002531020A (ja) 1998-11-20 1999-10-27 立体画像符号化処理におけるフォアグラウンド情報抽出方法

Country Status (5)

Country Link
US (1) US20020051491A1 (ja)
EP (1) EP1050169A1 (ja)
JP (1) JP2002531020A (ja)
KR (1) KR100669837B1 (ja)
WO (1) WO2000031981A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016527791A (ja) * 2013-08-19 2016-09-08 華為技術有限公司Huawei Technologies Co.,Ltd. 画像処理方法及び装置

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4670303B2 (ja) * 2004-10-06 2011-04-13 ソニー株式会社 画像処理方法及び画像処理装置
JP4251650B2 (ja) * 2005-03-28 2009-04-08 株式会社カシオ日立モバイルコミュニケーションズ 画像処理装置及びプログラム
TW200822751A (en) * 2006-07-14 2008-05-16 Objectvideo Inc Video analytics for retail business process monitoring
US20090316777A1 (en) * 2008-06-20 2009-12-24 Xin Feng Method and Apparatus for Improved Broadcast Bandwidth Efficiency During Transmission of a Static Code Page of an Advertisement
JP5562408B2 (ja) 2009-04-20 2014-07-30 ドルビー ラボラトリーズ ライセンシング コーポレイション 指揮された補間およびデータの後処理
US9628722B2 (en) 2010-03-30 2017-04-18 Personify, Inc. Systems and methods for embedding a foreground video into a background feed based on a control input
US8649592B2 (en) 2010-08-30 2014-02-11 University Of Illinois At Urbana-Champaign System for background subtraction with 3D camera
US9049447B2 (en) 2010-12-30 2015-06-02 Pelco, Inc. Video coding
US9171075B2 (en) 2010-12-30 2015-10-27 Pelco, Inc. Searching recorded video
US9560314B2 (en) * 2011-06-14 2017-01-31 Microsoft Technology Licensing, Llc Interactive and shared surfaces
US9681125B2 (en) * 2011-12-29 2017-06-13 Pelco, Inc Method and system for video coding with noise filtering
US9414016B2 (en) * 2013-12-31 2016-08-09 Personify, Inc. System and methods for persona identification using combined probability maps
US9485433B2 (en) 2013-12-31 2016-11-01 Personify, Inc. Systems and methods for iterative adjustment of video-capture settings based on identified persona
US9563962B2 (en) 2015-05-19 2017-02-07 Personify, Inc. Methods and systems for assigning pixels distance-cost values using a flood fill technique
US9916668B2 (en) 2015-05-19 2018-03-13 Personify, Inc. Methods and systems for identifying background in video data using geometric primitives
US9607397B2 (en) 2015-09-01 2017-03-28 Personify, Inc. Methods and systems for generating a user-hair-color model
US9883155B2 (en) 2016-06-14 2018-01-30 Personify, Inc. Methods and systems for combining foreground video and background video using chromatic matching
CN107662872B (zh) * 2016-07-29 2021-03-12 奥的斯电梯公司 乘客运输机的监测系统及其监测方法
US9881207B1 (en) 2016-10-25 2018-01-30 Personify, Inc. Methods and systems for real-time user extraction using deep learning networks
KR20190004010A (ko) * 2017-07-03 2019-01-11 삼성에스디에스 주식회사 전경 추출 방법 및 장치
GB201717011D0 (en) * 2017-10-17 2017-11-29 Nokia Technologies Oy An apparatus a method and a computer program for volumetric video
CA3061699C (en) * 2017-12-14 2023-03-07 Canon Kabushiki Kaisha Generation device, generation method and non-transitory computer-readable meadium storing a program for generating a three-dimensional model from an image
JP6513169B1 (ja) * 2017-12-14 2019-05-15 キヤノン株式会社 仮想視点画像を生成するシステム、方法及びプログラム
CN110502954B (zh) * 2018-05-17 2023-06-16 杭州海康威视数字技术股份有限公司 视频分析的方法和装置
GB2595679A (en) * 2020-06-02 2021-12-08 Athlone Institute Of Tech Video storage system
US11800056B2 (en) 2021-02-11 2023-10-24 Logitech Europe S.A. Smart webcam system
US11800048B2 (en) 2021-02-24 2023-10-24 Logitech Europe S.A. Image generating system with background replacement or modification capabilities
US11831696B2 (en) 2022-02-02 2023-11-28 Microsoft Technology Licensing, Llc Optimizing richness in a remote meeting

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0330455A3 (en) * 1988-02-22 1990-07-04 Kabushiki Kaisha Toshiba Image encoding apparatus
DE4118571A1 (de) * 1991-06-06 1992-12-10 Philips Patentverwaltung Vorrichtung zur steuerung des quantisierers eines hybrid-kodierers
JP3258840B2 (ja) * 1994-12-27 2002-02-18 シャープ株式会社 動画像符号化装置および領域抽出装置
JP3086396B2 (ja) * 1995-03-10 2000-09-11 シャープ株式会社 画像符号化装置及び画像復号装置
US5710829A (en) * 1995-04-27 1998-01-20 Lucent Technologies Inc. System and method for focused-based image segmentation for video signals
AUPN732395A0 (en) * 1995-12-22 1996-01-25 Xenotech Research Pty Ltd Image conversion and encoding techniques
US5832115A (en) * 1997-01-02 1998-11-03 Lucent Technologies Inc. Ternary image templates for improved semantic compression

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016527791A (ja) * 2013-08-19 2016-09-08 華為技術有限公司Huawei Technologies Co.,Ltd. 画像処理方法及び装置

Also Published As

Publication number Publication date
WO2000031981A1 (en) 2000-06-02
US20020051491A1 (en) 2002-05-02
EP1050169A1 (en) 2000-11-08
KR20010034256A (ko) 2001-04-25
KR100669837B1 (ko) 2007-01-18

Similar Documents

Publication Publication Date Title
JP2002531020A (ja) 立体画像符号化処理におけるフォアグラウンド情報抽出方法
US8798168B2 (en) Video telecommunication system for synthesizing a separated object with a new background picture
US6593955B1 (en) Video telephony system
US6343141B1 (en) Skin area detection for video image systems
Chai et al. Face segmentation using skin-color map in videophone applications
US7659920B2 (en) System and method for very low frame rate teleconferencing employing image morphing and cropping
US7583287B2 (en) System and method for very low frame rate video streaming for face-to-face video conferencing
US20030235338A1 (en) Transmission of independently compressed video objects over internet protocol
US20080235724A1 (en) Face Annotation In Streaming Video
WO2015024362A1 (zh) 一种图像处理方法及设备
JP2002517846A (ja) オブジェクト・トラッキングとユーザー補助によりビデオ・シーケンスにおいてオブジェクトを分割する方法
WO2008116400A1 (fr) Terminal, procédé et système pour réaliser une communication vidéo
CN112954398B (zh) 编码方法、解码方法、装置、存储介质及电子设备
US20040001091A1 (en) Method and apparatus for video conferencing system with 360 degree view
JP4340532B2 (ja) 誤り隠蔽方法及び装置
Chai et al. Automatic face location for videophone images
CN113810692B (zh) 对变化和移动进行分帧的方法、图像处理装置及程序产品
EP1739965A1 (en) Method and system for processing video data
JPH0998428A (ja) 画像信号の復号化装置
JPH0998416A (ja) 画像信号の符号化装置および画像の認識装置
CN110784716B (zh) 媒体数据处理方法、装置及介质
Strat Object-based encoding: next-generation video compression
WO2023051705A1 (zh) 视频通讯方法及装置、电子设备、计算机可读介质
US20230025378A1 (en) Task-driven machine learning-based representation and compression of point cloud geometry
JP3799842B2 (ja) 静的映像検出方法、及び装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061024

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20070112