JP2002531020A - 立体画像符号化処理におけるフォアグラウンド情報抽出方法 - Google Patents
立体画像符号化処理におけるフォアグラウンド情報抽出方法Info
- Publication number
- JP2002531020A JP2002531020A JP2000584695A JP2000584695A JP2002531020A JP 2002531020 A JP2002531020 A JP 2002531020A JP 2000584695 A JP2000584695 A JP 2000584695A JP 2000584695 A JP2000584695 A JP 2000584695A JP 2002531020 A JP2002531020 A JP 2002531020A
- Authority
- JP
- Japan
- Prior art keywords
- foreground
- information
- pair
- encoding
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/174—Segmentation; Edge detection involving the use of two or more images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/194—Segmentation; Edge detection involving foreground-background segmentation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/194—Transmission of image signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/597—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
- G06T2207/10012—Stereo images
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/189—Recording image signals; Reproducing recorded image signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/20—Image signal generators
- H04N13/204—Image signal generators using stereoscopic image cameras
- H04N13/239—Image signal generators using stereoscopic image cameras using two 2D image sensors having a relative position equal to or related to the interocular distance
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/20—Image signal generators
- H04N13/286—Image signal generators having separate monoscopic and stereoscopic modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N2013/0074—Stereoscopic image analysis
- H04N2013/0081—Depth or disparity estimation from stereoscopic image signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N2013/0074—Stereoscopic image analysis
- H04N2013/0092—Image segmentation from stereoscopic image signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N2013/0074—Stereoscopic image analysis
- H04N2013/0096—Synchronisation or controlling aspects
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
Abstract
(57)【要約】
フォアグラウンド情報を抽出し、それをバックグラウンド情報よりも高いビットレートで符号化処理することにより、低帯域幅のネットワークにおける画像データの送信を向上する画像処理装置。
Description
【0001】 [発明の属する技術分野] 本発明は、画像処理に係り、より詳しくは、テレビ会議アプリケーション用の
一対の立体画像からのフォアグラウンド及びバックグラウンド情報の抽出及び可
変転送レート方式に関する。
一対の立体画像からのフォアグラウンド及びバックグラウンド情報の抽出及び可
変転送レート方式に関する。
【0002】 [従来の技術] 通常、テレビ会議アプリケーションにおいて、出席者間の通信帯域は、電話回
線では64Kbps程度に限定されている。低いビットレートの音声及び画像デ
ータを効率良く圧縮するためのデータ圧縮の方式、例えばH.263やMPEG
4などが数年にわたって開発されてきた。しかし、通常のテレビ会議アプリケー
ションでは、ほとんどの画像データに不必要な情報、例えばバックグラウンド(
背景)に存在する物体などが含まれている。圧縮アルゴリズムでは、必要な物と
不必要な物との区別をつけることができないため、すべての情報を低帯域チャン
ネルで送信することになる。その結果、ビデオ会議出席者の映像は、実際よりも
遅れた、途切れた感じの映像になってしまう。
線では64Kbps程度に限定されている。低いビットレートの音声及び画像デ
ータを効率良く圧縮するためのデータ圧縮の方式、例えばH.263やMPEG
4などが数年にわたって開発されてきた。しかし、通常のテレビ会議アプリケー
ションでは、ほとんどの画像データに不必要な情報、例えばバックグラウンド(
背景)に存在する物体などが含まれている。圧縮アルゴリズムでは、必要な物と
不必要な物との区別をつけることができないため、すべての情報を低帯域チャン
ネルで送信することになる。その結果、ビデオ会議出席者の映像は、実際よりも
遅れた、途切れた感じの映像になってしまう。
【0003】 先行技術として、ドイツ国特許番号DE3608489(A1)に示すように
、テレビ会議出席者を写すために一対のカメラを用いたシステムがある。まず2
つの画像の比較を行い、様々なディスプレイスメント技術を用いてフォアグラウ
ンド(前景)情報の輪郭を検出する(この点については、上記の独国特許及び「
Depth Discontinuities by Pixel-to-pixel Stereo」Birchfield 及び Tomasiに
よる、インド・ボンベイでの1998年IEEEのComputer Visionについての
国際会議議事録(以下、「Birchfield」とする)にも記述がある。)。フォアグ
ラウンド情報の輪郭を検出すれば、バックグラウンド情報も自動的に検出できる
。その後、単一の静止バックグラウンド画像を受信器に対して送信し、メモリ内
に保存する。そのフォアグラウンド画像を符号化し、保存されたバックグラウン
ド画像内におけるフォアグラウンド画像の位置情報を示すアドレスデータと共に
送信する。
、テレビ会議出席者を写すために一対のカメラを用いたシステムがある。まず2
つの画像の比較を行い、様々なディスプレイスメント技術を用いてフォアグラウ
ンド(前景)情報の輪郭を検出する(この点については、上記の独国特許及び「
Depth Discontinuities by Pixel-to-pixel Stereo」Birchfield 及び Tomasiに
よる、インド・ボンベイでの1998年IEEEのComputer Visionについての
国際会議議事録(以下、「Birchfield」とする)にも記述がある。)。フォアグ
ラウンド情報の輪郭を検出すれば、バックグラウンド情報も自動的に検出できる
。その後、単一の静止バックグラウンド画像を受信器に対して送信し、メモリ内
に保存する。そのフォアグラウンド画像を符号化し、保存されたバックグラウン
ド画像内におけるフォアグラウンド画像の位置情報を示すアドレスデータと共に
送信する。
【0004】 このシステムの問題点は、動きが全く無いためにバックグラウンドが人工的に
見えてしまう点と、テレビ会議出席者の輪郭をある程度の精度で決定しなければ
ならない点である。更に、DCT係数の8×8ブロックのような四角の画像に対
して最適化されている符号器で、テレビ会議出席者の輪郭を表すような不規則な
形の画像を符号化しなければならない。この不規則な形の情報を別々に送信しな
ければならず、帯域にとっても、符号器側・復号器側の計算資源にとっても、負
荷となってしまう。
見えてしまう点と、テレビ会議出席者の輪郭をある程度の精度で決定しなければ
ならない点である。更に、DCT係数の8×8ブロックのような四角の画像に対
して最適化されている符号器で、テレビ会議出席者の輪郭を表すような不規則な
形の画像を符号化しなければならない。この不規則な形の情報を別々に送信しな
ければならず、帯域にとっても、符号器側・復号器側の計算資源にとっても、負
荷となってしまう。
【0005】 [発明の開示] したがって、本発明は、テレビ会議画像のフォアグラウンド情報を抽出し、そ
れを第1のビットレートで符号化し、バックグラウンド情報を第1よりも低い第
2のビットレートで符号化することを目的とする。この目的は、わずかに異なる
視界を有するように配置した一対のカメラを使用することで達成される。2つの
画像を得た後、各画像内で一致する対応画素の位置差を計算し、これらの画素の
位置差を判定する。2つの同一画素の位置差が小さい場合は、これらの画素がバ
ックグラウンド情報であることを示し、位置差が大きい場合は、これらの画素が
フォアグラウンド情報であることを示している。フォアグラウンド画素は、高い
ビットレートで送信され、バックグラウンド画素は、それよりも低いビットレー
トで送信される。
れを第1のビットレートで符号化し、バックグラウンド情報を第1よりも低い第
2のビットレートで符号化することを目的とする。この目的は、わずかに異なる
視界を有するように配置した一対のカメラを使用することで達成される。2つの
画像を得た後、各画像内で一致する対応画素の位置差を計算し、これらの画素の
位置差を判定する。2つの同一画素の位置差が小さい場合は、これらの画素がバ
ックグラウンド情報であることを示し、位置差が大きい場合は、これらの画素が
フォアグラウンド情報であることを示している。フォアグラウンド画素は、高い
ビットレートで送信され、バックグラウンド画素は、それよりも低いビットレー
トで送信される。
【0006】 本発明の更なる目的は、テレビ会議出席者の輪郭線を正確に表す必要性をなく
すことである。この目的は、輪郭線を決定する際、係数の8×8DCTブロック
を用いることで達成される。所定の数のフォアグラウンド画素を含むブロックは
、高いビットレートで符号化され、この所定の数より少ない数しかフォアグラウ
ンド画素を含んでいないブロックは、それより低いビットレートで符号化される
。
すことである。この目的は、輪郭線を決定する際、係数の8×8DCTブロック
を用いることで達成される。所定の数のフォアグラウンド画素を含むブロックは
、高いビットレートで符号化され、この所定の数より少ない数しかフォアグラウ
ンド画素を含んでいないブロックは、それより低いビットレートで符号化される
。
【0007】 本発明の更に別の目的は、係数の8×8DCTブロックを符号化する標準型符
号器を用いてデータの符号化を行うことである。この目的も、テレビ会議出席者
の正確な輪郭線よりも、DCTデータのブロックの基づいてフォアグラウンド情
報を決定することによって達成される。
号器を用いてデータの符号化を行うことである。この目的も、テレビ会議出席者
の正確な輪郭線よりも、DCTデータのブロックの基づいてフォアグラウンド情
報を決定することによって達成される。
【0008】 したがって、本発明は、以下に説明する実施例から明らかになるように、構成
要素の様々な組み合わせ、配置等を含んだ方法及び特徴に関する。本発明の請求
範囲は独立の請求項にて示す。従属の請求項においては、好ましい実施態様を定
義する。
要素の様々な組み合わせ、配置等を含んだ方法及び特徴に関する。本発明の請求
範囲は独立の請求項にて示す。従属の請求項においては、好ましい実施態様を定
義する。
【0009】 [発明の好ましい実施の形態] 図1は、本発明によるテレビ会議機構を示す。テレビ会議出席者30は少し間
隔を置いて設置された2つのカメラ10、20の前のデスク32に着席する。図
中のバックグラウンドには、コンピュータ40、人が出入りするためのドア50
、時計60がある。カメラ10からの視界を図2に示す。テレビ会議出席者30
は、カメラ10から見て右側に位置し、コンピュータ40は、カメラから距離が
あるため、そのまま画像のほぼ中央に位置する。ドア50は画像の右側であり、
時計60は画像の左側に位置する。
隔を置いて設置された2つのカメラ10、20の前のデスク32に着席する。図
中のバックグラウンドには、コンピュータ40、人が出入りするためのドア50
、時計60がある。カメラ10からの視界を図2に示す。テレビ会議出席者30
は、カメラ10から見て右側に位置し、コンピュータ40は、カメラから距離が
あるため、そのまま画像のほぼ中央に位置する。ドア50は画像の右側であり、
時計60は画像の左側に位置する。
【0010】 カメラ20からの視界を図2Bに示す。テレビ会議出席者30は、画像の左に
位置し、時計60は、テレビ会議出席者30のさらに左に位置する。コンピュー
タ40は、テレビ会議出席者30の右側に位置するものの、やはりほぼ中央に位
置する。ドア50は、画像の右上方に位置する。
位置し、時計60は、テレビ会議出席者30のさらに左に位置する。コンピュー
タ40は、テレビ会議出席者30の右側に位置するものの、やはりほぼ中央に位
置する。ドア50は、画像の右上方に位置する。
【0011】 これら2つのカメラから受信される画像を比較し、フォアグラウンド情報の画
素の位置決定を行う。(DE3608489及び birchfield に開示されている
ような、フォアグラウンド情報の位置決定を行うためのアルゴリズムが多数ある
。)本発明の好ましい実施態様によると、左側のカメラ10からの画像(画像A
)を、右側のカメラ20からの画像(画像B)とを比較する。スキャンラインは
一直線に集結されており、画像Aのスキャンライン19と画像Bのスキャンライ
ン19とは一致する。画像Aのスキャンライン19上の各画素は、画像Bのスキ
ャンライン19上の各対応画素と一致する。例えば、画像Aのスキャンライン1
9の画素28が画像Bのスキャンライン19の画素13と一致する場合、両者の
差は、28−13=15のように計算できる。カメラが接近して配置されている
ため、フォアグラウンド情報の画素は、バックグラウンド情報の画素よりも、両
者の差が大きくなる。ここで、両者の差のしきい値として、例えば7を選択し、
差が7より大きい場合は、その画素がフォアグラウンド情報であることを示し、
7より小さい場合は、その画素がバックグラウンド情報であることを示す。これ
らの計算はすべて、図4に示すフォアグラウンド検知器50で行われる。このフ
ォアグラウンド検知器は、例えば画像Bなどの画像と、画像データと同じサイズ
で、どの画素がフォアグラウンド画素(例えば「1」)で、どの画素がバックグ
ラウンド画素(例えば「0」)なのかを示すデータブロックとを出力する。これ
ら2つの出力は、8×8のDCT画像ブロックと、どのDCTブロックがフォア
グラウンド情報でありバックグラウンド情報であるかを示すバイナリブロックを
作成するDCTブロック選別器52に供給される。予め設定されたしきい値であ
るか、またはそのチャネルのビットレート限界の変化にともなって変化する、フ
ォアグラウンド情報である特定のDCTブロック内の画素の数に従って、そのブ
ロックは、フォアグラウンドブロック(高ビットレート符号化処理部56Aを始
動)あるいはバックグラウンド(低ビットレート符号化処理部56Bを始動)と
して、符号器56に対して識別される。
素の位置決定を行う。(DE3608489及び birchfield に開示されている
ような、フォアグラウンド情報の位置決定を行うためのアルゴリズムが多数ある
。)本発明の好ましい実施態様によると、左側のカメラ10からの画像(画像A
)を、右側のカメラ20からの画像(画像B)とを比較する。スキャンラインは
一直線に集結されており、画像Aのスキャンライン19と画像Bのスキャンライ
ン19とは一致する。画像Aのスキャンライン19上の各画素は、画像Bのスキ
ャンライン19上の各対応画素と一致する。例えば、画像Aのスキャンライン1
9の画素28が画像Bのスキャンライン19の画素13と一致する場合、両者の
差は、28−13=15のように計算できる。カメラが接近して配置されている
ため、フォアグラウンド情報の画素は、バックグラウンド情報の画素よりも、両
者の差が大きくなる。ここで、両者の差のしきい値として、例えば7を選択し、
差が7より大きい場合は、その画素がフォアグラウンド情報であることを示し、
7より小さい場合は、その画素がバックグラウンド情報であることを示す。これ
らの計算はすべて、図4に示すフォアグラウンド検知器50で行われる。このフ
ォアグラウンド検知器は、例えば画像Bなどの画像と、画像データと同じサイズ
で、どの画素がフォアグラウンド画素(例えば「1」)で、どの画素がバックグ
ラウンド画素(例えば「0」)なのかを示すデータブロックとを出力する。これ
ら2つの出力は、8×8のDCT画像ブロックと、どのDCTブロックがフォア
グラウンド情報でありバックグラウンド情報であるかを示すバイナリブロックを
作成するDCTブロック選別器52に供給される。予め設定されたしきい値であ
るか、またはそのチャネルのビットレート限界の変化にともなって変化する、フ
ォアグラウンド情報である特定のDCTブロック内の画素の数に従って、そのブ
ロックは、フォアグラウンドブロック(高ビットレート符号化処理部56Aを始
動)あるいはバックグラウンド(低ビットレート符号化処理部56Bを始動)と
して、符号器56に対して識別される。
【0012】 図3Aは、本発明に従って、フォアグラウンド情報として符号化された情報を
破線で表した画像Bを示す。各マス目は、8×8のDCTブロックを表すものと
する。8×8のDCTブロック内のいずれかの画素がフォアグラウンド情報であ
る場合、そのブロック内全体の画素もフォアグラウンド情報として符号化される
ように、フォアグラウンドしきい値を設定する。図3Aの破線は、フォアグラウ
ンド情報として識別されたDCTブロックを示す。これらのブロックは、より精
密な量子化レベルで符号化される。
破線で表した画像Bを示す。各マス目は、8×8のDCTブロックを表すものと
する。8×8のDCTブロック内のいずれかの画素がフォアグラウンド情報であ
る場合、そのブロック内全体の画素もフォアグラウンド情報として符号化される
ように、フォアグラウンドしきい値を設定する。図3Aの破線は、フォアグラウ
ンド情報として識別されたDCTブロックを示す。これらのブロックは、より精
密な量子化レベルで符号化される。
【0013】 図3Bは、DCTブロック識別器52の出力である、バイナリDCT差ブロッ
クを示す。符号器56は、画像B及びバイナリDCT差ブロックを受け取る。論
理値「1」のDCT差ブロックに対応するDCTブロックは、細かく符号化され
る。論理値「0」のDCT差ブロックに対応するDCTブロックは、粗く符号化
される。その結果、チャンネルの帯域幅のほとんどがフォアグラウンド情報に割
当てられ、ほんのわずかな部分のみがバックグラウンド情報に割当てられる。復
号器58(図4に図示)はビットストリームを受け取り、そのビットストリーム
内に設定されている量子化レベルに従って、復号化する。
クを示す。符号器56は、画像B及びバイナリDCT差ブロックを受け取る。論
理値「1」のDCT差ブロックに対応するDCTブロックは、細かく符号化され
る。論理値「0」のDCT差ブロックに対応するDCTブロックは、粗く符号化
される。その結果、チャンネルの帯域幅のほとんどがフォアグラウンド情報に割
当てられ、ほんのわずかな部分のみがバックグラウンド情報に割当てられる。復
号器58(図4に図示)はビットストリームを受け取り、そのビットストリーム
内に設定されている量子化レベルに従って、復号化する。
【0014】 本発明は、ネットワーク上で動画を送信する場合に適応可能であり、例えば、
インターネット、電話、ビデオメール、テレビ電話、デジタルテレビジョン受信
機などに適用可能である。
インターネット、電話、ビデオメール、テレビ電話、デジタルテレビジョン受信
機などに適用可能である。
【0015】 本発明の好ましい態様では、本発明は、処理用トリメディアプロセッサ及び表
示用テレビジョンモニタを用いたデジタルテレビジョンプラットフォームにも適
用可能である。本発明はまた、パーソナルコンピュータにも適用可能である。
示用テレビジョンモニタを用いたデジタルテレビジョンプラットフォームにも適
用可能である。本発明はまた、パーソナルコンピュータにも適用可能である。
【0016】 図5は、本発明を適用したコンピュータシステム7の代表的な実施例を示す。
図5に示すように、パーソナルコンピュータ(PC)8は、可変帯域ネットワー
クやインターネットなどのネットワークへのインタフェース機能を持つネットワ
ーク接続部11と、ビデオカメラ(図示せず)などの他の離れた装置とのインタ
フェース機能を持つFAX/モデム接続部12を有する。PC8はさらに、ユー
ザに対して情報(画像情報も含む)を表示するための表示スクリーン14と、テ
キストやユーザコマンドを入力するためのキーボード15と、表示スクリーン1
4上のカーソルの位置決め及びユーザコマンドの入力を行うためのマウス13と
、挿入されたフロッピー(登録商標)ディスクからの読出し及び書込みを行うた めのディスクドライブ16と、CD―ROMに保存された情報にアクセスするた めのCD−ROMドライブ17とを有する。これに加えて、PC8は、画像等を 入力するための一対のテレビ会議用カメラや、画像やテキストなどを出力するた めのプリンタ19などの周辺機器を備える。
図5に示すように、パーソナルコンピュータ(PC)8は、可変帯域ネットワー
クやインターネットなどのネットワークへのインタフェース機能を持つネットワ
ーク接続部11と、ビデオカメラ(図示せず)などの他の離れた装置とのインタ
フェース機能を持つFAX/モデム接続部12を有する。PC8はさらに、ユー
ザに対して情報(画像情報も含む)を表示するための表示スクリーン14と、テ
キストやユーザコマンドを入力するためのキーボード15と、表示スクリーン1
4上のカーソルの位置決め及びユーザコマンドの入力を行うためのマウス13と
、挿入されたフロッピー(登録商標)ディスクからの読出し及び書込みを行うた めのディスクドライブ16と、CD―ROMに保存された情報にアクセスするた めのCD−ROMドライブ17とを有する。これに加えて、PC8は、画像等を 入力するための一対のテレビ会議用カメラや、画像やテキストなどを出力するた めのプリンタ19などの周辺機器を備える。
【0017】 図6は、PC8の内部構造を示す。図6に示すように、PC8は、コンピュー
タハードディスクなどのコンピュータで読取り可能な媒体を備えるメモリ25を
有する。メモリ25は、データ23、アプリケーション25、プリントドライバ
24、オペレーションシステム26を保存する。本発明の好ましい態様において
は、オペエーションシステム26は、マイクロソフトのWindows95(商
標名)などのウインドウ型オペレーションシステムであるが、本発明は他のオペ
レーションシステムを使用する場合でも適用可能である。メモリ25のアプリケ
ーション領域51に保存されたアプリケーションには、フォアグラウンド情報検
知器/DCTブロック選別器/画像符号器21(以下、画像符号器21)及び画
像復号器22がある。画像符号器21は、上述した方法で画像データの符号化処
理を行い、画像復号器22は、ビデオ符号器21に予め設定した方法で符号化さ
れた画像データを復号化する。これらのアプリケーションの処理動作は、既に詳
細な説明を行っているので、ここでは省略する。
タハードディスクなどのコンピュータで読取り可能な媒体を備えるメモリ25を
有する。メモリ25は、データ23、アプリケーション25、プリントドライバ
24、オペレーションシステム26を保存する。本発明の好ましい態様において
は、オペエーションシステム26は、マイクロソフトのWindows95(商
標名)などのウインドウ型オペレーションシステムであるが、本発明は他のオペ
レーションシステムを使用する場合でも適用可能である。メモリ25のアプリケ
ーション領域51に保存されたアプリケーションには、フォアグラウンド情報検
知器/DCTブロック選別器/画像符号器21(以下、画像符号器21)及び画
像復号器22がある。画像符号器21は、上述した方法で画像データの符号化処
理を行い、画像復号器22は、ビデオ符号器21に予め設定した方法で符号化さ
れた画像データを復号化する。これらのアプリケーションの処理動作は、既に詳
細な説明を行っているので、ここでは省略する。
【0018】 さらにPC8は、表示インタフェース29、キーボードインタフェース41、
マウスインタフェース31、ディスクドライブインタフェース42、CD−RO
Mドライブインタフェース34、コンピュータバス36、RAM37、プロセッ
サ38、プリンタインタフェース43を有する。プロセッサ38は、上述したよ
うなアプリケーションをRAM37から実行するためのマイクロプロセッサなど
を備えるのが好ましい。画像符号器21及び画像復号器22を含むこれらのアプ
リケーションは、メモリ25に(上述のように)保存されているか、あるいはデ
ィスクドライブ内のフロッピーディスクまたはCD−ROMドライブ17内のC
D―ROMに保存されている。プロセッサ38は、フロッピーディスク上に保存
されたアプリケーションに対しては、ディスクドライブインタフェース32を介
してアクセスし、CD−ROMに保存されたアプリケーションに対しては、CD
−ROMドライブインタフェース34を介してアクセスする。
マウスインタフェース31、ディスクドライブインタフェース42、CD−RO
Mドライブインタフェース34、コンピュータバス36、RAM37、プロセッ
サ38、プリンタインタフェース43を有する。プロセッサ38は、上述したよ
うなアプリケーションをRAM37から実行するためのマイクロプロセッサなど
を備えるのが好ましい。画像符号器21及び画像復号器22を含むこれらのアプ
リケーションは、メモリ25に(上述のように)保存されているか、あるいはデ
ィスクドライブ内のフロッピーディスクまたはCD−ROMドライブ17内のC
D―ROMに保存されている。プロセッサ38は、フロッピーディスク上に保存
されたアプリケーションに対しては、ディスクドライブインタフェース32を介
してアクセスし、CD−ROMに保存されたアプリケーションに対しては、CD
−ROMドライブインタフェース34を介してアクセスする。
【0019】 アプリケーションの実行及びPC8のその他の機能は、キーボード15または
マウス13を使って、キーボードインタフェース41及びマウスインタフェース
31を介してそれぞれプロセッサ38に送信されたコマンドを用いて、開始され
る。PC8において作動するアプリケーションからの出力結果は、表示インタフ
ェース29によって処理され、表示機14上にユーザに対して表示されるか、あ
るいは、ネットワーク接続部11を介して出力される。例えば、画像符号器21
によって符号化された入力画像データは通常ネットワーク接続部11を介して出
力される。それに対して、可変帯域ネットワークなどから受信した符号化された
画像データは、画像復号器22によって復号化された後、表示器14上に表示さ
れる。このことから、表示インタフェース29は、プロセッサ38によってコン
ピュータバス36を通して供給された復号化画像データに基づいて画像を形成し
、及び、それらの画像を表示器14に出力するための表示プロセッサを備えるこ
とが好ましい。文章作成プログラムなど、PC8で作動する他のアプリケーショ
ンの出力結果は、プリンタインタフェース43を介してプリンタ19に供給され
る。プロセッサ38は、プリントドライバ24を駆動し、プリンタ19への送信
の前に、各プリントジョブに対して適切な書式作成を行う。
マウス13を使って、キーボードインタフェース41及びマウスインタフェース
31を介してそれぞれプロセッサ38に送信されたコマンドを用いて、開始され
る。PC8において作動するアプリケーションからの出力結果は、表示インタフ
ェース29によって処理され、表示機14上にユーザに対して表示されるか、あ
るいは、ネットワーク接続部11を介して出力される。例えば、画像符号器21
によって符号化された入力画像データは通常ネットワーク接続部11を介して出
力される。それに対して、可変帯域ネットワークなどから受信した符号化された
画像データは、画像復号器22によって復号化された後、表示器14上に表示さ
れる。このことから、表示インタフェース29は、プロセッサ38によってコン
ピュータバス36を通して供給された復号化画像データに基づいて画像を形成し
、及び、それらの画像を表示器14に出力するための表示プロセッサを備えるこ
とが好ましい。文章作成プログラムなど、PC8で作動する他のアプリケーショ
ンの出力結果は、プリンタインタフェース43を介してプリンタ19に供給され
る。プロセッサ38は、プリントドライバ24を駆動し、プリンタ19への送信
の前に、各プリントジョブに対して適切な書式作成を行う。
【0020】 以上によって、前述した本発明の目的は効率的に達成される。また、本発明の
請求の範囲から反れない限りは様々な変更や変形が可能なことから、添付の図面
を参考に説明した実施態様は単なる例であり、これに限定されるものではない。
請求の範囲から反れない限りは様々な変更や変形が可能なことから、添付の図面
を参考に説明した実施態様は単なる例であり、これに限定されるものではない。
【0021】 本発明はまた、本発明の特徴を示す要素を有するハードウェアや、適切にプロ
グラミングされたコンピュータによっても実行可能である。複数の手段を有する
装置では、これらの手段を単一のハードウェアで実現してもよい。
グラミングされたコンピュータによっても実行可能である。複数の手段を有する
装置では、これらの手段を単一のハードウェアで実現してもよい。
【図1】 図1は、一対の立体カメラを用いたテレビ会議機構を示す。
【図2】 図2A、2Bは、図1のカメラからの画像を示す。
【図3】 図3Aは、フォアグラウンド情報の識別を示し、図3Bは、高ビットレートで
送信されるDCTブロックを示す。
送信されるDCTブロックを示す。
【図4】 図4は、本発明によるテレビ会議装置を示すブロック図である。
【図5】 図5は、本発明を実行するPCの概略図である。
【図6】 図6は、図5のPCの内部構造を示す。
───────────────────────────────────────────────────── フロントページの続き (71)出願人 Groenewoudseweg 1, 5621 BA Eindhoven, Th e Netherlands Fターム(参考) 5C059 MA23 MC11 PP13 SS07 5C061 AA29 AB04 AB08 AB12 AB17 AB24 5C064 AA02 AB04 AC04 AC09 AC12 AC22 AD02 AD03 AD06 AD14 AD18 5J064 AA03 BA16 BB01 BC01 BD03 5K041 AA09 BB06 CC04 CC07 EE38 HH25
Claims (9)
- 【請求項1】 画像処理装置において、 一対の立体画像を受け取る入力部と、 該一対の立体画像からフォアグラウンド画素情報を検知するフォアグラウンド
抽出部と、 第1の高い量子化レベルで該フォアグラウンド画素情報を符号化し、第2の低
い量子化レベルでバックグラウンド画素情報を符号化する、該フォアグラウンド
抽出部に連結する符号化処理部とを有する画像処理装置。 - 【請求項2】 前記フォアグラウンド抽出部は、各画像内の同一画素の位置
差を計算し、位置差がしきい距離よりも長い画素をフォアグラウンド画素として
選択する請求項1記載の画像処理装置。 - 【請求項3】 前記フォアグラウンド画素情報はブロック全体を考慮して設
定される請求項1記載の画像処理装置。 - 【請求項4】 画像処理システムにおいて、 一対の立体画像を撮る一対の立体カメラと、 該一対の立体画像からフォアグラウンド画素情報を検知するフォアグラウンド
抽出部と、 第1の高い量子化レベルで該フォアグラウンド画素情報を符号化し、第2の低
い量子化レベルでバックグラウンド画素情報を符号化する、該フォアグラウンド
抽出部に連結する符号化処理部とを有する画像処理装置。 - 【請求項5】 一つの立体画像を符合化する方法において、 一対の立体画像を受け取る工程と 該一対の立体画像からフォアグラウンド情報を抽出する工程、 第1の高い量子化レベルで該フォアグラウンド情報を符号化し、第2の低い量
子化レベルでバックグラウンド情報を符号化する工程とを含む方法。 - 【請求項6】 前記抽出工程は、 前記一対の立体画像のそれぞれにおける同一画素の位置を識別する工程と、 該同一画素の位置差を計算する工程と、 該位置差がしきい値を越えているか否かを判定し、超えている場合にはそれら
の画素をフォアグラウンド情報として識別する工程とを含むことを特徴とする請
求項5記載の方法。 - 【請求項7】 コンピュータで読取り可能な媒体に保存され、一対の立体画
像からの画像データを処理するための、コンピュータで実行可能な処理工程にお
いて、 該一対の立体画像からフォアグラウンド画素情報を検出するフォアグラウンド
抽出工程と、 第1の高い量子化レベルで少なくとも1つの画像のフォアグラウンド画素情報
を符号化し、第2の低い量子化レベルで少なくとも1つの画像のバックグラウン
ド画素情報を符号化する符号化工程とを含む処理工程。 - 【請求項8】 前記フォアグラウンド抽出工程において、どの8×8のDC
Tブロックが少なくとも所定の量のフォアグラウンド画素情報を含んでいるかを
判定し、 前記符号化工程において、少なくとも所定の量のフォアグラウンド画素情報含
んでいるDCT係数の8×8ブロックについて、前記第1の高い量子化レベルで
該DCT係数の8×8ブロック全体を符号化することを特徴とする請求項7記載
のコンピュータで実行可能な処理工程。 - 【請求項9】 一対の立体画像を処理する装置において、 処理工程を保存するメモリと、 該一対の立体画像からフォアグラウンド情報を抽出し、第1の高い量子化レベ
ルで該フォアグラウンド情報を符号化し、第2の低い量子化レベルでバックグラ
ウンド情報を符号化するように、該メモリに保存された処理工程を実行するプロ
セッサとを含む装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/196,574 | 1998-11-20 | ||
US09/196,574 US20020051491A1 (en) | 1998-11-20 | 1998-11-20 | Extraction of foreground information for video conference |
PCT/EP1999/008243 WO2000031981A1 (en) | 1998-11-20 | 1999-10-27 | Extraction of foreground information for stereoscopic video coding |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2002531020A true JP2002531020A (ja) | 2002-09-17 |
Family
ID=22725937
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000584695A Withdrawn JP2002531020A (ja) | 1998-11-20 | 1999-10-27 | 立体画像符号化処理におけるフォアグラウンド情報抽出方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20020051491A1 (ja) |
EP (1) | EP1050169A1 (ja) |
JP (1) | JP2002531020A (ja) |
KR (1) | KR100669837B1 (ja) |
WO (1) | WO2000031981A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016527791A (ja) * | 2013-08-19 | 2016-09-08 | 華為技術有限公司Huawei Technologies Co.,Ltd. | 画像処理方法及び装置 |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4670303B2 (ja) * | 2004-10-06 | 2011-04-13 | ソニー株式会社 | 画像処理方法及び画像処理装置 |
JP4251650B2 (ja) * | 2005-03-28 | 2009-04-08 | 株式会社カシオ日立モバイルコミュニケーションズ | 画像処理装置及びプログラム |
TW200822751A (en) * | 2006-07-14 | 2008-05-16 | Objectvideo Inc | Video analytics for retail business process monitoring |
US20090316777A1 (en) * | 2008-06-20 | 2009-12-24 | Xin Feng | Method and Apparatus for Improved Broadcast Bandwidth Efficiency During Transmission of a Static Code Page of an Advertisement |
JP5562408B2 (ja) | 2009-04-20 | 2014-07-30 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 指揮された補間およびデータの後処理 |
US9628722B2 (en) | 2010-03-30 | 2017-04-18 | Personify, Inc. | Systems and methods for embedding a foreground video into a background feed based on a control input |
US8649592B2 (en) | 2010-08-30 | 2014-02-11 | University Of Illinois At Urbana-Champaign | System for background subtraction with 3D camera |
US9049447B2 (en) | 2010-12-30 | 2015-06-02 | Pelco, Inc. | Video coding |
US9171075B2 (en) | 2010-12-30 | 2015-10-27 | Pelco, Inc. | Searching recorded video |
US9560314B2 (en) * | 2011-06-14 | 2017-01-31 | Microsoft Technology Licensing, Llc | Interactive and shared surfaces |
US9681125B2 (en) * | 2011-12-29 | 2017-06-13 | Pelco, Inc | Method and system for video coding with noise filtering |
US9414016B2 (en) * | 2013-12-31 | 2016-08-09 | Personify, Inc. | System and methods for persona identification using combined probability maps |
US9485433B2 (en) | 2013-12-31 | 2016-11-01 | Personify, Inc. | Systems and methods for iterative adjustment of video-capture settings based on identified persona |
US9563962B2 (en) | 2015-05-19 | 2017-02-07 | Personify, Inc. | Methods and systems for assigning pixels distance-cost values using a flood fill technique |
US9916668B2 (en) | 2015-05-19 | 2018-03-13 | Personify, Inc. | Methods and systems for identifying background in video data using geometric primitives |
US9607397B2 (en) | 2015-09-01 | 2017-03-28 | Personify, Inc. | Methods and systems for generating a user-hair-color model |
US9883155B2 (en) | 2016-06-14 | 2018-01-30 | Personify, Inc. | Methods and systems for combining foreground video and background video using chromatic matching |
CN107662872B (zh) * | 2016-07-29 | 2021-03-12 | 奥的斯电梯公司 | 乘客运输机的监测系统及其监测方法 |
US9881207B1 (en) | 2016-10-25 | 2018-01-30 | Personify, Inc. | Methods and systems for real-time user extraction using deep learning networks |
KR20190004010A (ko) * | 2017-07-03 | 2019-01-11 | 삼성에스디에스 주식회사 | 전경 추출 방법 및 장치 |
GB201717011D0 (en) * | 2017-10-17 | 2017-11-29 | Nokia Technologies Oy | An apparatus a method and a computer program for volumetric video |
CA3061699C (en) * | 2017-12-14 | 2023-03-07 | Canon Kabushiki Kaisha | Generation device, generation method and non-transitory computer-readable meadium storing a program for generating a three-dimensional model from an image |
JP6513169B1 (ja) * | 2017-12-14 | 2019-05-15 | キヤノン株式会社 | 仮想視点画像を生成するシステム、方法及びプログラム |
CN110502954B (zh) * | 2018-05-17 | 2023-06-16 | 杭州海康威视数字技术股份有限公司 | 视频分析的方法和装置 |
GB2595679A (en) * | 2020-06-02 | 2021-12-08 | Athlone Institute Of Tech | Video storage system |
US11800056B2 (en) | 2021-02-11 | 2023-10-24 | Logitech Europe S.A. | Smart webcam system |
US11800048B2 (en) | 2021-02-24 | 2023-10-24 | Logitech Europe S.A. | Image generating system with background replacement or modification capabilities |
US11831696B2 (en) | 2022-02-02 | 2023-11-28 | Microsoft Technology Licensing, Llc | Optimizing richness in a remote meeting |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0330455A3 (en) * | 1988-02-22 | 1990-07-04 | Kabushiki Kaisha Toshiba | Image encoding apparatus |
DE4118571A1 (de) * | 1991-06-06 | 1992-12-10 | Philips Patentverwaltung | Vorrichtung zur steuerung des quantisierers eines hybrid-kodierers |
JP3258840B2 (ja) * | 1994-12-27 | 2002-02-18 | シャープ株式会社 | 動画像符号化装置および領域抽出装置 |
JP3086396B2 (ja) * | 1995-03-10 | 2000-09-11 | シャープ株式会社 | 画像符号化装置及び画像復号装置 |
US5710829A (en) * | 1995-04-27 | 1998-01-20 | Lucent Technologies Inc. | System and method for focused-based image segmentation for video signals |
AUPN732395A0 (en) * | 1995-12-22 | 1996-01-25 | Xenotech Research Pty Ltd | Image conversion and encoding techniques |
US5832115A (en) * | 1997-01-02 | 1998-11-03 | Lucent Technologies Inc. | Ternary image templates for improved semantic compression |
-
1998
- 1998-11-20 US US09/196,574 patent/US20020051491A1/en not_active Abandoned
-
1999
- 1999-10-27 JP JP2000584695A patent/JP2002531020A/ja not_active Withdrawn
- 1999-10-27 WO PCT/EP1999/008243 patent/WO2000031981A1/en not_active Application Discontinuation
- 1999-10-27 KR KR1020007007936A patent/KR100669837B1/ko not_active IP Right Cessation
- 1999-10-27 EP EP99972820A patent/EP1050169A1/en not_active Withdrawn
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016527791A (ja) * | 2013-08-19 | 2016-09-08 | 華為技術有限公司Huawei Technologies Co.,Ltd. | 画像処理方法及び装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2000031981A1 (en) | 2000-06-02 |
US20020051491A1 (en) | 2002-05-02 |
EP1050169A1 (en) | 2000-11-08 |
KR20010034256A (ko) | 2001-04-25 |
KR100669837B1 (ko) | 2007-01-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2002531020A (ja) | 立体画像符号化処理におけるフォアグラウンド情報抽出方法 | |
US8798168B2 (en) | Video telecommunication system for synthesizing a separated object with a new background picture | |
US6593955B1 (en) | Video telephony system | |
US6343141B1 (en) | Skin area detection for video image systems | |
Chai et al. | Face segmentation using skin-color map in videophone applications | |
US7659920B2 (en) | System and method for very low frame rate teleconferencing employing image morphing and cropping | |
US7583287B2 (en) | System and method for very low frame rate video streaming for face-to-face video conferencing | |
US20030235338A1 (en) | Transmission of independently compressed video objects over internet protocol | |
US20080235724A1 (en) | Face Annotation In Streaming Video | |
WO2015024362A1 (zh) | 一种图像处理方法及设备 | |
JP2002517846A (ja) | オブジェクト・トラッキングとユーザー補助によりビデオ・シーケンスにおいてオブジェクトを分割する方法 | |
WO2008116400A1 (fr) | Terminal, procédé et système pour réaliser une communication vidéo | |
CN112954398B (zh) | 编码方法、解码方法、装置、存储介质及电子设备 | |
US20040001091A1 (en) | Method and apparatus for video conferencing system with 360 degree view | |
JP4340532B2 (ja) | 誤り隠蔽方法及び装置 | |
Chai et al. | Automatic face location for videophone images | |
CN113810692B (zh) | 对变化和移动进行分帧的方法、图像处理装置及程序产品 | |
EP1739965A1 (en) | Method and system for processing video data | |
JPH0998428A (ja) | 画像信号の復号化装置 | |
JPH0998416A (ja) | 画像信号の符号化装置および画像の認識装置 | |
CN110784716B (zh) | 媒体数据处理方法、装置及介质 | |
Strat | Object-based encoding: next-generation video compression | |
WO2023051705A1 (zh) | 视频通讯方法及装置、电子设备、计算机可读介质 | |
US20230025378A1 (en) | Task-driven machine learning-based representation and compression of point cloud geometry | |
JP3799842B2 (ja) | 静的映像検出方法、及び装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20061024 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20070112 |