JP6283108B2 - 画像処理方法及び装置 - Google Patents

画像処理方法及び装置 Download PDF

Info

Publication number
JP6283108B2
JP6283108B2 JP2016526410A JP2016526410A JP6283108B2 JP 6283108 B2 JP6283108 B2 JP 6283108B2 JP 2016526410 A JP2016526410 A JP 2016526410A JP 2016526410 A JP2016526410 A JP 2016526410A JP 6283108 B2 JP6283108 B2 JP 6283108B2
Authority
JP
Japan
Prior art keywords
image
video image
contour
encoding
foreground
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2016526410A
Other languages
English (en)
Other versions
JP2016527791A5 (ja
JP2016527791A (ja
Inventor
岩▲リン▼ 郭
岩▲リン▼ 郭
田 王
田 王
▲徳▼▲軍▼ ▲張▼
▲徳▼▲軍▼ ▲張▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of JP2016527791A publication Critical patent/JP2016527791A/ja
Publication of JP2016527791A5 publication Critical patent/JP2016527791A5/ja
Application granted granted Critical
Publication of JP6283108B2 publication Critical patent/JP6283108B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • H04N7/142Constructional details of the terminal equipment, e.g. arrangements of the camera and the display
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/50Depth or shape recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • H04N19/29Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding involving scalability at the object level, e.g. video object layer [VOL]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10028Range image; Depth image; 3D point clouds

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

本発明は、画像データ処理技術の分野に関し、具体的には、画像処理方法及び装置に関する。
この出願は、2013年8月19日に中国特許庁に出願され、“IMAGE PROCESSING METHOD AND DEVICE”と表題が付けられた中国特許出願第201310362321.1号に対する優先権を主張するとともに、それはその全体における参照によりここに組み込まれている。
没入型会議システムは、次の世代のマルチメディア会議システムの典型であるとともに、没入型会議システムは、より現実的で、かつ実体験のように感じるユーザ経験を提供することができる。一般に、ユーザが会議に参加しているときに没入型経験を得ることを可能にするために、ハイディフィニション・オーディオ/ビデオ、立体音響、3次元ビデオ、及び強化現実技術のような新しい技術が没入型会議システムに適用される。
概して、没入型会議システムは、2つのタイプのカメラを含む。一方のタイプは、ユーザのカラー画像をキャプチャすることができる従来のカラーカメラであり、もう一方のタイプは、ユーザとカメラとの間の距離の距離画像をキャプチャすることができる奥行きカメラである。奥行きカメラによりキャプチャされた奥行き情報は、3次元画像合成、骨格識別、及び追跡のような、それに続く技術的処理において大いに役立つ。
現存する没入型会議システムでは、会議システムのビデオ画像に対して合成が実行される場合に、ネットワーク帯域幅の占有率が比較的高くなる。
本発明の実施例は、ビデオ画像において異なるレベルのユーザの注意を伴う画像の分割を実行するとともに、分割された画像に対して異なる符号化方法を使用する画像処理方法及び装置を提供し、したがって、ビデオ画像伝送プロセスにおけるネットワーク帯域幅の占有率が下げられることができる。
前述の技術的問題を解決するために、本発明の実施例は下記の技術的解決法を開示する。
第1の態様によれば、画像処理方法であって、対象物のビデオ画像及び距離画像を収集するステップと、同じ瞬間における前記ビデオ画像に対応するビデオ画像フレームを、前記ビデオ画像フレームにおける前景画像の輪郭を獲得するために、前記距離画像を使用することにより分割するステップと、前記ビデオ画像フレームに対応する符号化データを獲得するために、前記前景画像の前記輪郭に従って、前記ビデオ画像フレームにおける前記前景画像の前記輪郭の内側のビデオ画像のピクセルに対する第1の符号化、及び前記ビデオ画像フレームにおける前記輪郭の外側のビデオ画像のピクセルに対する第2の符号化を実行するステップであって、前記第1の符号化の符号化レートが前記第2の符号化の符号化レートより高い、ステップと、前記ビデオ画像フレームに対応する前記符号化データ、及び前記前景画像の前記輪郭に対応する奥行きデータを出力するステップとを含む、方法が提供される。
前述の第1の態様に関連して、第1の可能な実施方法において、同じ瞬間における前記ビデオ画像に対応するビデオ画像フレームを、前記ビデオ画像フレームにおける前景画像の輪郭を獲得するために、前記距離画像を使用することにより分割する前記ステップは、前記距離画像及び前記ビデオ画像フレームの前記ビデオ画像に対してピクセルアライメントを実行するステップと、複数のピクセルの中から1つのピクセルを分割点として判定するために、前記距離画像上の各ピクセルと隣接ピクセルとの間の奥行き差を計算するステップであって、前記ピクセルと全ての隣接ピクセルとの間の奥行き差の分散が設定しきい値より大きい、ステップと、全ての分割点を判定するために前記距離画像の全てのピクセルをトラバースするステップと、全ての前記分割点に従って前記ビデオ画像フレームにおける前記前景画像の前記輪郭を獲得するステップとを含む。
前述の第1の態様に関連して、第2の可能な実施方法において、前記輪郭に対応する奥行きデータを出力する前記ステップは、前記輪郭に従って前記距離画像を二値画像に単純化するステップと、前記二値画像に対して符号化処理を実行するとともに、前記二値画像に対応する符号化データを出力するステップとを含む。
前述の第1の態様及び第1の可能な実施方法に関連して、第3の可能な実施方法において、前記前景画像の前記輪郭に対応する奥行きデータを出力する前記ステップは、全ての前記分割点における各分割点の座標情報を獲得するステップと、全ての前記座標情報に対して圧縮処理を実行し、全ての前記座標情報に対応するとともに前記圧縮処理を用いて獲得される圧縮データを出力するステップとを含む。
第2の態様によれば、画像処理方法であって、ビデオ画像フレームの符号化データ、及び前記ビデオ画像フレームにおける前景画像の輪郭に対応する奥行きデータを受信するステップであって、前記ビデオ画像フレームでは、前記ビデオ画像フレームに対応する前記符号化データを獲得するために、前記前景画像の前記輪郭に従って、前記前景画像の前記輪郭の内側のビデオ画像のピクセルに対して第1の符号化が実行され、前記輪郭の外側のビデオ画像のピクセルに対して第2の符号化が実行されるとともに、前記第1の符号化の符号化レートが前記第2の符号化の符号化レートより高い、ステップと、前記ビデオ画像フレームにおける前記前景画像を獲得するために、前記奥行きデータに従って前記ビデオ画像フレームを分割するステップと、前記前景画像を再生するステップとを含む、方法が提供される。
前述の第2の態様に関連して、第1の可能な実施方法において、当該方法は、前記前景画像が再生される場合に、プリセットされた背景画像又はピクチャを再生し、前記背景画像又はピクチャを前記前景画像の背景として使用するステップを更に含む。
第3の態様によれば、画像処理装置であって、対象物のビデオ画像及び距離画像を収集するように構成される収集モジュールと、同じ瞬間における前記ビデオ画像に対応するビデオ画像フレームを、前記ビデオ画像フレームにおける前景画像の輪郭を獲得するために、前記距離画像を使用することにより分割するように構成される輪郭分割モジュールと、前記ビデオ画像フレームに対応する符号化データを獲得するために、前記前景画像の前記輪郭に従って、前記ビデオ画像フレームにおける前記前景画像の前記輪郭の内側のビデオ画像のピクセルに対する第1の符号化、及び前記ビデオ画像フレームにおける前記輪郭の外側のビデオ画像のピクセルに対する第2の符号化を実行するように構成されるビデオ符号化モジュールであって、前記第1の符号化の符号化レートが前記第2の符号化の符号化レートより高い、前記ビデオ符号化モジュールと、前記ビデオ画像フレームに対応する前記符号化データを出力するように構成される第1の出力モジュールと、前記前景画像の前記輪郭に対応する奥行きデータを出力するように構成される第2の出力モジュールとを含む、装置が提供される。
前述の第3の態様に関連して、第1の可能な実施方法において、前記輪郭分割モジュールは、前記距離画像及び前記ビデオ画像フレームの前記ビデオ画像に対してピクセルアライメントを実行するように構成されるピクセルアライメントユニットと、複数のピクセルの中から1つのピクセルを分割点として判定するために、前記距離画像上の各ピクセルと隣接ピクセルとの間の奥行き差を計算するように構成される奥行き差計算ユニットであって、前記ピクセルと全ての隣接ピクセルとの間の奥行き差の分散が設定しきい値より大きい、前記奥行き差計算ユニットと、全ての分割点を判定するために前記距離画像の全てのピクセルをトラバースするように構成される分割点判定ユニットと、全ての前記分割点に従って前記ビデオ画像フレームにおける前記前景画像の前記輪郭を獲得するように構成される輪郭獲得ユニットとを含む。
前述の第3の態様に関連して、第2の可能な実施方法において、前記第2の出力モジュールは、前記輪郭に従って前記距離画像を二値画像に単純化するように構成される二値画像単純化ユニットと、前記二値画像に対して符号化処理を実行するように構成される二値画像符号化ユニットと、前記二値画像に対応する符号化データを出力するように構成される二値画像出力ユニットとを含む。
前述の第3の態様及び第1の可能な実施方法に関連して、第3の可能な実施方法において、前記第2の出力モジュールは、全ての前記分割点における各分割点の座標情報を獲得するように構成される座標獲得ユニットと、全ての前記座標情報に対して圧縮処理を実行するように構成される圧縮ユニットと、全ての前記座標情報に対応するとともに前記圧縮処理を用いて獲得される圧縮データを出力するように構成される座標出力ユニットとを含む。
第4の態様によれば、画像処理装置であって、ビデオ画像フレームの符号化データ、及び前記ビデオ画像フレームにおける前景画像の輪郭に対応する奥行きデータを受信するように構成される受信モジュールであって、前記ビデオ画像フレームでは、前記ビデオ画像フレームに対応する前記符号化データを獲得するために、前記前景画像の前記輪郭に従って、前記前景画像の前記輪郭の内側のビデオ画像のピクセルに対して第1の符号化が実行され、前記輪郭の外側のビデオ画像のピクセルに対して第2の符号化が実行されるとともに、前記第1の符号化の符号化レートが前記第2の符号化の符号化レートより高い、前記受信モジュールと、前記ビデオ画像フレームにおける前記前景画像を獲得するために、前記奥行きデータに従って前記ビデオ画像フレームを分割するように構成される前景画像分割モジュールと、前記前景画像を再生するように構成される前景再生モジュールとを含む、装置が提供される。
前述の第4の態様に関連して、第1の可能な実施方法において、当該画像処理装置は、前記前景画像が再生される場合に、プリセットされた背景画像又はピクチャを再生し、前記背景画像又はピクチャを前記前景画像の背景として使用するように構成される背景再生モジュールを更に含む。
第5の態様によれば、前述のうちのいずれか1つによる2つの画像処理装置を含む、画像処理システムが提供される。
本発明の実施例では、ビデオ画像フレームにおける前景画像の輪郭がビデオ画像フレームを分割することにより獲得され、ビデオ画像フレームにおける“前景”画像と“背景”画像が前景画像の輪郭に従って相互に区別されることができ、さらに、異なる方法における符号化処理が、“前景”画像に含まれるビデオ画像のピクセル及び“背景”画像に含まれるビデオ画像のピクセルに対して実行され、すなわち、より高い符号化レートの符号化方法が輪郭の内側の“前景”画像のために使用され、より低い符号化レートの符号化方法が輪郭の外側の“背景”画像のために使用される。これらの符号化方法を使用することにより、符号化プロセスにおけるビットの利用率が削減されることができ、ビデオ画像フレーム伝送プロセスにおけるネットワーク帯域幅の占有率が下げられることができ、“前景”画像の画質が改善されることができる。さらに、距離画像における全てのピクセルに対応する奥行きデータの代わりに、輪郭に対応するピクセルの奥行きデータのみが送信されるので、ビデオ画像伝送プロセスにおけるネットワーク帯域幅の占有率は更に下げられることができる。
本発明の実施例における技術的解決法をより明確に説明するために、下記は、実施例を説明するために必要とされる添付図面を簡単に説明する。明らかに、当業者は、創造的な努力なしでこれらの添付図面からさらに他の図面を導き出し得る。
本発明による画像処理方法の実施例のフローチャートである。 図1におけるステップ101の実行のフローチャートである。 本発明による別の画像処理方法の実施例のフローチャートである。 本発明による画像処理装置の実施例の構造的な構成図である。 図4における輪郭分割モジュールの構造的な構成図である。 図4における第2の出力モジュール405の構造的な構成図である。 図4における第2の出力モジュール405の別の構造的な構成図である。 本発明による別の画像処理装置の実施例の構造的な構成図である。 本発明によるさらに別の画像処理装置の実施例の構造的な構成図である。 本発明による特定のアプリケーションシナリオである。
本発明の実施例における技術的解決法を当業者により良く理解させるとともに、本発明の実施例の目的、特徴、及び利点をより明確にするために、下記は、添付図面を参照して、さらに本発明の実施例における技術的解決法を詳細に説明する。
最初に、本発明において提供される画像処理方法が説明される。本発明において提供される画像処理方法、並びに画像処理装置及びシステムは、没入型会議システムに適用され得る。
図1を参照すると、図1は、本発明による画像処理方法の実施例のフローチャートであり、方法は、具体的に下記を含み得る。
ステップ101:対象物のビデオ画像及び距離画像を収集する。
この実施例は、ビデオ画像を送信する側における画像処理方法を説明する。このステップでは、ユーザのカラービデオ画像がカラーカメラを使用することによりキャプチャされることができ、一方では、ユーザとカメラとの間の距離の距離画像が奥行きカメラを使用することによりキャプチャされることができる。
ステップ102:同じ瞬間におけるビデオ画像に対応するビデオ画像フレームを、ビデオ画像フレームにおける前景画像の輪郭を獲得するために、距離画像を使用することにより分割する。
本発明において提供される画像処理方法、装置、及びシステムは、没入型会議システムに適用され得る。実際は、没入型会議システムの場合には、より高いレベルのユーザの注意を伴うビデオ画像は、実際に受け取られたビデオ画像の単なる一部分である。ユーザが注意を払うビデオ画像のこの部分は“前景”と称されるとともに、ユーザがほとんど注意を払わないビデオ画像の別の部分は“背景”と称される。例えば、一般的なテレビ会議では、ユーザは、現在のシステムにおいてユーザと交信する全ての他の人に注意を払い、したがって、これらの人の画像は“前景”であり、ユーザがこれらの人を除いて注意を払わない画像は“背景”である。
前述のステップでは、同じ瞬間におけるビデオ画像に対応するビデオ画像フレームが、距離画像を使用することにより分割されるとともに、ビデオ画像フレームにおける前景画像の輪郭が、画像分割を使用することにより獲得される。この分割方法を使用することにより、各ビデオ画像フレームにおける前景画像の輪郭が獲得され得る。
前景画像の輪郭を使用することにより、ビデオ画像フレームにおける“前景”と“背景”が分割され得る。ビデオ画像フレームの一連のピクセルにおいて、輪郭の内側の全てのピクセルは“前景”画像を形成し、そして輪郭の外側の全てのピクセルは“背景”画像を形成する。
ステップ103:ビデオ画像フレームに対応する符号化データを獲得するために、前景画像の輪郭に従って、ビデオ画像フレームにおける前景画像の輪郭の内側のビデオ画像のピクセルに対する第1の符号化、及びビデオ画像フレームにおける輪郭の外側のビデオ画像のピクセルに対する第2の符号化を実行し、ここで、第1の符号化の符号化レートは第2の符号化の符号化レートより高い。
このステップでは、ROI(Region of Interest、関心領域)符号化が、前景画像の輪郭を使用することにより、ビデオ画像フレームに対して実行される。ビデオ画像フレームにおける前景画像の輪郭の内側のビデオ画像のピクセル及びビデオ画像フレームにおける前景画像の輪郭の外側のビデオ画像のピクセルに対して異なる符号化方法で符号化を実行することは、より高い符号化レートの符号化方法がビデオ画像における前景画像の輪郭の内側の“前景”画像のために使用され、そしてより低い符号化レートの符号化方法がビデオ画像における前景画像の輪郭の外側の“背景”画像のために使用されることを含む。これらの符号化方法を使用することにより、符号化プロセスにおけるビットの利用率が削減されることができ、ビデオ画像伝送プロセスにおけるネットワーク帯域幅の占有率が下げられることができ、“前景”画像の画質が改善されることができる。
ステップ104:ビデオ画像フレームに対応する符号化データ、及び前景画像の輪郭に対応する奥行きデータを出力する。
このステップでは、ビデオ画像フレームに対応する符号化データ、及び輪郭に対応する奥行きデータが一緒に出力され、したがって、受信端は、前景画像の輪郭に対応する奥行きデータに従って、ビデオ画像フレームにおける“前景”画像と“背景”画像を分割する輪郭を獲得するとともに、前景画像の輪郭に従って、復号によって獲得されたビデオ画像フレームからビデオ画像フレームにおける“前景”画像を更に獲得する。
距離画像における全てのピクセルに対応する奥行きデータの代わりに、前景画像の輪郭に対応するピクセルの奥行きデータのみが送信されるので、ビデオ画像伝送プロセスにおけるネットワーク帯域幅の占有率は更に下げられることができる。
本発明のこの実施例では、ビデオ画像フレームにおける前景画像の輪郭がビデオ画像フレームを分割することにより獲得され、ビデオ画像フレームにおける“前景”画像と“背景”画像が前景画像の輪郭に従って相互に区別されることができ、さらに、異なる方法における符号化処理が、“前景”画像に含まれるビデオ画像のピクセル及び“背景”画像に含まれるビデオ画像のピクセルに対して実行され、すなわち、より高い符号化レートの符号化方法が輪郭の内側の“前景”画像のために使用され、より低い符号化レートの符号化方法が輪郭の外側の“背景”画像のために使用される。これらの符号化方法を使用することにより、符号化プロセスにおけるビットの利用率が削減されることができ、ビデオ画像フレーム伝送プロセスにおけるネットワーク帯域幅の占有率が下げられることができ、“前景”画像の画質が改善されることができる。さらに、距離画像における全てのピクセルに対応する奥行きデータの代わりに、前景画像の輪郭に対応するピクセルの奥行きデータのみが送信されるので、ビデオ画像伝送プロセスにおけるネットワーク帯域幅の占有率は更に下げられることができる。
本発明の技術的解決法の理解を容易にするために、下記は、特定の実施方法を使用することにより本発明の技術的解決法を詳細に説明する。
特定の実施の間、前述のステップ101では、ビデオ画像フレームにおける前景画像の輪郭を獲得するために、同じ瞬間におけるビデオ画像に対応するビデオ画像フレームが距離画像を使用することにより分割され、ここで、このステップの特定の実施方法は図2で示されるとともに、具体的に下記の実行ステップを含み得る。
ステップ201:距離画像及びビデオ画像フレームのビデオ画像に対してピクセルアライメントを実行する。
このステップでは、同じ瞬間に奥行きカメラ及びカラーカメラにより収集された距離画像及びカラー画像に対してピクセルアライメントが実行される。
具体的には、カラー画像の解像度が距離画像の解像度より高い場合に、カラー画像の解像度は距離画像の解像度へダウンサンプルされ、カラー画像の解像度が距離画像の解像度より低い場合に、カラー画像の解像度は距離画像の解像度へアップサンプルされ、又はカラー画像の解像度が距離画像の解像度と等しい場合に、処理は行われる必要がない。
ステップ202:複数のピクセルの中から1つのピクセルを分割点として判定するために、距離画像上の各ピクセルと隣接ピクセルとの間の奥行き差を計算し、ここで、ピクセルと全ての隣接ピクセルとの間の奥行き差の分散は設定しきい値より大きい。
このステップでは、距離画像上の各ピクセルと隣接ピクセルとの間の奥行き差を計算することは、一般に、距離画像上の各ピクセルと隣接の8つのピクセルとの間の奥行き差を計算している。実際には、距離画像上の各ピクセルの値は投影された空間点の座標であり、それは空間点から奥行きセンサが配置された平面までの距離がZであることを示し、ここで単位はmmである。距離画像上の不連続点、すなわち分割点は、これらの奥行き差を計算することにより抽出され得る。
ピクセルに関しては、計算された8つの奥行き差の中の1つ又は複数の奥行き差と残りの奥行き差との間に明らかな差異がある場合に、すなわち、8つの奥行き差の分散が特定の設定しきい値より大きい場合に、そのピクセルは分割点として判定され得る。
ステップ203:全ての分割点を判定するために距離画像の全てのピクセルをトラバースする。
このステップでは、各ピクセルと隣接ピクセルとの間の奥行き差の前述の計算が、全ての分割点を判定するために、距離画像上の各ピクセルに対して順次に実行される。
ステップ204:全ての分割点に従ってビデオ画像における前景画像の輪郭を獲得する。
このステップでは、全ての分割点が判定される場合に、全ての分割点が接続されたあとで、ビデオ画像において“前景”画像を“背景”画像と区別する輪郭が形成され得る。
本発明のこの実施例では、ビデオ画像フレームを受信端に送信するプロセスにおいて、輪郭に対応する奥行きデータが同様に送信される必要がある。輪郭に対応する奥行きデータを出力するために、本発明のこの実施例は下記の2つの処理方法を提供する。
(1)距離画像は、輪郭に従って二値画像に単純化され、二値画像に対して符号化処理が実行されるとともに、二値画像に対応する符号化データが出力される。
この方法では、輪郭の内側の全てのピクセルの値が0に設定され、そして輪郭の外側の全てのピクセルの値が1に設定される。
出力するステップの間に、二値画像に単純化された距離画像に対して符号化処理が実行され、さらに、符号化によって別個に処理された二値画像及びカラー画像の符号列が出力されるとともに、ビデオ画像を見るために、受信端に対して伝送ネットワークを通して送信される。
さらに、二値画像に対して符号化が実行される場合に、JBIG2符号器が適用され得る。
(2)全ての分割点における各分割点の座標情報が獲得され、全ての座標情報に対して圧縮処理が実行されるとともに、全ての座標情報に対応するとともに圧縮処理を用いて獲得される圧縮データが出力される。
この方法では、分割点に対応するピクセルの空間座標又はベクトル座標を含む、全ての分割点の座標情報が獲得され、例えば、空間座標は(x、y)の座標になる。その場合に、全ての分割点の座標情報は集約されて、例えば、データセットを示す。全ての分割点の座標情報を含むデータセットに対して圧縮が実行され、圧縮されたデータセットは、ビデオ画像を見るために、受信端に対して伝送ネットワークを通して送信される。
前述の実施例は、画像処理プロセスにおいて画像を送信する側における画像処理方法を主に説明する。対応して、本発明は、画像処理方法を更に提供し、それは画像処理プロセスにおいて画像を受信する側における画像処理方法である。
図3を参照すると、図3は、本発明による画像処理方法の実施例のフローチャートであり、方法は、具体的に下記を含み得る。
ステップ301:ビデオ画像フレームの符号化データ、及びビデオ画像フレームにおける前景画像の輪郭に対応する奥行きデータを受信し、ここで、ビデオ画像フレームでは、ビデオ画像フレームに対応する符号化データを獲得するために、前景画像の輪郭に従って、前景画像の輪郭の内側のビデオ画像のピクセルに対して第1の符号化が実行され、輪郭の外側のビデオ画像のピクセルに対して第2の符号化が実行されるとともに、第1の符号化の符号化レートは第2の符号化の符号化レートより高い。
このステップでは、受信側は、送信側により送信された、ビデオ画像フレームに対応する符号化データ、及びビデオ画像フレームにおける前景画像の輪郭に対応する奥行きデータを受信する。ビデオ画像を送信する側は、画像分割によって、ビデオ画像フレームにおける前景画像の輪郭を獲得し、輪郭を使用することにより、ビデオ画像フレームにおいて“前景”を“背景”から分離している。ビデオ画像フレームにおいて、輪郭の内側の全てのピクセルは“前景”画像を形成し、そして輪郭の外側の全てのピクセルは“背景”画像を形成する。
さらに、受信側により受信された、ビデオ画像フレームに対応する符号化データにおいて、ビデオ画像を送信する側は、ビデオ画像フレームにおける前景画像の輪郭の内側の“前景”画像に対して、より高い符号化レートの符号化方法を使用しているとともに、ビデオ画像フレームにおける前景画像の輪郭の外側の“背景”画像に対して、より低い符号化レートの符号化方法を使用している。これらの符号化方法を使用することにより、符号化プロセスにおけるビットの利用率が削減されることができ、ビデオ画像伝送プロセスにおけるネットワーク帯域幅の占有率が下げられることができ、“前景”画像の画質が改善されることができる。
ステップ302:ビデオ画像フレームにおける前景画像を獲得するために、奥行きデータに従ってビデオ画像フレームを分割する。
このステップでは、受信側は、送信側により収集されたビデオ画像を獲得するために、受信された符号化データに対して復号を実行し得るとともに、受信されたビデオ画像における前景画像を更に獲得するために、受信された奥行きデータに従って受信されたビデオ画像を分割し得る。一般に、前景画像のこの部分は、ビデオユーザがより多くの注意を払う画像部分である。
ステップ303:前景画像を再生する。
このステップでは、ビデオ画像における前景画像が分割されたあとで、前景画像は再生され得る。ほとんどの場合、ユーザは、受信されたビデオ画像において、前景画像を除いて背景画像には注意を払わないとともに、背景画像のこの部分は再生されない。
例えば、一般的なテレビ会議では、ユーザは、現在のシステムにおいてユーザと交信する全ての他の人に注意を払い、したがって、これらの人の画像は“前景”であり、ユーザがこれらの人を除いて注意を払わない画像は“背景”である。本発明のこの実施例によれば、ビデオを受信する側では、ユーザがより多くの注意を払う、現在のシステムにおいてユーザと交信するこれらの人の画像のみが再生されるが、しかしながら、ユーザがこれらの人を除いて注意を払わない“背景”画像は再生されない。
没入型会議システムの場合には、前景画像が再生される場合に、前景画像は、再生のために、テレビ会議システムにおける会議インタフェースにおける再生ウィンドウ上に準備され得る。
本発明のこの実施例では、ビデオ画像を送信する側は、ビデオ画像フレームを分割することによりビデオ画像フレームにおける前景画像の輪郭を獲得し、前景画像の輪郭に従って、ビデオ画像フレームにおいて“前景”画像を“背景”画像と区別することができ、さらに、“前景”画像に含まれるビデオ画像のピクセル及び“背景”画像に含まれるビデオ画像のピクセルに対して異なる方法における符号化処理を実行し、すなわち、より高い符号化レートの符号化方法が輪郭の内側の“前景”画像のために使用され、より低い符号化レートの符号化方法が輪郭の外側の“背景”画像のために使用される。これらの符号化方法を使用することにより、符号化プロセスにおけるビットの利用率が削減されることができ、ビデオ画像フレーム伝送プロセスにおけるネットワーク帯域幅の占有率が下げられることができ、“前景”画像の画質が改善されることができる。さらに、距離画像における全てのピクセルに対応する奥行きデータの代わりに、前景画像の輪郭に対応するピクセルの奥行きデータのみが送信されるので、ビデオ画像伝送プロセスにおけるネットワーク帯域幅の占有率は更に下げられることができる。
ほとんどの場合、ユーザは、受信されたビデオ画像において、前景画像を除いて背景画像には注意を払わない。ユーザがテレビ会議に参加する場合に、ユーザの没入型経験を向上させるために、背景画像のこの部分は再生されないかもしれず、その代わりに、前景画像が再生される場合に、プリセットされた背景画像又はピクチャが再生され、背景画像又はピクチャが前景画像の背景として使用される。例えば、没入型会議システムの会議インタフェース上で、現在のシステムにおいてユーザと交信する相手方ユーザの人物画像は、一般に、“前景”画像である。“前景”画像のこの部分が再生される場合に、プリセットされた背景画像又はピクチャが再生されることができ、プリセットされた背景画像又はピクチャは、会議インタフェースの“背景”画像として使用されるとともに、会議インタフェース上で再生された相手方ユーザの人物画像と一緒に再生される。
本発明において提供される画像処理方法の実施例に対応して、本発明は、画像処理装置を更に提供する。
図4に示されたように、図4は、本発明において提供される画像処理装置の実施例であり、装置は、具体的に、対象物のビデオ画像及び距離画像を収集するように構成される収集モジュール401と、同じ瞬間におけるビデオ画像に対応するビデオ画像フレームを、ビデオ画像フレームにおける前景画像の輪郭を獲得するために、距離画像を使用することにより分割するように構成される輪郭分割モジュール402と、ビデオ画像フレームに対応する符号化データを獲得するために、前景画像の輪郭に従って、ビデオ画像フレームにおける前景画像の輪郭の内側のビデオ画像のピクセルに対する第1の符号化、及びビデオ画像フレームにおける輪郭の外側のビデオ画像のピクセルに対する第2の符号化を実行するように構成されるビデオ符号化モジュールであって、第1の符号化の符号化レートが第2の符号化の符号化レートより高い、ビデオ符号化モジュール403と、ビデオ画像フレームに対応する符号化データを出力するように構成される第1の出力モジュール404と、前景画像の輪郭に対応する奥行きデータを出力するように構成される第2の出力モジュール405とを含み得る。
本発明のこの実施例では、収集モジュールを使用することにより対象物のビデオ画像及び距離画像が収集され、ビデオ画像フレームにおける前景画像の輪郭を獲得するために、画像処理装置内の輪郭分割モジュールを使用することによりビデオ画像フレームが分割され、ビデオ画像フレームにおける“前景”画像と“背景”画像が輪郭に従って相互に区別され、さらに、ビデオ符号化モジュールを使用することにより、異なる方法における符号化処理が、“前景”画像に含まれるビデオ画像のピクセル及び“背景”画像に含まれるビデオ画像のピクセルに対して実行され、すなわち、より高い符号化レートの符号化方法が輪郭の内側の“前景”画像のために使用され、より低い符号化レートの符号化方法が輪郭の外側の“背景”画像のために使用される。これらの符号化方法を使用することにより、符号化プロセスにおけるビットの利用率が削減されることができ、ビデオ画像伝送プロセスにおけるネットワーク帯域幅の占有率が下げられることができ、“前景”画像の画質が改善されることができる。さらに、距離画像における全てのピクセルに対応する奥行きデータの代わりに、前景画像の輪郭に対応するピクセルの奥行きデータのみが送信されるので、ビデオ画像伝送プロセスにおけるネットワーク帯域幅の占有率は更に下げられることができる。
本発明において提供される実行可能な実施例では、図5に示されたように、輪郭分割モジュール402が、具体的に、距離画像及びビデオ画像フレームのビデオ画像に対してピクセルアライメントを実行するように構成されるピクセルアライメントユニット501と、複数のピクセルの中から1つのピクセルを分割点として判定するために、距離画像上の各ピクセルと隣接ピクセルとの間の奥行き差を計算するように構成される奥行き差計算ユニットであって、ピクセルと全ての隣接ピクセルとの間の奥行き差の分散が設定しきい値より大きい、奥行き差計算ユニット502と、全ての分割点を判定するために距離画像の全てのピクセルをトラバースするように構成される分割点判定ユニット503と、全ての分割点に従ってビデオ画像における前景画像の輪郭を獲得するように構成される輪郭獲得ユニット504とを含み得る。
本発明において提供される実行可能な実施例では、図6に示されたように、第2の出力モジュール405は、具体的に、輪郭に従って距離画像を二値画像に単純化するように構成される二値画像単純化ユニット601と、二値画像に対して符号化処理を実行するように構成される二値画像符号化ユニット602と、二値画像に対応する符号化データを出力するように構成される二値画像出力ユニット603とを含み得る。
この実施方法では、輪郭の内側の全てのピクセルの値が0に設定され、そして輪郭の外側の全てのピクセルの値が1に設定される。出力するステップの間に、符号化処理が二値画像に単純化された距離画像に対して実行され、さらに、符号化によって別個に処理された二値画像及びカラー画像の符号列が出力されるとともに、ビデオ画像を見るために、受信端に対して伝送ネットワークを通して送信される。
本発明において提供される別の実行可能な実施例では、図7に示されたように、第2の出力モジュール405は、具体的に、全ての分割点における各分割点の座標情報を獲得するように構成される座標獲得ユニット701と、全ての座標情報に対して圧縮処理を実行するように構成される圧縮ユニット702と、全ての座標情報に対応するとともに圧縮処理を用いて獲得される圧縮データを出力するように構成される座標出力ユニット703とを含み得る。
この実施方法では、分割点に対応するピクセルの空間座標又はベクトル座標を含む、全ての分割点の座標情報が獲得され、例えば、空間座標は(x、y)の座標になる。その場合に、全ての分割点の座標情報は集約されて、例えば、データセットを示す。全ての分割点の座標情報を含むデータセットに対して圧縮が実行され、圧縮されたデータセットは、ビデオ画像を見るために、受信端に対して伝送ネットワークを通して送信される。
前述の画像処理装置は、画像処理プロセスにおいて画像を送信する側における対応装置である。本発明のこの実施例では、画像処理装置が提供され、ここで、画像処理装置は、画像処理プロセスにおいて画像を受信する側における対応装置である。
図8に示されたように、図8は、本発明において提供される画像処理装置の実施例であり、装置は、具体的に、ビデオ画像フレームの符号化データ、及びビデオ画像フレームにおける前景画像の輪郭に対応する奥行きデータを受信するように構成される受信モジュールであって、ビデオ画像フレームでは、ビデオ画像フレームに対応する符号化データを獲得するために、前景画像の輪郭に従って、前景画像の輪郭の内側のビデオ画像のピクセルに対して第1の符号化が実行され、輪郭の外側のビデオ画像のピクセルに対して第2の符号化が実行されるとともに、第1の符号化の符号化レートが第2の符号化の符号化レートより高い、受信モジュール801と、ビデオ画像フレームにおける前景画像を獲得するために、ビデオ画像フレームを分割するように構成される前景画像分割モジュール802と、前景画像を再生するように構成される前景再生モジュール803とを含み得る。
本発明のこの実施例では、ビデオ画像を送信する側は、ビデオ画像フレームを分割することによりビデオ画像フレームにおける前景画像の輪郭を獲得し、前景画像の輪郭に従って、ビデオ画像フレームにおいて“前景”画像を“背景”画像と区別することができ、さらに、“前景”画像に含まれるビデオ画像のピクセル及び“背景”画像に含まれるビデオ画像のピクセルに対して異なる方法における符号化処理を実行し、すなわち、より高い符号化レートの符号化方法が輪郭の内側の“前景”画像のために使用され、より低い符号化レートの符号化方法が輪郭の外側の“背景”画像のために使用される。これらの符号化方法を使用することにより、符号化プロセスにおけるビットの利用率が削減されることができ、ビデオ画像フレーム伝送プロセスにおけるネットワーク帯域幅の占有率が下げられることができ、“前景”画像の画質が改善されることができる。さらに、距離画像における全てのピクセルに対応する奥行きデータの代わりに、前景画像の輪郭に対応するピクセルの奥行きデータのみが送信されるので、ビデオ画像伝送プロセスにおけるネットワーク帯域幅の占有率は更に下げられることができる。
本発明において提供される別の実施例では、図9に示されたように、画像処理装置は、前景画像が再生される場合に、プリセットされた背景画像又はピクチャを再生し、背景画像又はピクチャを前景画像の背景として使用するように構成される背景再生モジュール804を更に含み得る。
ほとんどの場合、ユーザは、受信されたビデオ画像において、前景画像を除いて背景画像には注意を払わない。ユーザがテレビ会議に参加する場合に、ユーザの没入型経験を向上させるために、本発明のこの実施例では、背景画像のこの部分は再生されないかもしれず、その代わりに、前景画像が再生される場合に、プリセットされた背景画像又はピクチャが再生され、背景画像又はピクチャが前景画像の背景として使用される。
対応して、本発明は、画像処理システムを更に提供する。システムは、具体的に、画像送信装置と、画像受信装置とを含み得る。
画像送信装置は、対象物のビデオ画像及び距離画像を収集し、同じ瞬間におけるビデオ画像に対応するビデオ画像フレームを、ビデオ画像フレームにおける前景画像の輪郭を獲得するために、距離画像を使用することにより分割し、ビデオ画像フレームに対応する符号化データを獲得するために、前景画像の輪郭に従って、ビデオ画像フレームにおける前景画像の輪郭の内側のビデオ画像のピクセルに対する第1の符号化、及びビデオ画像フレームにおける輪郭の外側のビデオ画像のピクセルに対する第2の符号化であって、第1の符号化の符号化レートが第2の符号化の符号化レートより高い符号化を実行し、ビデオ画像フレームに対応する符号化データ、及び前景画像の輪郭に対応する奥行きデータを出力するように構成される。
画像受信装置は、ビデオ画像フレームの符号化データ、及びビデオ画像フレームにおける前景画像の輪郭に対応する奥行きデータを受信し、ビデオ画像フレームにおける前景画像を獲得するために、奥行きデータに従ってビデオ画像フレームを分割し、前景画像を再生するように構成される。
前述のシステムの実施例では、画像送信装置の側において、ビデオ画像フレームにおける前景画像の輪郭がビデオ画像フレームを分割することにより獲得され、ビデオ画像フレームにおける“前景”画像と“背景”画像が前景画像の輪郭に従って相互に区別されることができ、さらに、異なる方法における符号化処理が、“前景”画像に含まれるビデオ画像のピクセル及び“背景”画像に含まれるビデオ画像のピクセルに対して実行され、すなわち、より高い符号化レートの符号化方法が輪郭の内側の“前景”画像のために使用され、より低い符号化レートの符号化方法が輪郭の外側の“背景”画像のために使用される。これらの符号化方法を使用することにより、符号化プロセスにおけるビットの利用率が削減されることができ、ビデオ画像フレーム伝送プロセスにおけるネットワーク帯域幅の占有率が下げられることができ、“前景”画像の画質が改善されることができる。さらに、距離画像における全てのピクセルに対応する奥行きデータの代わりに、前景画像の輪郭に対応するピクセルの奥行きデータのみが送信されるので、ビデオ画像伝送プロセスにおけるネットワーク帯域幅の占有率は更に下げられることができる。
さらに、前述のシステムでは、画像送信装置は、図2において示された実行手続き、及び輪郭に対応する奥行きデータを出力するための前述の2つの処理方法を更に実行し得る。画像受信装置は、図3において示された実行手続きを更に実行し得るとともに、前景画像が再生される場合に、プリセットされた背景画像又はピクチャを再生し、背景画像又はピクチャを前景画像の背景として使用することができる。
下記は、特定のアプリケーションシナリオを使用することにより、前述の技術的解決法をさらに詳しく説明する。
図10において示されたアプリケーションシナリオでは、“a”側の画像送信装置における奥行きカメラ1001は、ユーザとカメラとの間の距離の距離画像をキャプチャするように構成され、カラーカメラ1002は、現在のビデオ画像のビデオ画像フレームを獲得するために、ユーザのカラービデオ画像をキャプチャするように構成され、輪郭分割モジュール1003は、ビデオ画像フレームを、ビデオ画像フレームにおける前景画像の輪郭を獲得するために、距離画像を使用することにより分割するように構成され、距離画像は輪郭に従って二値画像に単純化されるとともに、JBIG2符号器1004を使用することにより二値画像に対して符号化処理が実行され、一方では、前景画像の輪郭を使用することによるビデオ画像フレームに対するROI符号化が、ROI符号化をベースにしたビデオ符号器1005を使用することにより実施される。2つのタイプの符号化データは、ネットワーク1006を通して、“b”側の画像受信装置におけるJBIG2復号器1007及びROI復号器1008に送信される。ビデオ画像フレームにおける前景画像の輪郭は、JBIG2復号器を使用することにより獲得され、さらに、ビデオ画像フレームにおける前景画像は、前景画像分割モジュール1009を使用することにより別々に分割され、その上、背景再生モジュール1010は、前景画像が再生される場合に、プリセットされた背景画像又はピクチャが再生されるとともに、前景画像の背景として使用されることを実施するように構成される。
当業者は、本明細書中で開示される実施例において説明される例と組み合わせて、ユニット及びアルゴリズムステップが、電子ハードウェア、又は、コンピュータソフトウェアと電子ハードウェアの組み合わせにより実施され得ることに、気付くかもしれない。機能がハードウェアにより実行されるか又はソフトウェアにより実行されるかは、技術的解決法の特定のアプリケーション及び設計制約条件に依存する。当業者は、各特定のアプリケーションに対して説明された機能を実施するために異なる方法を使用し得るが、しかし、その実施は本発明の範囲を超えるものと考えられるべきではない。
都合が良くそして簡潔な記述のために、前述のシステム、装置、及びユニットの詳細な作業処理については、前述の方法の実施例の対応する処理に対して参照が行われるとともに、詳細は再度ここでは説明されない、ということが当業者によって明らかに理解され得る。
本願において提供されるいくらかの実施例では、開示されたシステム、装置、及び方法は他の様式で実施され得る、ということが理解されるべきである。例えば、説明された装置の実施例は、単に代表的である。例えば、ユニットの分割は、単に論理的な機能の分割であるとともに、実際の実装例では他の分割であるかもしれない。例えば、複数のユニット又はコンポーネントは、別のシステムに結合され得るか若しくは統合され得るか、又は、いくつかの特徴は、無視され得るか若しくは実行されないかもしれない。さらに、表示されたか若しくは論じられた相互の結合又は直接的な結合又は通信接続は、いくつかインタフェースを使用することにより実施され得る。装置又はユニットの間の間接的な結合又は通信接続は、電子的方式、機械的方式、又は他の方式において実施され得る。
別個の部品として説明されるユニットは、物理的に分離しているかもしれないし、又は物理的に分離していないかもしれないとともに、ユニットとして表示される部品は、物理的なユニットであるかもしれないし、又は物理的なユニットでないかもしれず、1つの位置に位置付けられるかもしれないし、又は複数のネットワークユニットに対して分散されるかもしれない。いくつか又は全てのユニットは、実施例の解決法の目的を達成するために、実際のニーズに従って選択され得る。
さらに、本発明の実施例における機能ユニットは1つの演算処理装置に統合され得るか、又は、それぞれのユニットは物理的に単独で存在し得るか、又は、2つ以上のユニットは1つのユニットに統合される。
機能がソフトウェア機能ユニットの形式で実施されるとともに、独立した製品として販売されるか又は使用される場合に、機能は、コンピュータ読み取り可能な記憶媒体に記憶され得る。そのような理解に基づくと、本発明の技術的解決法は本質的に、又は、従来技術に貢献する部分は、又は、技術的解決法の一部は、ソフトウェア製品の形式で実施され得る。ソフトウェア製品は、記憶媒体に記憶されるとともに、コンピュータ装置(それはパーソナルコンピュータ、サーバ、若しくはネットワーク装置であり得る)又はプロセッサに、本発明の実施例において説明された方法のステップの全部又は一部を実行するように指示するためのいくらかの命令を含む。前述の記憶媒体は、USBフラッシュドライブ、リムーバブルハードディスク、読出し専用メモリ(ROM、Read-Only Memory)、ランダムアクセスメモリ(RAM、Random Access Memory)、磁気ディスク、又は光ディスクのような、プログラムコードを記憶することができるあらゆる媒体を含む。
前述の説明は、本発明の単なる具体的な実施方法にすぎず、本発明の保護範囲を限定することを意図していない。本発明において開示された技術的な範囲内の当業者によって容易に判断されるあらゆる変形又は置換は、本発明の保護範囲に含まれるものとする。したがって、本発明の保護範囲は、請求項の保護範囲に支配されるものとする。

Claims (6)

  1. 画像処理方法であって、
    対象物のビデオ画像及び距離画像を収集するステップと、
    同じ瞬間における前記ビデオ画像に対応するビデオ画像フレームを、前記ビデオ画像フレームにおける前景画像の輪郭を獲得するために、前記距離画像を使用することにより分割するステップと、
    前記ビデオ画像フレームに対応する符号化データを獲得するために、前記前景画像の前記輪郭に従って、前記ビデオ画像フレームにおける前記前景画像の前記輪郭の内側のビデオ画像のピクセルに対する第1の符号化、及び前記ビデオ画像フレームにおける前記輪郭の外側のビデオ画像のピクセルに対する第2の符号化を実行するステップであって、前記第1の符号化の符号化レートが前記第2の符号化の符号化レートより高い、ステップと、
    前記ビデオ画像フレームに対応する前記符号化データ、及び前記前景画像の前記輪郭に対応する奥行きデータを出力するステップとを含み、
    同じ瞬間における前記ビデオ画像に対応するビデオ画像フレームを、前記ビデオ画像フレームにおける前景画像の輪郭を獲得するために、前記距離画像を使用することにより分割する前記ステップが、
    前記距離画像及び前記ビデオ画像フレームの前記ビデオ画像に対してピクセルアライメントを実行するステップと、
    複数のピクセルの中から1つのピクセルを分割点として判定するために、前記距離画像上の各ピクセルと隣接ピクセルとの間の奥行き差を計算するステップであって、前記ピクセルと全ての隣接ピクセルとの間の奥行き差の分散が設定しきい値より大きい場合に前記ピクセルが前記分割点として判定される、ステップと、
    全ての分割点を判定するために前記距離画像の全てのピクセルをトラバースするステップと、
    全ての前記分割点に従って前記ビデオ画像フレームにおける前記前景画像の前記輪郭を獲得するステップとを含む、方法。
  2. 前記前景画像の前記輪郭に対応する奥行きデータを出力する前記ステップが、
    前記輪郭に従って前記距離画像を二値画像に単純化するステップと、
    前記二値画像に対して符号化処理を実行するとともに、前記二値画像に対応する符号化データを出力するステップとを含む、請求項1に記載の方法。
  3. 前記前景画像の前記輪郭に対応する奥行きデータを出力する前記ステップが、
    全ての前記分割点における各分割点の座標情報を獲得するステップと、
    全ての前記座標情報に対して圧縮処理を実行し、全ての前記座標情報に対応するとともに前記圧縮処理を用いて獲得される圧縮データを出力するステップとを含む、請求項1に記載の方法。
  4. 画像処理装置であって、
    対象物のビデオ画像及び距離画像を収集するように構成される収集モジュールと、
    同じ瞬間における前記ビデオ画像に対応するビデオ画像フレームを、前記ビデオ画像フレームにおける前景画像の輪郭を獲得するために、前記距離画像を使用することにより分割するように構成される輪郭分割モジュールと、
    前記ビデオ画像フレームに対応する符号化データを獲得するために、前記前景画像の前記輪郭に従って、前記ビデオ画像フレームにおける前記前景画像の前記輪郭の内側のビデオ画像のピクセルに対する第1の符号化、及び前記ビデオ画像フレームにおける前記輪郭の外側のビデオ画像のピクセルに対する第2の符号化を実行するように構成されるビデオ符号化モジュールであって、前記第1の符号化の符号化レートが前記第2の符号化の符号化レートより高い、前記ビデオ符号化モジュールと、
    前記ビデオ画像フレームに対応する前記符号化データを出力するように構成される第1の出力モジュールと、
    前記前景画像の前記輪郭に対応する奥行きデータを出力するように構成される第2の出力モジュールとを備え、
    前記輪郭分割モジュールが、
    前記距離画像及び前記ビデオ画像フレームの前記ビデオ画像に対してピクセルアライメントを実行するように構成されるピクセルアライメントユニットと、
    複数のピクセルの中から1つのピクセルを分割点として判定するために、前記距離画像上の各ピクセルと隣接ピクセルとの間の奥行き差を計算するように構成される奥行き差計算ユニットであって、前記ピクセルと全ての隣接ピクセルとの間の奥行き差の分散が設定しきい値より大きい場合に前記ピクセルが前記分割点として判定される、前記奥行き差計算ユニットと、
    全ての分割点を判定するために前記距離画像の全てのピクセルをトラバースするように構成される分割点判定ユニットと、
    全ての前記分割点に従って前記ビデオ画像フレームにおける前記前景画像の前記輪郭を獲得するように構成される輪郭獲得ユニットとを備える、装置。
  5. 前記第2の出力モジュールが、
    前記輪郭に従って前記距離画像を二値画像に単純化するように構成される二値画像単純化ユニットと、
    前記二値画像に対して符号化処理を実行するように構成される二値画像符号化ユニットと、
    前記二値画像に対応する符号化データを出力するように構成される二値画像出力ユニットとを備える、請求項4に記載の装置。
  6. 前記第2の出力モジュールが、
    全ての前記分割点における各分割点の座標情報を獲得するように構成される座標獲得ユニットと、
    全ての前記座標情報に対して圧縮処理を実行するように構成される圧縮ユニットと、
    全ての前記座標情報に対応するとともに前記圧縮処理を用いて獲得される圧縮データを出力するように構成される座標出力ユニットとを備える、請求項4に記載の装置。
JP2016526410A 2013-08-19 2014-01-06 画像処理方法及び装置 Expired - Fee Related JP6283108B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201310362321.1A CN104427291B (zh) 2013-08-19 2013-08-19 一种图像处理方法及设备
CN201310362321.1 2013-08-19
PCT/CN2014/070138 WO2015024362A1 (zh) 2013-08-19 2014-01-06 一种图像处理方法及设备

Publications (3)

Publication Number Publication Date
JP2016527791A JP2016527791A (ja) 2016-09-08
JP2016527791A5 JP2016527791A5 (ja) 2017-05-25
JP6283108B2 true JP6283108B2 (ja) 2018-02-21

Family

ID=52483014

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016526410A Expired - Fee Related JP6283108B2 (ja) 2013-08-19 2014-01-06 画像処理方法及び装置

Country Status (5)

Country Link
US (1) US9392218B2 (ja)
EP (1) EP2999221A4 (ja)
JP (1) JP6283108B2 (ja)
CN (1) CN104427291B (ja)
WO (1) WO2015024362A1 (ja)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9560103B2 (en) * 2013-06-26 2017-01-31 Echostar Technologies L.L.C. Custom video content
US9847082B2 (en) * 2013-08-23 2017-12-19 Honeywell International Inc. System for modifying speech recognition and beamforming using a depth image
JP6529360B2 (ja) * 2015-06-26 2019-06-12 キヤノン株式会社 画像処理装置、撮像装置、画像処理方法およびプログラム
JP6358552B2 (ja) 2015-12-08 2018-07-18 パナソニックIpマネジメント株式会社 画像認識装置および画像認識方法
CN107180407A (zh) * 2016-03-09 2017-09-19 杭州海康威视数字技术股份有限公司 一种图片处理方法及装置
CN107295360B (zh) * 2016-04-13 2020-08-18 成都鼎桥通信技术有限公司 视频传输方法及装置
US10373592B2 (en) * 2016-08-01 2019-08-06 Facebook Technologies, Llc Adaptive parameters in image regions based on eye tracking information
WO2018101080A1 (ja) * 2016-11-30 2018-06-07 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 三次元モデル配信方法及び三次元モデル配信装置
EP3565259A1 (en) * 2016-12-28 2019-11-06 Panasonic Intellectual Property Corporation of America Three-dimensional model distribution method, three-dimensional model receiving method, three-dimensional model distribution device, and three-dimensional model receiving device
JP2018136896A (ja) * 2017-02-24 2018-08-30 キヤノン株式会社 情報処理装置、システム、情報処理方法、および物品の製造方法
CN106911902B (zh) * 2017-03-15 2020-01-07 微鲸科技有限公司 视频图像传输方法、接收方法及装置
CN107945192B (zh) * 2017-12-14 2021-10-22 北京信息科技大学 一种托盘纸箱垛型实时检测方法
CN107948650A (zh) * 2017-12-25 2018-04-20 横琴国际知识产权交易中心有限公司 一种视频编码方法及装置
KR102664392B1 (ko) 2018-06-28 2024-05-08 삼성전자주식회사 디스플레이 장치
KR20200013453A (ko) 2018-07-30 2020-02-07 삼성전자주식회사 3차원 영상 표시 장치 및 영상 처리 방법
KR102546321B1 (ko) 2018-07-30 2023-06-21 삼성전자주식회사 3차원 영상 표시 장치 및 방법
CN109089097A (zh) * 2018-08-28 2018-12-25 恒信东方文化股份有限公司 一种基于vr图像处理的焦点对象选取方法
US11089279B2 (en) * 2018-12-06 2021-08-10 Htc Corporation 3D image processing method, camera device, and non-transitory computer readable storage medium
CN111435551B (zh) * 2019-01-15 2023-01-13 华为技术有限公司 点云滤波方法、装置及存储介质
US11303877B2 (en) * 2019-08-13 2022-04-12 Avigilon Corporation Method and system for enhancing use of two-dimensional video analytics by using depth data
CN112395912B (zh) * 2019-08-14 2022-12-13 中移(苏州)软件技术有限公司 一种人脸分割方法、电子设备及计算机可读存储介质
CN113191210B (zh) * 2021-04-09 2023-08-29 杭州海康威视数字技术股份有限公司 一种图像处理方法、装置及设备
CN113613039B (zh) * 2021-08-09 2023-06-30 咪咕文化科技有限公司 视频传输方法、系统、计算设备及计算机存储介质
CN116193153B (zh) * 2023-04-19 2023-06-30 世优(北京)科技有限公司 直播数据的发送方法、装置及系统

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1013799A (ja) * 1996-06-19 1998-01-16 Mega Chips:Kk テレビ電話装置
US6055330A (en) * 1996-10-09 2000-04-25 The Trustees Of Columbia University In The City Of New York Methods and apparatus for performing digital image and video segmentation and compression using 3-D depth information
JPH11339007A (ja) * 1998-05-26 1999-12-10 Matsushita Electric Ind Co Ltd 画像処理装置
US20020051491A1 (en) * 1998-11-20 2002-05-02 Kiran Challapali Extraction of foreground information for video conference
FR2806570B1 (fr) * 2000-03-15 2002-05-17 Thomson Multimedia Sa Procede et dispositif de codage d'images video
JP2002016911A (ja) * 2000-06-29 2002-01-18 Toshiba Corp オブジェクト映像符号化装置
US7426304B2 (en) * 2004-09-15 2008-09-16 Hewlett-Packard Development Company, L.P. Method and device for three-dimensional graphics to two-dimensional video encoding
JP4670303B2 (ja) * 2004-10-06 2011-04-13 ソニー株式会社 画像処理方法及び画像処理装置
KR100708180B1 (ko) * 2005-09-22 2007-04-17 삼성전자주식회사 화상 압축 장치 및 방법
EP1806697B1 (en) * 2006-01-10 2016-08-10 Microsoft Technology Licensing, LLC Segmenting image elements
EP1830573A1 (en) * 2006-03-02 2007-09-05 Thomson Licensing Method and apparatus for determining in picture signal encoding the bit allocation for groups of pixel blocks in a picture
JP4679425B2 (ja) * 2006-04-20 2011-04-27 株式会社東芝 画像処理装置、画像処理方法およびプログラム
TWI381717B (zh) * 2008-03-31 2013-01-01 Univ Nat Taiwan 數位視訊動態目標物體分割處理方法及系統
EP2425624A2 (en) * 2009-05-01 2012-03-07 Thomson Licensing 3d video coding formats
GB2473247B (en) * 2009-09-04 2015-02-11 Sony Corp A method and apparatus for image alignment
US9117310B2 (en) * 2010-04-02 2015-08-25 Imec Virtual camera system
US8300938B2 (en) * 2010-04-09 2012-10-30 General Electric Company Methods for segmenting objects in images
US8818028B2 (en) * 2010-04-09 2014-08-26 Personify, Inc. Systems and methods for accurate user foreground video extraction
KR102185765B1 (ko) * 2010-08-11 2020-12-03 지이 비디오 컴프레션, 엘엘씨 멀티-뷰 신호 코덱
US8649592B2 (en) * 2010-08-30 2014-02-11 University Of Illinois At Urbana-Champaign System for background subtraction with 3D camera
ES2395102B1 (es) * 2010-10-01 2013-10-18 Telefónica, S.A. Metodo y sistema para segmentacion de primer plano de imagenes en tiempo real
CN102158712B (zh) * 2011-03-22 2012-10-24 宁波大学 一种基于视觉的多视点视频信号编码方法
CN102156995A (zh) * 2011-04-21 2011-08-17 北京理工大学 一种运动相机下的视频运动前景分割方法
JP2014140089A (ja) * 2011-05-10 2014-07-31 Sharp Corp 画像符号化装置、画像符号化方法、画像符号化プログラム、画像復号装置、画像復号方法及び画像復号プログラム
CN102972038B (zh) * 2011-07-01 2016-02-10 松下电器产业株式会社 图像处理装置、图像处理方法、程序、集成电路
HUE034631T2 (en) * 2011-11-11 2018-02-28 Ge Video Compression Llc Adaptive partition coding
CN103108197A (zh) * 2011-11-14 2013-05-15 辉达公司 一种用于3d视频无线显示的优先级压缩方法和系统
JP2013118468A (ja) * 2011-12-02 2013-06-13 Sony Corp 画像処理装置および画像処理方法
EP2706503A3 (en) * 2012-09-11 2017-08-30 Thomson Licensing Method and apparatus for bilayer image segmentation
CN102999901B (zh) * 2012-10-17 2016-06-29 中国科学院计算技术研究所 基于深度传感器的在线视频分割后的处理方法及系统
CN103152569A (zh) * 2013-02-28 2013-06-12 哈尔滨工业大学 一种基于深度信息的视频感兴趣区域压缩方法
US9191643B2 (en) * 2013-04-15 2015-11-17 Microsoft Technology Licensing, Llc Mixing infrared and color component data point clouds
US9414016B2 (en) * 2013-12-31 2016-08-09 Personify, Inc. System and methods for persona identification using combined probability maps

Also Published As

Publication number Publication date
WO2015024362A1 (zh) 2015-02-26
US20160105636A1 (en) 2016-04-14
CN104427291B (zh) 2018-09-28
US9392218B2 (en) 2016-07-12
EP2999221A4 (en) 2016-06-22
EP2999221A1 (en) 2016-03-23
CN104427291A (zh) 2015-03-18
JP2016527791A (ja) 2016-09-08

Similar Documents

Publication Publication Date Title
JP6283108B2 (ja) 画像処理方法及び装置
JP7277372B2 (ja) 三次元モデル符号化装置、三次元モデル復号装置、三次元モデル符号化方法、および、三次元モデル復号方法
EP3751857A1 (en) A method, an apparatus and a computer program product for volumetric video encoding and decoding
US10762653B2 (en) Generation apparatus of virtual viewpoint image, generation method, and storage medium
CN111402399B (zh) 人脸驱动和直播方法、装置、电子设备及存储介质
US8761541B2 (en) Comfort noise and film grain processing for 3 dimensional video
US11232625B2 (en) Image processing
JP7105062B2 (ja) 画像処理装置、コンテンツ処理装置、コンテンツ処理システム、および画像処理方法
JP7202087B2 (ja) 映像処理装置
JP7344988B2 (ja) ボリュメトリック映像の符号化および復号化のための方法、装置、およびコンピュータプログラム製品
JP4806088B1 (ja) 画像変換装置、画像変換装置の制御方法、画像変換装置制御プログラムおよび記録媒体
US20230122149A1 (en) Asymmetric communication system with viewer position indications
JP6340675B1 (ja) オブジェクト抽出装置、オブジェクト認識システム及びメタデータ作成システム
JP3859989B2 (ja) 画像マッチング方法およびその方法を利用可能な画像処理方法と装置
JP4860763B2 (ja) 画像符号化装置、画像符号化装置の制御方法、制御プログラムおよび記録媒体
KR20200111645A (ko) 3차원 와핑을 이용한 레지듀얼 영상의 패킹 및 언패킹 방법
CN115988189A (zh) 一种银行远程服务方法、装置及系统
JP2020127150A (ja) システム、画像処理装置、画像処理方法、及びプログラム
KR20190045053A (ko) (초)다시점 미디어의 라이브 스트리밍 방법 및 장치
Pourazad et al. Random Forests Based View Generation for Multiview TV

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170207

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170328

A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20170328

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170808

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170823

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180109

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180125

R150 Certificate of patent or registration of utility model

Ref document number: 6283108

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees