JP4988770B2 - モード間の関心領域画像オブジェクト区分 - Google Patents

モード間の関心領域画像オブジェクト区分 Download PDF

Info

Publication number
JP4988770B2
JP4988770B2 JP2008554492A JP2008554492A JP4988770B2 JP 4988770 B2 JP4988770 B2 JP 4988770B2 JP 2008554492 A JP2008554492 A JP 2008554492A JP 2008554492 A JP2008554492 A JP 2008554492A JP 4988770 B2 JP4988770 B2 JP 4988770B2
Authority
JP
Japan
Prior art keywords
roi
image frame
detected
image
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008554492A
Other languages
English (en)
Other versions
JP2009526495A (ja
Inventor
ワン、ハオホン
エル−マレー、クハレド・ヘルミ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2009526495A publication Critical patent/JP2009526495A/ja
Application granted granted Critical
Publication of JP4988770B2 publication Critical patent/JP4988770B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/162Detection; Localisation; Normalisation using pixel segmentation or colour matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/165Detection; Localisation; Normalisation using facial parts and geometric relationships
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/167Detection; Localisation; Normalisation using comparisons between temporally consecutive images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/18Eye characteristics, e.g. of the iris
    • G06V40/19Sensors therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • General Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Geometry (AREA)
  • Ophthalmology & Optometry (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)
  • Closed-Circuit Television Systems (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

本開示は、画像オブジェクト区分に関し、より詳細には、マルチメディア・アプリケーションのための画像シーケンスからの関心領域(ROI)画像オブジェクトの自動区分のための技術に関する。
自動関心領域(ROI)画像オブジェクト区分は、画像シーケンスを利用する幅広いマルチメディア・アプリケーションにとって有用であり得る。ROIオブジェクトは、画像フレーム内の「前景」オブジェクトと呼ばれる場合があり、非ROI範囲は、画像フレーム内の「背景」範囲と呼ばれる場合がある。ROIオブジェクト区分は、視聴者にとって関心あるものであり得る画像シーケンスの選択された前景オブジェクトが画像シーケンスの背景から抽出されることを可能にする。マルチメディア・アプリケーションは、その場合、画像シーケンスから区分されたROIオブジェクトを優先的に利用することができる。ROIオブジェクトの典型的な例は、人の顔または頭、および人体の肩の範囲である。
例えば、画像監視アプリケーションでは、捕捉された画像シーケンスから区分されたROIオブジェクトは、顔のデータベース・システム内へのインプットであり得る。顔のデータベース・システムは、データベース内に記憶された目標顔オブジェクトに正確に整合させるために、区分されたROIオブジェクト(例えば、人の顔)を使用することができる。警察は、監視画像シーケンスから容疑者を識別するために、ROIオブジェクト区分のこの応用例を利用することができる。
もう1つの例として、画像電話(VT)アプリケーションでは、捕捉された画像シーケンスから区分されたROIオブジェクトは、画像シーケンスエンコーダ内へのインプットであり得る。画像シーケンスエンコーダは、受信者への伝送のために、より高い品質を用いてROIを符号化する目的で、より多くのリソースを区分されたROIオブジェクトに割り当てることが可能である。VTアプリケーションは、テレビ会議などのアプリケーションをサポートするために、ユーザが画像および音声の情報を共有することを可能にする。VTシステムでは、ユーザは画像情報を送ることおよび受信すること、単に画像情報を受信すること、または単に画像情報を送ることが可能である。受信者は、一般に、送信者から送信された形式で受信された画像情報を閲覧する。区分されたROIオブジェクトの優先的な符号化により、受信者は、画像シーケンスの非ROI範囲よりも、より明確にROIオブジェクトを閲覧することが可能である。
その他の例は、人物が、生放送もしくは事前記録されたニュース放送または娯楽放送など、情報画像を提示する画像放送アプリケーションを含む。かかるアプリケーションでは、取材記者またはトークショーの司会者など、司会者の顔に対応するROIオブジェクトを優先的にエンコードすることが望まれる可能性がある。
従来、自動ROIオブジェクト区分は、一般に、動作分析、動作区分、および領域区分に重点を置く。1つの事例では、統計的なモデル・ベースのオブジェクト・区分アルゴリズムは、ROIオブジェクトをブラブベースの統計的な領域モデルと形状モデルとに切り離す。したがって、ROIオブジェクト区分問題は、モデル検出およびトラッキング問題に変換され得る。もう1つの事例では、前景オブジェクトは、ステレオ・カメラ・セット・アップからの2つのビューの間の不整合推定に基づいて、画像フレームから抽出されることが可能である。別の事例は、領域ベースの切出手法および特徴ベースの区分手法の両方を含むROIオブジェクト区分アルゴリズムを提案する。アルゴリズムは、動作、色、およびテクスチャの特徴に関して同種のオブジェクト領域を表すために領域記述子を使用して、画像シーケンスの全域でそれらの領域記述子を追跡する。
発明の概要
本開示は、画像シーケンスからの関心領域(ROI)画像オブジェクトの自動区分のための技術に関する。ROIオブジェクト区分は、画像シーケンスの非ROI、すなわち「背景」範囲から、画像シーケンスの選択されたROI、すなわち「前景」オブジェクトが抽出されることを可能にする。ROIオブジェクトの例は、人の顔または頭、および人体の肩の範囲である。開示された技術は、ROI特徴検出と、領域区分と、背景減算とを組み合わせるハイブリッド技術を含む。このようにして、開示された技術は、正確な前景オブジェクトの生成と、画像シーケンスからの前景オブジェクトの低複雑性の抽出とを提供することができる。
開示された技術はまた、対称位置特性および形状特性など、顔の特徴の固有の属性に基づいて、画像シーケンスの画像フレーム内で検出された顔の特徴の検証のための技術も含む。加えて、開示された技術は、画像シーケンスの画像フレーム内の複数の個々の顔に関して検出された顔の特徴の分離のための技術を含む。本明細書で説明されるように、複数の顔の分離技術は、計算処理上の複雑性を指数関数的なものから多項式的なものに低減する最大整合方式問題にマップされ得る。このようにして、これらの技術は、画像シーケンスのフレーム内の各顔に関して正確な特徴検出を提供する。
ROIオブジェクト区分システムは、例えば、本明細書で説明される技術を実施することができる。ROIオブジェクト・区分システムは、モード内区分とモード間区分とをサポートする。モード内区分は、ROIオブジェクト動作情報を使用せずに、画像シーケンス内のその他のフレームから独立して画像シーケンスのフレームを処理する。モード間区分は、現在のフレームと画像シーケンスのこれまでのフレームまたは後続のフレームとの間の動作を表示するROIオブジェクトに関する動作情報に基づいて、画像シーケンスのフレームを処理する。ROIオブジェクト区分システムは、1つまたは複数の区分モード決定係数に基づいて、受信されたフレームに対して、モード内区分を実行するか、またはモード間区分を実行するかを決定することができる。
開示された技術は、フレーム全体内の候補領域のセットから、ROIオブジェクト形状内に配置された画像フレームの定義された領域を自動的に選択することによって、モード内区分の間の前景オブジェクトの生成のための技術をさらに含む。開示された技術はまた、背景モデル形成と減算とに基づいて、モード間区分の間、前景オブジェクト内の移動領域を検出するための技術も含む。移動前景領域を首尾よく検出することにより、モード間区分の間、ROI特徴検出の性能速度を改善することができる。
1つの実施形態では、本開示は、画像シーケンスの画像フレームを受信することと、画像フレーム内のROI特徴を検出することと、検出されたROI特徴に基づいて、画像フレーム内のROIオブジェクト形状を概算することとを備える方法を提供する。この方法は更に、検出されたROI特徴に基づいて、画像フレームを、多数の候補領域へ区分することと、画像フレームのROIオブジェクト形状内に位置する候補領域のうちの1または複数を、ROIオブジェクトとして選択することとを備える。
別の実施形態では、本開示は、コンピュータ読取可能媒体を備える。このコンピュータ読取可能媒体は、画像シーケンスの画像フレームを受信することと、画像フレーム内のROI特徴を検出することと、検出されたROI特徴に基づいて、画像フレーム内のROIオブジェクト形状を概算することとを、プログラム可能なプロセッサに実行させる。これら命令群はまた、検出されたROI特徴に基づいて、画像フレームを、多数の候補領域へ区分することと、画像フレームのROIオブジェクト形状内に位置する候補領域のうちの1または複数を、ROIオブジェクトとして選択することとを、プログラム可能なプロセッサに実行させる。
別の実施形態では、本開示は、画像シーケンスの受信された画像フレーム内のROI特徴を検出するROI特徴検出器と、検出されたROI特徴に基づいて、受信された画像フレーム内のROIオブジェクト形状を概算するオブジェクト形状概算モジュールとを備える自動ROIオブジェクト区分システムを提供する。この自動ROIオブジェクト区分システムはまた、検出されたROI特徴に基づいて、受信した画像フレームを、多数の候補領域へ区分する領域区分モジュールと、受信した画像フレームのROIオブジェクト形状内に位置する候補領域のうちの1または複数をROIオブジェクトとして選択するオブジェクト生成モジュールとを備える。
更なる実施形態では、本開示は、画像シーケンスの画像フレームを受信することと、前記画像フレーム内の、目の特徴と口の特徴とを含む顔面を含む関心領域(ROI)特徴を検出することと、検出されたROI特徴に基づいて、画像フレームを多数の候補領域へ区分することとを備える方法を提供する。この方法はまた、目の特徴候補と口の特徴候補とを目と口との三角形へ組み合わせることと、画像フレーム内の目と口との三角形の方向に基づいて目と口との三角形を検証することと、この検証に基づいて、候補領域のうちの1または複数をROIオブジェクトとして選択することとを備える。
別の実施形態では、本開示は、画像シーケンスの画像フレームを受信することと、画像フレーム内の、目の特徴と口の特徴とを含む顔面を含む関心領域(ROI)特徴を検出することと、検出されたROI特徴に基づいて、画像フレームを多数の候補領域へ区分することとを、プログラム可能なプロセッサに実行させる命令群を備えたコンピュータ読取可能媒体を提供する。これら命令群はまた、目の特徴候補と口の特徴候補とを目と口との三角形へ組み合わせることと、画像フレーム内の目と口との三角形の方向に基づいて、目と口との三角形を検証することと、この検証に基づいて、候補領域のうちの1または複数をROIオブジェクトとして選択することとを、プログラム可能なプロセッサに実行させる。
別の実施形態では、本開示は、画像シーケンスの画像フレーム内のROI特徴を検出するROI特徴検出器を備えるシステムを提供する。ここで、ROI特徴は、目の特徴と口の特徴とを含む顔面を含む。このシステムはまた、検出されたROI特徴に基づいて、画像フレームを、多数の候補領域へ区分する領域区分モジュールと、目の特徴候補と口の特徴候補とを目と口との三角形へ組み合わせ、画像フレーム内の目と口との三角形の方向に基づいて、目と口との三角形を検証する特徴検証モジュールと、この検証に基づいて、候補領域のうちの1または複数をROIオブジェクトとして選択するオブジェクト生成モジュールとを備える。
本明細書で説明される技術は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せで実施され得る。ソフトウェアで実施される場合、技術は、単一のプロセッサまたはプロセッサの任意の組合せを含めて、プログラム可能プロセッサによって実行された場合、本明細書で開示される方法の1つまたは複数を実行する命令を含むプログラム・コードを備えるコンピュータ可読媒体によって一部実施され得る。
1つまたは複数の実施形態の詳細は、添付の図面および下の説明で記載される。その他の特徴機能、オブジェクト、および利点は、説明および図面から、ならびに特許請求の範囲から明らかになるであろう。
詳細な説明
図1は、画像シーケンスからのROI画像オブジェクトの自動区分のための技術を実施する関心領域(ROI)オブジェクト区分システム14を例示するブロック図である。ROIオブジェクト区分は、画像電話(VT)アプリケーションおよび画像監視アプリケーションなど、画像シーケンスを利用する幅広いマルチメディア・アプリケーションで有用であり得る。
例えば、画像監視アプリケーションでは、捕捉された画像シーケンスから区分されたROIオブジェクトは、顔のデータベース・システム内へのインプットであり得る。顔のデータベース・システムは、データベース内に記憶された目標顔オブジェクトに正確に整合させるために、区分されたROIオブジェクト(例えば、人の顔)を使用することができる。
もう1つの例として、VTアプリケーションでは、捕捉された画像シーケンスから区分されたROIオブジェクトは、画像シーケンスエンコーダ内へのインプットであり得る。画像シーケンスエンコーダは、受信者への伝送のために、より高い品質を用いてROIを符号化する目的で、区分されたROIオブジェクトにより多くのリソースを割り当てることが可能である。
その他の例は、人物が、生放送もしくは事前記録されたニュース放送または娯楽放送など、情報画像を提示する画像放送アプリケーションを含む。かかるアプリケーションでは、取材記者またはトークショーの司会者など、司会者の顔に対応するROIオブジェクトを優先的に符号化することが所望される可能性がある。
図1で示されるように、システム14は、画像源12から画像シーケンスを受信する。画像源12は、カメラなど、画像シーケンスを取得する画像捕捉装置、または事前記録された画像シーケンスを記憶する画像アーカイブであり得る。システム14は、受信された画像シーケンスからROIオブジェクトを自動的に区分する。ROIオブジェクト区分システム14は、ROIオブジェクト区分処理の間に、画像源12から取得された画像シーケンスの画像フレームを画像メモリ16内に記憶する。画像シーケンスの各フレームが処理された後、システム14は、区分された画像フレームのアウトプット画像をマルチメディア・アプリケーション18に送る。
例えば、ROIオブジェクトは、人の顔または頭、および人体の肩の範囲を備え得る。ROIオブジェクトは、画像フレーム内の「前景」オブジェクトと呼ばれる場合があり、非ROI範囲は、画像フレーム内の「背景」範囲と呼ばれる場合がある。ROIオブジェクト・区分システム14は、マルチメディア・アプリケーション18のユーザにとって関心あるものであり得る画像シーケンス内のフレームの1つまたは複数の選択された前景オブジェクトを画像シーケンスの背景範囲から抽出する。マルチメディア・アプリケーション18は、画像シーケンスから区分されたROIオブジェクトを優先的に利用することができる。一つの実施形態では、マルチメディア・アプリケーション18は、顔のデータベース・システムを組み込んだ画像監視アプリケーションを備え得る。もう1つの実施形態では、マルチメディア・アプリケーション18は、ROI動作可能にされた画像エンコーダエンコーダ・デコーダ(CODEC)を組み込んだ、画像電話(VT)アプリケーションを備え得る。
マルチメディア・アプリケーション18が、画像監視アプリケーションを備える実施形態では、捕捉された画像シーケンスから区分されたROIオブジェクトは、顔のデータベース・システム内へのインプットであり得る。この場合、画像源12は、監視カメラからの事前記録された画像シーケンスを記憶する画像アーカイブであり得る。顔のデータベース・システムは、データベース内に記憶された目標顔オブジェクトに正確に整合させるために、区分されたROIオブジェクト(例えば、人の顔)を使用することができる。警察は、監視画像シーケンスから容疑者を識別するために、顔のデータベース・システムを有するROIオブジェクト区分システム14を利用することができる。
マルチメディア・アプリケーション18がVTアプリケーションを備える実施形態では、捕捉された画像シーケンスから区分されたROIオブジェクトは、ROI動作可能にされた画像エンコーダエンコーダへのインプットであり得る。VTアプリケーションは、テレビ会議などのアプリケーションをサポートするために、ユーザが画像および音声の情報を共有することを可能にする。VTシステムでは、ユーザは画像情報を送ることおよび受信すること、単に画像情報を受信すること、または単に画像情報を送ることが可能である。この場合、画像源12は、カメラなど、画像シーケンスを取得する画像捕捉装置であり得る。例えば、画像源12は、もう1つの通信装置と画像電話に参加することが可能な通信装置内に含まれたビデオカメラを備え得る。
ROI動作可能にされた画像エンコーダは、有線または無線の通信をサポートするために適切な送信電子工学、受信電信工学、モデム電信工学、および処理電子工学をさらに含む通信装置内に常駐し得る。例えば、ROI動作可能にされた画像エンコーダは、その他の端末と通信するために装備された無線移動体端末内または有線端末内に常駐し得る。無線移動体端末の例は、移動体無線電話、移動体パーソナル・デジタル・アシスタント(PDA)、移動体コンピュータ、または無線通信能力と画像エンコード能力および/またはデコード能力とを備えたその他の移動体装置を含む。例えば、ROI動作可能にされた画像エンコーダエンコーダは、VTアプリケーションで使用される、いわゆる、カメラ電話内または画像電話内に常駐し得る。有線端末の例は、デスクトップ・コンピュータ、画像電話、ネットワーク装置、セット・トップ・ボックス、インタラクティブ・テレビなどを含む。
ROI動作可能にされた画像エンコーダは、ROIオブジェクト区分システム14から受信されたアウトプット画像内に含まれた、区分されたROIオブジェクトを優先的にエンコードすることができる。例えば、ROI動作可能にされた画像エンコーダは、追加のコーディング・ビットを画像フレームのROIオブジェクトに割り当て、減じられた数のコーディング・ビットを画像フレームの非ROI領域に割り当てることができる。移動体アプリケーションでは、特に、画像フレームをエンコードするために利用可能なエンコードビットの量は、少なく、かつ無線チャネル条件に従って変化する可能性がある。したがって、ROIオブジェクトへのコーディング・ビットの優先的な割り当ては、適用可能なビットレート要件に効率的に準拠すると同時に、ROIオブジェクトの視覚的品質を改善するのに役立つ可能性がある。したがって、ROIオブジェクトの優先的なエンコードにより、受信者は、画像シーケンスの非ROI領域よりも、より明確にROIオブジェクトを閲覧することが可能である。エンコードされた画像フレームは、次いで、有線または無線の通信チャネル上でもう1つの通信装置に送信されることが可能である。
上記のように説明したように、ROIオブジェクト区分システム14は、画像シーケンスからのROI画像オブジェクトの自動区分のための技術を実施することが可能である。開示された技術は、画像シーケンスの画像フレーム内のROI特徴(すなわち、顔面および顔の特徴)を検出することと、画像フレームを複数の候補領域に区分することと、画像フレームおよび画像シーケンスのこれまでの画像フレームに基づいて、背景(非ROI)減算を実行することとを組み合わせるハイブリッド技術を含む。このようにして、開示された技術は、正確な前景(ROI)オブジェクトの生成と、画像シーケンス内のフレームからの前景オブジェクトの低複雑性の抽出とを提供することができる。
開示された技術はまた、対称位置特性および形状特性など、顔の特徴の固有の属性に基づいて、画像シーケンスの画像フレーム内で検出された顔の特徴の検証のための技術も含む。加えて、開示された技術は、画像シーケンスの画像フレーム内の複数の個々の顔に関して検出された顔の特徴の分離のための技術を含む。本明細書で説明されるように、複数の顔の分離技術は、計算処理上の複雑性を指数関数的なものから多項式的なものに低減する最大整合方式問題にマップされ得る。このようにして、これらの技術は、低減された処理要件により、画像シーケンスのフレーム内の各顔に関して正確な特徴検出を提供する。
ROIオブジェクト区分システム14は、区分の複数の(例えば、2つの)モード、すなわち、モード内とモード間とをサポートする。モード内区分は、画像シーケンス内のその他のフレームから独立して画像シーケンスのフレームを処理する。この場合、ROIオブジェクト動作情報は使用されない。モード内区分は、第1の、高複雑性の区分モードである。モード間区分は、これまでのフレーム情報または後続のフレーム情報に基づいて、画像シーケンスのフレームを処理し、一般に、より低い複雑性の区分モードである、第2の、低複雑性の区分モードである。モード間区分は、現在のフレームと画像シーケンスの1つまたは複数のこれまでのフレームまたは後続のフレームの間のROIオブジェクトに関する動作情報を使用する。したがって、モード間区分は、比較的低複雑性の区分モードである。
ROIオブジェクト区分システム14は、1つまたは複数の区分モード決定係数に基づいて、受信されたフレームに対して、モード内区分を実行するか、またはモード間区分を実行するかについて決定することができる。画像フレームに関する動作情報の参照を伴わない画像フレームからのROIオブジェクトの区分、すなわち、モード内区分は、高複雑性の区分モードが選択された場合に適用される。画像フレームおよび画像シーケンスの異なる画像フレームに関する動作情報に基づく画像フレームからのROIオブジェクトの区分は、低複雑性の区分モードが選択された場合に適用される。
開示された技術は、フレーム全体の候補領域のセットから、ROIオブジェクト形状内に配置された画像フレームの定義された領域を自動的に選択することによって、モード内区分の間の前景オブジェクトの生成のための技術をさらに含む。開示された技術はまた、背景モデル形成と減算とに基づいて、モード間区分の間、前景オブジェクト内の移動領域を検出するための技術も含む。移動前景領域を首尾よく検出することは、モード間区分の間、ROI特徴検出の性能速度を改善する可能性がある。背景モデル形成および減算技術は、雑音と移動背景領域とに関して頑強である。技術はまた、計算処理上集中的な動作推定演算を用いる移動オブジェクト区分手法よりも、実質的により効率的である。
モード内区分の場合、ROIオブジェクト区分システム14は、まず、画像フレーム内の顔面を検出し、次いで、人の目および口など、顔面内の顔の特徴を検出する。システム14は、次いで、擬似の顔の特徴検出を除去するために、人の顔の特徴の幾何学的属性と形状特性とに基づいて特徴検証を実行する。その後、システム14は、フレームが2つ以上の人の顔を含むかどうかを判断して、検出された顔の特徴を個々の顔に関するグループに分離する。顔の特徴の幾何学的位置およびROI幾何モデルに基づいて、ROIオブジェクトが概算される。例えば、ROI幾何モデルは、人の頭および肩の幾何学モデルを備え得る。
システム14は、候補領域のセットを生成するために画像フレームに対して領域増大を実行する。システム14は、次いで、フレーム全体向けの候補領域のセットから、結果として生じるROIオブジェクト形状内に配置された領域を選択することによって前景オブジェクトを生成する。システム14は、次いで、2個以上の前景オブジェクトが存在するかどうかを判断して、アウトプット画像向けの組み合わされた前景オブジェクトを形成するために、複数の前景オブジェクトを一緒に統合する。複数の前景オブジェクトを統合すると、適用可能である場合、システム14は、例えば、監視アプリケーションでの個人識別検出またはVTアプリケーションでの優先的なエンコードのために、区分されたフレームのアウトプット画像をマルチメディア・アプリケーション18に送る。
モード間区分の場合、ROIオブジェクト区分システム14は、画像シーケンスの連続する画像フレームの時間的相関性を活かすために、背景モデル形成および減算技術を使用する。このようにして、本明細書で説明される技術は、拡張された効率を提供する。システム14は、現在のフレームとこれまでのフレームの間のROIオブジェクト内の移動画素を前景画素として分類する。システム14は、次いで、前景画素に基づいて、移動前景領域を生成する。システム14は、次いで、移動前景領域内のROI特徴と、これまでのフレーム内の顔面および顔の特徴位置とを検出することができる。このようにして、システム14は、画像シーケンスの各フレームのための領域区分を実行することの計算処理上の複雑性を低減する。システム14は、次いで、アウトプット画像にから移動前景領域をこれまでのフレームの前景オブジェクトと統合し、区分されたフレームのアウトプット画像をマルチメディア・アプリケーション18に送る。
ROIオブジェクト区分システム14は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せで実施され得る。例えば、ROIオブジェクト区分システム14の様々な態様は、1つまたは複数のデジタル信号プロセッサ(DSP)、マイクロプロセッサ、特定アプリケーション向け集積回路(ASIC)、フィールド・プログラム可能な論理アレイ(FPGA)、または任意のその他の等価の集積論理回路または離散的論理回路、ならびにかかる成分の任意の組合せの範囲内で実施され得る。用語「プロセッサ」は、一般に、単独でまたはその他の論理回路との組合せで、前述の論理回路のいずれかを指す場合があり、かかるプロセッサの1つまたは複数を指す場合がある。ソフトウェアで実施された場合、ROIオブジェクト区分システム14に帰される機能性は、ランダム・アクセス・メモリ(RAM)、読出し専用メモリ(ROM)、不揮発性ランダム・アクセス・メモリ(NVRAM)、電気的に消去可能でプログラム可能な読取り専用メモリ(EEPROM)、フラッシュメモリ、磁気媒体、光媒体など、コンピュータ可読媒体上の命令として実施され得る。命令は、本開示で説明される機能性の1つまたは複数の態様をサポートするために実行される。
図2Aおよび2Bは、画像シーケンスの画像フレーム22内のROIオブジェクト24および非ROI領域25の定義を例示するブロック図である。図2Bの例では、ROIオブジェクトは頭および肩のROIオブジェクト24として示される。その他の実施形態では、ROIオブジェクトは、長方形のROIオブジェクトまたは曲線的なもしくは不規則な形状を有する可能性がある非長方形のROIオブジェクトを備え得る。ROIオブジェクト24は、画像フレーム22内に提示された人物の顔26を含む。非ROI領域25、すなわち、背景は、図2Bで影によって強調表示される。
ROIオブジェクト24は、図1からのROIオブジェクト区分システム14によって画像シーケンスから自動的に区分されることが可能である。VTアプリケーションの場合、通信装置は、ROI動作可能にされたエンコーダを用いてROIオブジェクト24を優先的にエンコードすることができる。その場合、ROIオブジェクト24は、テレビ会議の参加者の顔26を含む、画像フレーム22の部分を包括し得る。その他の例は、ストリーミング画像(例えば、情報画像またはニュース放送もしくは娯楽放送)内の情報を提示する人物の顔を優先的にエンコードすることを含む。ROIオブジェクト24のサイズ、形状、および位置は、固定され得、または調整可能であり得、様々な方法で定義、説明または調整され得る。
ROIオブジェクト24は、画像の送信者が、人物の顔26など、送信された画像フレーム22内の個々のオブジェクトを強調することを可能にする。逆に、ROIオブジェクト24は、画像の受信者が、受信された画像フレーム22内の所望されるオブジェクトをより明確に閲覧することを可能にする。いずれの場合も、ROIオブジェクト24内の顔26は、画像フレーム22の背景領域など、非ROI領域25に対してより高い画像品質でエンコードされる。このようにして、ユーザは顔の表情、唇の動き、目の動きなどをより明確に閲覧することができる。いくつかの実施形態では、ROIオブジェクトはまた、追加のコーディング・ビットだけでなく、拡張された擬似検出および耐障害性も用いてエンコードされることも可能である。
図3は、画像シーケンスのROIオブジェクト内に提示されたオブジェクトに関するオブジェクト移動/回転と、形状変形の変化を例示する。特に、図3のフレーム0および1内に描写された人物の頭は、その位置をかなり変える。図3の例では、人物の頭は、フレーム0に対してフレーム1内で傾いている。図4は、画像シーケンスのROIオブジェクト内の人物に関する顔の表情の変化を例示する。特に、フレーム0および1内に描写された人物の口は、かなり閉じた位置から大きく開いた位置に変化する。したがって、図3および4は、画像シーケンスのROIオブジェクトの大量の移動の事例を表す。
図5Aは、図1からのROIオブジェクト区分システム14の例示的な動作を示すフローチャートである。ROIオブジェクト区分システム14は、画像シーケンスからのROIオブジェクトの自動的区分のための技術を実施する。上で説明されたように、ROIオブジェクト区分システム14は、画像シーケンスを処理するために、モード内区分およびモード間区分の両方をサポートする。
ROIオブジェクト区分システム14は、画像源12から画像シーケンスの第1のフレームを受信する(30)。ROIオブジェクト区分システム14は、受信されたフレームに対してモード内区分を実行する(32)。モード内区分は、画像シーケンス内のその他のフレームから独立して画像シーケンスの現在のフレームを処理する。モード内区分の場合、ROIオブジェクト区分システム14は、ROIオブジェクト移動情報を使用しない。モード内区分を実行する間、ROIオブジェクト区分システム14は、画像シーケンスの受信されたフレームを画像メモリ16内に記憶する。ROIオブジェクト区分システム14は、次いで、区分されたフレームのアウトプット画像をマルチメディア・アプリケーション18に送る(34)。
ROIオブジェクト区分システム14は、画像源12から画像シーケンスの次のフレームを受信する(36)。システム14は、次いで、受信されたフレームに対して、モード内区分を実行するか、またはモード間区分を実行するかを判断するために、モード決定を行う(37)。モード決定は、1つまたは複数の区分モード決定係数に基づくことが可能である。例えば、システム14は、受信されたフレームの計算処理上の複雑性、受信されたフレームのための区分の所望される品質、受信されたフレームとこれまでのフレームの間の類似性の量、受信されたフレームとこれまでのフレームの間の移動活動の量、これまでのフレームのために使用された区分モード、および最後のモード内処理以来、区分されたフレームの数など、区分モード決定係数に基づいて、どの区分モードが受信されたフレームに対して実行されるかを決定することができる。その他の実施形態では、区分モード決定は、追加の区分モード決定計係数に基づくことが可能である。
システム14がモード内区分を実行しないことを決定する場合(37の「いいえ」ブランチ)、ROIオブジェクト区分システム14は、これまでのフレームに基づいて、受信されたフレームに対してモード間区分を実行する(38)。この場合、ROIオブジェクト区分システム14は、画像シーケンスのこれまでのフレームから(例えば、画像メモリ16から)動作情報を取り出して、動作情報を現在のフレームとこれまでのフレームの間のROIオブジェクトのために使用する。モード間区分を実行する間、ROIオブジェクト区分システム14は、画像シーケンスの受信されたフレームを画像メモリ16内に記憶する。ROIオブジェクト区分システム14は、次いで、区分されたフレームのアウトプット画像をマルチメディア・アプリケーション18に送る(40)。
ROIオブジェクト区分システム14は、引き続き画像源12から画像シーケンスのフレームを受信する。システム14がモード間区分を実行することを決定した場合(37の「はい」ブランチ)、ROI区分システム14は、受信されたフレームに対してモード内区分を再び実行する(32)。したがって、ROIオブジェクト区分システム14は、画像源12から受信された画像シーケンスのフレームのいくつかに対してモード内区分を実行して、画像シーケンスのその他のフレームに対してモード間区分を実行する。
図5Bは、図5Aからの区分モード決定(ステップ37)をより詳細に例示するフローチャートである。ROIオブジェクト区分システム14は、1つまたは複数の区分モード決定係数に基づいて区分モード決定を行うことができる。システム14は、受信されたフレームに対して実行するための区分のモードを決定するために、図5で例示されたステップの1つまたは複数を実行することができる。いくつかの実施形態では、システム14は、ステップを個々に実行すること、または任意の順序でステップの1つまたは複数を組み合わせることが可能である。その他の実施形態では、ROIオブジェクト区分システム14は、受信されたフレームに対してモード内区分を実行するか、またはモード間区分を実行するかを決定する場合、追加の区分モード決定係数を考慮することができる。
システム14は、受信されたフレームの計算処理上の複雑性を決定することができる(46)。例えば、システム14は、受信されたフレーム内に含まれたROI特徴候補の数を決定するために受信されたフレームを調査することができる。フレームが大量のROI特徴を含む場合、受信されたフレームは、モード間区分処理がフレームからROIオブジェクトを正確に区分するにはあまりにも複雑すぎる可能性がある。したがって、システム14は、高複雑性の画像フレームを処理するために計算処理上の複雑性が所定のレベルより高い場合、モード内区分を実行することを決定することができる。システム14はまた、最終利用者から区分の所望される品質を決定することもできる(48)。例えば、ROI区分システム14を実施する画像通信装置の最終利用者が、受信された画像フレームに関して所定のレベルより高い品質の区分を要求する場合、システム14は、受信されたフレームに対してモード内区分を実行することができる。逆に、最終利用者が受信された画像フレームに関して所定のレベル未満の品質の区分を要求する場合、システム14は、受信されたフレームに対してモード間区分を実行することができる。
加えて、システム14は、受信されたフレームとこれまでのフレームの間の類似性の量を決定することが可能である(50)。例えば、システム14は、2個のフレームのカラー・ヒストグラム間の類似性の量が所定のレベルより高いかどうかを判断するために、受信されたフレームをこれまでのフレームと比較することができる。2個のフレーム間の大きな色変化は、シーンの変化を表示する可能性がある。この場合、システム14は、受信されたフレーム内の潜在的な新しいROIオブジェクトを区分するために、モード内区分を実行することができる。カラー・ヒストグラムが2個のフレーム間で依然として実質的に類似する場合、システム14はモード間区分を実行することができる。
システム14は、受信されたフレームとこれまでのフレームの間の動作活動の量を決定することが可能である(52)。例えば、システム14は、フレーム内のROIオブジェクトの位置の間の移動量が所定のレベルより高いかどうかを判断するために、受信されたフレームをこれまでのフレームと比較することができる。ROIオブジェクトが、2個のフレーム内の実質的に異なる領域または位置を占有する場合、システム14は、モード内区分を実行することができる。ROIオブジェクトが、2個のフレーム内の実質的に同じ領域または位置を占有する場合、システム14はモード間区分を実行することができる。
上のステップで、画像シーケンスのROI区分処理は、任意の順序で画像シーケンスの画像フレームに対して実行される任意の数のモード内区分と任意の数のモード間区分とを含み得る。例えば、モード内区分は0として表されることが可能であり、モード間区分は1として表されることが可能である。例示的な画像シーケンス区分において、フレームのセットのモード内区分(0)およびモード間区分状態(1)は、0011011110として表されることが可能である。この場合、区分モード決定は、受信されたフレームの属性、または受信されたフレームとこれまでのフレームの間の属性に単に基づく。
システム14はまた、これまでのフレームを区分するために使用された区分モードに基づいて、受信されたフレームに対してどの区分モードが実行されるかを判断することも可能である。システム14は、これまでのフレームがモード内処理によって区分されたかどうかを判断することができる(54)。これまでのフレームがモード内処理によって区分された場合、システム14は、受信されたフレームをモード間処理によって区分することを決定することができる。このステップでは、画像シーケンスのROI区分処理は、モード間区分が常にモード内区分に続くように、画像シーケンスの画像フレームに対して実行される任意の数のモード内区分と任意の数のモード間区分とを含み得る。例示的な画像シーケンス区分において、フレームのセットのモード内(0)およびモード間状態(1)は、0110111101として表されることが可能である。この場合、区分モード決定は、これまでのフレームの区分モードに単に基づく。
さらに、システム14は、最後のモード内区分されたフレーム以来、区分されたフレームの数を決定することが可能である(56)。例えば、システム14は、N個のフレームごとになど、周期ベースでモード内区分を実行することを決定することができる。場合によっては、第N番目のフレームは、第10番目のフレームを備える可能性がある。その他の実施形態では、Nは10個のフレーム以上または以下であり得る。このステップでは、画像シーケンスのROI区分処理は、モード内区分が周期的に実行されるように、画像シーケンスの画像フレームに対して実行される任意の数のモード内区分と任意の数のモード間区分とを含み得る。例示的な画像シーケンス区分において、フレームのセットのモード内(0)およびモード間状態(1)は、0111011101として表されることが可能である。この場合、区分モード決定は、第4番目のフレームごとにモード内区分を実行することに基づく。
図6は、画像源12から受信された画像シーケンスのフレームに対してモード内区分を実行する場合のROIオブジェクト区分システム14を例示するブロック図である。この場合、ROIオブジェクト区分システム14は、画像シーケンスのその他のフレームから独立して、かつ動作情報なしに、画像シーケンスのフレームを処理する。図7〜13は、モード内区分の間、ROIオブジェクト区分システム14によって実施される技術の例示的な結果を示すスクリーン・ショットである。
図6内に例示された実施形態では、画像シーケンス12は、クロミナンス・ブルー・チャネル(Cb)60と、クロミナンス・レッド・チャネル(Cr)61と、輝度チャネル(Y)62とを含む。ROIオブジェクト区分システム14は、画像源12から受信された画像シーケンスの画像フレームから、人の頭および肩の範囲など、ROIオブジェクトを自動的に区分するための技術を実施する。開示された技術は、モード内区分の間、特徴ベースおよびモデル・ベースの検出を領域区分と組み合わせるハイブリッド技術を含む。
ROIオブジェクト区分システム14は、画像源12のクロミナンス・ブルー・チャネル60とクロミナンス・レッド・チャネル61とから受信されたブルー・チャネルとレッド・チャネルのクロミナンス値に基づいて、画像フレーム内の皮膚色領域を検出する顔面検出器64を含む。顔面検出器64は、次いで、検出された皮膚色領域の画素を顔の画素として分類する。このようにして、顔面検出器64は、受信されたフレーム内の顔の画素でない画素を除去することによって顔面を取得することができる。顔面が取得された後で、顔面検出器64は、目および口の領域など、顔の特徴による顔面内の雑音およびホールを除外するために膨張および侵食の数学的な形態的演算を使用する。図7は、標準「母と娘」画像テスト系列のフレームに関する迅速な顔面検出の例を示す。
一般に、顔面検出器64は、YCbCr色空間内に狭くかつ一貫して分布されたクロミナンス値のある種のセットの存在によって、画像フレーム内の皮膚色領域を識別することが可能な皮膚色マップを使用する。皮膚色マップは、異なる種類の皮膚色に対してロバストである。人類の皮膚色は、主に皮膚の黒さと白さによって異なって認識される。すなわち、皮膚色は、CrまたはCbではなく、Yによって支配される色の明るさの違いによって特徴付けられる。したがって、効果のある皮膚色マップは、受信されたフレームのCrおよびCbの成分だけに基づいて実現され得る。顔面検出器64は、受信された画像フレーム内の皮膚色領域を検出するために、Cr∈[133,173]およびCb∈[77,127]の範囲の有するCbCr皮膚色マップを利用することが可能である。Cr範囲およびCb範囲は、限定的なものと考えるべきではなく、顔面検出器64は、異なるCr範囲およびCb範囲を有する皮膚色マップを利用することが可能である。
場合によっては、顔面検出器64は、人の顔を排他的に取得することができない可能性がある。図7で例示されたように、フレーム内の母と娘の衣類の領域は、皮膚の色調マップによって定義されるものに類似した色調を有するようである。したがって、顔面検出器64は、衣類の領域を誤って顔面の一部として選択する可能性がある。本明細書で説明される迅速な顔面検出ステップは、フレーム内の顔でない一部の領域を除外するが、正確な顔の領域を取得および検証するためにさらなる処理が必要とされる可能性がある。
システム14は、顔面内の顔の特徴候補を検出する目検出器66および口検出器67と、目および口の候補から顔の特徴を選択する特徴検証モジュール68とを含む。顔フィルタは、一般に、顔の領域の楕円形状、および顔の特徴の中の全体的な空間的関係制約など、人の顔およびそれらの特徴の一般知識に基づいて構築される。したがって、これらの顔の特徴の位置を突き止めることは、画像フレーム内のおよその顔の位置を導出する際に有用である。
目検出器66は、顔面検出器64によって取得された顔面内の目の特徴候補を検出する。目検出器66は、2つの考察に基づいて目の特徴候補を検出する。第1に、目の周りのクロミナンス成分は、通常、高いCb値と低いCr値とを含む。したがって、目検出器66は、下で提示される方程式(1)に基づいてフレームのクロミナンス目マップを構築することができる。
Figure 0004988770
クロミナンス目マップが取得されると、目検出器66は、目の候補に関して目マップ内の最も明るい領域の位置を突き止めるために、しきい値を目マップ内の各画素のクロミナンス(C)目マップ値に適用することができる。目検出器66は、次いで、実質的に近接した最も明るい領域を単一の目の候補に統合するために、形態的演算を適用する。図8Aは「母と娘」画像テスト系列のフレームのクロミナンス目マップ内の目の検出の例を示す。
第2に、目は、通常、輝度成分内に黒い画素および明るい画素の両方を含む。したがって、目の領域の回りの輝度成分内のより明るい画素とより暗い画素とを強調するために、グレー・スケール形態的演算が使用され得る。目検出器66は、下で提示される方程式(2)に基づいてフレームの輝度目マップを構築することができる。
Figure 0004988770
輝度目マップが取得されると、目検出器66は、目の候補に関して目マップ内の最も明るい領域の位置を突き止めるために、しきい値を目マップ内の各画素の輝度(L)目マップ値に適用することができる。目検出器66は、次いで、実質的に近接した最も明るい領域を単一の目の候補に統合するために、形態的演算を適用する。図8Bは、「母と娘」画像テスト系列のフレームの輝度目マップ内の目の検出の例を示す。
目検出器66は、顔面内の最終的な目の候補を見つけるために、(図8Aで示された)クロミナンス目マップ内で検出された目の候補を、(図8Bで示された)輝度目マップ内で検出された目の候補と組み合わせる。しかし、場合によっては、最終的な目の候補は、依然として不正確な目の候補を含む場合がある。これらの異質の目の候補は、後に特徴検証処理の間に除外され得る。
口検出器67は、顔面検出器64によって取得された顔面内の口の特徴候補を検出する。一般に、口領域の色は、その他の顔の領域よりも、より強い赤色成分と、より弱い青色成分とを含む。したがって、口領域では、クロミナンス成分Crはクロミナンス成分Cbよりも多いはずである。しかし、口領域は、Cr/Cb特徴内で比較的低い反応を有するが、Cr特徴内で比較的高い反応を有する。口検出器67は、下で提示される方程式(3)および(4)に基づいてフレームの口マップを構築することができる。
Figure 0004988770
Figure 0004988770
口マップが取得されると、口検出器67は、口の候補に関して口マップ内の最も明るい領域の位置を突き止めるために、しきい値を口マップ内の各画素の口(M)値に適用することができる。口検出器67は、次いで、実質的に近接した最も明るい領域を単一の口の候補に統合するために、形態的演算を適用する。図9は、「母と娘」画像テスト系列のフレームの口マップ内の口の検出の例を示す。
特徴検証モジュール68は、目および口の候補から正確な顔の特徴を選択するために、目検出器66と口検出器67とによって顔面内で検出された顔の特徴候補を検証する。特徴検出モジュール68は、頑強なROI特徴検出処理を確実にする。上で説明された目および口のマップ処理は、目および口の領域を分類する際に効果があるが、いくつかの誤った分類は、依然として、擬似の顔の特徴検出という結果をもたらす可能性がある。特徴検証モジュール68は、顔面内で顔の特徴候補を検証して、任意の擬似の顔の特徴検出を除去するために、3つの検証ステップを実行する。
第1に、顔の形態学の点から、顔の特徴は、一般に、領域内の高輝度コントラストによって特徴付けられる「くぼみ」領域、すなわち、陥凹領域内に配置されることが観察される。したがって、特徴検出モジュール68は、グレー・スケール近接・膨張形態的演算を実行することによって、くぼみ領域を識別する。特徴検証モジュール68は、次いで、フレーム内の顔の特徴候補の位置をフレーム内のくぼみ領域の位置と比較する。顔の特徴候補が、検出されたくぼみ領域の範囲に少なくとも一部重複しない場合、特徴検証モジュール68は、その顔の特徴候補を考慮から除外することになる。したがって、顔の特徴候補を保持するために、特徴検証モジュール68は、特徴と識別されたくぼみ領域のうちの1つとの相関性を要求する。図10Aは、「母と娘」画像シーケンスのフレーム内で識別されたくぼみ領域を例示する。
第2に、特徴検証モジュール68は、フレーム内の対称位置および形状特徴など、目の対の固有の属性に基づいて目の特徴候補を検証する。図10Bは、それぞれの重心OおよびOを有する目の対の固有の属性を例示する。例えば、2つの目は、|AO|=|AO|であるように、顔の主軸Aに関して対称であり、両目は類似範囲を有し、両目は、軸OAに対して投影することによって比較され得る類似の形状を有する。2つの目はまた、それぞれのPCA(主成分分析)軸、すなわち、PCAおよびPCAに関しても対称である。加えて、眉は、通常、2つの目の上に検出され得る。
特徴検証モジュール68は、顔面内の目の特徴候補を検証するために、重み付けされた得点システムを利用することができる。この場合、特徴検出モジュール68は、目の対の属性に基づいていくつかの基準をチェックして、基準の各々に関して得点を提供する。例えば、特徴検証モジュール68は、目の重心位置がくぼみ領域内部にあるかどうかを判断する。次に、特徴検証モジュール68は、目の重心の位置と検出された虹彩とが実質的に近接しているかどうかを判断する。虹彩の位置は、目の中の輝度値を横軸と縦軸とに投影して、累算された最低総輝度値に対応するポイントを識別することによって発見され得る。特徴検証モジュール68は、次いで、眉が目の上に発見されるかどうかを判断する。次に、特徴検証モジュール68は、目のPCA軸が合理的な方向の範囲内にあるかどうかを判断するが、これは典型的な人の目の対の経験的な特徴から判断され得る。特徴検証モジュール68は、次いで、目が合理的な距離内に目の対を有するかどうかを判断するが、これも経験的な特徴から判断され得る。次に、特徴検証モジュール68は、軸OAに従って、目の対が対称的なPCA軸を有するかどうかを判断する。特徴検証モジュール68は、次いで、軸OAに従って、目の対が対称的形状を有するかどうかを判断する。
特徴検証モジュール68は、候補から正確な顔の特徴を選択して、画像フレームの顔の特徴マップを構築するために、上で説明された各基準からの得点を累算する。様々な個々の基準に関して決定された得点は、等しく重み付けされることが可能であり、またはその他の基準に対して1つまたは複数の基準を強調するために、異なって重み付けされることも可能である。特徴検証モジュール68は、事前設定されたしきい値未満の累積得点を有するそれらの顔の特徴候補として擬似検出を識別する。特徴検証モジュール68は、次いで、それらの誤って検出された顔の特徴候補を除外する。
第3に、特徴検証モジュール68は、顔の特徴マップ内の2つの目の候補および1つの口の候補のあらゆる可能な組合せから目と口の三角形を検証する。特徴検証モジュール68は、まず、目と口の三角形の幾何学的形状と方向性とを精査して、合理的でない目と口の三角形をさらなる考察から除外する。合理的でないと見なされる目と口の三角形は、典型的な人に関して経験的に決定された目と口の三角形形状の範囲に実質的に整合しないそれらのものである。図10Cは、「母と娘」画像シーケンスのフレームの顔の特徴マップ内の2つの可能な目と口の三角形(破線)を例示する。特徴検証モジュール68は、次いで、目と口の三角形範囲の勾配特性を検証するためにテンプレートを使用する。人の顔は3次元(3D)オブジェクトであるため、顔の領域の全体にわたる輝度は不均等になりがちである。正規の目と口の三角形範囲は、顎など、その他の顔の範囲よりも勾配情報をより複雑にする鼻を含むべきである。目と口の三角形範囲から利用可能なより識別可能な勾配情報を使用して、特徴検証モジュール68は、画像フレーム内の顔に関して正確な目および口の候補を選択することができる。
システム14はまた、特徴検証モジュール68によって選択された顔の特徴をフレーム内の個々の顔に関するグループに分離する複数の顔分離モジュール70も含む。画像フレーム内に2つ以上の顔を含む母と娘系列などの画像シーケンスでは、複数の顔分離モジュール70は、目および口の候補のセットを異なる顔に対応するグループに分離する。このタスクの困難は三重である。第1に、画像フレーム内に含まれる顔の総数は知られていない。第2に、いくつかの顔の特徴は、画像フレーム内で検出されていない可能性がある。第3に、すべての潜在的な顔の特徴グループの組合せの網羅的なチェックは、指数関数的な計算処理上の複雑性を有する。問題を、目を口と対にするタスクに簡素化することによって、元の問題は多項式的な計算処理上の複雑性を有するグラフ理論問題にマップされ得る。結果として生じる、計算処理上の複雑性の抑圧は、限定された電力および処理リソースを有する移動体アプリケーション、ならびに高速の、場合によっては、リアルタイムの結果を要求するその他のアプリケーションを含めて、多くのアプリケーションにとって非常に望ましい可能性がある。
グラフ理論を適用して、複数の顔分離モジュール70は、頂点セットV={口}+{目の対}と輪郭線セットE={(v,v)}とを有する偶グラフG=(V,E)を考慮し、vおよびvは異なるセットに属し、ノードvおよびvの間の距離は合理的な範囲内である。整合するSが、S内の2つの輪郭線が同じ頂点に付随するものまたは直接的に連結された頂点でないように、Eのサブセットとして定義された場合、問題は最大整合方式問題になる。このように、元の最大整合方式問題定義では、整合に対する制約は、S内の2つの輪郭線が同じ頂点に付随しないことだけを要求するため、複数の顔分離処理は元の最大整合方式問題の可変要素である。
複数の顔分離問題を元の最大整合方式問題に変換する可能性を観察することは重要である。(v,v)∈E,(v,v)∈Eであるが
Figure 0004988770
であるようにvが存在する、輪郭線セットE’={(v,v)}が輪郭線セットをEからE∪E’に拡張した後で定義された場合、結果として生じる整合がE∪E’の代わりにEのサブセットでなければならないように、追加の制約が含まれなければならない点を除いて、問題は元の最大整合方式問題になる。したがって、複数の顔分離モジュール70は、多項式時間の複雑性における複数の顔分離問題を解決することができる。
システム14は、ROIオブジェクト幾何モデルに基づいて、画像フレーム内の各顔に関してROIオブジェクト形状を概算するオブジェクト形状概算モジュール72を含む。例えば、ROIオブジェクト形状は、人の頭および肩の幾何モデルに基づいて、フレーム内で概算され得る。特徴検証モジュール68が顔に関して正確な目と口の三角形を取得した後で、オブジェクト形状概算モジュール72は、目と口の三角形のノード間の幾何学的関係に基づいて、ROIオブジェクト形状(例えば、頭および肩のモデル)を構築することができる。
モード内区分の間の性能を加速するために、オブジェクト形状概算モジュール72は、人の頭および肩のオブジェクト形状など、ROIオブジェクト形状を概算するために簡単な長方形モデルを使用することが可能である。画像フレーム内に2つ以上の顔を含む画像シーケンスの場合、複数の顔分離モジュール70が目および口の候補を異なる顔に関するグループに分離した後、オブジェクト形状概算モジュール72は、個別の目と口の三角形に基づいて顔の各々に関してROIオブジェクト形状を概算する。例えば、オブジェクト形状概算モジュール72は、画像フレーム内に含まれた各顔に関して頭および肩のオブジェクト形状を概算することができる。図11は、「母と娘」画像テスト系列のフレーム内で各顔に関して定義された頭および肩のオブジェクト形状を例示する。
ROIオブジェクト区分システム14はまた、フレーム全体に対してスプリット・統合領域増大を実行する領域区分モジュール74も含む。領域区分モジュール74は、元のフレームを複数の同種の候補領域に分割する。スプリット・統合領域増大を実行する場合、領域区分モジュール74は、画像フレーム内の隣り合う画素間の関係を、類似するクラスと異なるクラスとに分類する。領域類似性は、領域内の平均画素輝度値に基づいて決定され得る。領域区分モジュール74は、次いで、連結された類似する画素を小さな領域にクラスタ化して、最低数の候補領域を形成するために、それらの領域を統合し続ける。図12は、画像フレームが当初1195個の領域に分割され、次いで、22個の候補領域が生成されるまで領域が統合される領域増大処理を例示する。
システム14は、フレーム全体内の候補領域から、概算されたROIオブジェクト形状内に配置されたフレームの領域を自動的に選択するオブジェクト生成モジュール76をさらに含む。選択された領域は前景領域と見なされることが可能であり、選択されなかった領域は、背景領域と見なされることが可能である。オブジェクト生成モジュール76は、次いで、前景領域に基づいて前景オブジェクトを生成する。
オブジェクト生成モジュール76は、オブジェクト形状概算モジュール72によって概算されたROIオブジェクト形状内に配置された、領域区分モジュール74によって生成された候補領域のセットだけから領域を選択する。上で説明されたように、ROIオブジェクト形状は、ROIオブジェクト(例えば、顔)を含む長方形範囲を備えることが可能であり、ROIオブジェクト形状のサイズは、顔に関して選択された目と口の三角形に基づいて推定され得る。このようにして、さらなる処理は、画像フレーム全体内での代わりにROIオブジェクト形状内で行われ得る。
オブジェクト生成モジュール76は、領域区分モジュール74によって生成された画像フレーム内の候補領域の各々を調査して、領域がROIオブジェクト形状内に配置されるかどうかを判断する。オブジェクト生成モジュール76は、ROIオブジェクト形状内の総画素の事前定義された割合(例えば、60%)を超える総画素を有する領域を前景領域と見なすことができる。オブジェクト生成モジュール76は、次いで、ROIオブジェクト形状内の総画素の事前定義された割合未満の総画素を有する画像フレーム内の残りの領域を背景領域と見なすことができる。このようにして、オブジェクト生成モジュール76は、画像フレーム内の前景領域から前景オブジェクトを生成する。
最後に、システム14は、フレーム内の複数の前景オブジェクトを最終的なアウトプット画像に統合するオブジェクト融合モジュール78を含む。2個以上の前景オブジェクトを含む画像シーケンスの場合、オブジェクト融合モジュール78は、アウトプット画像を形成するために前景オブジェクトを統合する。図13は、画像フレーム内の顔の各々に関する前景オブジェクトの生成と、2個の前景オブジェクトを統合することによるアウトプット画像の生成とを例示する。ROIオブジェクト区分システム14は、次いで、区分されたフレームのアウトプット画像をマルチメディア・アプリケーション18に送る。
図14は、モード内区分を実行するROIオブジェクト区分システム14の動作を例示するフローチャートである。動作は、本明細書で、図7で例示されたROIオブジェクト区分システム14を参照して説明される。ROIオブジェクト区分システム14は、画像源12から画像シーケンスのフレームを受信する(80)。モード内区分の場合、ROIオブジェクト区分システム14は、画像シーケンスのその他のフレームから独立して、かつ動作情報なしに、画像シーケンスの受信されたフレームを処理する。
顔面検出器64は、画像フレーム内で識別された皮膚色領域に基づいて、受信されたフレーム内の顔面を検出する(82)。顔面検出器64は、次いで、識別された皮膚色領域の画素を顔の画素として分類する。このようにして、顔面検出器64は、受信されたフレーム内の顔の画素ではない画素を除去することによって顔面を取得することができる。
目検出器66および口検出器67は、次いで、顔面内の顔の特徴候補を検出する(84)。目検出器66は、顔面内の画素のクロミナンス値と輝度値とに基づいて、目の特徴候補を検出することができる。装着検出器67は、顔面内の画素のクロミナンス値に基づいて、口の特徴候補を検出することができる。特徴検証モジュール68は、正確な顔の特徴を選択するために、目検出器66と口検出器67とによって検出された顔の特徴候補の検証を実行する。
ROIオブジェクト区分システム14は、次いで、受信された画像フレームが2つ以上の顔を含むか否かを判断する(87)。画像フレームが2つ以上の顔を含む場合、複数の顔分離モジュール70は、特徴検証モジュール68によって選択された顔の特徴をフレーム内に含まれた個々の顔に関するグループに分離する(88)。オブジェクト形状概算モジュール72は、次いで、特徴検証モジュール68によって選択された顔の特徴によって定義されたROIオブジェクト幾何モデルに基づいて、画像フレーム内の各顔に関してROIオブジェクト形状を概算する(90)。例えば、頭および肩のオブジェクト形状は、正確な目と口の三角形の位置に基づいて、フレーム内の各顔に関して概算され得る。
領域区分モジュール74は、フレーム全体に対してスプリット・統合領域増大を実行する(92)。領域区分モジュール74は、元のフレームを複数の同種の候補領域に分割する。オブジェクト生成モジュール76は、次いで、フレーム全体内の候補領域から、概算されたROIオブジェクト形状内に配置されたフレームの領域を選択する。選択された領域は前景領域と見なされることが可能であり、選択されなかった領域は背景領域と見なされることが可能である。オブジェクト生成モジュール76は、次いで、前景領域に基づいて前景オブジェクトを生成する(94)。
ROIオブジェクト区分システム14は、画像フレームが2個以上の前景オブジェクトを含むかどうかを判断する(95)。画像フレームが2個以上の前景オブジェクトを含む場合、オブジェクト融合モジュール78は、フレーム内の前景オブジェクトを最終的なアウトプット画像に統合する(96)。ROIオブジェクト区分システム14は、次いで、区分されたフレームのアウトプット画像をマルチメディア・アプリケーション18に送る(98)。
図15は、画像源12から受信された画像シーケンスのフレームに対してモード間区分を実行する場合のROIオブジェクト区分システム14を例示するブロック図である。この場合、ROIオブジェクト区分システム14は、現在のフレームと画像メモリ16内に記憶されたこれまでのフレームまたは後続のフレームの間のROIオブジェクトに関する動作情報に基づいて画像シーケンスのフレームを処理する。図16および17は、モード間区分の間、ROIオブジェクト区分システム14によって実施された技術の例示的な結果を示すスクリーン・ショットである。いくつかの実施形態では、ROIオブジェクト区分システム14は、画像シーケンスのフレームのいくつかに対して、図6〜14で説明されたように、モード内区分を実行し、1つまたは複数の区分モード決定係数に基づいて、画像シーケンスのその他のフレームに対して、下で説明されるように、モード間区分を実行することができる。
上で説明されたように、ROIオブジェクト区分システム14は、画像源12から受信された画像シーケンスの画像フレームから、人の頭および肩の範囲など、ROIオブジェクトを自動的に区分するための技術を実施する。ROIオブジェクト区分システム14は、ROIオブジェクトに関する動作情報に基づいて、モード間区分を実行する。開示された技術は、背景モデル形成と減算とに基づいて、前景オブジェクト内の移動領域を検出するための技術を含む。移動前景領域を首尾よく検出することは、モード間区分の間、ROI特徴検出の性能速度を改善する可能性がある。
図15で例示された実施形態では、画像源12は、この場合も、クロミナンス・ブルー・チャネル(Cb)100と、クロミナンス・レッド・チャネル(Cr)101と、輝度チャネル(Y)102とを含む。ROIオブジェクト区分システム14は、図15で例示されたように、モード間区分を実行する場合、背景減算モジュール112をさらに含む。この場合、ROIオブジェクト区分システム14はまた、図6で例示されたモード内区分を実行する場合に使用される成分も含む。例えば、ROIオブジェクト区分システム14は、図6からの顔面検出器64と、目検出器68と、口検出器67とを備える、ROI特徴検出器104を含む。加えて、ROIオブジェクト区分モジュール14は、図6で対応する成分に類似した方法で動作することが可能な、特徴検証モジュール106、複数の顔分離モジュール108、オブジェクト形状概算モジュール110、領域区分モジュール114、オブジェクト生成モジュール116、およびオブジェクト融合モジュール118も含む。
背景減算モジュール112は、モード間区分をサポートするために、ROI特徴検出器104および領域区分モジュール114と相互作用する。背景減算モジュール112を用いて、システム14は、画像シーケンス内の異なる画像フレームに対する移動を表す、画像フレームの移動前景領域を識別する。特に、移動前景領域を識別するために、背景減算モジュール112は、画像フレームのROIオブジェクト内の画素の第1の位置を異なる画像フレーム(例えば、画像シーケンス内のこれまでのフレーム)内の画素の第2の位置と比較する。
背景減算モジュール112は、次いで、第2の位置から移動していない画素を背景画素として分類して、第2の位置から移動した画素を前景画素として分類する。移動前景領域は、識別された前景画素に基づいて識別される。システム14は、次いで、移動前景領域と異なる(例えば、これまでの)画像フレーム内でこれまで識別された前景領域とに対応する画像フレームの組み合わされた前景領域内のROI特徴を検出する。検出されたROI特徴に基づいて、形状概算モジュール110は、画像フレーム内のROIオブジェクトの形状を概算する。
背景減算モジュール112は、画像シーケンスの連続する画像フレームの時間的相関性を活かす。背景減算モジュール112は、画像源12から受信された画像シーケンスのROIオブジェクト内の画素の画素単位の分類処理を行う。このようにして、背景減算モジュール112は、現在のフレームと画像メモリ16から取り出された画像シーケンスのこれまでのフレームまたは後続のフレームの間の動作情報に基づいて、現在のフレームのどの画素が背景画素であるかを判断する。すなわち、背景減算モジュール112は、前景オブジェクトの移動領域を迅速かつ効率的に発見するために、モード間動作で利用可能な追加の情報を使用する。この場合も、背景減算モジュール112は、それらのこれまでの位置から移動していない、現在のフレームのそれらの画素を背景画素として分類する。背景減算モジュール112は、次いで、それらのこれまでの位置から移動したそれらの画素を前景画素として分類する。このように、背景減算モジュール112は、より効率的であり、かつより低い複雑性を有する。
背景減算モジュール112は、1つまたは複数の利点を提供することが可能である。例えば、顔面の探索空間は、画像全体から、移動前景領域に加えて組み合わされた前景領域と見なされ得る、これまでのフレームからの顔面領域に低減され得る。加えて、顔の特徴は、移動前景領域内にあるかまたはこれまでのフレームと同じ位置内にあることになる。もう1つの可能な利点として、連結された移動前景領域は、同種の領域として処理されることが可能である。
図16は、「母と娘」画像シーケンスのフレーム間の画素動作に基づく、前景画素分類の例を示す。図16で、フレーム8から10までの前景オブジェクトの移動はやや小さいため、背景減算モジュール112は、頭の画素の部分だけを前景画素として分類し、一方、体の画素は初めの10個のフレームの間、静的である。
画素単位の分類処理を実行するために、背景減算モジュール112は背景モデルを適用する。特に、背景減算モジュール112は、画素輝度(例えば、K=5)をモデル形成するために、Kガウス分布の混合を適合させ、各ガウスは、それにより観察された背景を説明する周波数に従って重み付けされる。したがって、前景領域内の一定の画素が時間tの時点で輝度Xを有する確率は、
Figure 0004988770
として推定され、wi,tは、正規化された重みμであり、σは第i番目の分布の平均値かつ標準偏移である。
各画素変化の混合モデルのパラメータとして、背景減算モジュール112は、混合のどのガウスが背景処理によって生み出される可能性が最も高いかを判断する。発見的情報に基づいて、背景減算モジュール112は、最もサポートする証拠と最小の分散とを有するガウス分布を選択する。K分布がw/σの値に基づいて順序付けられるのはこの理由からである。モデルのこの順序付けは、効果的に順序付けられたリストであり、最も可能性のある背景分布は上にとどまり、可能性の低い過渡背景分布は下に引き付けられる。背景減算モジュール112は、下に提示された方程式(6)に基づいて、最も可能性のある分布モデルを発見することができる。
Figure 0004988770
しきい値Tは、背景に与えられたわずかな総重みである。
次いで、背景減算モジュール112は、整合が発見されるまで、既存のKガウス分布に対して新しい画素をチェックする。背景減算モジュール112は、分布の平均値と新しい画素値の間の距離が、分布の2.5平均偏移内である場合、整合を発見する。K分布のいずれも現在の画素値と整合しない場合、w/σの最も小さい値を有する、可能性が最も低い分布は、平均値として現在の新しい画素値と、当初の高い分散と、低い先行重みとを有する新しい分布と取り替えられる。一般に、新しい画素値は、Kガウス分布の混合モデルの主な成分のうちの1つによって常に表されることが可能である。この整合された分布がB背景分布のうちの1つである場合、新しい画素は背景として印される。そうでない場合、画素は前景として印される。
混合モデルをアダプティブに維持するために、背景減算モジュール112は、新しい画素値を用いてモデルパラメータを連続的に更新する。整合されたガウス分布の場合、背景減算モジュール112は、この新しい画素値Xを用いて時間tですべてのパラメータを更新する。加えて、背景減算モジュール112は、先行重みを、
Figure 0004988770
として更新し、平均値と分散とは、
Figure 0004988770
Figure 0004988770
として更新され、αは学習レート制御適合速度であり、1/αは変化を決定する時間定数を定義し、ρは、学習レートαによって基準化された現在の画素に関連する確率性である。したがって、ρは、
Figure 0004988770
によって表されることが可能である。整合されない分布の場合、平均値μと分散σとは、依然として変化せず、一方、背景減算モジュール112は先行重みを、
Figure 0004988770
として更新する。
この更新方法の1つの利点は、背景減算モジュール112が、オブジェクトが背景の一部になることを可能にする場合、元の背景モデルが破棄されないことである。すなわち、元の背景分布は、可能性が最も低い分散になり、新しい色が観察されるまで混合の形で残る。したがって、この静的オブジェクトが偶然再び移動する場合、背景減算モジュール112は、これまでの背景分布をモデルに迅速に再度組み込むことになる。
背景減算モジュール112が移動画素を前景画素として分類すると、領域区分モジュール114は、画像フレームの移動前景領域を生み出すために、前景画素に対してスプリット・統合領域増大を実行することが可能である。このようにして、分類された前景画素は、領域増大手法から取得された領域を統合するために、かつそれにより前景領域を形成するために使用される。特に、スプリット・統合増大技術を用いた背景減算の結果として生じた移動前景領域を融合することによって、前景オブジェクトの移動領域が取得され得る。
前景画素を検出して、移動前景領域を生み出すことは、モード間区分処理の頑強さを高めて、ROI特徴検出の性能を加速する可能性がある。ROI特徴に関する探索は、移動前景領域とこれまでのフレームの顔面によって形成された前景領域とを含めて、組み合わされた前景領域に限定され得る。図17は、「母と娘」画像シーケンスの画像フレームの背景範囲から抽出された移動前景領域を例示する。
ROIオブジェクト区分システム14は、次いで、モード間区分処理を完了するために、上で説明されたモード内区分を実行するために使用されたのと実質的に類似の技術を使用することが可能である。例えば、ROI特徴検出器100は、移動前景領域によって形成された組み合わされた前景領域内の顔面および顔の特徴と、これまでのフレーム内の顔面および顔の特徴の位置とを検出する。このようにして、背景減算モジュール112は、画像フレーム全体内でROI特徴検出を実行することの計算処理上の複雑性を低減する。オブジェクト融合モジュール118は、次いで、アウトプット画像を形成するために前景オブジェクトを統合する。ROIオブジェクト区分モジュール14は、区分されたフレームのアウトプット画像をマルチメディア・アプリケーション18に送る。
例示された実施形態では、新しい顔または新しい顔の特徴は画像シーケンスの間に導入されない。したがって、ROIオブジェクト区分システム14は、ROI特徴検出器104とオブジェクト形状概算モジュール110の間で拡張する破線によって表示されるように、モード間区分を実行する場合、特徴検証モジュール108と、複数の顔分離モジュール108とを省略することができる。特に、これまでのフレーム内のオブジェクトがかなりの移動を提示しないことを意味する、検出された顔の特徴がこれまでのフレーム内の特徴に近接して配置される場合、現在のフレームのオブジェクトは、特徴検証モジュール106および複数の顔分離モジュール108の機能を適用する必要なしに、オブジェクト形状概算モジュール110とオブジェクト生成モジュール116とを使用して迅速に生成され得る。
その他の点では、新しい顔または新しい顔の特徴が導入される場合、処理全体が適用される。すなわち、特徴検証モジュール106と、複数の顔分離モジュール108と、オブジェクト形状概算モジュール110と、オブジェクト生成モジュール116とが適用される。オブジェクト生成モジュール116では、連結された移動前景領域は同種の領域として処理される。オブジェクト融合モジュール118は、アウトプット画像を形成するために、前景オブジェクトを統合する。ROIオブジェクト区分システム14は、区分されたフレームの画像をマルチメディア・アプリケーション18に送る。
顔面および顔の特徴検出器100は、モード間区分の間、画像フレーム内の追加のROI特徴を検出することが可能である。この場合、ROIオブジェクト区分システム14は、新たに検出された顔の特徴を検証するために、特徴検証モジュール106を使用することができる。加えて、システム14は、画像フレーム内に含まれた新しい顔に関して、複数の顔分離モジュール108と、その後に続く、オブジェクト形状概算モジュール110と、オブジェクト生成モジュール116とを使用することができる。
図18は、モード間区分を実行するROIオブジェクト区分システム14の動作を例示するフローチャートである。動作は、本明細書で、図15で例示されたROIオブジェクト区分システム14を参照して説明され、ROIオブジェクト区分システム14は、画像源12から画像シーケンスのフレームを受信して、画像メモリ16から画像シーケンスのこれまでのフレームを取り出す(120)。モード間区分の場合、ROIオブジェクト区分システム14は、現在のフレームと画像シーケンスのこれまでのフレームの間のROIオブジェクトに関する動作情報に基づいて画像シーケンスのフレームを処理する。いくつかの実施形態では、ROIオブジェクト区分システム14は、あるいはまたは加えて、後続の画像フレームに関するROIオブジェクト動作を表示する動作情報を使用する。
背景減算モジュール112は、これまでのフレームと現在のフレームの間のROIオブジェクト内の移動画素を前景画素として分類するために、受信された画像フレームに対して背景減算を実行する(122)。背景減算モジュール112は、現在のフレームのどの画素がこれまでのフレーム内のそれらのこれまでの位置から移動したかを決定するために、画素単位の分類処理を行う。背景減算モジュール112が移動画素を前景画素として分類すると、領域区分モジュール114は、画像フレームの移動前景領域を生み出すために、前景画素に対してスプリット・統合領域増大を実行することができる(124)。
ROIオブジェクト区分システム14は、次いで、モード間区分処理を完了するために、上で説明されたモード内区分を実行するために使用されたのと実質的に類似の技術を使用することが可能である。ROI特徴検出器104は、移動前景領域およびこれまでのフレームからの顔面位置の両方を含む領域内、すなわち、組み合わされた前景領域内の顔面を検出する(126)。さらに、ROI特徴検出器104は、移動前景領域を含めて、組み合わされた前景領域内の顔の特徴(例えば、目および口の候補)を検出し、これまでのフレーム内で顔の特徴位置を検出する(128)。
ROI特徴検出器104によって検出された顔の特徴がこれまでのフレーム内で検出された顔の特徴に近接して配置される(130)場合、これまでのフレーム内のオブジェクトはかなりの移動を提示しない。この場合、現在のフレームのオブジェクトは、特徴検証モジュール106(132)および複数の顔分離モジュール108(134)の機能を省略すると同時に、オブジェクト形状概算モジュール110(136)とオブジェクト生成モジュール116(138)とを使用することによって迅速に生成され得る。
その他の点では、ROI特徴検出器104によって検出された顔の特徴が、これまでのフレーム内で検出された顔の特徴に近接して配置されない場合、これまでのフレーム内のオブジェクトはかなり移動した。この場合、処理全体が適用される。特に、特徴検証モジュール106は検出された特徴を検証して(132)、複数の顔分離モジュール108は顔の分離を実行する(134)。次いで、オブジェクト形状概算モジュール110(136)と、その後に続くオブジェクト生成モジュール116(138)とが適用される。オブジェクト生成モジュール116で、連結された移動前景領域は、オブジェクトを生成する(138)ために同種の領域として処理される。オブジェクト融合モジュール118は、次いで、アウトプット画像を形成するために前景オブジェクトを統合する(140)。ROIオブジェクト区分システム14は、区分されたフレームのアウトプット画像をマルチメディア・アプリケーション18に送る(142)。
本明細書で説明された技術は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せで実施され得る。ソフトウェアで実施される場合、技術は、実行された場合、上で説明された方法の1つまたは複数を実行する命令を含むプログラム・コードを備えるコンピュータ可読媒体によって一部実施され得る。この場合、コンピュータ可読媒体は、同時ダイナミック・ランダム・アクセス・メモリ(SDRAM)、読出し専用メモリ(ROM)、不揮発性ランダム・アクセス・メモリ(NVRAM)、電気的に消去可能でプログラム可能な読取り専用メモリ(EEPROM)、フラッシュメモリ、磁気データ記憶媒体または光データ記憶媒体など、ランダム・アクセス・メモリ(RAM)を備え得る。
プログラム・コードは、1つまたは複数のデジタル信号プロセッサ(DSP)、汎用マイクロプロセッサ、特定アプリケーション向け集積回路(ASIC)、フィールド・プログラム可能論理アレイ(FPGA)、または等価の集積論理回路または離散的論理回路のその他の組合せによって実施され得るプログラム可能プロセッサによって実施されることが可能である。いくつかの実施形態では、本明細書で説明される機能性は、自動オブジェクト切出のために構成された専用のソフトウェア・モジュール内もしくはハードウェア装置内で提供されること、または自動オブジェクト区分システム内に組み込まれることが可能である。
この開示では、画像シーケンスからのROIオブジェクトの自動区分のための様々な技術が説明された。ROIオブジェクト区分システムは、VTアプリケーション、画像ストリーミング・アプリケーション、または画像監視用となど、マルチメディア・アプリケーションでの使用のために正確に区分されたROIオブジェクトを提供する目的で、開示された技術のうちの1つまたは複数を個々にまたは組み合わせて実施することが可能である。
開示された技術は、ROI特徴検出と、領域区分と、背景減算とを含むハイブリッド技術を含む。開示された技術は、モード内およびモード間のオブジェクト区分を含み得る。モード間区分は、ROIオブジェクト区分システムの実行を加速するために、通常の計算処理上集中的な動作推定演算の代わりに、背景モデル形成と減算とを使用することによって、画像シーケンスの連続する画像フレームの時間的相関性を活かす。開示された技術はまた、ROIオブジェクト区分システムによるモード内区分の性能を加速するために、顔の特徴検証、複数の顔分離、およびROIオブジェクト区分も含む。これらのおよびその他の実施形態は、特許請求の範囲の範囲内である。
画像シーケンスからのROI画像オブジェクトの自動区分のための技術を実施する関心領域(ROI)オブジェクト区分システムを例示するブロック図。 画像シーケンスの画像フレーム内のROIオブジェクトおよび非ROIオブジェクトの定義を例示するブロック図。 画像シーケンスの画像フレーム内のROIオブジェクトおよび非ROIオブジェクトの定義を例示するブロック図。 画像シーケンスのROIオブジェクト内に提示されるオブジェクトに関してオブジェクト移動/回転、および形状変形の変化を例示する図。 画像シーケンスのROIオブジェクト内の人物に関して顔の表情の変更を例示する図。 図1からのROIオブジェクト区分システムの例示的な動作を示すフローチャート。 図5Aからの区分モード決定をより詳細に例示するフローチャート。 画像源から受信された画像シーケンスのフレームに関してモード内区分を実行する場合のROIオブジェクト区分システムを例示するブロック図。 モード内区分の間、ROIオブジェクト区分システムによって実施される技術の例示的な結果を示すスクリーン・ショット。 モード内区分の間、ROIオブジェクト区分システムによって実施される技術の例示的な結果を示すスクリーン・ショット。 モード内区分の間、ROIオブジェクト区分システムによって実施される技術の例示的な結果を示すスクリーン・ショット。 モード内区分の間、ROIオブジェクト区分システムによって実施される技術の例示的な結果を示すスクリーン・ショット。 モード内区分の間、ROIオブジェクト区分システムによって実施される技術の例示的な結果を示すスクリーン・ショット。 モード内区分の間、ROIオブジェクト区分システムによって実施される技術の例示的な結果を示すスクリーン・ショット。 モード内区分の間、ROIオブジェクト区分システムによって実施される技術の例示的な結果を示すスクリーン・ショット。 モード内区分の間、ROIオブジェクト区分システムによって実施される技術の例示的な結果を示すスクリーン・ショット。 モード内区分の間、ROIオブジェクト区分システムによって実施される技術の例示的な結果を示すスクリーン・ショット。 モード内区分の間、ROIオブジェクト区分システムによって実施される技術の例示的な結果を示すスクリーン・ショット。 モード内区分を実行するROIオブジェクト区分システムの動作を例示するフローチャート。 画像源から受信された画像シーケンスのフレームに対してモード間区分を実行する場合のROIオブジェクト区分システムを例示するブロック図。 モード間区分の間、ROIオブジェクト区分システムによって実施される技術の例示的な結果を示すスクリーン・ショット。 モード間区分の間、ROIオブジェクト区分システムによって実施される技術の例示的な結果を示すスクリーン・ショット。 モード間区分を実行するROIオブジェクト区分システムの動作を例示するフローチャート。

Claims (38)

  1. 関心領域(ROI)オブジェクトを自動的に区分する装置によって実行される方法であって、
    前記ROIオブジェクトを自動的に区分する装置で、画像シーケンスの画像フレームを受信することと、
    前記ROIオブジェクトを自動的に区分する装置で、前記画像フレーム内の関心領域(ROI)特徴を、前記画像シーケンスの他の画像フレームから独立して検出することと、
    検出されたROI特徴の幾何学的な関係に基づいて、前記画像フレーム内の検出されたROI特徴を検証することと、
    前記ROIオブジェクトを自動的に区分する装置で、前記検出されたROI特徴および前記検出されたROI特徴の幾何学的な関係に基づいて、画像フレーム内のROIオブジェクト形状を概算することとを備え、
    ROIオブジェクト形状を概算することは、前記検出されたROI特徴の位置によって定義された幾何学モデルに基づいて前記ROIオブジェクト形状を概算することを備え
    前記ROIオブジェクトを自動的に区分する装置で、前記画像フレームを、多数の候補領域へ区分することであって、前記区分することは、隣接した画素に対する類似性に基づいて、前記画像フレーム内の画素を分類することを備える、ことと、
    前記ROIオブジェクトを自動的に区分する装置で、前記画像フレームの概算されたROIオブジェクト形状内に位置する候補領域のうちの1または複数をROIオブジェクトとして選択することと
    を備える方法。
  2. 前記ROIオブジェクトを識別するアウトプット画像を生成することと、
    前記画像フレームの非ROI領域に対するROIオブジェクトを優先的にエンコードすることと
    を更に備える請求項1に記載の方法。
  3. 1または複数の候補領域を選択することは、前記ROIオブジェクトとして、前記候補領域のうちの1または複数を選択することを備える請求項1に記載の方法。
  4. ROI特徴を検出することは、
    前記画像フレーム内の皮膚色領域のクロミナンス値に基づいて、前記画像フレーム内の顔面を検出することと、
    前記検出された顔面内の画素のクロミナンス値と輝度値との両方に基づいて、前記画像フレーム内の目の特徴を検出することと、
    前記検出された顔面内の画素のクロミナンス値に基づいて、前記画像フレーム内の口の特徴を検出することと
    を備える請求項1に記載の方法。
  5. 前記検出されたROI特徴は、前記画像フレーム内で検出された顔の特徴候補を備え、前記検出されたROI特徴を検証することは、前記検出された顔の特徴候補のセットから、前記ROIオブジェクトの正しい顔の特徴を選択するために、前記検出された顔の特候補を検証することを更に備える請求項1に記載の方法。
  6. 前記検出された顔の特徴候補を検証することは、
    前記画像フレーム内のくぼみ領域を検出することと、
    前記画像フレーム内の検出された顔の特徴候補の位置を、前記画像フレーム内のくぼみ領域の位置と比較することと、
    の特徴が、前記画像フレーム内の検出されたくぼみ領域のうちの1つと少なくとも部分的に重複しない場合に、前記顔の特徴候補のセットから前記顔の特徴を取り除くことと
    を備える請求項5に記載の方法。
  7. 前記検出された顔の特徴候補を検証することは、
    前記検出された顔の特徴候補の各々を、目の特徴の対称特性および幾何学特性に基づく複数の基準と比較することと、
    前記複数の基準に対応するレベルに基づいて、前記検出された顔の特徴候補の各々に得点を割り当てることと、
    の特徴に割り当てられた得点がしきい値未満である場合、前記顔の特徴候補のセットから前記顔の特徴を取り除くことと
    を備える請求項5に記載の方法。
  8. 前記検出された顔の特徴候補を検証することは、
    目の特徴候補と口の特徴候補とを目と口との三角形へ組み合わせることと、
    前記画像フレーム内の目と口との三角形の方向と、前記目と口との三角形内のROIオブジェクトの勾配特性とに基づいて前記目と口との三角形を検証することと
    を備える請求項5に記載の方法。
  9. 前記画像フレームは、1を越えるROIオブジェクトを含み、前記方法は更に、
    前記検出されたROI特徴を、個々のROIオブジェクトのグループへ分離することと、
    前記画像フレーム内の検出されたROI特徴へ、最大整合グラフ理論を適用することとを備える請求項1に記載の方法。
  10. ROIオブジェクト形状を概算することは、前記検出されたROI特徴の位置によって定義された幾何学モデルに基づいて前記ROIオブジェクト形状を概算することを備え、
    前記概算されたROIオブジェクト形状は、前記画像フレーム内に人間の頭と肩のオブジェクト形状を備える請求項1に記載の方法。
  11. 前記画像フレームを区分することは、
    隣接した画素に対する強度の類似性に基づいて、前記画像フレーム内の各画素を分類することと、
    前記類似の画素を、前記画像フレーム内の最小数の候補領域へ統合することと
    を備える請求項1に記載の方法。
  12. 前記候補領域のうちの1または複数選択することは、前記画像フレームのROIオブジェクト形状内に位置する事前定義された割合の画素を有する候補領域のうちの1または複数を選択することを備え、
    前記方法は更に、
    前記候補領域のうちの選択された1または複数を統合することによって、前景オブジェクトを生成することを備える請求項1に記載の方法。
  13. 前記画像フレームは、1を超える前景オブジェクトを含み、
    前記方法は更に、
    前記1を超える前景オブジェクトを統合して、アウトプット画像を生成することと、
    前記アウトプット画像をマルチメディア・アプリケーションへ送ることと
    を備える請求項12に記載の方法。
  14. 画像シーケンスの画像フレームを受信することと、
    前記画像フレーム内の関心領域(ROI)特徴を、前記画像シーケンスの他の画像フレームから独立して検出することと、
    検出されたROI特徴の幾何学的な関係に基づいて、前記画像フレーム内の検出されたROI特徴を検証することと、
    前記検出されたROI特徴に基づいて、画像フレーム内のROIオブジェクト形状を概算することとを、プログラム可能なプロセッサに対して実行させる命令群を備えたコンピュータ読取可能記録媒体であって
    前記ROIオブジェクト形状は、前記検出されたROI特徴の位置によって定義された幾何学モデル、および前記検出されたROI特徴の幾何学的な関係に基づいて概算され、
    記画像フレームを、多数の候補領域へ区分することであって、前記区分することは、隣接した画素に対する類似性に基づいて、前記画像フレーム内の画素を分類することを含む、ことと、
    前記画像フレームの概算されたROIオブジェクト形状内に位置する候補領域のうちの1または複数をROIオブジェクトとして選択することと
    を、プログラム可能なプロセッサに対して実行させる命令群を備えたコンピュータ読取可能記録媒体。
  15. 前記命令群は、
    前記ROIオブジェクトを識別するアウトプット画像を生成することと、
    前記画像フレームの非ROI領域に対するROIオブジェクトを優先的にエンコードすることと
    を前記プロセッサに対して実行させる請求項14に記載のコンピュータ読取可能記録媒体。
  16. 記ROIオブジェクトとして、前記候補領域のうちの1または複数を選択することを前記プロセッサに対して実行させる命令群を更に備える請求項14に記載のコンピュータ読取可能記録媒体。
  17. 前記プログラム可能なプロセッサに対してROI特徴を検出させる命令群は、
    前記画像フレーム内の皮膚色領域のクロミナンス値に基づいて、前記画像フレーム内の顔面を検出することと、
    前記検出された顔面内の画素のクロミナンス値と輝度値との両方に基づいて、前記画像フレーム内の目の特徴を検出することと、
    前記検出された顔面内の画素のクロミナンス値に基づいて、前記画像フレーム内の口の特徴を検出することと
    を前記プログラム可能なプロセッサに対して実行させる請求項14に記載のコンピュータ読取可能記録媒体。
  18. 前記検出されたROI特徴は、前記画像フレーム内で検出された顔の特徴候補を備え、
    前記コンピュータ読取可能記録媒体は更に、
    前記顔の特徴候補のセットから、前記ROIオブジェクトの正しい顔の特徴を選択するために、前記検出された顔の特候補を検証することを、前記プログラム可能なプロセッサに対して実行させる命令群を備える請求項14に記載のコンピュータ読取可能記録媒体。
  19. 前記命令群は、前記プログラム可能なプロセッサに対して、
    前記画像フレーム内のくぼみ領域を検出することと、
    前記画像フレーム内の検出された顔の特徴候補の位置を、前記画像フレーム内のくぼみ領域の位置と比較することと、
    の特徴が、前記画像フレーム内の検出されたくぼみ領域のうちの1つと少なくとも部分的に重複しない場合に、前記顔の特徴候補のセットから前記顔の特徴を取り除くことと
    を実行させる請求項18に記載のコンピュータ読取可能記録媒体。
  20. 前記命令群は、前記プログラム可能なプロセッサに対して、
    前記検出された顔の特徴候補の各々を、目の特徴の対称特性および幾何学特性に基づく複数の基準と比較することと、
    前記複数の基準に対応するレベルに基づいて、前記検出された顔の特徴候補の各々に得点を割り当てることと、
    の特徴に割り当てられた得点がしきい値未満である場合、前記顔の特徴候補のセットから前記顔の特徴を取り除くことと
    を実行させる請求項18に記載のコンピュータ読取可能記録媒体。
  21. 前記命令群は、前記プログラム可能なプロセッサに対して、
    目の特徴候補と口の特徴候補とを目と口との三角形へ組み合わせることと、
    前記画像フレーム内の目と口との三角形の方向と、前記目と口との三角形内のROIオブジェクトの勾配特性とに基づいて前記目と口との三角形を検証することと
    を実行させる請求項18に記載のコンピュータ読取可能記録媒体。
  22. 前記画像フレームは、1を越えるROIオブジェクトを含み、
    前記コンピュータ読取可能記録媒体は更に、
    前記検出されたROI特徴を、個々のROIオブジェクトのグループへ分離することと、
    前記画像フレーム内の検出されたROI特徴へ、最大整合グラフ理論を適用することとを、前記プログラム可能なプロセッサに対して実行させる命令群を備える請求項14に記載のコンピュータ読取可能記録媒体。
  23. 前記命令群は、前記検出されたROI特徴の位置によって定義された幾何学モデルに基づいて前記ROIオブジェクト形状を概算することを、前記プログラム可能なプロセッサに対して実行させる請求項14に記載のコンピュータ読取可能記録媒体。
  24. 前記プログラム可能なプロセッサに対して、前記画像フレームを区分することを実行させる命令群は、
    隣接した画素に対する強度の類似性に基づいて、前記画像フレーム内の各画素を分類することと、
    前記類似の画素を、前記画像フレーム内の最小数の候補領域へ統合することと
    を、前記プログラム可能なプロセッサに対して実行させる請求項14に記載のコンピュータ読取可能記録媒体。
  25. 前記命令群は、前記プログラム可能なプロセッサに対して、前記画像フレームのROIオブジェクト形状内に位置する事前定義された割合の画素を有する候補領域のうちの1または複数を選択することを実行させ、
    前記コンピュータ読取可能記録媒体は更に、
    前記候補領域のうちの選択された1または複数を統合することによって、前景オブジェクトを生成することを、前記プログラム可能なプロセッサに対して実行させる命令群を備える請求項17に記載のコンピュータ読取可能記録媒体。
  26. 前記画像フレームは、1を超える前景オブジェクトを含み、
    前記コンピュータ読取可能記録媒体は更に、
    前記1を超える前景オブジェクトを統合して、アウトプット画像を生成することと、
    前記アウトプット画像をマルチメディア・アプリケーションへ送ることと
    を、前記プログラム可能なプロセッサに対して実行させる命令群を備える請求項25に記載のコンピュータ読取可能記録媒体。
  27. 関心領域(ROI)オブジェクトを自動的に区分するシステムであって、
    画像シーケンスの画像フレーム内のROI特徴を、前記画像シーケンスの他の画像フレームから独立して検出するROI特徴検出器と、
    検出されたROI特徴の幾何学的な関係に基づいて、前記画像フレーム内の検出されたROI特徴を検証する特徴検証モジュールと、
    前記検出されたROI特徴および前記検出されたROI特徴の幾何学的な関係に基づいて、画像フレーム内のROIオブジェクト形状を概算するオブジェクト形状概算モジュールとを備え前記ROIオブジェクト形状は、前記検出されたROI特徴の位置によって定義された幾何学モデルに基づいて概算され、
    記画像フレームを、多数の候補領域へ区分する領域区分モジュールであって、前記領域区分モジュールによる区分は、隣接した画素に対する類似性に基づいて前記画像フレーム内の各画素を分類することを備える、領域区分モジュールと、
    前記画像フレームの概算されたROIオブジェクト形状内に位置する候補領域のうちの1または複数をROIオブジェクトとして選択するオブジェクト生成モジュールと
    を備えるシステム。
  28. 前記ROIオブジェクトを識別するアウトプット画像を生成するオブジェクト融合モジュールと、
    前記画像フレームの非ROI領域に対するROIオブジェクトを優先的にエンコードするエンコーダと
    を更に備える請求項27に記載のシステム。
  29. 前記オブジェクト生成モジュールは、前記ROIオブジェクトとして、前記候補領域のうちの1または複数を選択する請求項27に記載のシステム。
  30. 前記ROI特徴検出器は、
    前記画像フレーム内の皮膚色領域のクロミナンス値に基づいて、前記画像フレーム内の顔面を検出する顔面検出器と、
    前記検出された顔面内の画素のクロミナンス値と輝度値との両方に基づいて、前記画像フレーム内の目の特徴を検出する目検出器と、
    前記検出された顔面内の画素のクロミナンス値に基づいて、前記画像フレーム内の口の特徴を検出する口検出器と
    を含む請求項27に記載のシステム。
  31. 請求項27に記載のシステムにおいて、前記検出されたROI特徴は、前記画像フレーム内で検出された顔の特徴候補を備え、
    前記特徴検証モジュールは、前記顔の特徴候補のセットから、前記ROIオブジェクトの正しい顔の特徴を選択するために、前記検出された顔の特候補を検証
    前記特徴検証モジュールは、前記画像フレーム内のくぼみ領域を検出し、前記画像フレーム内の検出された顔の特徴候補の位置を、前記画像フレーム内のくぼみ領域の位置と比較し、顔の特徴が、前記画像フレーム内の検出されたくぼみ領域のうちの1つと少なくとも部分的に重複しない場合に、前記顔の特徴候補のセットから前記顔の特徴を取り除く請求項27に記載のシステム。
  32. 前記特徴検証モジュールは、
    前記検出された顔の特徴候補の各々を、目の特徴の対称特性および幾何学特性に基づく複数の基準と比較し、
    前記複数の基準に対応するレベルに基づいて、前記検出された顔の特徴候補の各々に得点を割り当て、
    の特徴に割り当てられた得点がしきい値未満である場合、前記顔の特徴候補のセットから前記顔の特徴を取り除く
    請求項31に記載のシステム。
  33. 前記特徴検証モジュールは、目の特徴候補と口の特徴候補とを目と口との三角形へ組み合わせ、前記画像フレーム内の目と口との三角形の方向と、前記目と口との三角形内のROIオブジェクトの勾配特性とに基づいて前記目と口との三角形を検証する請求項31に記載のシステム。
  34. 請求項27に記載のシステムにおいて、前記画像フレームは、1を越えるROIオブジェクトを含み、
    前記システムは更に、
    前記検出されたROI特徴を、個々のROIオブジェクトのグループへ分離し、前記画像フレーム内の検出されたROI特徴を分離するために、前記検出されたROI特徴、最大整合グラフ理論適用する複数顔分離モジュールを備えるシステム。
  35. 前記オブジェクト形状概算モジュールは、
    前記検出されたROI特徴の位置によって定義された幾何学モデルに基づいて前記ROIオブジェクト形状を概算し、前記概算されたROIオブジェクト形状は、前記画像フレーム内に人間の頭と肩のオブジェクト形状を備える請求項27に記載のシステム。
  36. 前記領域区分モジュールは、隣接した画素に対する強度の類似性に基づいて、前記画像フレーム内の各画素を分類し、前記類似の画素を、前記画像フレーム内の最小数の候補領域へ統合する請求項27に記載のシステム。
  37. 前記画像フレームのROIオブジェクト形状内に位置する事前定義された割合の画素を有する候補領域のうちの1または複数を選択するオブジェクト生成モジュールを更に備え、
    前記オブジェクト生成モジュールは、前記候補領域のうちの選択された1または複数を統合することによって、前景オブジェクトを生成する請求項27に記載のシステム。
  38. 前記画像フレームは、1を超える前景オブジェクトを含み、
    前記オブジェクト融合モジュールは、前記1を超える前景オブジェクトを統合して、アウトプット画像を生成し、前記アウトプット画像をマルチメディア・アプリケーションへ送る請求項37に記載のシステム。
JP2008554492A 2006-02-07 2007-02-07 モード間の関心領域画像オブジェクト区分 Expired - Fee Related JP4988770B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/350,376 2006-02-07
US11/350,376 US8265349B2 (en) 2006-02-07 2006-02-07 Intra-mode region-of-interest video object segmentation
PCT/US2007/061803 WO2007092905A2 (en) 2006-02-07 2007-02-07 Intra-mode region-of-interest video object segmentation

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2012045149A Division JP2012155727A (ja) 2006-02-07 2012-03-01 モード間の関心領域画像オブジェクト区分

Publications (2)

Publication Number Publication Date
JP2009526495A JP2009526495A (ja) 2009-07-16
JP4988770B2 true JP4988770B2 (ja) 2012-08-01

Family

ID=38334114

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2008554492A Expired - Fee Related JP4988770B2 (ja) 2006-02-07 2007-02-07 モード間の関心領域画像オブジェクト区分
JP2012045149A Pending JP2012155727A (ja) 2006-02-07 2012-03-01 モード間の関心領域画像オブジェクト区分

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2012045149A Pending JP2012155727A (ja) 2006-02-07 2012-03-01 モード間の関心領域画像オブジェクト区分

Country Status (6)

Country Link
US (1) US8265349B2 (ja)
EP (1) EP1994761A2 (ja)
JP (2) JP4988770B2 (ja)
KR (1) KR101023733B1 (ja)
CN (1) CN101375608A (ja)
WO (1) WO2007092905A2 (ja)

Families Citing this family (83)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7088872B1 (en) * 2002-02-14 2006-08-08 Cogent Systems, Inc. Method and apparatus for two dimensional image processing
US8681100B2 (en) 2004-07-30 2014-03-25 Extreme Realty Ltd. Apparatus system and method for human-machine-interface
US8872899B2 (en) * 2004-07-30 2014-10-28 Extreme Reality Ltd. Method circuit and system for human to machine interfacing by hand gestures
KR101424942B1 (ko) 2004-07-30 2014-08-01 익스트림 리얼리티 엘티디. 이미지 프로세싱을 기반으로 한 3d 공간 차원용 시스템 및 방법
US8019170B2 (en) 2005-10-05 2011-09-13 Qualcomm, Incorporated Video frame motion-based automatic region-of-interest detection
US8208758B2 (en) 2005-10-05 2012-06-26 Qualcomm Incorporated Video sensor-based automatic region-of-interest detection
US20070285554A1 (en) * 2005-10-31 2007-12-13 Dor Givon Apparatus method and system for imaging
US9046962B2 (en) 2005-10-31 2015-06-02 Extreme Reality Ltd. Methods, systems, apparatuses, circuits and associated computer executable code for detecting motion, position and/or orientation of objects within a defined spatial region
US8131477B2 (en) * 2005-11-16 2012-03-06 3M Cogent, Inc. Method and device for image-based biological data quantification
US8150155B2 (en) 2006-02-07 2012-04-03 Qualcomm Incorporated Multi-mode region-of-interest video object segmentation
JP4427533B2 (ja) * 2006-09-22 2010-03-10 富士フイルム株式会社 顔画像検出装置およびその制御方法
US8787445B2 (en) * 2007-03-15 2014-07-22 Nvidia Corporation Allocation of available bits to represent different portions of video frames captured in a sequence
US8275179B2 (en) * 2007-05-01 2012-09-25 3M Cogent, Inc. Apparatus for capturing a high quality image of a moist finger
US8446454B2 (en) 2007-05-21 2013-05-21 Polycom, Inc. Dynamic adaption of a continuous presence videoconferencing layout based on video content
US8411916B2 (en) * 2007-06-11 2013-04-02 3M Cogent, Inc. Bio-reader device with ticket identification
CN101325691B (zh) * 2007-06-14 2010-08-18 清华大学 融合不同生存期的多个观测模型的跟踪方法和跟踪装置
US8548049B2 (en) * 2007-07-02 2013-10-01 Vixs Systems, Inc Pattern detection module, video encoding system and method for use therewith
US7995841B2 (en) * 2007-09-24 2011-08-09 Microsoft Corporation Hybrid graph model for unsupervised object segmentation
CN101409817B (zh) * 2007-10-11 2012-08-29 鸿富锦精密工业(深圳)有限公司 视频处理方法、视频处理系统及视频设备
US8233676B2 (en) * 2008-03-07 2012-07-31 The Chinese University Of Hong Kong Real-time body segmentation system
US9646087B2 (en) * 2008-04-17 2017-05-09 Adobe Systems Incorporated Scene break prediction based on characteristics of previous scenes
US8243987B2 (en) * 2008-06-06 2012-08-14 International Business Machines Corporation Object tracking using color histogram and object size
US20100329568A1 (en) * 2008-07-02 2010-12-30 C-True Ltd. Networked Face Recognition System
US9031279B2 (en) * 2008-07-09 2015-05-12 Disney Enterprises, Inc. Multiple-object tracking and team identification for game strategy analysis
US20100014755A1 (en) * 2008-07-21 2010-01-21 Charles Lee Wilson System and method for grid-based image segmentation and matching
JP5599400B2 (ja) * 2008-09-04 2014-10-01 エクストリーム リアリティー エルティーディー. 画像センサベースのヒューマンマシンインタフェースを提供する方法システムおよびソフトウェア
US7809195B1 (en) * 2008-09-18 2010-10-05 Ernest Greene Encoding system providing discrimination, classification, and recognition of shapes and patterns
US8805004B2 (en) * 2009-01-09 2014-08-12 Thomson Licensing Method and apparatus for detecting and separating objects of interest in soccer video by color segmentation and shape analysis
US8358834B2 (en) 2009-08-18 2013-01-22 Behavioral Recognition Systems Background model for complex and dynamic scenes
CA2774867A1 (en) 2009-09-21 2011-03-24 Extreme Reality Ltd. Methods circuits apparatus and systems for human machine interfacing with an electronic appliance
US8878779B2 (en) 2009-09-21 2014-11-04 Extreme Reality Ltd. Methods circuits device systems and associated computer executable code for facilitating interfacing with a computing platform display screen
JP2011090569A (ja) * 2009-10-23 2011-05-06 Sony Corp 画像処理装置および画像処理方法
DE102010013580A1 (de) * 2010-03-31 2011-10-06 Rohde & Schwarz Gmbh & Co. Kg Vorrichtung und Verfahren zur Identifikation von Personen
CN101854520A (zh) * 2010-04-16 2010-10-06 广东中大讯通信息有限公司 一种无线传输视频监控系统及方法
JP5837484B2 (ja) 2010-05-26 2015-12-24 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 画像情報処理装置
JP5590390B2 (ja) * 2010-07-15 2014-09-17 ソニー株式会社 画像処理装置および方法
KR20240034886A (ko) 2010-10-08 2024-03-14 지이 비디오 컴프레션, 엘엘씨 블록 분할 및 블록 병합을 지원하는 픽처 코딩
JP5036084B2 (ja) * 2010-10-14 2012-09-26 シャープ株式会社 映像処理装置、映像処理方法、及びプログラム
CA2806520C (en) 2011-01-23 2016-02-16 Extreme Reality Ltd. Methods, systems, devices and associated processing logic for generating stereoscopic images and video
EP2689392B1 (en) * 2011-03-24 2015-09-02 Koninklijke Philips N.V. Apparatus and method for analyzing image gradings
US9165201B2 (en) * 2011-09-15 2015-10-20 Xerox Corporation Systems and methods for detecting cell phone usage by a vehicle operator
US9082195B2 (en) 2011-10-19 2015-07-14 Crown Equipment Corporation Generating a composite score for a possible pallet in an image scene
US9025836B2 (en) * 2011-10-28 2015-05-05 Intellectual Ventures Fund 83 Llc Image recomposition from face detection and facial features
US8811747B2 (en) * 2011-10-28 2014-08-19 Intellectual Ventures Fund 83 Llc Image recomposition from face detection and facial features
US20130108170A1 (en) * 2011-10-28 2013-05-02 Raymond William Ptucha Image Recomposition From Face Detection And Facial Features
US9025835B2 (en) 2011-10-28 2015-05-05 Intellectual Ventures Fund 83 Llc Image recomposition from face detection and facial features
US8938100B2 (en) 2011-10-28 2015-01-20 Intellectual Ventures Fund 83 Llc Image recomposition from face detection and facial features
US20130108119A1 (en) * 2011-10-28 2013-05-02 Raymond William Ptucha Image Recomposition From Face Detection And Facial Features
US9008436B2 (en) * 2011-10-28 2015-04-14 Intellectual Ventures Fund 83 Llc Image recomposition from face detection and facial features
TWI439967B (zh) * 2011-10-31 2014-06-01 Hon Hai Prec Ind Co Ltd 安全監控系統及安全監控方法
WO2013069023A2 (en) * 2011-11-13 2013-05-16 Extreme Reality Ltd. Methods systems apparatuses circuits and associated computer executable code for video based subject characterization, categorization, identification and/or presence response
US20130308856A1 (en) 2012-01-12 2013-11-21 Google Inc. Background Detection As An Optimization For Gesture Recognition
CN102547290B (zh) * 2012-01-20 2013-12-18 厦门大学 一种基于几何分割的视频图像解编码方法
US9262670B2 (en) * 2012-02-10 2016-02-16 Google Inc. Adaptive region of interest
JP5949481B2 (ja) * 2012-03-14 2016-07-06 富士通株式会社 画像処理方法、プログラム及び装置
KR20130111061A (ko) * 2012-03-30 2013-10-10 한국전자통신연구원 이진 분할 트리를 이용한 영상 인코딩 방법
KR101640527B1 (ko) * 2012-10-09 2016-07-18 에스케이 텔레콤주식회사 단일객체의 크기를 추정하는 영상 감시장치 및 방법
KR20140098959A (ko) * 2013-01-31 2014-08-11 한국전자통신연구원 증거 영상 생성 장치 및 방법
CN103218555A (zh) * 2013-03-04 2013-07-24 北京百纳威尔科技有限公司 应用程序登录方法及装置
US9098737B2 (en) * 2013-03-12 2015-08-04 Dell Products L.P. Efficient 360 degree video processing
CN103220530A (zh) * 2013-04-22 2013-07-24 郑永春 用于智能监控的高分辨率图像处理系统及方法
WO2014175919A1 (en) 2013-04-26 2014-10-30 Intel IP Corporation Shared spectrum reassignment in a spectrum sharing context
JP2015231145A (ja) * 2014-06-05 2015-12-21 日本放送協会 送信装置、受信装置及びこれらのプログラム
US9858470B2 (en) * 2014-07-18 2018-01-02 Htc Corporation Method for performing a face tracking function and an electric device having the same
US9607210B2 (en) 2014-12-19 2017-03-28 Tata Consultancy Services Limited Video surveillance system and method for fraud detection
US9584716B2 (en) 2015-07-01 2017-02-28 Sony Corporation Method and apparatus for autofocus area selection by detection of moving objects
CN106407984B (zh) * 2015-07-31 2020-09-11 腾讯科技(深圳)有限公司 目标对象识别方法及装置
CN105407352A (zh) * 2015-11-23 2016-03-16 小米科技有限责任公司 图像压缩方法、装置及服务器
WO2017120384A1 (en) 2016-01-08 2017-07-13 Flir Systems, Inc. Thermal-image based object detection and heat map generation systems and methods
US10147195B2 (en) 2016-02-19 2018-12-04 Flir Systems, Inc. Object detection along pre-defined trajectory
US9990535B2 (en) 2016-04-27 2018-06-05 Crown Equipment Corporation Pallet detection using units of physical length
EP3287947A1 (en) 2016-08-25 2018-02-28 Dolby Laboratories Licensing Corp. Automatic video framing of conference participants
US11158060B2 (en) * 2017-02-01 2021-10-26 Conflu3Nce Ltd System and method for creating an image and/or automatically interpreting images
US11176675B2 (en) 2017-02-01 2021-11-16 Conflu3Nce Ltd System and method for creating an image and/or automatically interpreting images
GB2561607B (en) * 2017-04-21 2022-03-23 Sita Advanced Travel Solutions Ltd Detection System, Detection device and method therefor
KR102343648B1 (ko) * 2017-08-29 2021-12-24 삼성전자주식회사 영상 부호화 장치 및 영상 부호화 시스템
CN108198203B (zh) * 2018-01-30 2022-02-08 广东美的制冷设备有限公司 运动报警方法、装置以及计算机可读存储介质
CN108898604A (zh) * 2018-06-28 2018-11-27 上海连尚网络科技有限公司 用于处理图像的方法和设备
TWI692731B (zh) * 2019-01-02 2020-05-01 瑞昱半導體股份有限公司 物件位置判斷電路
WO2020150692A1 (en) * 2019-01-18 2020-07-23 Snap Inc. Systems and methods for template-based generation of personalized videos
US11544828B2 (en) 2020-11-18 2023-01-03 Disney Enterprises, Inc. Automatic occlusion detection
US11494944B2 (en) 2020-11-18 2022-11-08 Disney Enterprises, Inc. Automatic low contrast detection
CN116630355B (zh) * 2023-07-24 2023-11-07 荣耀终端有限公司 一种视频分割方法、电子设备、存储介质及程序产品

Family Cites Families (105)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59194274A (ja) 1983-04-18 1984-11-05 Nippon Telegr & Teleph Corp <Ntt> 人物判定装置
EP0330455A3 (en) * 1988-02-22 1990-07-04 Kabushiki Kaisha Toshiba Image encoding apparatus
KR930009111B1 (ko) * 1988-03-14 1993-09-23 세이꼬 엡슨 가부시끼가이샤 프린터의 급지장치
US5150432A (en) * 1990-03-26 1992-09-22 Kabushiki Kaisha Toshiba Apparatus for encoding/decoding video signals to improve quality of a specific region
US5048095A (en) * 1990-03-30 1991-09-10 Honeywell Inc. Adaptive image segmentation system
JP2863818B2 (ja) 1990-08-31 1999-03-03 工業技術院長 動画像の変化点検出方法
US5323470A (en) * 1992-05-08 1994-06-21 Atsushi Kara Method and apparatus for automatically tracking an object
KR950009699B1 (ko) * 1992-06-09 1995-08-26 대우전자주식회사 움직임벡터 검출방법 및 장치
GB9308952D0 (en) * 1993-04-30 1993-06-16 Philips Electronics Uk Ltd Tracking objects in video sequences
US5852669A (en) * 1994-04-06 1998-12-22 Lucent Technologies Inc. Automatic face and facial feature location detection for low bit rate model-assisted H.261 compatible coding of video
KR100235345B1 (ko) * 1994-12-29 1999-12-15 전주범 분할영역에서의 움직임 추정방법 및 장치
KR100235343B1 (ko) * 1994-12-29 1999-12-15 전주범 영역분할 기법을 이용한 동영상신호 부호화기의 움직임 벡터 측정장치
KR0180170B1 (ko) * 1995-06-30 1999-05-01 배순훈 움직임 추정 방법 및 추정 장치
US6026183A (en) 1995-10-27 2000-02-15 Texas Instruments Incorporated Content-based video compression
KR0181069B1 (ko) * 1995-11-08 1999-05-01 배순훈 움직임 추정장치
US5774591A (en) * 1995-12-15 1998-06-30 Xerox Corporation Apparatus and method for recognizing facial expressions and facial gestures in a sequence of images
US5764283A (en) * 1995-12-29 1998-06-09 Lucent Technologies Inc. Method and apparatus for tracking moving objects in real time using contours of the objects and feature paths
US5692063A (en) * 1996-01-19 1997-11-25 Microsoft Corporation Method and system for unrestricted motion estimation for video
JPH1051755A (ja) * 1996-05-30 1998-02-20 Fujitsu Ltd テレビ会議端末の画面表示制御装置
US6343141B1 (en) * 1996-10-08 2002-01-29 Lucent Technologies Inc. Skin area detection for video image systems
US5828769A (en) * 1996-10-23 1998-10-27 Autodesk, Inc. Method and apparatus for recognition of objects via position and orientation consensus of local image encoding
US5864630A (en) * 1996-11-20 1999-01-26 At&T Corp Multi-modal method for locating objects in images
US6456328B1 (en) * 1996-12-18 2002-09-24 Lucent Technologies Inc. Object-oriented adaptive prefilter for low bit-rate video systems
US6993201B1 (en) * 1997-07-08 2006-01-31 At&T Corp. Generalized scalability for video coder based on video objects
US6188777B1 (en) * 1997-08-01 2001-02-13 Interval Research Corporation Method and apparatus for personnel detection and tracking
US6335985B1 (en) * 1998-01-07 2002-01-01 Kabushiki Kaisha Toshiba Object extraction apparatus
US6148092A (en) * 1998-01-08 2000-11-14 Sharp Laboratories Of America, Inc System for detecting skin-tone regions within an image
GB2333590A (en) * 1998-01-23 1999-07-28 Sharp Kk Detecting a face-like region
US6301370B1 (en) * 1998-04-13 2001-10-09 Eyematic Interfaces, Inc. Face recognition from video images
US6477201B1 (en) * 1998-05-22 2002-11-05 Sarnoff Corporation Content-adaptive compression encoding
AUPP400998A0 (en) * 1998-06-10 1998-07-02 Canon Kabushiki Kaisha Face detection in digital images
US6023183A (en) * 1998-06-15 2000-02-08 International Business Machines Corporation Voltage conversion circuit and method
US6141041A (en) * 1998-06-22 2000-10-31 Lucent Technologies Inc. Method and apparatus for determination and visualization of player field coverage in a sporting event
US6292575B1 (en) * 1998-07-20 2001-09-18 Lau Technologies Real-time facial recognition and verification system
US6924832B1 (en) * 1998-08-07 2005-08-02 Be Here Corporation Method, apparatus & computer program product for tracking objects in a warped video image
US6999604B1 (en) * 1998-08-07 2006-02-14 Korea Institute Of Science And Technology Apparatus and method for detecting a moving object in a sequence of color frame images
GB2341231A (en) * 1998-09-05 2000-03-08 Sharp Kk Face detection in an image
US6480615B1 (en) * 1999-06-15 2002-11-12 University Of Washington Motion estimation within a sequence of data frames using optical flow with adaptive gradients
US6545706B1 (en) * 1999-07-30 2003-04-08 Electric Planet, Inc. System, method and article of manufacture for tracking a head of a camera-generated image of a person
US6526161B1 (en) 1999-08-30 2003-02-25 Koninklijke Philips Electronics N.V. System and method for biometrics-based facial feature extraction
EP1968012A3 (en) * 1999-11-16 2008-12-03 FUJIFILM Corporation Image processing apparatus, image processing method and recording medium
US7123745B1 (en) * 1999-11-24 2006-10-17 Koninklijke Philips Electronics N.V. Method and apparatus for detecting moving objects in video conferencing and other applications
US6754389B1 (en) * 1999-12-01 2004-06-22 Koninklijke Philips Electronics N.V. Program classification using object tracking
GB2358098A (en) * 2000-01-06 2001-07-11 Sharp Kk Method of segmenting a pixelled image
US6829395B2 (en) * 2000-01-20 2004-12-07 Axis, Ab Apparatus and method for storing and reading digital images
US6970598B1 (en) * 2000-01-21 2005-11-29 Xerox Corporation Data processing methods and devices
US6668070B2 (en) * 2000-03-29 2003-12-23 Sony Corporation Image processing device, image processing method, and storage medium
US6580821B1 (en) * 2000-03-30 2003-06-17 Nec Corporation Method for computing the location and orientation of an object in three dimensional space
JP3603737B2 (ja) * 2000-03-30 2004-12-22 日本電気株式会社 移動体追尾方法及びその装置
EP1158786A3 (en) * 2000-05-24 2005-03-09 Sony Corporation Transmission of the region of interest of an image
US6731799B1 (en) * 2000-06-01 2004-05-04 University Of Washington Object segmentation with background extraction and moving boundary techniques
US6826292B1 (en) * 2000-06-23 2004-11-30 Sarnoff Corporation Method and apparatus for tracking moving objects in a sequence of two-dimensional images using a dynamic layered representation
US6665450B1 (en) * 2000-09-08 2003-12-16 Avid Technology, Inc. Interpolation of a sequence of images using motion analysis
US6965684B2 (en) 2000-09-15 2005-11-15 Canon Kabushiki Kaisha Image processing methods and apparatus for detecting human eyes, human face, and other objects in an image
US6680745B2 (en) * 2000-11-10 2004-01-20 Perceptive Network Technologies, Inc. Videoconferencing method with tracking of face and dynamic bandwidth allocation
US6678413B1 (en) * 2000-11-24 2004-01-13 Yiqing Liang System and method for object identification and behavior characterization using video analysis
US7020305B2 (en) * 2000-12-06 2006-03-28 Microsoft Corporation System and method providing improved head motion estimations for animation
JP2002175538A (ja) * 2000-12-08 2002-06-21 Mitsubishi Electric Corp 似顔絵生成装置及び似顔絵生成方法及び似顔絵生成プログラムを記録した記録媒体及び通信用端末及び通信用端末による通信方法
US6670963B2 (en) 2001-01-17 2003-12-30 Tektronix, Inc. Visual attention model
US6964023B2 (en) 2001-02-05 2005-11-08 International Business Machines Corporation System and method for multi-modal focus detection, referential ambiguity resolution and mood classification using multi-modal input
GB2372165A (en) * 2001-02-10 2002-08-14 Hewlett Packard Co A method of selectively storing images
US20020168091A1 (en) * 2001-05-11 2002-11-14 Miroslav Trajkovic Motion detection via image alignment
US6870945B2 (en) * 2001-06-04 2005-03-22 University Of Washington Video object tracking by estimating and subtracting background
JP4596222B2 (ja) * 2001-06-26 2010-12-08 ソニー株式会社 画像処理装置および方法、記録媒体、並びにプログラム
JP4840630B2 (ja) * 2001-06-27 2011-12-21 ソニー株式会社 画像処理装置および方法、記録媒体、並びにプログラム
JP3920849B2 (ja) * 2001-06-29 2007-05-30 株式会社エヌ・ティ・ティ・ドコモ 画像符号化装置、画像復号装置、画像符号化方法、及び画像復号方法
US7861169B2 (en) * 2001-11-19 2010-12-28 Ricoh Co. Ltd. Multimedia print driver dialog interfaces
US7130446B2 (en) * 2001-12-03 2006-10-31 Microsoft Corporation Automatic detection and tracking of multiple individuals using multiple cues
JP2003174504A (ja) 2001-12-05 2003-06-20 Mitsubishi Electric Corp 通話機能付き携帯端末装置およびそのための制御装置、ならびにバックライト制御方法
KR100456619B1 (ko) * 2001-12-05 2004-11-10 한국전자통신연구원 에스.브이.엠(svm)을 이용한 얼굴 등록/인증 시스템 및방법
US7277580B2 (en) * 2001-12-12 2007-10-02 Sony Corporation Multiple thresholding for video frame segmentation
KR100411347B1 (ko) * 2001-12-29 2003-12-18 엘지전자 주식회사 동영상 비디오의 장면전환 검출 방법
AUPS140502A0 (en) * 2002-03-27 2002-05-09 Seeing Machines Pty Ltd Method for automatic detection of facial features
US7212670B1 (en) * 2002-05-03 2007-05-01 Imagetree Corp. Method of feature identification and analysis
US7082211B2 (en) * 2002-05-31 2006-07-25 Eastman Kodak Company Method and system for enhancing portrait images
AU2003236900A1 (en) 2002-06-12 2003-12-31 British Telecommunications Public Limited Company Video pre-processing
US7190809B2 (en) * 2002-06-28 2007-03-13 Koninklijke Philips Electronics N.V. Enhanced background model employing object classification for improved background-foreground segmentation
KR100474848B1 (ko) 2002-07-19 2005-03-10 삼성전자주식회사 영상시각 정보를 결합하여 실시간으로 복수의 얼굴을검출하고 추적하는 얼굴 검출 및 추적 시스템 및 방법
US7227893B1 (en) * 2002-08-22 2007-06-05 Xlabs Holdings, Llc Application-specific object-based segmentation and recognition system
US7035461B2 (en) * 2002-08-22 2006-04-25 Eastman Kodak Company Method for detecting objects in digital images
EP1418530B1 (en) * 2002-10-08 2012-12-05 Sony France S.A. Adaptive artificial vision method and system
KR100455294B1 (ko) * 2002-12-06 2004-11-06 삼성전자주식회사 감시 시스템에서의 사용자 검출 방법, 움직임 검출 방법및 사용자 검출 장치
JP2004220555A (ja) 2002-12-27 2004-08-05 Fuji Photo Film Co Ltd 画像から被写体領域を抽出する装置、方法、プログラムおよびプログラムを記録した記録媒体
US6999600B2 (en) * 2003-01-30 2006-02-14 Objectvideo, Inc. Video scene background maintenance using change detection and classification
US7599524B2 (en) * 2003-04-04 2009-10-06 Sarnoff Corporation Method and apparatus for providing a robust object finder
WO2005036456A2 (en) * 2003-05-12 2005-04-21 Princeton University Method and apparatus for foreground segmentation of video sequences
US7430335B2 (en) * 2003-08-13 2008-09-30 Apple Inc Pre-processing method and system for data reduction of video sequences and bit rate reduction of compressed video sequences using spatial filtering
US7536032B2 (en) * 2003-10-24 2009-05-19 Reactrix Systems, Inc. Method and system for processing captured image information in an interactive video display system
US7127083B2 (en) * 2003-11-17 2006-10-24 Vidient Systems, Inc. Video surveillance system with object detection and probability scoring based on object class
US7136507B2 (en) * 2003-11-17 2006-11-14 Vidient Systems, Inc. Video surveillance system with rule-based reasoning and multiple-hypothesis scoring
US20050104960A1 (en) * 2003-11-17 2005-05-19 Mei Han Video surveillance system with trajectory hypothesis spawning and local pruning
JP2005182196A (ja) * 2003-12-16 2005-07-07 Canon Inc 画像表示方法および画像表示装置
JP2005293539A (ja) 2004-03-08 2005-10-20 Matsushita Electric Works Ltd 表情認識装置
JP4819380B2 (ja) * 2004-03-23 2011-11-24 キヤノン株式会社 監視システム、撮像設定装置、制御方法、及びプログラム
US8594391B2 (en) * 2004-05-06 2013-11-26 Avago Technologies General Ip (Singapore) Pte. Ltd. Finger-based identification systems and methods
GB2414614A (en) * 2004-05-28 2005-11-30 Sony Uk Ltd Image processing to determine most dissimilar images
EP1622009A1 (en) * 2004-07-27 2006-02-01 Texas Instruments Incorporated JSM architecture and systems
WO2006025185A1 (ja) * 2004-08-31 2006-03-09 Matsushita Electric Industrial Co., Ltd. 監視記録装置およびその方法
US20060067562A1 (en) * 2004-09-30 2006-03-30 The Regents Of The University Of California Detection of moving objects in a video
US7391907B1 (en) * 2004-10-01 2008-06-24 Objectvideo, Inc. Spurious object detection in a video surveillance system
US7583287B2 (en) * 2005-03-22 2009-09-01 Microsoft Corp. System and method for very low frame rate video streaming for face-to-face video conferencing
US7602944B2 (en) * 2005-04-06 2009-10-13 March Networks Corporation Method and system for counting moving objects in a digital video stream
US7409076B2 (en) * 2005-05-27 2008-08-05 International Business Machines Corporation Methods and apparatus for automatically tracking moving entities entering and exiting a specified region
JP2009508450A (ja) * 2005-09-13 2009-02-26 ヴェリフィコン コーポレーション 物体のトラッキングおよび活動分析のためのシステムおよび方法
US8150155B2 (en) 2006-02-07 2012-04-03 Qualcomm Incorporated Multi-mode region-of-interest video object segmentation

Also Published As

Publication number Publication date
CN101375608A (zh) 2009-02-25
JP2009526495A (ja) 2009-07-16
EP1994761A2 (en) 2008-11-26
US20070183663A1 (en) 2007-08-09
WO2007092905A2 (en) 2007-08-16
KR20080099296A (ko) 2008-11-12
US8265349B2 (en) 2012-09-11
JP2012155727A (ja) 2012-08-16
KR101023733B1 (ko) 2011-03-25
WO2007092905A3 (en) 2007-12-13

Similar Documents

Publication Publication Date Title
JP4988770B2 (ja) モード間の関心領域画像オブジェクト区分
JP4981818B2 (ja) モード間の関心領域ビデオオブジェクトセグメンテーション
JP4819912B2 (ja) マルチモードの関心領域ビデオオブジェクトセグメンテーション
US20220067946A1 (en) Video background subtraction using depth
US8983152B2 (en) Image masks for face-related selection and processing in images
EP3767520B1 (en) Method, device, equipment and medium for locating center of target object region
WO2005116910A2 (en) Image comparison
JP2006508462A (ja) 顔検出
WO2020052275A1 (zh) 图像处理方法、装置、终端设备、服务器及系统
KR20140134549A (ko) 연속 촬영 이미지에서의 고조점 이미지 추출 장치 및 방법
Zafarifar et al. Blue sky detection for picture quality enhancement
KR102194511B1 (ko) 대표 영상프레임 결정시스템 및 이를 이용한 방법
Ramkissoon et al. Scene and Texture Based Feature Set for DeepFake Video Detection
TWI624793B (zh) 物件偵測的適應系統與方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110906

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20111206

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20111213

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120301

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120327

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120426

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150511

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees