JP2010521757A - 映像における移動物体の一般的な色への分類方法、装置およびプログラム(映像における移動物体の一般的な色への分類) - Google Patents

映像における移動物体の一般的な色への分類方法、装置およびプログラム(映像における移動物体の一般的な色への分類) Download PDF

Info

Publication number
JP2010521757A
JP2010521757A JP2009553986A JP2009553986A JP2010521757A JP 2010521757 A JP2010521757 A JP 2010521757A JP 2009553986 A JP2009553986 A JP 2009553986A JP 2009553986 A JP2009553986 A JP 2009553986A JP 2010521757 A JP2010521757 A JP 2010521757A
Authority
JP
Japan
Prior art keywords
color
histogram
quantization
object trajectory
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009553986A
Other languages
English (en)
Other versions
JP4988872B2 (ja
Inventor
ブラウン、リサ、マリー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2010521757A publication Critical patent/JP2010521757A/ja
Application granted granted Critical
Publication of JP4988872B2 publication Critical patent/JP4988872B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

【課題】 映像において移動物体を一般的な色に分類するための改良された解決策を提供する。
【解決手段】 映像において移動物体を一般的な色に分類するための改良された解決策を提供する。本発明の一実施形態では、映像において移動物体を分類するための方法は、映像入力を受信するステップと、映像入力の少なくとも1つの物体軌跡を特定するステップと、少なくとも1つの物体軌跡の正規化累積ヒストグラムを生成するステップと、ヒストグラムのパラメータ化量子化を実行するステップであって、彩度および光度の1つから導出された少なくとも1つの表面曲線に基づいてヒストグラムを複数の領域に分離することを含む、ステップ、または、量子化ヒストグラムの有意な色を識別するステップの1つと、を含む。
【選択図】 図2

Description

本発明の態様は、一般に、ビデオ処理および色検索に関し、更に具体的には、映像において移動物体を一般的な色に分類することに関する。
多くの場合、色検索は、1組の画像から画像を検索することに基づいている。通常は画像全体が用いられる。場合によっては、画像を予め分割し、次いで物体の検索を実行する。ごく最近になって、色情報に基づいた映像からの移動物体検索について検討する研究が行われている。この研究は予備的なものであり、色の不変性の問題によって制限されている。その問題には、照明条件の変化、照明に対する表面の向きの変化、および物体の一般的な複雑さが含まれる。
色検索は、通常、予め定義された一般的な色に基づき、色サーチ空間から導出された問い合わせ例または色分類に基づいている。多くの場合、色検索は、問い合わせ入力または管理されていない学習を必要とし、これらは双方ともリソースを消費する。更に、訓練データ、特に、カメラ、ビュー、照明条件、または物体の種類の各組ごとに手動でまたは半自動的にラベルを付けたデータを有しなければならない必要性は、非効率的である。
また、これらの様々な色検索方法は適応的でない。新しいカメラ、ビュー、照明条件、または物体の種類に対処するためには、分類を更新するための追加の訓練データが暗黙的に必要とされている。
更に、色検索方法は、画像、領域、または物体を照合するために、複雑な色分布情報を用いる。例えば、空間色ヒストグラムを用いて複雑な物体の色を記述する。しかしながら、これらの方法はいくつかの問題に対して適切に対処しないので、これらには欠点がある。その第1のものは、色不変性の問題である。人は、広範囲の照明条件にわたって、ある物体を同一の色として知覚する。しかしながら、実際の物体の画素は、同じ色に知覚されても、照明条件によっては色スペクトル全体におよぶ値を有する場合がある。第2に、映像から抽出された移動物体は、背景から完全には分割されない。多くの場合、影は物体の一部であり、物体と背景モデルとの類似性のために、分割においてエラーが生じる。最後に、複雑な物体は1つの色が支配的ではない。人にとって重要なのは物体のいくつかの側面であるが、これは物体および用途の種類によって異なる。これらの欠点は全て、一般的な色記述子に基づいた移動物体の選択を難しくする。
前述のことに鑑み、関連技術における欠点の1つ以上を克服する必要がある。
本発明の態様は、映像において移動物体を一般的な色に分類するための改良された解決策を提供する。本発明の一実施形態では、映像において移動物体を分類するための方法は、映像入力を受信するステップと、映像入力の少なくとも1つの物体軌跡を特定するステップと、少なくとも1つの物体軌跡の正規化累積ヒストグラムを生成するステップと、ヒストグラムのパラメータ化量子化を実行するステップであって、彩度および光度の1つから導出された少なくとも1つの表面曲線に基づいてヒストグラムを複数の領域に分離することを含む、ステップ、または、量子化ヒストグラムの有意な色を識別するステップの1つと、を含む。
本発明の第1の態様は、映像において移動物体を分類するための方法を提供する。この方法は、映像入力を受信するステップと、映像入力の少なくとも1つの物体軌跡を特定するステップと、少なくとも1つの物体軌跡の正規化累積ヒストグラムを生成するステップと、ヒストグラムのパラメータ化量子化を実行するステップであって、彩度および光度の1つから導出された少なくとも1つの表面曲線に基づいてヒストグラムを複数の領域に分離することを含む、ステップ、または、量子化ヒストグラムの有意な色を識別するステップの1つと、を含む。
本発明の第2の態様は、映像において移動物体を分類するためのシステムを提供する。この方法は、映像入力を受信するためのシステムと、映像入力の少なくとも1つの物体軌跡を特定するためのシステムと、少なくとも1つの物体軌跡の正規化累積ヒストグラムを生成するためのシステムと、ヒストグラムのパラメータ化量子化を実行するためのシステムであって、彩度および光度の1つから導出された少なくとも1つの表面曲線に基づいてヒストグラムを複数の領域に分離することを含む、システム、または、量子化ヒストグラムの有意な色を識別するためのシステムの1つと、を含む。
本発明の第3の態様は、コンピュータ読み取り可能媒体上に記憶されるコンピュータ・プログラム・コードを含むコンピュータ・プログラムを提供する。このプログラムは、実行されると、コンピュータ・システムが映像において移動物体を一般的な色に分類する方法を実施することを可能とする。この方法は、映像入力を受信するステップと、映像入力の少なくとも1つの物体軌跡を特定するステップと、少なくとも1つの物体軌跡の正規化累積ヒストグラムを生成するステップと、ヒストグラムのパラメータ化量子化を実行するステップであって、彩度および光度の1つから導出された少なくとも1つの表面曲線に基づいてヒストグラムを複数の領域に分離することを含む、ステップ、または、量子化ヒストグラムの有意な色を識別するステップの1つと、を含む。
本発明の第4の態様は、電話会議の参加者に優先順位をつけるためのシステムを発生する方法を提供する。この方法は、映像入力を受信することと、映像入力の少なくとも1つの物体軌跡を特定することと、少なくとも1つの物体軌跡の正規化累積ヒストグラムを生成することと、ヒストグラムのパラメータ化量子化を実行することであって、彩度および光度の1つから導出された少なくとも1つの表面曲線に基づいてヒストグラムを複数の領域に分離することを含むこと、または、量子化ヒストグラムの有意な色を識別することの1つと、を実行するように動作可能であるコンピュータ・システムを提供するステップを含む。
本発明の第5の態様は、映像において移動物体を一般的な色に分類するためのデータ処理システムを提供する。このシステムは、処理ユニットと、処理ユニットに結合されたバスと、バスに結合されプログラム・コードを含むメモリ媒体と、を含み、このプログラム・コードは、処理ユニットによって実行された場合、データ処理ユニットに、映像入力を受信することと、映像入力の少なくとも1つの物体軌跡を特定することと、少なくとも1つの物体軌跡の正規化累積ヒストグラムを生成することと、ヒストグラムのパラメータ化量子化を実行することであって、彩度および光度の1つから導出された少なくとも1つの表面曲線に基づいてヒストグラムを複数の領域に分離することを含むこと、または、量子化ヒストグラムの有意な色を識別することの1つと、を実行させる。
本発明の第6の態様は、映像において移動物体を一般的な色に分類するための少なくとも1つの伝搬信号において具現化されるコンピュータ・ソフトウェアを提供する。少なくとも1つの伝搬信号は、少なくともコンピュータ・システムに、映像入力を受信することと、映像入力の少なくとも1つの物体軌跡を特定することと、少なくとも1つの物体軌跡の正規化累積ヒストグラムを生成することと、ヒストグラムのパラメータ化量子化を実行することであって、彩度および光度の1つから導出された少なくとも1つの表面曲線に基づいてヒストグラムを複数の領域に分離することを含むこと、または、量子化ヒストグラムの有意な色を識別することの1つと、を実行させるための命令を含む。
本発明の第7の態様は、映像において移動物体を一般的な色に分類するための事業方法を提供する。この事業方法は、本発明に記載したプロセスを実行する少なくとも1つのコンピュータ・システムを含むネットワークを管理するステップと、この管理に基づいて支払いを受け取るステップと、を含む。
本発明の例示的な態様は、本発明において述べた問題の1つ以上または述べない1つ以上の他の問題あるいはその両方を解決するように意図されている。
本発明のこれらおよび他の特徴は、以下の本発明の様々な態様の詳細な説明を、本発明の様々な実施形態を示す添付図面に関連付けることによって、より容易に明らかとなろう。
図面は縮尺どおりに描かれているわけではないことに留意すべきである。図面は、本発明の典型的な態様を図示するように意図されており、従って、本発明の範囲を限定するものとして見なされるものではない。図面において、同様の番号は図面全体を通して同様の要素を表す。
本発明の一実施形態に従った、映像において移動物体を一般的な色に分類するためのシステムのための例示的な環境を示す。 本発明の一実施形態に従った、映像において移動物体を一般的な色に分類するための例示的な環境の詳細図を示す。 本発明の一実施形態に従った、映像において移動物体を一般的な色に分類するための例示的なデータ・フローを示す。 本発明の実施形態に従った例示的な色空間を示す。 本発明の実施形態に従った例示的な色空間を示す。
上述のように、本発明の態様は、映像において移動物体を一般的な色に分類するための改良された解決策を提供する。本発明の一実施形態では、映像において移動物体を分類するための方法は、映像入力を受信するステップと、映像入力の少なくとも1つの物体軌跡を特定するステップと、少なくとも1つの物体軌跡の正規化累積ヒストグラムを生成するステップと、ヒストグラムのパラメータ化量子化を実行するステップであって、彩度および光度の1つから導出された少なくとも1つの表面曲線に基づいてヒストグラムを複数の領域に分離することを含む、ステップ、または、量子化ヒストグラムの有意な色を識別するステップの1つと、を含む。本発明において用いる場合、特に注記しない限り、「設定」という言葉は1つ以上(少なくとも1つ以上)を意味し、「いずれかの解決策」という言葉はいずれかの既知または後に生み出される解決策を意味する。
本発明の態様は、移動物体を、例えば、少数の予め定義された色または規範の色あるいはその両方の1つに分類することを実行する。この方法の態様は、各物体軌跡ごとの正規化累積色ヒストグラムを収集し、それを円筒形の(色相、彩度、光度)HSI空間に変換することに基づいている。本発明の態様は、この空間を、ユーザによってまたはシーンのアクティブな色測定によって設定可能なパラメータ化によってインテリジェントに分割するための機構を記述する。色空間をインテリジェントに個別化(discretize)する機能は、色相、彩度、および光度間の関係の使用に基づいている。色情報は彩度および光度の双方が欠如することによって制限される場合があるので、本発明の方法の態様は、円筒形の空間において彩度および光度の関数によって定義した表面に沿って色空間を分離する。また、対象となる有意な色の学習は、ユーザ・パラメータに基づくことができ、または、シーンの前景において「追跡された」移動物体の区分から累積された情報を用いて導出することができる。これによって、本発明の態様は、一般的な色または一般的な色記述子あるいはその両方に基づいた移動物体イベントの有益な選択を行うことを可能とする。
図面に移ると、図1は、本発明の一実施形態に従って映像において移動物体を一般的な色に分類するための例示的な環境を示す。この範囲において、少なくとも1つのカメラ42が、シーンまたは背景90を捕捉する。多くの場合、背景またはシーン90は、94で示す移動中の車両、人物、動物等、少なくとも1つの物体92(または物体軌跡)を含むことができる。デジタル映像入力42が取得され、システム12に送信される。このシステム12は、例えば、本発明において述べるように、色分類プログラム30、データ50等を含む。
図2は、本発明の一実施形態に従って、映像40において移動物体92(図1)を一般的な色に分類するための例示的な環境10の詳細な図を示す。この範囲において、環境10は、コンピュータ・システム12を含み、これが、映像40において移動物体92を一般的な色に分類するために本発明において記載するプロセスを実行することができる。具体的には、コンピュータ・システム12は、コンピューティング・デバイス14を含むものとして図示され、これは色分類プログラム30を含み、本発明に記載するプロセスを実行することによって、映像40において移動物体92(図1)を一般的な色に分類するためにコンピューティング・デバイス14を動作可能とする。
コンピューティング・デバイス14は、プロセッサ20と、メモリ22Aと、入出力(I/O)インタフェース24と、バス26と、を含むものとして図示されている。更に、コンピューティング・デバイス14は、外部のI/Oデバイス/リソース28および記憶デバイス22Bと通信を行うように図示されている。一般に、プロセッサ20は、メモリ22Aまたは記憶デバイス22Bあるいはその両方等の記憶システムに記憶された色分類プログラム30等のプログラム・コードを実行する。プログラム・コードを実行する一方で、プロセッサ20は、メモリ22A、記憶デバイス22B、またはI/Oインタフェース24あるいはそれら全てへのまたはそれらからのデータ36等のデータの読み取りまたは書き込みまたはその両方を実行することができる。バス26は、コンピューティング・デバイス14内の各コンポーネント間の通信リンクを提供する。I/Oデバイス28は、ユーザ16とコンピューティング・デバイス14との間、またはデジタル映像入力40とコンピューティング・デバイス14との間、またはそれら両方の間で情報を転送するいずれかのデバイスを含むことができる。この範囲において、I/Oデバイス28はユーザI/Oデバイスを含み、これによって各ユーザ16はコンピューティング・デバイス14または通信デバイスあるいはそれら両方と対話することができ、デジタル映像入力40等の要素が、いずれかの種類の通信リンクを用いてコンピューティング・デバイス14と通信を行うことを可能とすることができる。
いずれの場合であっても、コンピューティング・デバイス14は、インストールされたプログラム・コードを実行可能ないずれかの汎用コンピューティング製造品を含むことができる。しかしながら、コンピューティング・デバイス14および色分類プログラム30は、本発明において記載するプロセスを実行可能である様々な考えられる均等なコンピューティング・デバイスを表すに過ぎないことは理解されよう。この範囲において、他の実施形態においては、コンピューティング・デバイス14および色分類プログラム30が提供する機能は、汎用または特定用途向けあるいはその両方のハードウェアまたはプログラム・コードあるいはその両方のいずれかの組み合わせを含むコンピューティング製造品によって実施することができる。各実施形態において、プログラム・コードおよびハードウェアは、標準的なプログラミングおよびエンジニアリング技法を用いてそれぞれ生成することができる。
同様に、コンピューティング・システム12は、本発明の態様を実施するための様々な種類のコンピュータ・システムを例示するに過ぎない。例えば、一実施形態において、コンピュータ・システム12は、ネットワーク、共有メモリ等のいずれかの種類の通信リンクを介して通信を行って本発明に記載するプロセスを実行する2つ以上のコンピューティング・デバイスを含む。更に、本発明に記載されるプロセスを実行する一方で、コンピュータ・システム12内の1つ以上のコンピューティング・デバイスが、いずれかの種類の通信リンクを用いて、コンピュータ・システム12の外部の1つ以上の他のコンピューティング・デバイスと通信を行うことができる。いずれの場合であっても、通信リンクは、様々な種類の有線または無線あるいはその両方のリンクのいずれかの組み合わせを含むことができ、1つ以上の種類のネットワークのいずれかの組み合わせを含むことができ、または様々な種類の伝送技法およびプロトコルのいずれかの組み合わせを利用することができ、またはそれら全てとすることができる。
本発明において述べるように、色分類プログラム30によって、コンピュータ・システム12は、映像40において移動物体92(図1)を一般的な色(複数の色)に分類することができる。この範囲において、色分類プログラム30は、物体軌跡モジュール32と、ヒストグラム・モジュール34と、パラメータ化モジュール36と、色表明(signifier)モジュール38と、を含むものと図示されている。これらのモジュールの各々の動作については、本明細書において更に述べる。しかしながら、図2に示す様々なモジュールのいくつかは、別個に実施されるか、組み合わされるか、またはコンピュータ・システム12に含まれる1つ以上の別個のコンピューティング・デバイスのメモリに記憶されるか、あるいはそれら全てとすることができることは理解されよう。更に、モジュールまたは機能あるいはその両方のいくつかは実施されない場合があり、または、追加のモジュールまたは機能あるいはその両方をコンピューティング・システム12の一部として含ませることも可能であることは理解されよう。
本発明の態様は、映像40において移動物体92(図1)を一般的な色に分類するための改良された解決策を提供する。この範囲において、図3は、本発明の一実施形態に従って、色分類プログラム30(図2)のモジュールを用いることによって映像40において移動物体92(図1)を一般的な色に分類するための例示的なデータ・フローを示す。例えば、システム12は、D1において、デジタル色映像入力40を受信する。デジタル色映像入力40は、典型的には赤−緑−青(RGB)フォーマットであり、各時点において映像入力フレームが物体軌跡モジュール32(図2)に到着する。
S1において、オブジェクト軌跡モジュール32(図2)は、リアル・タイムでまたは遅延モードでフレームを分析して、デジタル色映像入力40において生じる物体軌跡92(図1)の全てを特定する。物体軌跡92は、フレーム当たり1つずつ、分割された1組の物体を含み、以降の1組のフレーム全体を通して関連付けられている。例えば、物体軌跡92は、車または人物がシーン90(図1)の92(図1)を通ってまたはその中であるいはその両方で横断または移動する際のその車または人物のインスタンスとすることができる。物体軌跡モジュール32(図2)は更に、少なくとも2つの部分を含むことができる。すなわち、分割された前景「ブロブ(blob)」(例えば背景モデルとは大きく異なる隣接画素)を出力する背景減算モジュールと、分割された前景「ブロブ」を関連付けて物体軌跡92を構成する追跡(tracker)・モジュールと、である。追跡モジュールが用いるモデルに従って、前景「ブロブ」を、合併し、分割し、または再構成し、あるいはそれら全てを行って、シーン90内の移動物体軌跡92を最適に特定することができる。
物体軌跡92は、画素当たりの色情報を含むことができる。これは通常、赤、緑、および青に関連付けられた3つの8ビット色である。別の一般的な表現は、輝度/帯域幅/クロミナンス(YUV)、または輝度/クロミナンス空間である。S2において、物体軌跡モジュール32は、画素色を色調/彩度/光度すなわちHSI(時にHSVと呼ばれる)空間に変換する。HSI空間に変換するために、現在既知であるかまたは後に生成される標準的な非線形変換方法を使用可能である。
この方法をリアル・タイム・システムにとって計算的に実現可能とするために、任意にS3を含むことができる。S3では、物体軌跡モジュール32は更にサブ軌跡(sub-track)色選択モジュールを含み、これは、HSI物体軌跡92のフレームをリアル・タイムでサブサンプリング(sub sample)する。サブ軌跡色選択モジュールは、軌跡がどのくらい長いのかを必ずしもあらかじめ知っているわけではない。このように、サブ軌跡色選択モジュールは、最初は頻繁に色情報を取得し、軌跡の寿命が持続するにつれて徐々にこの頻度を低下させる。このように、軌跡は、その持続時間が短い場合には充分なサンプルが保証されるが、軌跡の寿命が長い場合には、軌跡の寿命全体に分布したデータをサンプリングするように、周期的に更新される。サンプリングには、以下の幾何学公式を用いることができる。
i>S+M*2 (式1−1)
式1−1において、iはこれまでの物体軌跡のフレーム数であり、Sはサンプリングの開始前に必要なフレーム数である。後者は、軌跡が現在安定した状態にあることを保証するための最小フレーム数に基づいている。このパラメータは、物体軌跡モジュール32から取得した他の情報によって置換することができる。定数Mは、スキップするフレームの最初の番号(最初のSフレームの後)であり、以降、次のサンプリングの前に続けて2倍にされる数である。反復(iterator)nは、最初はゼロに設定され、式1−1を満たすたびに増分される。
例えば、映像40が毎秒30フレームのフレーム・レートを有する場合、S=60(2秒)およびM=5であり、物体軌跡は60、65、70、80、100、140、および180(等)のフレームでサンプリングされる。軌跡が安定化した後にサンプリングが開始され、最初は高頻度でサンプリングされ、徐々に遅くなっていく。
S4では、ヒストグラム・モジュール34によって、S2(または用いる場合はS3)におけるサブHSI物体軌跡出力に基づいて、物体軌跡のためのHSI空間における正規化累積ヒストグラムを生成する。HSI物体軌跡の各フレームがヒストグラム・モジュール34に入力されると、この物体軌跡のためのHSIヒストグラムに累積されて連続的に正規化される。例えば、8x8x8ビン(bin)を使用可能である。任意に、ヒストグラム・モジュール34は出力54を生成することができ、これは、パラメータ52(D2またはD3あるいはその両方)の発生に役立てることができる。この方法は次いで、S5に進むか、または直接S6に進むことができる。
S5において、パラメータ化モジュール36(図2)は、各軌跡ヒストグラムに対してパラメータ化量子化を実行する。これは、軌跡が終了し、最後のヒストグラムが計算された時点で行うことができる。量子化は段階的なものである。第1に、彩色および無彩色の色空間領域のパラメータ化分離を行う。次いで、各副領域(subregion)を更に分離する。彩色/無彩色分離は、光度によって変動する彩度レベルに従ってHSI空間60(図4、図5)を分割する曲線群に基づいている。図4に、この曲線群70の1つの構成要素の一例を(断面で)示す。HSI空間60に、光度62、彩度64、および色相66が図示されている。例えば、光度62が極めて大きいか極めて小さい場合、彩色領域に含まれるために必要な彩度レベル64は非常に高い。中間領域の光度62では、彩度レベル64が非常に高いことは必要でない。これは実際には、いくつかのカメラ/ビュー/証明条件では、ある程度、色相66によって変動し得る。しかしながら、この曲線70がパラメータに従って変動して、無彩色として抽出される花瓶型の領域が徐々に狭くなるか、または2つの円錐形領域になるようにすることができる。図5に、このタイプの曲線群の構成要素または曲線70の一例を示す。この曲線群70を生成するために用いるパラメータを定義可能な方法はいくつかある。ヒストグラムが比較的小さい場合に使用可能な1つの簡単な例は、各光度レベル62ごとに彩度の境界を明確に含むことである。別の可能性は、図4に示す円p1、p2、およびp3からの内挿に基づいた双一次または単純な曲線モデルである。いったんこの分離を実行したら、各副領域を更に分解する。無彩色領域は、閾値に基づいて少数のグレー・レベル(grey level)に分離することができる。彩色領域は、指定された色相数およびそれらの対応する波長に基づいて、様々な色相に分離される。人工的な着色を導入する照明条件では、それに従って色分離を歪める場合がある。
S5の代わりに、またはS5の後に、この方法ではS6において、色表明モジュール38(図2)が、量子化奇跡ヒストグラムにおいて見出された少数(例えば3つ)の主要な色を計算または検出する。一実施形態において、これは、ヒストグラムにおいて最大のピークまたはモードを求めることに基づいている。
S7において、色表明モジュール38(図2)は、S6において求められた主要な色に基づいて、物体軌跡の単一の主要な色を特定する。色表明モジュール38は、従来技術と共に述べた問題の2つに対処する。第1の問題は、背景から真の物体を分割する困難から生じる。多くの場合、影が含まれ、物体の一部が失われるか、または背景の一部がカモフラージュ・エラー(camouflage error)のために誤って含まれてしまう。カモフラージュ・エラーは、背景および前景の物体の類似性のために生じる。第2の問題は、多くの場合、移動物体が複雑で、多数の構成要素を含み、その各々が多数の色であり得るという事実によるものである。それらは実際には、人の知覚によっても(すなわち色の不変性の問題なしでも)、1色が支配的ではない。しかしながら、人はこのような複雑な物体を、少数の規範色の1つとして分類することができる(実際に分類する)。この良い例が車両色認識の場合である。多くの場合、典型的な車は、タイヤ、窓、フロントガラス、およびバンパのために主として黒または銀である(影、反射、および誤って道路または背景の断片を含むことは言うまでもない)が、人は車のボディーの色に基づいてその車両に言及するということが頻繁に起こる。同様に、人は、コートまたはジャケットの色に従って小売環境に入る人々を分類することが役立つと感じている。
色表明モジュール38は、有意な色検出を実行するために、黒、白、および各々が有意の色となるのに必要な色の量を示す閾値を、ユーザ16(またはシステム12)が指定することを可能とする。それらの量が充分である場合(これは極めて小さい場合がある)、無彩色領域上で色相が選択される。また、異なる色を識別する難しさに関連したパラメータに基づいて異なる色が存在するか否かを決定するために、異なる閾値を用いる。例えば、赤、黄、オレンジ、ピンク、および白に比べて、黒、緑、紫、および灰は、見分けることが難しい場合がある。このように、色表明モジュール38は、本発明の様々な実施形態においてフィードバックを提供することができる。
別の実施形態においては、ユーザ16は、D2において、軌跡ヒストグラムを量子化するためのパラメータ52を明確に指定することができる。
別の実施形態においては、ユーザ16は、物体軌跡上で直接色空間の個別化をフィードバック視覚化することによって、または物体軌跡をデータ50に記憶される色カテゴリに分類することによって、パラメータ52を指定することができる。本発明において述べるこれらの実施形態の全てにおいて、IBM社のSmart Surveillance System[S3]等のシステムを用いて、物体追跡、軌跡色ヒストグラム生成、量子化、またはカテゴリ化あるいはそれら全ての中間結果および最終結果にアクセスすることができる。かかるシステムによって、ユーザは、パラメータ化の現在の結果を迅速に視覚的に調べ、このパラメータ化の変更の影響に関するフィードバックを即座に得ることができる。一実施形態では、ユーザ16は、色空間のパラメータ化を対話式に変更し、どのように物体軌跡の画素を色空間において個別化するか、または一般的な色に分類するか、あるいはその両方について検討することができる。
別の実施形態においては、パラメータ52(図3)は、S4において累積ヒストグラムを生成したヒストグラム・モジュール34からの軌跡ヒストグラム出力54(図3)から導出される。
別の実施形態では、物体色分布を用いて、色空間を量子化するパラメータを最適に指定することができる。これは、自動的に、またはユーザ・フィードバックを用いて実行可能であるが、映像/シーン/カメラ/照明条件の再評価を必要としない。色分布情報が長期間にわたって変更された条件を通して収集される場合、この情報を用いて、色分類を最適化するのに必要なパラメータにおける相対的な差を学ぶことができる。
別の実施形態においては、本発明は、コンピュータ読み取り可能媒体上に記憶されるコンピュータ・プログラムを提供する。このプログラムは、実行されると、コンピュータ・システムが映像40において移動物体92(図1)を一般的な色に分類することを可能とする。この範囲において、コンピュータ読み取り可能媒体は、本発明に記載するプロセスを実施する色分類プログラム30(図1)等のプログラム・コードを含む。「コンピュータ読み取り可能媒体」という言葉は、プログラム・コードのコピーを具現化(例えば物理的な具現化)することができるいずれかの種類の有形の(tangible)表現媒体の1つ以上を含むことは理解されよう。具体的には、コンピュータ読み取り可能媒体は、1つ以上の携帯型記憶製造品上、メモリ22A(図1)または記憶システム22B(図1)あるいはその両方等のコンピューティング・デバイスの1つ以上のデータ記憶部分上に、ネットワーク上を搬送されるデータ信号として(例えばコンピュータ・プログラムの有線/無線電子的配信中に)、紙上で(例えばスキャンされて電子データに変換することができる)等によって具現化されたプログラム・コードを含むことができる。
別の実施形態では、本発明は、映像40において移動物体92(図1)を一般的な色に分類するためのシステムを発生する方法を提供する。この場合、コンピュータ・システム12(図1)等のコンピュータ・システムを取得(例えば生成、維持、利用可能とする等)することができ、本発明に記載したプロセスを実行するための1つ以上のプログラム/システムを取得(例えば生成、購入、使用、変更等)して、コンピュータ・システムに展開することができる。この範囲で、この展開は、(1)コンピュータ読み取り可能媒体からコンピューティング・デバイス14(図1)等のコンピューティング・デバイス上にプログラム・コードをインストールすること、(2)コンピュータ・システムに1つ以上のコンピューティング・デバイスを追加すること、および(3)コンピュータ・システムの1つ以上の既存デバイスを組み込むかまたは変更するかあるいはその両方を行って、コンピュータ・システムが本発明に記載したプロセスを実行することを可能とすること、の1つ以上を含むことができる。
更に別の実施形態においては、本発明は、映像40において移動物体92(図1)を一般的な色に分類する事業方法を提供する。これによって、ユーザは、申し込み制、広告、または料金制、あるいはそれら全てで、本発明に記載したプロセスを実行することができる。すなわち、サービス提供業者は、本発明に記載したように、ユーザが映像40において移動物体92(図1)を一般的な色に分類することを可能とするネットワークまたはコンピュータ・システム12(図1)あるいはその両方を管理しようとする。この場合、サービス提供業者は、本発明に記載したプロセスを実行するコンピュータ・システム12等のコンピュータ・システムを用いてユーザが内容を伝達可能である仮想的または物理的あるいはその両方のネットワークを維持(例えば生成、維持、支持等)することができる。これに応答して、サービス提供業者は、申し込み契約または料金契約あるいはその両方のもとでユーザ(複数のユーザ)からの支払いを受け、1つ以上の第三者等への広告販売からの支払いを受けることができる。
本発明において用いる場合、「プログラム・コード」とは、いずれかの言語、コード、または表記におけるいずれかの1組のステートメントまたは命令を意味し、情報処理機能を有するコンピューティング・デバイスに、直接または、(a)別の言語、コード、または表記への変換、(b)異なる材料形態における再生、または(c)伸張、あるいはそれら全てのいずれかの組み合わせの後に、特定の機能を実行させることは理解されよう。この範囲で、プログラム・コードは、アプリケーション/ソフトウェア・プログラム、コンポーネント・ソフトウエア/機能ライブラリ、オペレーティング・システム、特定のコンピューティング、記憶、またはI/Oあるいはそれら全てのデバイスのための基本I/Oシステム/ドライバ等、コンピュータ・プログラムの1つ以上の種類のいずれかの組み合わせとして具現化することができる。
本発明の様々な態様のこれまでの記載は、例示および説明の目的のために提示したものである。網羅的であったり、開示した形態に本発明を厳密に限定したりすることは意図しておらず、明らかに、多くの変更および変形が可能である。当業者に明らかであり得るかかる変更および変形は、添付図面によって規定される本発明の範囲内に含まれる。

Claims (25)

  1. 映像において移動物体を分類するための方法であって、
    映像入力を受信するステップと、
    前記映像入力の少なくとも1つの物体軌跡を特定するステップと、
    前記少なくとも1つの物体軌跡の正規化累積ヒストグラムを生成するステップと、
    前記ヒストグラムのパラメータ化量子化を実行するステップであって、彩度および光度の1つから導出された少なくとも1つの表面曲線に基づいて前記ヒストグラムを複数の領域に分離することを含む、前記ステップと、
    前記量子化ヒストグラムの有意な色を識別するステップと、
    を含む、方法。
  2. 前記パラメータ化量子化および前記有意な色の1つを出力することを更に含む、請求項1に記載の方法。
  3. 前記実行するステップが、
    色空間を彩色領域および無彩色領域に分離することと、
    少なくとも1つの閾値を用いて前記領域を分割することと、
    を含む、請求項1に記載の方法。
  4. 前記少なくとも1つの物体軌跡の複数のフレームをサブサンプリングすることを更に含む、請求項1に記載の方法。
  5. 前記実行するステップが、色の個別化のフィードバック視覚化またはデータベースからの移動物体の色分類結果の1つを有する量子化パラメータを設定することを含む、請求項1に記載の方法。
  6. 前記ヒストグラムの出力を用いて量子化および有意な色の識別のパラメータの1つを導出するステップを更に含む、請求項1に記載の方法。
  7. 物体色分布を用いて前記量子化パラメータを指定するステップを更に含む、請求項1に記載の方法。
  8. 量子化および有意な色の識別のパラメータの1つに関連した相対的な差を求めるために、物体色分布に関連した履歴データを用いるステップを更に含む、請求項1に記載の方法。
  9. 前記少なくとも1つの物体軌跡を色相/彩度/光度(HSI)空間に変換するステップを更に含む、請求項1に記載の方法。
  10. 前記識別するステップが、色当たりの閾値を用いて黒および白にかけての色相を選択することを含む、請求項1に記載の方法。
  11. 前記特定するステップが、
    分割された前景領域を出力することと、
    前記分割された前景領域を前記少なくとも1つの物体軌跡に関連付けることと、
    を含む、請求項1に記載の方法。
  12. 前記量子化ヒストグラムに関連した複数の主要な色を検出するステップを更に含む、請求項1に記載の方法。
  13. 映像において移動物体を分類するための装置であって、
    映像入力を受信するための手段と、
    前記映像入力の少なくとも1つの物体軌跡を特定するための手段と、
    前記少なくとも1つの物体軌跡の正規化累積ヒストグラムを生成するための手段と、
    前記ヒストグラムのパラメータ化量子化を実行するための手段であって、彩度および光度の1つから導出された少なくとも1つの表面曲線に基づいて前記ヒストグラムを複数の領域に分離することを含む、前記手段と、
    前記量子化ヒストグラムに関連した有意な色を識別するための手段と、
    を含む、装置。
  14. 前記パラメータ化量子化および前記有意な色の1つを出力するための手段を更に含む、請求項13に記載の装置。
  15. 前記実行するための手段が、
    色空間を彩色領域および無彩色領域に分離するための手段と、
    少なくとも1つの閾値を用いて前記領域を分割するための手段と、
    を含む、請求項13に記載の措置。
  16. 前記少なくとも1つの物体軌跡の複数のフレームをサブサンプリングするための手段を更に含む、請求項13に記載の装置。
  17. 前記実行するための手段が、色の個別化のフィードバック視覚化またはデータベースからの移動物体の色分類結果の1つを有する量子化パラメータを設定するための手段を含む、請求項13に記載の装置。
  18. 前記ヒストグラムの出力を用いて量子化および有意な色の識別のパラメータの1つを導出するための手段を更に含む、請求項13に記載の装置。
  19. 物体色分布を用いて前記量子化パラメータを指定するための手段を更に含む、請求項13に記載の装置。
  20. 量子化および有意な色の識別のパラメータの1つに関連した相対的な差を求めるために、物体色分布に関連した履歴データを用いるための手段を更に含む、請求項13に記載の装置。
  21. 前記少なくとも1つの物体軌跡を色相/彩度/光度(HSI)空間に変換するための手段を更に含む、請求項13に記載の装置。
  22. 前記識別するための手段が、色当たりの閾値を用いて黒および白にかけての色相を選択するための手段を含む、請求項13に記載の装置。
  23. 前記特定するための手段が、
    分割された前景領域を出力するための手段と、
    前記分割された前景領域を前記少なくとも1つの物体軌跡に関連付けるための手段と、
    を含む、請求項13に記載の装置。
  24. 前記量子化ヒストグラムに関連した複数の主要な色を検出するための手段を更に含む、請求項13に記載の装置。
  25. コンピュータ上において実行された場合に請求項1から12のいずれかの全ステップを実行するように適合されたプログラム・コード手段を含むコンピュータ・プログラム。
JP2009553986A 2007-03-20 2008-02-15 映像における移動物体の一般的な色への分類方法、装置およびプログラム(映像における移動物体の一般的な色への分類) Active JP4988872B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/688,588 US8223835B2 (en) 2007-03-20 2007-03-20 Categorizing moving objects into familiar colors in video
US11/688,588 2007-03-20
PCT/EP2008/051823 WO2008113650A2 (en) 2007-03-20 2008-02-15 Categorizing moving objects into familiar colours in video

Publications (2)

Publication Number Publication Date
JP2010521757A true JP2010521757A (ja) 2010-06-24
JP4988872B2 JP4988872B2 (ja) 2012-08-01

Family

ID=39766537

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009553986A Active JP4988872B2 (ja) 2007-03-20 2008-02-15 映像における移動物体の一般的な色への分類方法、装置およびプログラム(映像における移動物体の一般的な色への分類)

Country Status (7)

Country Link
US (1) US8223835B2 (ja)
EP (1) EP2137697A2 (ja)
JP (1) JP4988872B2 (ja)
KR (1) KR101039202B1 (ja)
AU (1) AU2008228412B2 (ja)
IL (1) IL200645A (ja)
WO (1) WO2008113650A2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI382762B (zh) * 2008-11-17 2013-01-11 Ind Tech Res Inst 移動物體的追蹤方法
US20120092492A1 (en) * 2010-10-19 2012-04-19 International Business Machines Corporation Monitoring traffic flow within a customer service area to improve customer experience
KR102093500B1 (ko) * 2018-03-21 2020-03-25 (주) 올림플래닛 실린더 디스플레이를 위한 공간 왜곡 보정 시스템 및 방법
KR102638967B1 (ko) * 2019-11-20 2024-02-22 한국전력공사 전력 데이터의 이미지화 장치 및 그 방법

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6292074A (ja) * 1985-10-17 1987-04-27 Mitsubishi Electric Corp カラ−画像変換装置
JP2006078261A (ja) * 2004-09-08 2006-03-23 Nissan Motor Co Ltd 物体検出装置
JP2006227973A (ja) * 2005-02-18 2006-08-31 Kyushu Institute Of Technology 物体追跡方法および物体追跡装置ならびにプログラム
JP2007011696A (ja) * 2005-06-30 2007-01-18 Matsushita Electric Ind Co Ltd 映像検索装置及び映像検索方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5740345A (en) 1995-03-28 1998-04-14 Compaq Computer Corporation Method and apparatus for displaying computer graphics data stored in a compressed format with an efficient color indexing system
US6411953B1 (en) 1999-01-25 2002-06-25 Lucent Technologies Inc. Retrieval and matching of color patterns based on a predetermined vocabulary and grammar
US6424370B1 (en) * 1999-10-08 2002-07-23 Texas Instruments Incorporated Motion based event detection system and method
US20010014356A1 (en) * 1999-12-24 2001-08-16 Yuzo Yoshida Plasminogen activator inhibitor and external preparation for skin comprising the same
KR100459893B1 (ko) 2002-01-08 2004-12-04 삼성전자주식회사 동영상에서 칼라 기반의 객체를 추적하는 방법 및 그 장치

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6292074A (ja) * 1985-10-17 1987-04-27 Mitsubishi Electric Corp カラ−画像変換装置
JP2006078261A (ja) * 2004-09-08 2006-03-23 Nissan Motor Co Ltd 物体検出装置
JP2006227973A (ja) * 2005-02-18 2006-08-31 Kyushu Institute Of Technology 物体追跡方法および物体追跡装置ならびにプログラム
JP2007011696A (ja) * 2005-06-30 2007-01-18 Matsushita Electric Ind Co Ltd 映像検索装置及び映像検索方法

Also Published As

Publication number Publication date
US20080232685A1 (en) 2008-09-25
IL200645A (en) 2014-07-31
IL200645A0 (en) 2010-05-17
WO2008113650A3 (en) 2009-09-03
WO2008113650A2 (en) 2008-09-25
AU2008228412A1 (en) 2008-09-25
EP2137697A2 (en) 2009-12-30
KR101039202B1 (ko) 2011-06-03
AU2008228412B2 (en) 2013-01-10
JP4988872B2 (ja) 2012-08-01
KR20090122212A (ko) 2009-11-26
US8223835B2 (en) 2012-07-17

Similar Documents

Publication Publication Date Title
CN108647641B (zh) 基于双路模型融合的视频行为分割方法和装置
Soriano et al. Using the skin locus to cope with changing illumination conditions in color-based face tracking
US7224735B2 (en) Adaptive background image updating
US8922674B2 (en) Method and system for facilitating color balance synchronization between a plurality of video cameras and for obtaining object tracking between two or more video cameras
US9460521B2 (en) Digital image analysis
CN108280426B (zh) 基于迁移学习的暗光源表情识别方法及装置
US9299011B2 (en) Signal processing apparatus, signal processing method, output apparatus, output method, and program for learning and restoring signals with sparse coefficients
CN109859236B (zh) 运动物体检测方法、系统、计算设备及存储介质
CN112489143A (zh) 一种颜色识别方法、装置、设备及存储介质
CN108734684B (zh) 动态照明场景的图像背景减除
CN102469302A (zh) 应用于影像监控的可适应光线变化的背景模型学习系统
JP4988872B2 (ja) 映像における移動物体の一般的な色への分類方法、装置およびプログラム(映像における移動物体の一般的な色への分類)
CN105791925A (zh) 一种处理录制视频的方法及装置
CN104145477A (zh) 调整颜色的方法及系统
CN113065568A (zh) 目标检测、属性识别与跟踪方法及系统
CN108900895B (zh) 一种对视频流的目标区域的屏蔽方法及其装置
Choudhury et al. Segmenting foreground objects in a multi-modal background using modified Z-score
EP4383183A1 (en) Data processing method and apparatus
Mouats et al. Fusion of thermal and visible images for day/night moving objects detection
KR101893677B1 (ko) 컬러 영상 내의 변화영역을 검출하는 방법 및 그 장치
US11543644B2 (en) Digital imaging device and method for generating a digital color image
Jyothi et al. Computational color naming for human-machine interaction
WO2013114802A1 (ja) 画像処理装置及びその画像処理方法、並びにコンピュータ・プログラム、および画像処理システム
CN111724297A (zh) 图像处理方法及装置
KR101675030B1 (ko) 색상 대비가 강조된 흑백영상 획득 시스템 및 이를 이용한 흑백 영상 획득 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100924

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111128

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120306

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120403

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120426

R150 Certificate of patent or registration of utility model

Ref document number: 4988872

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150511

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250