JPH08322033A - 画像の中の画素を分類するためのコンピュータユニットの中に色テーブルを形成する方法 - Google Patents

画像の中の画素を分類するためのコンピュータユニットの中に色テーブルを形成する方法

Info

Publication number
JPH08322033A
JPH08322033A JP8111755A JP11175596A JPH08322033A JP H08322033 A JPH08322033 A JP H08322033A JP 8111755 A JP8111755 A JP 8111755A JP 11175596 A JP11175596 A JP 11175596A JP H08322033 A JPH08322033 A JP H08322033A
Authority
JP
Japan
Prior art keywords
color
target object
image
dimensional
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP8111755A
Other languages
English (en)
Inventor
Christoph Maggioni
マッギオーニ クリストフ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Publication of JPH08322033A publication Critical patent/JPH08322033A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30204Marker

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

(57)【要約】 【目的】 パターン認識を実時間で行うことを可能にす
る色テーブルをコンピュータユニットの中に形成する。 【解決手段】 すべての色値を2次元色空間に変換し、
画像上で選択された色を有する領域をマーキングし、、
この領域の中で予め設定された色値から著しくずれてい
る色値を無視して、この領域の中の色平均値を計算し、
それぞれの色値についてそれが予め設定された色値に十
分に似ているか否かを計算し、検査2進結果を色テーブ
ルの中に記憶する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、画像の中の画素を
分類するためのコンピュータユニットの中に色テーブル
を形成する方法に関する。
【0002】
【従来の技術】画像処理の多くの分野例えばビデオ会議
等で、対象物を非常に迅速かつ簡単に検出し、これらの
対象物を、重要でない又は冗長な情報を最小化して処理
することが必要である。対象物は、ビデオ会議の領域で
は例えば会話参加者の頭等である。画像処理の別の用途
では、その他の対象物又は例えばその他の身体部分を検
出し処理すると有利であることもある。画像の中の個々
に検出された対象物の1つの利用方法は、仮想対象物を
身体の一部の運動により制御することにある。
【0003】この用途ではしばしば色テーブル又は色ヒ
ストグラムが使用される。色テーブルは、非常に簡単で
ありその他の用途に相応する構成を有しなければならな
い。
【0004】コンピュータユニットの中に色テーブルを
形成する種々の方法が公知である(ドイツ特許出願公開
第3639636号公報,H.Ernst著”Masc
h−inelles Sehen”(Europa F
achpresse Ve−rlag GmbH,ミュ
ンヘン,121〜125頁,1990),ELEKTR
ONIK 13/1988(61〜66頁),Siem
ens−Forschungs− und Entwi
cklungs−Bereich(第31巻,No.
1,28〜32頁,1984))。
【0005】適切にマーキングされた対象物の空間位置
及び回転位置の検出方法は公知である(PCT/DE
94/00893)。この方法の欠点はこの方法が、検
出する対象物に付けなければならないマーキングを必要
とすることにある。
【0006】動かされているセグメントのクラスタリン
グの分解方法は公知である(ヨーロッパ特許出願公開第
0564858号公報)。
【0007】更に、時間列のディジタルカラー画像の中
の人間の手の運動を追跡する方法が公知である(ドイツ
特許出願公開第4339161号公報)。この方法の欠
点はこの方法が、本発明の方法に比して不正確な結果を
招き、この方法の実行は複雑大規模であり、ひいてはこ
の方法の実行は長い時間を必要とすることにある。
【0008】
【発明が解決しようとする課題】本発明の課題は、パタ
ーン認識を実時間で行うことを可能にする色テーブルを
コンピュータユニットの中に形成することにある。
【0009】
【課題を解決するための手段】上記課題は本発明によ
り、すべての画素の色情報を2次元色空間の中に変換
し、前記2次元色空間の中にコンピュータユニットによ
り表示可能なすべての色を色テーブルのインデックスと
して使用し、予め設定された色と選択可能な大きさの少
なくとも1つの領域をマーキングし、前記領域にわたり
第1の色平均値を計算し、前記領域の中の、前記第1の
色平均値から最も離れている色点を有する画素の選択可
能なパーセント割合を考慮せずに、少なくとも1つの第
2の色平均値を計算し、前記選択可能な大きさの領域
を、2次元色空間の中の前記第2の色平均値の周りに選
択し、2次元色空間の中の任意の数の、前記予め設定さ
れた色に相応しない色を表す負の色点を計算し、コンピ
ュータユニットにより表示可能なすべての色に対して、
前記色を表す色点が前記第2の色平均値に対応するかど
うかを検査し、前記検査を次のように行い、すなわち、
まず初めに、それぞれの色を表す色点に対して垂線を、
少なくとも前記第2の色平均値と負の色点とを結ぶそれ
ぞれの直線に下ろし、次いで、それぞれの垂線基点から
前記第2の色平均値までの間隔が、それぞれの前記垂線
からそれぞれの前記の結ぶ直線に対応する別の負の色点
すなわち白点までの間隔より短く、且つ色点が前記第2
の色平均値の周りの領域の中に位置する場合には、それ
ぞれの前記色点を前記第2の色平均値に割当て、検査の
2進結果を2進値として色テーブルの中に記憶すること
により解決される。
【0010】本発明の方法の利点はとりわけ、色テーブ
ルの構成が非常に簡単に保持され、ひいては色テーブル
を基礎とする用途も簡単に実時間で実現可能であること
にある。次に本発明の方法を更に説明する。
【0011】本発明の方法の利用の1つの利点は、実時
間処理が制限無しに、目標対象物を前もってマーキング
することにより達成されることにある。コンピュータに
より表示可能なそれぞれの色に対して、その色が目標対
象物の色に相当するかしないかを2進値として記憶して
いる色テーブルを利用することにより、非常に迅速であ
り効率の良い対象物認識及びセグメンテーションが可能
である。これにより、以下に説明する実時間での利用が
可能となる。
【0012】実時間処理が可能であるので、仮想対象物
を無接触で身体運動のみにより制御することが可能とな
る。仮想対象物を無接触で制御できるので、例えば仮想
対象物を制御するためにいわゆるデータグローブすなわ
ちハンドジェスチャーインターフェースデバイスを使用
する(T.G.Zimmermann,J.Lanie
r,C.Blanchard,S.Bryson,Y.
Harvell著”ハンドジェスチャーインターフェー
スデバイス”(Proc.ACM CHI+CI Co
nf.誌記載の”計算システム及びグラフィックインタ
ーフェースの中の人間的要素”(189〜192頁))
に比して大幅な利点を有する。無接触制御メカニズムの
使用者受入れ度は、使用者側が利用の前又は間に付加的
な行為をしなければならない制御メカニズムに比してよ
り高い、なお、付加的な行為とは例えばデータグローブ
を利用の間に付けなければならない等であり、これは更
に、使用者の運動自由度を妨げる。ビデオカメラは更
に、汚れに対しても破壊に対しても容易に防護できる。
【0013】使用者が邪魔されないことにより、本発明
の方法の利用は、社会生活の多くの領域の中で非常に好
適に行うことができる。
【0014】例えば広告又は建築の領域での製品等の対
象物の3次元表示を、使用者にとって直観的に表示でき
る。本発明の方法を利用することにより観察者は、スク
リーンに映写される3次元仮想対象物を、身体の一部を
動かすことによりすべての視線方向から観察できる。
【0015】この特性は、科学の多くの分野で好適に利
用できる。例えば化学では分子が3次元で視覚化され、
任意の視線方向から観察できる。別の重要な1つの用途
は、医学である、すなわち例えばコンピュータトモグラ
フィにより提供される3次元画像を直観的に、身体の運
動のみにより異なる視線方向から観察できる。仮想及び
実際の遠くに位置するカメラを制御することの利点は、
例えば建物を監視する場合、又はバック運転するために
トラック後部に取付けられているカメラにより制御する
場合に得られる。ビデオゲームも、使用者にとって直観
的かつエキサイティングに形成できる。
【0016】本発明の方法をビデオ会議に利用する場
合、必要な伝送容量を節約できる、何故ならばビデオ会
議に実際に必要な情報のみ、すなわちこの場合には通信
相手の頭を取囲む方形のみが伝送されるからである。
【0017】本発明の方法の請求項5に記載の有利な実
施の形態により、1つ又は複数の目標対象物のより安定
した分類が実現される。
【0018】本発明のその他の有利な実施の形態は、そ
の他の請求項に記載されている。
【0019】本発明の1つの有利な実施の形態と、本発
明の方法の有利な利用とが、図面に示され、以下に詳細
に説明される。
【0020】
【実施の形態】図1〜4に基づいて本発明の方法及び本
発明の方法の利用を次に説明する。
【0021】第1のステップで本装置、すなわち目標対
象物を撮影するカメラと、目標対象物を検出するコンピ
ュータユニットとは、光の状態にも、検出する1つ又は
複数の目標対象物の色にも整合されなければならない。
【0022】図1には、カメラを校正するパターンが示
されている。この画像は1つ又は複数のカメラにより撮
影され、特徴抽出用の公知のアルゴリズムが、カメラの
幾何学的特性、例えばカメラ倍率、カメラのシャッタ速
度、白バランス及び彩度を、.例えば図1に示されてい
るような所定のパターンの色値を測定することにより計
算する。
【0023】本装置を使用者の肌の色に整合すること
は、例えばカラーヒストグラム(R.Schuste
r,S.Ahmad著”カラーヒストグラム及びカラー
画像セグメンテーションをモデルに基づいて説明する”
(DAGMシンポジウム 1993,1993))を形
成することにより行うことができる。色テーブルを好適
に形成する別の1つの方法を次に説明する。次に説明す
る方法は、カラーヒストグラムの公知の形成方法に比し
て大幅に速度が速い利点を有する。別の1つの利点は、
セグメンテーションの結果が大幅に改善されることにあ
る。
【0024】色テーブルは、使用者の補助により作成さ
れ、使用者の補助は使用者が、カメラにより撮影され1
つ又は複数の目標対象物が記録されている画像において
目標対象物をマーキングすることにある。このマーキン
グは、例えばマウスをクリックすることにより、又はタ
ッチスクリーンにおいてはタッチスクリーン上の目標対
象物を単にタッチすることにより行うことができる。
【0025】次に、一般性を制限することなく、本発明
を更に説明するために目標対象物をただ1つと仮定す
る。
【0026】色テーブルは、次に説明するように別の方
法で作成することも可能である。
【0027】第1のステップで相互作用的に使用者と一
緒に、何を予め設定された色として分類すべきかを決め
る。このために使用者により、カメラにより撮影された
画像の中で、予め設定された色を有する画像領域がマー
キングされる。これは有利には、例えば肌色の分類の際
に使用者自身例えば使用者の手又は頭等が撮影画像の中
に撮影されることにより行うことができる。次いで、画
像上の使用者の手又は頭は、使用者により、予め設定さ
れた色を有する画像領域としてマーキングされる。この
撮影画像はコンピュータユニットの中に記憶され、更な
る処理にかけられる。
【0028】この場合、その他の方法も可能であり、例
えば衣服の色を予め設定された色として指定でき、これ
は使用者が撮影画像の中に、予め設定された色の衣服を
有する画像領域をマーキングすることにより行われる。
【0029】このマーキングは異なる方法で行うことが
できる。マーキングは有利には、コンピュータマウス、
キーボード、又は当業者に知られている、コンピュータ
ユニットの中で処理する画像領域をマーキングするすべ
てのその他の方法により行うことができる。
【0030】マーキングされる画像領域の大きさは使用
者により自由に選択可能である。
【0031】使用される色空間、通常は3次元RGB
(赤緑青)空間からのコンピュータユニットにより表示
されるすべての色の色情報は、2次元色空間の中への変
換により変換される。変換により何等の色情報も失われ
ない。
【0032】変換は異なる方法を行うことができる。有
利には次の変換式が形成される。
【0033】第1の変換は次の構成を有する。
【0034】(1)a=R/(R+G+B) (2)b=G/(R+G+B) ただし、Rはその都度の色における赤色の成分を示し、
Gはその都度の色における緑色の成分を示し、Bはその
都度の色における青色の成分を示し、aは2次元色空間
の中の第1の空間座標を示し、bは2次元色空間の中の
第2の空間座標を示す。
【0035】第2の変換は次の構成を有する。
【0036】(3)a=(G−R)/(R+G+B) (4)b=(B・2−R−G)/(R+G+B) 第2の変換及び第3の変換に使用されている記号は、第
1の変換に使用される記号と同一の意味を有する。第3
の変換は次の構成を有する。
【0037】(5)a=G−R (6)b=(B・2−R−G)/2 これらの変換のうちその都度ただ1つのみが使用され、
これにより、コンピュータユニットにより表示可能なす
べての色を2次元色空間の中に変換できる。
【0038】その他の変換は当業者に知られており、無
制限に本発明の方法に使用できる。
【0039】変換により3次元色空間の中のそれぞれの
点に、2次元色空間の中の1つの点を一義的に対応す
る。
【0040】使用者によりマーキングされた前述の画像
領域に対して第1の色平均値が計算され、第1の色平均
値は、マーキングされている画像領域の中に現れるすべ
ての色の平均値を表す。1つの色はコンピュータユニッ
トの中で1つの数値により表されるので、例えばマーキ
ングされている画像領域の中に存在するそれぞれの画素
のすべての色値の和を形成し、次いで、マーキングされ
ている画像領域の中に存在する画素の数により除算する
ことにより計算を行うことができる。このようにして得
られる結果は、第1の色平均値を表す数値である。第1
の色平均値も、2次元色空間の中に1つの点により表さ
れる。
【0041】前述の方法と同一の方法で、マーキングさ
れている画像領域の中の第2の色平均値が計算され、マ
ーキングされている画像領域の中に存在する画素のn%
の成分は、第2の色平均値の計算の際に考慮されない。
考慮されない画素のn%の成分は、2次元色空間の中で
第1の色平均値から最も遠く離れている画素である、す
なわち、第1の色平均値から最も異なるそれぞれ1つの
色を有する。
【0042】色値をこのように考慮しないことは、誤差
補償に用いられる。この方法は、例えば肌の色を表す第
2の色平均値を、使用者の頭により表されるマーキング
されている画像領域に基づいて計算する場合、マーキン
グされている画像領域の中に存在する例えば使用者の目
等の色不規則性を補償するのに非常に有利である。
【0043】nの大きさ、すなわち、マーキングされて
いる画像領域の中に存在する色値の何%を考慮しないか
を示す大きさは、第2の色平均値を形成する際の基礎と
なる対象物にも依存し、第2の色平均値の所要精度と、
使用可能な計算能力とにも依存する。この理由から大き
さnはその都度、相応する状況に整合されなければなら
ない。nの大きさは有利には5〜50の領域の中にあ
る。本発明の方法は第2の色平均値に制限されない。同
一の方法により多数の色平均値を、nに対して異なる値
をとることにより形成できる。多数の色平均値は、後続
の分類の品質を高める。一般性を制限せずに以下におい
てただ第2の色平均値のみを考える。
【0044】次いで、任意の数の負の色値が選択され
る。本明細書において負の色値とは、予め設定された色
に相応しない色値のことである。有利には2次元色空間
の中の白色を表す少なくとも1つの白点が、負の色値と
して使用される。負の色値の数を増加すると、以下に説
明するようにすべての色を、予め設定された色に所属す
るすなわち充分に類似する色と、予め設定された色に類
似しない色とに分類する際の分類を改善する。
【0045】第2の色平均値の周りにも、それぞれの負
の色値を表す負の色点例えば白点の周りにも、丸い例え
ば円形又は楕円形の領域が形成される。これらの領域は
以下において、第2の色平均値のための平均値領域とも
呼ばれ、負の色点の周りの領域のための負の色領域とも
呼ばれる。
【0046】これらの領域は任意の大きさを有する、す
なわち、複数の領域が互いに重なることも可能であり、
1つの領域が完全に別の1つの領域を包含することも可
能である。
【0047】コンピュータユニットにより表示可能であ
り2次元色空間の中に変換されたそれぞれの色値に対し
て、それぞれの色点が、第2の色平均値を表す予め設定
された色点に充分に類似している色点として分類される
か、又はそれぞれの色点が予め設定された色点に充分に
類似していない色点として分類されるかに関する分類が
行われる。
【0048】この分類は、コンピュータユニットにより
表示可能なそれぞれの色点に対して1つの垂線が、第2
の色平均値を表す予め設定された色点と、それぞれの負
の色点とを結ぶ直線に下ろされる。これにより、負の色
点の数と正確に同一の数の垂線基点が形成される、なお
垂線基点とは、それぞれの垂線と、対応する前記結ぶ直
線との交点のことである。
【0049】それぞれの垂線基点に対して、垂線基点か
ら、第2の色平均値を表す予め設定された色点までの第
1の間隔が計算される。第1の間隔は、相応する垂線基
点からそれぞれの負の色点までの間隔を表す第2の間隔
と比較される。
【0050】次いで色点は、色点のそれぞれの垂線基点
に対して第1の間隔が第2の間隔より短くそれぞれの垂
線基点が平均値領域の中に位置する場合、第2の色平均
値を表す予め設定された色点に充分に類似する色点とし
て分類される。
【0051】2進結果は、色テーブルに記憶され、色テ
ーブルは、2次元色空間の中のそれぞれの色点に対し
て、すなわちコンピュータユニットにより表示可能なそ
れぞれの色に対して前述の方法の実行が終了すると2進
入力値を有する。
【0052】色テーブルは、色テーブルの中のそれぞれ
1つの入力値に一義的に対応するそれぞれの色値に対し
て、色点が予め設定された色に類似しているか否かに関
する2進情報を有する。
【0053】前述の方法で色テーブルを形成すると、本
発明の方法の種々の実時間利用が可能となる、何故なら
ば1つの色値に対してただ1つの2進値だけを読出すだ
けで、色値が予め設定された色に充分に類似する色値と
して分類されるかどうかが分かるからである。
【0054】色テーブルが形成された後、本発明の方法
の1つの有利な利用方法では、画像全体に対して、エッ
ジ追跡用の任意のアルゴリズムが実行される、このアル
ゴリズムには例えば、T.Pavlidis著”グラフ
ィック及びイメージ処理のためのアルゴリズム”(Sp
ringer出版社,1982)に記載の方法がある。
この方法を用いて画像の中で、例えば色テーブルにより
予め設定された色に類似の色として分類された色を有す
る対象物及び対象物のエッジが求められる。
【0055】この方法が画像に適用された後、画像の上
には、目標対象物として考慮されるべき多数であるかも
しれない対象物が存在する。
【0056】これらの多数の対象物から目標対象物が、
目標対象物の既知の特徴に基づいて求められる。特徴は
例えば、目標対象物の大きさ又は目標対象物の形状によ
り表すこともできる。
【0057】本発明の利用方法に依存して、例えば目標
対象物の幾何学的モーメントも計算することも可能であ
る、この計算は例えばJun Shen著”モーメント
不変量の高速計算”(Pattern Recogni
tion誌,Vol.42,No.8,807〜813
頁,1991)に記載の方法により行うこともできる。
【0058】目標対象物の求められた輪郭及び幾何学的
求めに関するデータは、画像改善のために更にいくつか
のステップにかけることもできる、これらのステップに
は例えばCH.Maggioni著”仮想環境の非はめ
こみ制御”(Proc.Virtual Realit
y誌1994)及び”応用及び傾向”(Stuttga
rt誌,1994年2月,1994)に記載されている
ものがある。
【0059】次いで目標対象物に対して、目標対象物を
取囲む方形が求められる。予め設定された平面を有し、
取囲む方形の外部に位置するすべての対象物は、背景画
像の所属する対象物として分類される。
【0060】この方法を改善する1つの方法は、この方
法を開始する際にカメラにより、目標対象物が存在する
後のシーンと同一のシーンを有する背景画像が撮影され
ることにある。背景画像には目標対象物は存在しない。
【0061】この方法はこの場合、対象物を目標対象物
に分類する際に対象物が、この対象物が更に背景画像の
上に存在しない場合にのみ目標対象物として分類される
ことにより改善される。
【0062】目標対象物が頭により表される場合、この
方法の結果は画像の中の例えば頭の位置である。
【0063】目標対象物が手により表される場合、本発
明の方法の結果は画像の中の例えば手の位置、画像を撮
影するカメラからの手の距離、又は例えば特定の手のジ
ェスチャーを表す手の個々の指の位置である。
【0064】後続の画像の中の取囲む方形の位置とひい
ては目標対象物の位置とを求めるために更に例えば運動
推測処理等にかけられる方形のみを更に処理することに
より必要計算量を、公知の方法に比して大幅に低減でき
る。
【0065】本発明の方法は、社会生活の多数の領域の
中で好適に使用できる、何故ならば本発明の方法によ
り、以下に説明する用途を実時間で実現できるからであ
る、なおこれらの用途は、従来では実時間で実現できな
かった。
【0066】本発明の方法の1つの非常に有利な用途
は、製品の3次元表示、又は建築の用途例えば仮想空間
の表示にある。一般的にこの方法は仮想現実の多数の領
域に使用できる。これらの利用領域では、モニターに表
示されている2次元製品又は仮想空間の中の視野光景又
は仮想家屋の視野光景も、観察者の例えば頭又は手等の
身体の一部の位置を変えることにより、”すべての側”
から観察できる。
【0067】この方法をこれらの目的に利用する場合、
カメラは、製品を表示するモニターの近辺に設置され
る。カメラは例えば観察者の頭又は手を撮影し、頭又は
手又は双方を目標対象物として分類する。本発明方法に
より供給される値、すなわち例えば観察者の頭の位置
は、モニターに表示される仮想対象物を撮影する仮想カ
メラのための制御量として使用される。頭の位置を変え
ることにより、又は手を動かすことにより、表示される
対象物の3次元視野光景が変化し、この変化は、身体の
動きが制御量に変換されることにより実現される。質的
な改善は、例えば低域フィルタ及び/又はヒステリシス
フィルタ等のフィルタを使用して、例えば頭又は手等の
位置パラメータをろ波することにより実現できる。更
に、方向に依存するヒステリシスフィルタを使用すると
有利である。方向に依存するヒステリシスフィルタと
は、時間的に順次に続き選択可能な座標を変換する関数
処理のことである。座標は本発明では、目標対象物の中
の固定した選択可能な点である。例えばこのような座標
は、手を目標対象物として使用する場合、手の重心又は
指の1つの点により表される。
【0068】時点iでの座標xの変換は有利には、時
点i−1及びi−2での時間的に先行する座標値x
−1及びx −2を基礎として次の変換式により行われ
る。
【0069】sgn(x −2−x −1)=sgn
(x −1−x)の場合、t=tであり、その他の
場合、t=tである。
【0070】|x −1−x|<tの場合、x=x
−1であり、その他の場合、x′=xである。
【0071】なお、t及びtは、使用者が自由に選
択できるヒステリシス閾値である。この場合、値t
領域]0;t[の中にある。
【0072】値x′は、変換された座標、すなわちx
の変換結果を表す。
【0073】方向に依存するヒステリシスフィルタをよ
り高い次元に拡張することが、sgn関数すなわち符号
比較を、座標xの多次元表示の運動方向変化を計算す
ることにより置換可能であることは、当業者には知られ
ている。
【0074】これは、例えば頭位置の角度αの変化は、
順次の多数の画像に適用される本発明の方法により検出
され、この角度は、モニターに表示される仮想対象物を
撮影する仮想カメラの位置を角度βだけ段階的に変える
(図2参照)。仮想カメラの位置の変化は公知であり、
例えば3次元CADの用途の場合にしばしば使用される
技術である。
【0075】しかし、本発明の方法により、対象物の3
次元視野光景を、無接触にかつ使用者の直観に基づいて
制御することが可能となる。
【0076】本発明の方法は同様に、科学の異なる領域
に非常に好適に使用できる。
【0077】医学の領域では、3次元の画像データ例え
ばコンピュータトモグラフィの画像を、トモグラフィ画
像を表示するモニターの例えば側方及び上方の近辺に設
置されているカメラにより撮影される観察者の頭又は手
の運動のみにより、異なる視点から観察できる。従っ
て、担当の医者は非常に簡単かつ非常に詳細に、トモグ
ラフィ画像のこの医者にとって重要な視野光景を選択で
きる。
【0078】化学では、相応する方法で3次元分子構造
を詳細かつ簡単に調べることができる。
【0079】交通関連の領域でも、本発明の方法を好適
に利用できる、このような用途は例えば、通常のバック
運転の際には隠れている視野の光景を運転者に提供する
ことを可能にするトラックの後部に取付けられたカメラ
を制御する場合である。トラック運転者の例えば運転室
の中に適切に例えば防風ガラスの中央の上縁に取付けら
れているカメラにより頭を撮影及び追跡する場合、運転
者は自動車後部のカメラを頭を動かすだけで制御でき
る。
【0080】相応する方法で、例えば建物の監視等の場
合、遠くにあるカメラを制御することが一般的に可能で
ある。
【0081】3次元対象物を制御する場合もあるコンピ
ュータゲームでも、本発明の方法を前述の方法に相応し
て好適に利用可能である。
【0082】ビデオ会議の領域でも本発明の方法を好適
に使用できる。従来の方法では使用者の運動自由度は非
常に制限されている、何故ならばシーンを撮影するため
に広角カメラを使用せず、不要情報をできるだけ僅かし
か伝送しないようにするからである。しかし広角カメラ
を使用する場合、過剰な伝送容量が必要となる。本発明
の方法により、通信相手の例えば頭等を取囲む方形の内
容のみを伝送することが可能となる。
【0083】取囲む方形を使用することにより、通信相
手の頭のみが伝送され、不要な画像背景を省くことがで
きる。取囲む方形の運動を本発明では予測するので、通
信相手の頭の運動を検出し、例えば伝送される画像の中
の頭が一部欠けることがないように取囲む方形の大きさ
をわずかに大きく選択するために取囲む方形を頭の動き
に整合するか、又は、シーンを撮影するカメラを、頭部
の運動に整合して適切に機械的に追従して、通信相手の
頭のみを撮影及び伝送すればよいようにすることが可能
である。これにより使用者はビデオ会議で、従来の程度
に使用者の運動自由度を制限することが不要となる。
【0084】更に、ビデオ会議の開始の前に又はビデオ
会議の最中に通信相手は、例えば取囲む方形と、ひいて
は通信相手の頭の画像とを伝送するかどうかを決定で
き、背景画像も一緒に伝送するかどうかも決定できる。
ウィンドウの大きさも、個別に定めることができ、従っ
て、その都度使用される個々のビデオ会議の通信相手又
はコンピュータユニットとにより、ビデオ会議の前又は
間に協議により決定できる。
【図面の簡単な説明】
【図1】カメラを校正するために利用できるパターンを
示すスケッチ図である。
【図2】仮想ホログラフィの幾何学的関係を示すスケッ
チ図である。
【図3】医学の領域での本発明の方法の好適な利用を示
すスケッチ図である。
【図4】3次元製品表示の領域での本発明の方法の好適
な利用を示すスケッチ図である。
【符号の説明】
α 頭の運動角度 β カメラの移動角度

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】 すべての画素の色情報を2次元色空間の
    中に変換し、 前記2次元色空間の中にコンピュータユニットにより表
    示可能なすべての色を色テーブルのインデックスとして
    使用し、 予め設定された色と選択可能な大きさの少なくとも1つ
    の領域をマーキングし、 前記領域にわたり第1の色平均値を計算し、 前記領域の中の、前記第1の色平均値から最も離れてい
    る色点を有する画素の選択可能なパーセント割合を考慮
    せずに、少なくとも1つの第2の色平均値を計算し、 前記選択可能な大きさの領域を、2次元色空間の中の前
    記第2の色平均値の周りに選択し、 2次元色空間の中の任意の数の、前記予め設定された色
    に相応しない色を表す負の色点を計算し、 コンピュータユニットにより表示可能なすべての色に対
    して、前記色を表す色点が前記第2の色平均値に対応す
    るかどうかを検査し、前記検査を次のように行い、すな
    わち、 まず初めに、それぞれの色を表す色点に対して垂線を、
    少なくとも前記第2の色平均値と負の色点とを結ぶそれ
    ぞれの直線に下ろし、 次いで、それぞれの垂線基点から前記第2の色平均値ま
    での間隔が、それぞれの前記垂線からそれぞれの前記の
    結ぶ直線に対応する別の負の色点すなわち白点までの間
    隔より短く、且つ色点が前記第2の色平均値の周りの領
    域の中に位置する場合には、それぞれの前記色点を前記
    第2の色平均値に割当て、 検査の2進結果を2進値として色テーブルの中に記憶す
    ることを特徴とする画像の中の画素を分類するためのコ
    ンピュータユニットの中に色テーブルを形成する方法。
  2. 【請求項2】 負の色点を、白色を表す白点により表す
    ことを特徴とする請求項1に記載の画像の中の画素を分
    類するためのコンピュータユニットの中に色テーブルを
    形成する方法。
  3. 【請求項3】 目標対象物の特徴を利用して画像の少な
    くとも1つの選択可能な目標対象物を計算機を介して検
    出するために請求項1又は請求項2に記載の方法を利用
    する方法において、 色テーブルを使用して、色テーブルの中に記憶されてい
    る予め設定された色を有する対象物を形成し、 前記対象物から、少なくとも1つの目標対象物の特徴を
    利用して少なくとも1つの目標対象物を分類し、 少なくとも1つの目標対象物のための空間位置を求める
    ことを特徴とする利用方法。
  4. 【請求項4】 少なくとも1つの目標対象物の周りに、
    取囲む方形を形成することを特徴とする請求項3に記載
    の方法。
  5. 【請求項5】 付加的にこの方法の開始の際に、少なく
    とも1つの目標対象物を有しない背景画像を撮影し、 次いで1つの対象物を、付加的に背景画像が前記対象物
    を有しない場合には目標対象物として分類することを特
    徴とする請求項3又は請求項4に記載の方法。
  6. 【請求項6】 それぞれの形成した取囲む方形に対し
    て、運動予測を行うことを特徴とする請求項3から請求
    項5のうちのいずれか1つの請求項に記載の方法。
  7. 【請求項7】 方向に依存するヒステリシスフィルタを
    使用することを特徴とする請求項3から請求項6のうち
    のいずれか1つの請求項に記載の方法。
  8. 【請求項8】 目標対象物を人間の頭により形成し、 予め設定された色を、人間の肌の色とすることを特徴と
    する請求項3から請求項7のうちのいずれか1つの請求
    項に記載の方法。
  9. 【請求項9】 目標対象物を、人間の手と、 予め設定された色を、人間の肌の色とすることを特徴と
    する請求項3から請求項8のうちのいずれか1つの請求
    項に記載の方法。
  10. 【請求項10】 3次元対象物を表すために請求項3か
    ら請求項8のうちのいずれか1つの請求項に記載の方法
    を利用する方法において、 目標対象物の位置パラメータを仮想カメラの制御量に変
    換し、 前記制御量により、表示された3次元対象物の視野光景
    を任意に変化可能にしたことを特徴とする請求項3から
    請求項9のうちのいずれか1つの請求項に記載の方法。
  11. 【請求項11】 目標対象物の位置パラメータを、3次
    元画像の視野光景を変化する制御量に変換することを特
    徴とする医学的に利用する請求項3から請求項10のう
    ちのいずれか1つの請求項に記載の方法を利用する方
    法。
  12. 【請求項12】 目標対象物の位置パラメータを、少な
    くとも1つの実際のカメラの制御量に変換し、 少なくとも1つの前記実際のカメラを、制御量により段
    階的に動かすことを特徴とする請求項3から請求項9の
    うちのいずれか1つの請求項に記載の方法を利用する方
    法。
  13. 【請求項13】 取囲む方形の大きさを変化できること
    を特徴とする請求項3から請求項9のうちのいずれか1
    つの請求項に記載の方法を利用する方法。
JP8111755A 1995-05-05 1996-05-02 画像の中の画素を分類するためのコンピュータユニットの中に色テーブルを形成する方法 Withdrawn JPH08322033A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE19516664A DE19516664C1 (de) 1995-05-05 1995-05-05 Verfahren zum Aufbau einer Farbtabelle in einer Computereinheit zur Klassifikation von Bildpunkten in einem Bild
DE19516664.7 1995-05-05

Publications (1)

Publication Number Publication Date
JPH08322033A true JPH08322033A (ja) 1996-12-03

Family

ID=7761253

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8111755A Withdrawn JPH08322033A (ja) 1995-05-05 1996-05-02 画像の中の画素を分類するためのコンピュータユニットの中に色テーブルを形成する方法

Country Status (3)

Country Link
US (1) US5828779A (ja)
JP (1) JPH08322033A (ja)
DE (1) DE19516664C1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005178473A (ja) * 2003-12-17 2005-07-07 Denso Corp 車載機器用インターフェース
JP2013525906A (ja) * 2010-04-22 2013-06-20 クゥアルコム・インコーポレイテッド 肌色領域及び顔領域に基づく視点検出器

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0891589B1 (de) 1996-04-02 1999-10-06 Siemens Aktiengesellschaft Anordnung zur erstellung eines digitalen wörterbuchs und verfahren zum aufbau eines digitalen wörterbuchs mit hilfe eines rechners
DE19708240C2 (de) * 1997-02-28 1999-10-14 Siemens Ag Anordnung und Verfahren zur Detektion eines Objekts in einem von Wellen im nichtsichtbaren Spektralbereich angestrahlten Bereich
DE19734511A1 (de) * 1997-08-08 1999-02-11 Siemens Ag Kommunikationseinrichtung
US6081422A (en) * 1997-08-19 2000-06-27 Compaq Computer Corporation Universal mount for computer peripheral device
US6011595A (en) * 1997-09-19 2000-01-04 Eastman Kodak Company Method for segmenting a digital image into a foreground region and a key color region
WO1999034319A1 (en) * 1997-12-29 1999-07-08 Cornell Research Foundation, Inc. Image subregion querying using color correlograms
US7036094B1 (en) 1998-08-10 2006-04-25 Cybernet Systems Corporation Behavior recognition system
US6950534B2 (en) * 1998-08-10 2005-09-27 Cybernet Systems Corporation Gesture-controlled interfaces for self-service machines and other applications
US6681031B2 (en) 1998-08-10 2004-01-20 Cybernet Systems Corporation Gesture-controlled interfaces for self-service machines and other applications
US20010008561A1 (en) * 1999-08-10 2001-07-19 Paul George V. Real-time object tracking system
DE10100615A1 (de) * 2001-01-09 2002-07-18 Siemens Ag Handerkennung mit Positionsbestimmung
DE10100616A1 (de) * 2001-01-09 2002-07-18 Siemens Ag Authentisierung einer Person mittels Handerkennung
JP4139571B2 (ja) * 2001-02-28 2008-08-27 大日本スクリーン製造株式会社 カラー画像の領域分割
US6873743B2 (en) * 2001-03-29 2005-03-29 Fotonation Holdings, Llc Method and apparatus for the automatic real-time detection and correction of red-eye defects in batches of digital images or in handheld appliances
US6751348B2 (en) * 2001-03-29 2004-06-15 Fotonation Holdings, Llc Automated detection of pornographic images
DE10132013B4 (de) * 2001-07-03 2004-04-08 Siemens Ag Multimodale Biometrie
DE10132012B4 (de) * 2001-07-03 2004-02-12 Siemens Ag Skalierung von Ähnlichkeitsmaßen für ein biometrisches Verfahren
US6996277B2 (en) * 2002-01-07 2006-02-07 Xerox Corporation Image type classification using color discreteness features
US6990639B2 (en) * 2002-02-07 2006-01-24 Microsoft Corporation System and process for controlling electronic components in a ubiquitous computing environment using multimodal integration
EP1567234A4 (en) * 2002-11-05 2006-01-04 Disney Entpr Inc VIDEO INTERACTIVE ENVIRONMENT
US8745541B2 (en) * 2003-03-25 2014-06-03 Microsoft Corporation Architecture for controlling a computer using hand gestures
US7665041B2 (en) * 2003-03-25 2010-02-16 Microsoft Corporation Architecture for controlling a computer using hand gestures
US7969451B2 (en) * 2003-03-27 2011-06-28 International Business Machines Corporation Method and apparatus for dynamically sizing color tables
US6897877B2 (en) * 2003-03-27 2005-05-24 International Business Machines Corporation Method and apparatus for managing dynamically sizeable color tables
US6980222B2 (en) * 2004-01-12 2005-12-27 International Business Machines Corporation Method and apparatus for implementing dynamically sizable color tables
JP4539964B2 (ja) * 2004-07-21 2010-09-08 大日本スクリーン製造株式会社 画像の領域分割
TWI279146B (en) * 2005-10-27 2007-04-11 Princeton Technology Corp Image compensation device and method
US8175382B2 (en) * 2007-05-10 2012-05-08 Microsoft Corporation Learning image enhancement
US8041956B1 (en) * 2010-08-16 2011-10-18 Daon Holdings Limited Method and system for biometric authentication
US8620113B2 (en) 2011-04-25 2013-12-31 Microsoft Corporation Laser diode modes
US8760395B2 (en) 2011-05-31 2014-06-24 Microsoft Corporation Gesture recognition techniques
US8635637B2 (en) 2011-12-02 2014-01-21 Microsoft Corporation User interface presenting an animated avatar performing a media reaction
US9100685B2 (en) 2011-12-09 2015-08-04 Microsoft Technology Licensing, Llc Determining audience state or interest using passive sensor data
US8811938B2 (en) 2011-12-16 2014-08-19 Microsoft Corporation Providing a user interface experience based on inferred vehicle state
US8898687B2 (en) 2012-04-04 2014-11-25 Microsoft Corporation Controlling a media program based on a media reaction
CA2775700C (en) 2012-05-04 2013-07-23 Microsoft Corporation Determining a future portion of a currently presented media program
CN104266673B (zh) 2014-09-26 2016-06-08 博奥生物集团有限公司 一种利用摄像头识别反应单元种类的方法
CN104298970B (zh) * 2014-09-26 2017-10-27 博奥生物集团有限公司 一种基于颜色特征的摄像头识别和检测方法
US10592742B1 (en) * 2015-09-28 2020-03-17 Amazon Technologies, Inc. Agent re-identification

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3639636C2 (de) * 1986-11-20 1996-04-18 Robert Prof Dr Ing Massen Automatische Inspektion von Textilbahnen
EP0435167A3 (en) * 1989-12-20 1991-07-10 Dai Nippon Insatsu Kabushiki Kaisha Cut mask preparation method and apparatus
EP0564858B1 (de) * 1992-04-06 1999-10-27 Siemens Aktiengesellschaft Verfahren zur Auflösung von Clustern bewegter Segmente
DE4339161C2 (de) * 1993-08-09 1996-11-28 Siemens Ag Verfahren zur Verfolgung von Bewegungen einer menschlichen Hand in einer zeitlichen Folge digitaler Farbbilder
JPH09501234A (ja) * 1993-08-09 1997-02-04 シーメンス アクチエンゲゼルシヤフト デジタル画像シーケンスにおいて、適切にマーキングされた対象物の空間位置および回転位置の識別方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005178473A (ja) * 2003-12-17 2005-07-07 Denso Corp 車載機器用インターフェース
JP2013525906A (ja) * 2010-04-22 2013-06-20 クゥアルコム・インコーポレイテッド 肌色領域及び顔領域に基づく視点検出器

Also Published As

Publication number Publication date
DE19516664C1 (de) 1996-08-29
US5828779A (en) 1998-10-27

Similar Documents

Publication Publication Date Title
JPH08322033A (ja) 画像の中の画素を分類するためのコンピュータユニットの中に色テーブルを形成する方法
Fischer et al. Rt-gene: Real-time eye gaze estimation in natural environments
Reale et al. A multi-gesture interaction system using a 3-D iris disk model for gaze estimation and an active appearance model for 3-D hand pointing
Sun et al. Real time gaze estimation with a consumer depth camera
JP4899729B2 (ja) 3次元マルチカメラビデオ監視支援システム、3次元マルチカメラビデオ監視支援方法、3次元マルチカメラビデオ監視支援プログラム
US7755608B2 (en) Systems and methods of interfacing with a machine
US8994652B2 (en) Model-based multi-hypothesis target tracker
CN108292362A (zh) 用于光标控制的手势识别
JP2007080262A (ja) 3次元マルチカメラビデオナビゲーション支援システム、3次元マルチカメラビデオナビゲーション支援方法、3次元マルチカメラビデオナビゲーション支援プログラム
EP3136203B1 (en) System and method of real-time interactive operation of user interface
Bawa et al. The saras endoscopic surgeon action detection (esad) dataset: Challenges and methods
JP2008102902A (ja) 視線方向の推定装置、視線方向の推定方法およびコンピュータに当該視線方向の推定方法を実行させるためのプログラム
WO2024001095A1 (zh) 面部表情识别方法、终端设备及存储介质
JP2986455B1 (ja) 手振り認識装置
CN110069125A (zh) 虚拟对象的控制方法和装置
JP2000331170A (ja) 手振り認識装置
CN115994944A (zh) 三维关键点预测方法、训练方法及相关设备
Guliani et al. Gesture controlled mouse navigation: Hand landmark approach
Jain et al. Gestarlite: An on-device pointing finger based gestural interface for smartphones and video see-through head-mounts
WO2024000233A1 (zh) 面部表情识别方法、装置、设备及可读存储介质
CN108401452B (zh) 使用虚拟现实头戴式显示器系统来执行真实目标检测和控制的装置和方法
Jain et al. Human computer interaction–Hand gesture recognition
US20210350625A1 (en) Augmenting live images of a scene for occlusion
Lyubanenko et al. Multi-camera finger tracking and 3d trajectory reconstruction for hci studies
EP4309142A1 (en) Adaptive visualization of contextual targets in surgical video

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20030805