JP5529844B2 - ジェスチャ多次元分析のためのシステムおよび方法 - Google Patents

ジェスチャ多次元分析のためのシステムおよび方法 Download PDF

Info

Publication number
JP5529844B2
JP5529844B2 JP2011501152A JP2011501152A JP5529844B2 JP 5529844 B2 JP5529844 B2 JP 5529844B2 JP 2011501152 A JP2011501152 A JP 2011501152A JP 2011501152 A JP2011501152 A JP 2011501152A JP 5529844 B2 JP5529844 B2 JP 5529844B2
Authority
JP
Japan
Prior art keywords
gesture
signals
signal
sensor
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011501152A
Other languages
English (en)
Other versions
JP2011530727A (ja
Inventor
ヴォルフガング リヒター,
ロラント アウバウエル,
Original Assignee
イデント テクノロジー アーゲー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by イデント テクノロジー アーゲー filed Critical イデント テクノロジー アーゲー
Publication of JP2011530727A publication Critical patent/JP2011530727A/ja
Application granted granted Critical
Publication of JP5529844B2 publication Critical patent/JP5529844B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/017Gesture based interaction, e.g. based on a set of recognized hand gestures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/03Arrangements for converting the position or the displacement of a member into a coded form
    • G06F3/033Pointing devices displaced or positioned by the user, e.g. mice, trackballs, pens or joysticks; Accessories therefor
    • G06F3/0346Pointing devices displaced or positioned by the user, e.g. mice, trackballs, pens or joysticks; Accessories therefor with detection of the device orientation or free movement in a 3D space, e.g. 3D mice, 6-DOF [six degrees of freedom] pointers using gyroscopes, accelerometers or tilt-sensors

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • User Interface Of Digital Computer (AREA)

Description

本発明は、ジェスチャに基づいて、より詳細には検知装置と向かい合ってユーザが行う手および/または指のジェスチャに基づいて制御信号を発生するためのシステムおよび方法に関する。
本出願人によって提出された国際特許出願PCT/EP2007/00355号[WO/2007/0853671号]は、車両用の制御システムであって、これを利用することで運転手または乗客の手のうちの一方の空間動作を検知することができ、この動作に基づいて例えばナビゲーション装置を作動させるために切り換えおよび入力操作を開始することができる電極配置を含む当該車両用の制御システムを開示している。
本出願人によって提出されたドイツ特許出願DE102007016408.6号もまた、携帯電話であって、これを利用することでユーザの指を介して接触しない方法で入力操作を行うことができるセンサ装置を装備した当該携帯電話を開示している。
さらに、本出願人によって提出されたドイツ特許出願DE102007039163.5号は、コンピュータマウスに対する手のジェスチャを利用することでマウスおよびメニューの制御機能を果たすことができる当該コンピュータマウスを開示している。
本出願人によって提出されたドイツ特許出願DE102007036636.3号およびドイツ特許出願DE102008009956.2号は、複数の電極を備えた人形を開示している。当該複数の電極を介して人形と遊んでいる子供の人形に対するジェスチャが検知され、これにより人形の言語再生機能を作動させ、任意選択で人形のメカトロニクス構成要素を始動させることができる。この技術によって、単調でない特に現実的な玩具との対話を開発することが可能になる。
上記に言及したシステムでは、電場と電気の相互作用効果に基づいて、手の空間動作が検知システムに対して検知される。この目的のために検知システムは電極を装備し、該電極はLCネットワークに統合され、手と電極の間の間隙についての情報を提供する信号を送信する。これらの信号を使用してジェスチャの経路を計算することができる。計算された経路から逆にジェスチャを決定することができる。
距離および経路情報の計算は、特徴的なジェスチャ経路が電子メモリに記憶されている電子回路によって行うことができる。
本発明の目的は、できるだけ低いハードウェアコストでジェスチャの信頼できる検知および翻訳を管理することができ、かつ、広範囲の入力ジェスチャが確実に処理されるような答えを生み出すことである。
上記目的は、検知システムに対してユーザが行う手のジェスチャとして発生され、かつ手またはその指の空間動作と相関する複数の入力信号の信号処理を実施する方法による、本発明の第1の態様によって達成される。この複数の入力信号は、その周波数帯域が言語認識システムにアクセス可能な音声信号の周波数帯域を含む複数の転送信号を構成するように発生または変換され、この複数の転送信号に基づいて手のジェスチャの翻訳が言語認識システムによって行われる。
したがって、音声認識の分野で開発された実績のある回路および分析システムを使用してジェスチャを有利なやり方で検知および分析することが可能となる。ここで、音声認識に関して開発された概念およびチップセットが、ジェスチャ認識に限って使用される用途が予想される。同様に音声認識システムがジェスチャ認識機能を備えることも可能であり、マイクロフォン入力がすなわちジェスチャ信号に関する入力としても直接機能することもできる。ジェスチャ経路を音的シーケンスに変換させる本発明による概念は、比較的費用がかからない追加ハードウェアによる言語認識、具体的にはマイクロプロセッサを実装することができる一般的なコンピュータシステムおよび他のシステムで履行することができる。本発明によって発生される音的シーケンスは、適切なシステムにおいて中間プラグで該システムの聴覚入力に結合され、任意選択でマイクロフォン信号と重なるように発生されてよい。この概念により、ジェスチャ翻訳機能を含むように特に有利な方法で言語認識プログラムを拡張させることが可能になる。ジェスチャを取得する、および/または、合図する手または任意選択で指のみの空間動作を検知する、ために設けられる検知電極は具体的には、ヘッドセット、キーボード、マウスパッド、コンピュータマウス、またはさらにモニタフレームにも組み込むことができる。検知電極はまた、ジェスチャ検知の典型的な基準地点として好適な他の構造体に組み込むこともできる。自動車分野では、制御パネルの領域内の構造体、ステアリングホイール、センターコンソールおよびドア張りが特にこの目的に適している。
本発明によるセンサ装置はまた、主に静的ジェスチャ、例えば静止した手の形を検知することができ、かつジェスチャをそれぞれ十分に区別できる音声シーケンスに変換させることができるように構成されてよい。この種の静的ジェスチャは、例えば「平らな手」、「親指を伸ばした握り拳」または「Vサイン」などに具現化することができる。静止局面で発生されたセンサ信号に基づくこれらの静的ジェスチャに対して特定の音声シーケンスを発生することができる。静的ジェスチャの構造および分解の代表的な動作シーケンスを音声として再生し、かつジェスチャを認識する際にこれを考慮することも可能である。
ジェスチャと相関する経路信号を音的信号シーケンスに変換することによって、音声データの周波数範囲内で電気通信およびVoIPシステムを介してジェスチャ情報を伝達することもできるようになる。したがって声を伝達するシステムを使用して、操作者、すなわち離れた場所で合図するユーザがジェスチャ情報を利用することができるようになる。本発明による概念によると、手話を音による言語に変換することも可能である。
個々のジェスチャに関する認識パターンは、教示プロセスを使用して計算され、またはさらに特定の経路に関して計算され、分析のために保存されるようにもできる。
本発明によると、検知器の助けを借りて生物(好ましくはヒト)が行うジェスチャが検知され、音調(トーン:tone)シーケンス(音声シーケンス)に変換される。これらの音調シーケンス(調子連鎖)はその後、現行の音声または音声処理方法を使用して分析および評価される。言語で話されるコマンドは任意選択で同一チャネルを介して並行してこのプロセス内に含まれてよく、個別に、または、引き続き相互に、ジェスチャと併せて分析されてよい。
ジェスチャ認識回路によって発生される音調シーケンスは好ましくは、音声処理で使用されるフィルタリング法を使用することができるように音声入力と同一の周波数帯域で発生される。しかしながら、例えば処理された周波数範囲のエッジ領域までずれた別の周波数範囲を選択することも可能である。つぎに、発話によるコマンドと同様のまたは同一の方法で、ジェスチャをシステムへ教え込むことができ、その見返りとして、例えばテーブル内に保存された関数で表現されるようにすることができる。したがってジェスチャ/音調シーケンス変換装置までも音声処理のときと同様のハードウェアおよびソフトウェアを使用することができ、別々に作動するシステムと比べて経済的および回路的観点で有利であることを示している。ここで問題のジェスチャは、一定の時間間隔で検知装置の前で空間的に行われてよく、ユーザからはかなり独立している。
原則として本発明の概念は、光学技術、容量技術または画像処理技術など最も多様なジェスチャ検知技術に適している。ジェスチャの検知がシーケンスとして生じ、かつ各シーケンスに関して特定の音調を発生することができる点で有利である。したがって簡単なまたは複雑なジェスチャは、長短種々の継続時間の多様な音列を発生するであろう。これまで正確に同じ方法で同じジェスチャを入力することは誰もできなかったため、システムは好ましくは、プログラムに基づいた寛容な認識を持つことが好ましい。本発明によると、具体的には本発明によってジェスチャと相関する音列が、特にジェスチャ経路内で発話された単語または文と同様の特徴を有する場合に、ソフトウェアシステム内に設けられた認識および翻訳手続を使用する適切なソフトウェアを設けることができる。
ジェスチャ信号の取得
ジェスチャ信号は好ましくは、1つまたは複数の容量(電場)センサの助けを借りて取得される。これらのセンサは好ましくは、それらが人工的に形成された電場の変化を検知し、これに応じて手または指の位置または動作と十分密接に相関する信号を送信するように構成される。
ジェスチャ信号は前もって処理されるのが好ましい。この前処理は、既に認識されているジェスチャによって有利に調整することができる。センサが提供する1つの信号、または複数のセンサが好ましく利用される場合には複数の信号を分割/多重分離することによって、ジェスチャ検知を行うことができる。
ジェスチャは、センサ信号が少なくとも2つ、好ましくは3つの空間座標に対して発生されることによって翻訳されるのが好ましい。これらのセンサ信号は好ましくは、多重チャネル測定システムにおいて得られる。すなわちセンサ信号は、多重チャネル方式または時間多重伝送で並行して捕捉されてよい。また時間多重伝送または周波数多重伝送でもシステムを励起させることが可能である。
多様なセンサチャネルからのキャリア変調(電極受信)信号の変換は、特に包絡線検波および/または整流およびローパスフィルタ処理(動作周波数<ローパス周波数<キャリア周波数)によって低周波数受信信号にするようにおこなうことができ、該低周波数受信信号におけるその振幅が受信センサからの近接/隔たりに比例する。
以下の方法の1つまたは複数の組み合わせの助けを借りてジェスチャの始まりとジェスチャの終わりを認識することができる。
a)近接の検知:少なくとも1つのセンサ信号が、適切な方法で事前に決められたまたは自動設定された特定のレベルを超えるまたはそれを下回るとき、電場センサからの信号がジェスチャとして認識される。
b)動作検知:最小変化速度の電場センサからの信号がジェスチャとして認識される。この目的のために、これらの信号の数学的導関数を作成することが有利である。代替として、導関数に対応するハイパスフィルタリング操作を行うことも可能である。
c)上記で考察した処置a)とb)を組み合わせて実施することもできる。
本発明の特に好ましい実施形態によると、例えば個々のセンサ信号それぞれから、全てのセンサ信号の平均時間値および/または直流信号部分を減算することによってジェスチャ信号が正規化される。
さらに、対応するジェスチャが空間基準面内に写像されるように、検知されたセンサ信号の座標変換を行うことができる。対応するジェスチャがセンサの起点に対して一定の距離で常に写像されるように、このジェスチャ基準面は基本的に電極面に平行な位置にあり、かつセンサ軸に直交するのが好ましい。ジェスチャによって張られる面の中心は有利にはセンサ軸上に位置する。
多様な(典型的には3つの)センサ信号が分析のために1つのジェスチャ信号(1つのチャネル)に変えられるように、多次元センサ信号の変換は、好ましくは、電圧−周波数変換(例えばVCO)によって典型的な音声の周波数範囲50Hz−8000Hzまたは300−3400Hz(電話帯域範囲)にある好適な音列へと行われる。次のステップで、このジェスチャ信号は分析するために提供される。
センサ信号は、時間多重伝送信号として発生され得る。VCO変換を利用したセンサ信号の転換または変換によって、好ましくは、それぞれが音声周波数範囲内の異なる周波数帯域内にある複数の信号が発生される。
ジェスチャの認識
ジェスチャの認識は好ましくは、音声認識装置における単語認識に似た、ジェスチャ全体を認識するDTW(動的時間伸縮法)パターン認識装置を利用して行われる。これらの認識装置のタイプは、非常に多くの用途に対して十分間に合う同じように行われるジェスチャの中からの選択、およびしたがって相対的に目立つジェスチャに対するより小さな範囲のジェスチャの十分な認識率によって特徴付けられる。
上記に言及したDTWパターン認識手法の代替として、音声認識の概念としても知られている隠れマルコフモデル(HMM)認識装置法を使用することも可能である。このタイプの音声認識において、単語は、音素、原子価、および準静的音声に分けられる。同様に、ジェスチャはHMMでの状態によって表されるジェスチャ断片に分割される。ジェスチャの任意の部分は、ジェスチャ断片、すなわち好ましくは特に直線または曲げ動作における指、手および/または腕の任意の所与のジェスチャ、向きの変化(例えば手の回転)、形の変化(例えば手の開き)、ならびにこれらの変化から派生し一体化された任意の形態(動作の長さ、速度など)として使用されてよい。これらのジェスチャ断片は1つ1つ個別に認識され、定義された関連する全体のジェスチャ(この例としてLジェスチャ)に戻るようにHMM認識装置によって(訓練または記述プロセスにおいて)割り当てられる。
さらに、本発明によって音的信号シーケンスとして発生されかつ手のジェスチャと相関する信号は、ニューラルネットワーク認識装置およびジェスチャ断片分類装置によって音声認識(音素分類装置)と似た方法で分析することもできる。
音的信号シーケンスとして発生された信号シーケンスを分析しこれにより翻訳する目的で、上記に言及した処置ならびに他の既知の音声認識法を組み合わせて行うこともできる。
訓練段階と認識段階での違い
認識されるべきジェスチャは好ましくは少なくとも1回、好ましくは複数回訓練され、基準パターンとしてジェスチャ認識装置に記憶される。同一の意味を持つが訓練中に余りに違い過ぎると認識されたジェスチャは拒絶されるのが好ましい。対応する基準信号を平均化することによって、拒絶されず、十分類似しており、したがってはっきりと区別できるジェスチャを組み合わせることができる。
訓練プロセスの代替として、例えばマウス/メニューによる基準ジェスチャの図形入力(右から左へ、下から上への矢印、円形など)を行うことができる。これらの入力ジェスチャに対応する予測されるセンサ信号が計算され、これを基準パターンとしてジェスチャ認識装置に記憶することができる。
認識段階
認識段階において、ジェスチャ信号は訓練/記述プロセスで記憶された基準信号パターンと比較され、最も可能性の高いジェスチャが返される。ジェスチャ信号が全ての基準信号から余りにかけ離れている場合、「認識されない」というメッセージが返される。ここで逸脱の程度に応じて、これを利用して用途に応じて検知エラー(認識されたジェスチャが誤って割り当てられる)の可能性および誤った拒絶(失敗)(ジェスチャが認識されず拒絶される)を適応させることができる閾値を定義することができる。
HMM認識装置では、最も適切なジェスチャを求める調査は好ましくは、ビタビアルゴリズムを使用して行われる。
本発明による概念によって、ジェスチャ信号を音声認識システムに提供し、音声認識に関して既に開発されている認識方法によって驚く程効果的な方法で評価することが可能になる。およそ100kHzまでの範囲の低周波数電場を使用するセンサ(電場センサ)によって、検知電極から典型的には50cmまでの距離で動作をはっきりと認識することが可能になる。
ジェスチャの空間的な写像に関して3つの電極が使用されるのが好ましく、電極は3つの音調の分担を行い、それぞれの音調が一定の距離での動的変化に相関する。特に手の形も認識することができるようにし、全体の分解能を向上させかつ任意選択で特定のレベルの冗長性を形成するには4つ以上の電極を使用するのが有利であり、したがって座標に関して任意選択で過剰に構成されたシステムが作成される。
本発明のさらなる詳細および特徴は、図面を参照する以下の記載において見いだすことができる。
3つの送信電極と1つの受信電極によって手の空間動作が取得され、受信電極を介して取得した信号が音声認識システムによって十分明確に認識され得るように発生または修正される本発明によるジェスチャ認識概念の概略図である。 本発明による別のジェスチャ認識概念の概略図である。 電極配置に対して行われたジェスチャと相関した音的信号を発生するのに利用できる本発明による取得回路の写真である。 図3による取得回路の構造を示す回路図である。 図形入力手段を利用して認識されるジェスチャの記憶を示すブロック図である。 複数の送信機と1つの受信機を有する、学習モードにある例示のシステムを示すブロック図である。 複数の受信機と1つの送信機を有する、学習モードにある例示のシステムを示すブロック図である。 複数の送信機と1つの受信機を有する、認識モードにあるさらなる例示のシステムを示すブロック図である。 1つの送信機と複数の受信機を有する、認識モードにあるさらなる例示のシステムを示すブロック図である。 ジェスチャ信号がマイクロフォン入力に結合され、拡張された語彙を備えた音声認識プログラムを介してジェスチャ認識が管理されるジェスチャ認識装置を有するコンピュータシステムを示す図である。 ジェスチャの形状および動力学に相関する音的信号を発生し、この信号が容易に拡張可能な語彙を有する音声認識システムによって特定される、本発明による概念のさらなる詳細の概略図である。
図1は、本発明による回路の第1の変形形態を示している。本来音声の処理に適しており、そのために装備された電子構成要素(例えば構成要素RSC4128)は、プログラマブルコントローラを含んでいる。このコントローラは、少なくとも1つのI/Oポートにおいて交流信号(1−0シーケンス)を発生するようにファームウェアによって管理される。この信号は、例えば発光ダイオードによる光学式、または例えば結合面での容量式のいずれかで発することができる。後者の場合、それは交流電場を発生する。検知器(好ましくはトランスインピーダンス型増幅器を装備した)が、この電場または発光ダイオードから生じる光を受信することができる。この電場は、電圧制御発振器VCOを作動させる直流に変換される。例えばヒトの手足が検知領域に進入することによって電場の変化することで音調のピッチが変化し、これは高くなったり低くなったりする可能性がある。ほんのわずかな時間(例えば40ミリ秒)だけ対応するコントローラピンが始動されると、この期間に限って音調の変化が生じる。最終的にアイドル時間にはどんな音調も発生しないように、問題のVCOは別のI/Oピンを介してスイッチを入れたり切ったりすることができる。近接によって発生された音調シーケンスは、元々は音声処理のために設けられた分析回路に送られ、分析回路は典型的には、好ましくは同様に電場または光信号を発生する同一チップ内にハードウェアとソフトウェアを組み合わせたものを備える。多次元の捕捉が望まれる場合、必要であれば複数の電場発生電極または発光ダイオードが設けられる。これは、同一コントローラの1つ1つと(すなわちシーケンスで)稼動させることができる他のI/Oピンの助けを借りて実現することができる。
本発明によると、信号の処理と分析は、それ自体既知である音声処理の分析技術を利用して本発明によって行われる。これらの音声認識技術は、音声と同様の音的信号シーケンスがジェスチャと相関して第1に発生されるジェスチャ認識を目的として本発明によって使用される。これらの音的信号シーケンスの分析は比較的信頼できるものであるが、その理由は、音調がより一層母音の連続のように聞こえ、かつ子音と歯擦音が省略され得る(もっともそれらは必要とされないが)ように音調を発生することができるからである。したがって言葉による命令とジェスチャによる命令を互いに混合させ、同時にまたは交互に行うことも可能である。ニューロネットワークまたは他の学習アルゴリズムの助けを借りて、このようなシステムを訓練し、許容閾値を調節することが可能である。
図1に示される電子構成要素において、そのI/Oポート(例えば銅表面)に例えば3つの電場発生電極が結合される。電場受信電極Einは、電場発生電極の近傍に配置される。この電場受信電極は、バッファ(例えばトランスインピーダンス型増幅器)、その後に続くダイオードおよびコンデンサを備えた整流回路ならびに電圧制御発振器(VCO、ここではスパイクパルス発生器)上に示されている。この回路の助けを借りて、そのピッチが近接によって、好ましくはヒトの手足が近接することによって変化する音調シーケンスを発生することが可能になる。その後、シーケンサー回路(ソフトウェアまたはハードウェア)の助けを借りて、具体的には例えば一度に20ミリ秒の間、100kHzの1−0連続で構成される交流電場によって、個々の電極面E1からE3が順次作動される。交流電場が発生される。手足が挿入されることで入力電極Keへの電場が弱められたり、またはバイパスとして作用する場合がある。この2つの効果は共に、接続されたVCOのピッチを変化させ、その出力がチップに返され音声処理が完成する。この方法では、動作のシーケンスを簡単な方法で訓練し評価することができる。同一の入力(または異なる入力)において、同様の方法で発話による命令を処理するマイクロフォンを接続することもできる。
図2は、トランジスタを備えた検知器の簡素な実施形態を示す。この回路をチップに統合させ、必要であれば充電用のコンデンサのみを例えば外付けで取付けることも可能である。VCOはまたソフトウェア機能としてチップ内で実現することもできる。
本発明は極めて費用対効果の高い方法で実現することができ、口頭およびジェスチャによって玩具を制御することができ、かつ継続的に玩具の楽しさを高める目的で玩具に組み込むのに特に好適である。ユーザは常に新しい発話による命令および/またはジェスチャを覚えさせることができる。
しかしながら本発明はまた技術的用途、テキストおよびデータ処理の分野ならびに通信デバイスにも適している。例えばこの種の構成を、例えば乾燥機のドラムの中など家庭電化製品に設置することもできる。例えば子供(または動物)がドラム内によじ登りその中で動き回っているときと、洗濯物を入れたときとでは、異なる系列の信号が発生される。さらに本発明は音に敏感でもある。したがって家庭電化製品を作動させることによってその中にいる生き物を傷つける前に、電化製品の中に生き物がいることに気付くことができる。この回路の助けを借りて、特定の言語命令または定義可能なジェスチャ(回路を立ち上げる)のみによって電化製品をスリープモードから立ち上げるおよび/またはそれを始動させる(断続的な作動の場合)ことも可能である。
例えば家具と連動して座っている位置またはジェスチャを分析する、または例えば調節できるマッサージ台などを言語命令に対して反応させるために、本明細書で記載する電極配置を家具に組み込むこともできる。
本発明の助けを借りてナビゲーション装置をより簡単に操作できるようにすることができる。ジェスチャによって位置決めし制御することによって均一なズーム機能が可能になり、これは運転中タッチスクリーンを使用する方法では実現するのが困難であった。複数の人間がこのようなシステムを操作することを望む場合、ユーザ固有の命令を提供する、または挿入されたジェスチャが発生した方向を分析することが可能である。
本発明はまた、高コストが理由でより費用のかかる個々の回路を使用することができないような場所でも、有利に採用することができる。
図5から図9のブロック図は自明である。図5は、図形入力を利用して認識されるジェスチャの記憶を視覚化するブロック図を示す。図6は、複数の送信機と1つの受信機を有する、学習モードにある例示のシステムを視覚化するブロック図を示す。図7は、複数の受信機と1つの送信機を有する、学習モードにある例示のシステムを視覚化するブロック図を示す。図8は、複数の送信機と1つの受信機を有する、認識モードにあるさらなる例示のシステムを視覚化するブロック図を示す。図9は、1つの送信機と複数の受信機を有する、認識モードにあるさらなる例示のシステムを視覚化するブロック図を示す。
複数の送信機と1つの受信機を備えた、または複数の受信機と1つの送信機を備えた上記に記載した検知技術の代替として、個々の電極を送信機および受信機として交互に作動させ、送信機および受信機として機能するそれぞれの電極間のバイパスの度合いを出力する、および/またはこれに対応して修正された音的信号の形態でバイパスの度合いの変化を出力することも可能である。
図10は、ジェスチャセンサを装備したコンピュータマウス1と、ジェスチャセンサを同様に装備したヘッドセット2とを備える電子データ処理システムを示している。手Hの動作を3つの空間的方向x、y、zで表す、コンピュータマウス1によって発生された信号およびヘッドセット2によって発生された信号が音的信号に変換され、PCの音声カード3の入力に直接送信される。マウスプラグ4は本明細書では中間プラグとして具体化され、その結果ヘッドセットプラグも同様にそれに装着することができる。それ自体既知である方法でマウスの動作をPCシステム7に送信することができるようにマウスプラグ4にUSBプラグ6が接続される。
より理解を深めるために本明細書に示されるケーブルの代替として、PCシステムとの通信をワイヤレスで行うこともできる。本発明によるジェスチャ捕捉装置は、PCの他の周辺機器、例えばモニタまたはタッチパッドなどに組み込むこともできる、あるいはノートブックの場合、例えばPCに直接組み込むことができる。
ジェスチャを入力するのにどのジェスチャ入力装置が使用されたかをシステムが判定するように、システムを調整することができる。各ジェスチャ入力装置に特定の機能を割り当てることができる。例えばマウスジェスチャセンサ装置は主に、文書またはデータ内を移動するのに使用されてよい。ヘッドセットジェスチャセンサ装置は、テキストの書式を整えたり、また句読点および校正を調整するのに特に使用することができる。2つのジェスチャセンサ装置は共に、任意選択で同時に作動させることができる。マウスジェスチャセンサ装置は、例えば細かな運動技能により適した手(主に右手)によって制御されてよい。残った自由な手は、第2のジェスチャセンサ装置、例えばヘッドセットジェスチャセンサ装置を制御するのに使用することができる。特定のジェスチャ、例えばマウスジェスチャセンサ装置に対して一定の距離で直線状に変化する形態の単純なジェスチャを連続する音調信号として送信することができ、顕著な経路と動的特徴を有するより複雑なジェスチャは、ジェスチャの完了を表す特徴が認識されたとき「個々の単語」として一定の遅れを伴って送信することができる。ジェスチャの完了を表す特徴の認識は任意選択で、本発明による音声認識システムの上流に接続された変換装置の付加的な機能によって管理されてよい。ジェスチャの完了を表す特徴は、例えば入力ジェスチャによって生じた前段階の10%にあたる時間枠内に、特定の信号変化が全く生じないことであってよい。
本発明による概念によって、相乗効果を引き起こすようにジェスチャ信号を音声信号によって処理することが可能になる。
発話による入力が必要でない用途では、音声認識ツールはジェスチャ翻訳のみに使用することができる。
本発明による概念に基づいて、音声認識用途用に開発されたチップセットまたはASICSを使用して特に効果的なやり方でジェスチャ認識システムを実現することが可能である。
本発明は、具体的には、出願人によって提出された上記に言及した先行出願に記載される技術と組み合わせて使用することができる。出願人によって提出されたおよび最初に言及されたこれらのより古い特許出願の開示の範囲は、参照により本出願に組み込まれる。

Claims (30)

  1. 手のジェスチャで規定されて発生される複数の入力信号の電子信号処理を行う方法であって、
    a)検知システムに対してユーザの前記手のジェスチャが実行され、
    b)前記複数の入力信号が、手またはその指の空間動作と相関する複数の転送信号を表すように発生または変換され、
    c)前記複数の転送信号の周波数帯域が音声認識システムにアクセス可能な音声信号の周波数帯域を捕捉するように前記複数の転送信号が発生され、
    d)前記複数の転送信号に基づいて音声分析手続を使用して前記手のジェスチャの翻訳が行われる方法。
  2. 前記複数の入力信号が音調発生器システム(例えばVCO即ち電圧制御発振器)によって発生されることを特徴とする、請求項1に記載の方法。
  3. 前記複数の入力信号が端末機回路のような回路によって発生されることを特徴とする、請求項1に記載の方法。
  4. 前記複数の転送信号が、前記ジェスチャの前記空間動作を写像するように発生されることを特徴とする、請求項1〜3の少なくとも一項に記載の方法。
  5. 音調的前記複数の転送信号が3つ(3つ組)の音調で構成され、ジェスチャを行う前記手またはその指の前記動作によって前記個々の音調の組成が、動作を写像する規則に従って変化することを特徴とする、請求項1〜4の少なくとも一項に記載の方法。
  6. 検知地点から離れる動作に関してこの基準地点に対する前記複数の転送信号のピッチが増大することを特徴とする、請求項1〜5の少なくとも一項に記載の方法。
  7. 検知地点に近づく動作に関してこの基準地点に対する前記複数の転送信号のピッチが低下することを特徴とする、請求項1〜5の少なくとも一項に記載の方法。
  8. 前記複数の転送信号が、ジェスチャを行う手から、好ましくは少なくとも3つの基準地点を含む基準システムまでの距離の変化を記述するように構成されることを特徴とする、請求項1〜7の少なくとも一項に記載の方法。
  9. 少なくとも1つのセンサ信号が所定のまたは適合可能な調節レベルを超える電場センサからの信号のみがジェスチャとして認識されることを特徴とする、請求項1〜8の少なくとも一項に記載の方法。
  10. 最小の変化速度を有する電場センサからの信号のみがジェスチャとして認識されることを特徴とする、請求項1〜9の少なくとも一項に記載の方法。
  11. これらの信号の数学的導関数が形成されることを特徴とする、請求項1〜10の少なくとも一項に記載の方法。
  12. 前記ジェスチャ信号の正規化が、例えば前記個々のセンサ信号それぞれから、全てのセンサ信号の平均時間値および/または直流信号部分を減算することによって行われることを特徴とする、請求項1〜11の少なくとも一項に記載の方法。
  13. 前記検知されたセンサ信号の座標変換が、前記対応するジェスチャが空間ジェスチャ基準面内に写像されるように行われることを特徴とする、請求項1〜12の少なくとも一項に記載の方法。
  14. 前記対応するジェスチャが前記センサの起点から常に一定の距離で写像されるように、このジェスチャ基準面が基本的に前記電極面に平行して延び、かつ前記センサ軸を横切るように確立されることを特徴とする、請求項1〜13の少なくとも一項に記載の方法。
  15. 前記ジェスチャによって張られる面の中心が基本的に前記センサの軸上に位置することを特徴とする、請求項1〜14の少なくとも一項に記載の方法。
  16. 前記多様なセンサ信号が分析のために1つのジェスチャ信号(1つのチャネル)のみに合体されるように、このように変換された前記多次元センサ信号の変換が、好適な電圧−周波数変換(例えばVCO)によって典型的な音声の周波数範囲50Hz−8000Hzまたは300−3400Hz(電話帯域範囲)にある好適な音調シーケンスに伝達されることを特徴とする、請求項1〜15の少なくとも一項に記載の方法。
  17. 前記センサ信号が時間多重化装置によって捕捉されることを特徴とする、請求項1〜16の少なくとも一項に記載の方法。
  18. 前記センサ信号が、VCO変換を利用して前記音声周波数範囲内の異なる周波数帯域に変換されることを特徴とする、請求項1〜17の少なくとも一項に記載の方法。
  19. 前記ジェスチャ認識が、音声認識における単語認識に似た、ジェスチャ全体を認識するDTW(動的時間伸縮法)パターン認識装置を利用して管理されることを特徴とする、請求項1〜18の少なくとも一項に記載の方法。
  20. 前記ジェスチャ認識が、音声認識で知られている隠れマルコフモデル(HMM)認識装置を使用して管理されることを特徴とする、請求項1〜19の少なくとも一項に記載の方法。
  21. 認識されるべき前記ジェスチャを基準パターンとして覚えさせかつこれが記憶されることを特徴とする、請求項1〜20の少なくとも一項に記載の方法。
  22. 訓練中に余りに違い過ぎると認識されたジェスチャは、信頼できないものとして拒絶されることを特徴とする、請求項1〜21の少なくとも一項に記載の方法。
  23. 拒絶されない類似するジェスチャが、対応する基準信号を平均化することによって組み合わされることを特徴とする、請求項1〜22の少なくとも一項に記載の方法。
  24. 前記ジェスチャ訓練プロセスが、視覚的パラメータまたは視覚的フィードバックによって支援されることを特徴とする、請求項1〜23の少なくとも一項に記載の方法。
  25. 請求項1〜24の少なくとも一項による方法を実施するためのシステム。
  26. ユーザの手または指の前記空間動作を検知する前記装置が、マウス、マウスパッド、ヘッドセット、キーボードおよび/またはモニタに組み込まれることを特徴とする、請求項25に記載のシステム。
  27. 当該システムが、例えば家庭電化製品または入力操作を行う機械などの技術装置に組み込まれることを特徴とする、請求項25に記載のシステム。
  28. 当該システムが、携帯通信デバイスに組み込まれることを特徴とする、請求項27に記載のシステム。
  29. 当該システムが、自動車、具体的には自動車のナビゲーションシステムに組み込まれることを特徴とする、請求項27に記載のシステム。
  30. 当該システムが、電子玩具に組み込まれることを特徴とする、請求項27に記載のシステム。
JP2011501152A 2008-03-26 2009-03-26 ジェスチャ多次元分析のためのシステムおよび方法 Expired - Fee Related JP5529844B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE102008015730.9 2008-03-26
DE102008015730 2008-03-26
PCT/EP2009/002229 WO2009118183A2 (de) 2008-03-26 2009-03-26 System und verfahren zur multidimensionalen gestenauwertung

Publications (2)

Publication Number Publication Date
JP2011530727A JP2011530727A (ja) 2011-12-22
JP5529844B2 true JP5529844B2 (ja) 2014-06-25

Family

ID=41000031

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011501152A Expired - Fee Related JP5529844B2 (ja) 2008-03-26 2009-03-26 ジェスチャ多次元分析のためのシステムおよび方法

Country Status (7)

Country Link
EP (1) EP2277098B1 (ja)
JP (1) JP5529844B2 (ja)
KR (1) KR101576148B1 (ja)
CN (1) CN102132227B (ja)
DE (2) DE102009014991A1 (ja)
ES (1) ES2527073T3 (ja)
WO (1) WO2009118183A2 (ja)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102010008301A1 (de) 2010-02-17 2011-08-18 Siemens Enterprise Communications GmbH & Co. KG, 81379 Verfahren zur Aufnahme und Übertragung von Bewegungsinformation
DE102010014462A1 (de) * 2010-04-09 2011-10-13 Ecomal Deutschland Gmbh Steuereinrichtung zum Ansteuern eines elektrischen Verbrauchers und Verfahren zum Betrieb einer solchen Steuereinrichtung
KR101251730B1 (ko) * 2010-09-27 2013-04-05 한국과학기술원 키보드를 이용한 컴퓨터 제어방법, 제어장치 및 이를 위한 프로그램 명령어가 기록된 기록매체
CN102810056B (zh) * 2011-06-03 2015-04-22 宏碁股份有限公司 语音信号处理方法与应用其的触控面板手机
US9251409B2 (en) 2011-10-18 2016-02-02 Nokia Technologies Oy Methods and apparatuses for gesture recognition
DE102012013503B4 (de) 2012-07-06 2014-10-09 Audi Ag Verfahren und Steuerungssystem zum Betreiben eines Kraftwagens
DE102013002680B3 (de) * 2013-02-15 2014-05-22 Audi Ag Verfahren zum Betreiben einer Vorrichtung, insbesondere eines Kraftwagens oder eines mobilen Endgeräts, mittels Gestensteuerung sowie Vorrichtung
CN105579319B (zh) * 2013-03-12 2018-02-16 罗伯特·博世有限公司 用于识别车载信息系统中的手写手势的系统和方法
DE102013208999B4 (de) * 2013-05-15 2015-11-12 EDISEN SENSOR SYSTEME GmbH & Co. KG Verfahren und Vorrichtung für ein kapazitives berührungsloses Eingabesystem auf Basis einer einzigen Sensorfläche
DE102013019335A1 (de) 2013-11-20 2015-05-21 Expresso Deutschland Gmbh Von einem Bediener steuerbares Flurförderzeug
US9921739B2 (en) * 2014-03-03 2018-03-20 Microchip Technology Incorporated System and method for gesture control
CN106456043B (zh) * 2014-04-16 2019-12-31 博洛尼亚大学 具有用于测量瓣膜内电阻抗的集成电子电路的心脏瓣膜假体和用于监测假体功能的系统
US9315197B1 (en) 2014-09-30 2016-04-19 Continental Automotive Systems, Inc. Hands accelerating control system
CN110794960B (zh) * 2014-12-08 2024-02-06 罗希特·塞思 可穿戴无线hmi装置
US10166995B2 (en) * 2016-01-08 2019-01-01 Ford Global Technologies, Llc System and method for feature activation via gesture recognition and voice command
CN105904945A (zh) * 2016-04-18 2016-08-31 皇田工业股份有限公司 手势控制的车用卷帘系统
CN106020492A (zh) * 2016-06-07 2016-10-12 赵武刚 通过手的动作与手势产生遥控无人机及附件的信号的方法
CN117687477A (zh) * 2016-07-06 2024-03-12 可穿戴设备有限公司 用于可穿戴设备的姿势控制接口的方法和装置
CN106354889B (zh) * 2016-11-07 2020-01-21 北京化工大学 一种基于lwpt-dtw的间歇过程不等长时段同步化的方法
KR101959522B1 (ko) * 2017-07-21 2019-03-18 단국대학교 산학협력단 특징 강조형 dtw 기반의 패턴인식 모델 구축을 위한 장치 및 방법
CN108256433B (zh) * 2017-12-22 2020-12-25 银河水滴科技(北京)有限公司 一种运动姿态评估方法及系统
DE102018100335B4 (de) * 2018-01-09 2023-04-06 Preh Gmbh Verfahren und Vorrichtung zur 3D-Gestenerkennung
CN109917909B (zh) * 2019-02-01 2022-05-31 成都思悟革科技有限公司 基于非传播电磁场的多点接收阵列的动作捕捉装置及方法
EP3839700A1 (en) * 2019-12-18 2021-06-23 Modelo Continente Hipermercados, S.A. Gesture recognition system for kitchen machines
WO2023044154A2 (en) * 2021-09-20 2023-03-23 Universal City Studios Llc Theremin-based tracking and triggering

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US1661058A (en) * 1924-12-08 1928-02-28 Firm Of M J Goldberg Und Sohne Method of and apparatus for the generation of sounds
US5982853A (en) * 1995-03-01 1999-11-09 Liebermann; Raanan Telephone for the deaf and method of using same
JP3298578B2 (ja) 1998-03-18 2002-07-02 日本電信電話株式会社 装着型コマンド入力装置
US6137042A (en) * 1998-05-07 2000-10-24 International Business Machines Corporation Visual display for music generated via electric apparatus
GB9928682D0 (en) * 1999-12-06 2000-02-02 Electrotextiles Comp Ltd Input apparatus and a method of generating control signals
JP3096424U (ja) 2002-12-25 2003-09-19 菊男 萩原 デジタルテルミン
US7454342B2 (en) * 2003-03-19 2008-11-18 Intel Corporation Coupled hidden Markov model (CHMM) for continuous audiovisual speech recognition
AU2003243003A1 (en) * 2003-06-20 2005-01-04 Nadeem Mohammad Qadir Human-assistive wearable audio-visual inter-communication apparatus.
US7653883B2 (en) * 2004-07-30 2010-01-26 Apple Inc. Proximity detector in handheld device
KR20060066483A (ko) 2004-12-13 2006-06-16 엘지전자 주식회사 음성 인식을 위한 특징 벡터 추출 방법
DE102006003714A1 (de) 2006-01-26 2007-08-02 Zf Friedrichshafen Ag Verfahren und Vorrichtung zur Regelung eines elektrodynamischen Antriebssystems eines Kraftfahrzeuges
JP4720568B2 (ja) 2006-03-24 2011-07-13 ソニー株式会社 ユーザ入力装置及びユーザ入力方法
WO2007121977A2 (de) 2006-04-22 2007-11-01 Ident Technology Ag Steuersystem für ein fahrzeugcockpit
DE102007016408A1 (de) 2007-03-26 2008-10-02 Ident Technology Ag Mobiles Kommunikationsgerät und Eingabeeinrichtung hierfür
WO2008139550A1 (ja) * 2007-05-01 2008-11-20 Osaka Electro-Communication University 入力インタフェース装置
DE102007036636A1 (de) 2007-08-03 2009-02-05 Ident Technology Ag Spielzeug, insbesondere in der Art einer Puppe oder eines Stofftieres
DE102007039163A1 (de) 2007-08-20 2009-02-26 Ident Technology Ag Eingabeeinrichtung, insbesondere Computermaus

Also Published As

Publication number Publication date
WO2009118183A3 (de) 2009-12-10
DE112009000684A5 (de) 2011-05-26
KR20100136984A (ko) 2010-12-29
DE102009014991A1 (de) 2010-08-05
WO2009118183A2 (de) 2009-10-01
KR101576148B1 (ko) 2015-12-09
EP2277098A2 (de) 2011-01-26
CN102132227A (zh) 2011-07-20
CN102132227B (zh) 2017-02-22
ES2527073T3 (es) 2015-01-19
EP2277098B1 (de) 2014-10-01
JP2011530727A (ja) 2011-12-22

Similar Documents

Publication Publication Date Title
JP5529844B2 (ja) ジェスチャ多次元分析のためのシステムおよび方法
US8280732B2 (en) System and method for multidimensional gesture analysis
US7519537B2 (en) Method and apparatus for a verbo-manual gesture interface
CN203300127U (zh) 儿童教学监护机器人
US7774204B2 (en) System and method for controlling the operation of a device by voice commands
EP3612915A1 (en) Haptic communication system using cutaneous actuators for simulation of continuous human touch
KR100906136B1 (ko) 정보 처리용 로봇
CN106328132A (zh) 一种智能设备的语音交互控制方法和装置
CN106157956A (zh) 语音识别的方法及装置
CN105919591A (zh) 一种基于表面肌电信号的手语识别发声系统及方法
JPH08187368A (ja) ゲーム装置、入力装置、音声選択装置、音声認識装置及び音声反応装置
Zhang et al. EchoSpeech: Continuous Silent Speech Recognition on Minimally-obtrusive Eyewear Powered by Acoustic Sensing
CN118235174A (zh) 无声语音检测
KR100423788B1 (ko) 완구에 있어서 대화형 음성 및 다감각인식 시스템 및 이의방법
JP2007155986A (ja) 音声認識装置および音声認識装置を備えたロボット
Fezari et al. New speech processor and ultrasonic sensors based embedded system to improve the control of a motorised wheelchair
JP2018075657A (ja) 生成プログラム、生成装置、制御プログラム、制御方法、ロボット装置及び通話システム
Freitas et al. Multimodal silent speech interface based on video, depth, surface electromyography and ultrasonic doppler: Data collection and first recognition results
JP2004024863A (ja) 口唇認識装置および発生区間認識装置
KR102119701B1 (ko) 음악 인터랙션 로봇
Lin et al. Nonverbal acoustic communication in human-computer interaction
CN114647301B (zh) 一种基于声音信号的车载应用手势交互方法及系统
WO2024150633A1 (ja) 情報処理装置、情報処理方法および情報処理プログラム
Chandramouli et al. Speech recognition based computer keyboard replacement for the Quadriplegics, Paraplegics, paralytics and amputees
US20240203435A1 (en) Information processing method, apparatus and computer program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120223

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130709

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130710

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20131003

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20131010

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20131105

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20131112

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131127

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140401

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140417

R150 Certificate of patent or registration of utility model

Ref document number: 5529844

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees