JP2005529421A

JP2005529421A - 可動ユニット及び可動ユニットを制御する方法

Info

Publication number: JP2005529421A
Application number: JP2004512119A
Authority: JP
Inventors: ショル，ホルガー
Original assignee: Koninklijke Philips Electronics NV
Current assignee: Koninklijke Philips NV
Priority date: 2002-06-05
Filing date: 2003-06-03
Publication date: 2005-09-29
Also published as: EP1514260A1; WO2003105125A1; DE10224816A1; AU2003232385A1; US20050234729A1

Abstract

ロボット（１２）といった可動ユニット、及び可動ユニットを制御する方法を記載する。可動ユニットは移動運動手段を有し、音声信号を獲得且つ認識可能である。例えば、ユーザ（２４）からの可動ユニットの距離又は音響干渉源（２０、２２）によって、可動ユニットの位置が、ユーザからの音声コマンドが適切な品質標準で伝送される又は認識されない位置である場合、伝送又は認識品質が恐らくより良いであろう少なくとも１つの目標場所（２８）が決定される。可動ユニットは、その目標位置に移動する。可動ユニットは、この場合、ユーザからの音声信号のための予想される伝送品質を絶えず決定し得る。同様に、認識品質も音声信号が受信され且つ認識された後でのみ決定されることも可能である。認識品質又は予想される伝送品質が、所定の閾値より下である場合、可動ユニットが移動するための目標位置が決定される。しかし、１つの実施例では、目標場所への移動に対し決定される負担が高すぎる場合には、可動ユニットの移動は中止される場合もある。この場合、メッセージがユーザに伝えられる。

Description

本発明は、可動ユニットと、可動ユニットを制御する方法に係る。

周知の可動ユニットを形成する様々な用途のためのロボットがある。

「可動ユニット」の意味するところは、移動運動のための独自の手段を有するユニットである。このユニットは、例えば、家の中を動き回り、その機能を行うロボットであり得る。しかし、例えば、工業企業における製造環境における可動ユニットでも同様にあり得る。

このような種類のユニットに対し音声制御を使用することは周知である。この場合、ユーザは、音声コマンドでユニットを制御することができる。更に、ユーザが様々な情報項目について問うユーザと可動ユニット間で会話が交わされることも可能である。

更には、音声認識技法も知られている。この技法では、認識される単語列は、音声信号に相関される。話者依存型及び話者独立型音声認識システムがともに周知である。

周知の音声認識システムは、話者の位置が、捕捉システムに対して最適化される用途的状況において用いられる。例えば、口述記録システム又は電話機システムにおける音声認識の使用が知られており、両方の場合において、ユーザは、そのために設けられているマイクロホンに直接話し掛けること。一方、音声認識が、可動ユニットのコンテキストで用いられる場合、可動ユニットであること自体が、音響信号が捕捉される場所への信号経路上に発生し得る幾つかの妨害があるということを意味するという問題を有する。これらには、一方には、例えば、スピーカといったノイズ源及び家庭用電化製品が動く際に発するノイズといった音響干渉源がある。しかし、他方には、可動ユニットからユーザへの距離と、可動ユニットとユーザ間にある任意の音減衰又は音反射障害物も影響を及ぼす。この結果、可動ユニットの音声コマンドを正確に理解する能力は、生存する状況に応じて大幅に異なる。

ＪＰ−Ａ０９１４６５８６から、背景ノイズをモニタリングするユニットが設けられた音声認識ユニットが公知である。背景ノイズを参照することによって、音声信号の品質が最低閾値より上か否かが判断される。音声信号の品質が最低閾値より上でないと判断されると、音声信号の品質が良好でないことがユーザに伝えられる。この解決策の不利点は、ユーザに対する要求がかなり高いということである。

従って、本発明は、可能な限り良好な音声信号の認識を一貫して達成することのできる可動ユニットとその可動ユニットを制御する方法を明記することを目的とする。

この目的は、請求項１及び２のいずれかに記載した可動ユニットと、請求項８及び９に記載した可動ユニットを制御する方法によって達成される。従属項は、本発明の有利な実施例に関連する。

請求項１及び２に記載した可動ユニットと、請求項８及び９に記載した制御方法は、それぞれ、この目的を達成する手段を構成する。これらの目的を達成する手段は、幾つかの共通事項を有する。

両方の場合において、本発明の可動ユニットは、音声信号を獲得且つ認識する手段を有する。音声信号は、複数のマイクロホンによって音響信号の形で捕捉されることが好適であり、通常はデジタル形式で処理される。周知の音声処理技法が、捕捉された音声信号に適用される。音声認識のための周知の技法は、例えば、仮定、即ち、例えば、音素を、捕捉された音響信号から信号処理技法によって抽出された属性ベクトルとの相関に基づいている。以前の訓練から、各音素に対して対応する属性ベクトルの確率分布が既知である。音声認識では、様々な仮説、つまり、様々な音素は、所与の場合に存在する属性ベクトルが当該の仮定の既知の確率分布に適合する確率を表すスコアで格付けされる。この音声認識の暫定的な結果は、最高スコアを有する仮定である。更に当業者には、例えば、語彙集を用いることによって有効と考えられる音素連鎖を制限する、又は、音声モデルを用いることによってよりもっともらしい単語列を優先することによって、認識を向上する更なる可能性も周知であろう。

本発明の第１の面（請求項１）では、音声信号が捕捉されて認識されると、認識の品質が十分に良好か否かが評価される。このために、認識品質を評価する評価手段が、用いられる音声認識手段と並列に適用される。音響音声列が処理されると、周知の音声認識アルゴリズムによって、認識された単語列と共に、認識品質がどれくらい良好かに関する情報を与える信頼インジケータが供給される。

従って、請求項１に記載する可動ユニットは、得られた認識品質が十分に良好か否かを決定する制御ユニットを有する。このことは、供給された信頼インジケータを、固定値に予め設定される又は可変値に設定可能な最小閾値と比較することによって行われる。制御ユニットが、認識品質が十分に良好ではない、即ち、例えば、所定の最小閾値より下であると決定すると、制御ユニットは、認識品質が恐らくより良い可動ユニット用の目標場所を決定する。このために、制御ユニットは、可動ユニットが決定された目標場所に移動するよう可動ユニットの移動運動手段を作動させる。

請求項２に記載するように、本発明の第２の面では、同様に、可動ユニットは、移動運動手段と、音声信号用の捕捉及び評価手段を有する。しかし、認識品質を向上するために、ここでは、音響音声信号の伝送路の品質が継続的に、即ち、音声信号が既に放射された後、及び、必要なとき、即ち、伝送の品質があまり良好でないという予想があるときだけでなく評価され、可動ユニットは適宜移動させられる。

このために、ユーザからの音声信号が可動ユニットに伝送される際の予想の品質が決定される。得られた結果が満足のいくものでない場合、可動ユニット用の認識品質が恐らくより良い位置が決定される。

本発明のこれら２つの面は、請求項１及び２、並びに、請求項８及び９にそれぞれ記載され、一方で、現在受信された音声信号用の認識品質のモニタリングと、他方で伝送の品質の継続的なモニタリングは、それぞれ、意図する目的を達成し、互いとは別々に、各手順において、可動ユニットによる音響音声信号の認識を向上する。しかし、これらの２つの面は、組合わせられても十分である。以下に説明する本発明の実施例は、上述した面の１つ又は両方の面に関連して使用され得る。

複数の目標場所が決定され得、その場合、制御ユニットは、これらの目標場所のうち好適である目標場所を選択し、可動ユニットがこの選択された目標場所に移動するよう移動運動手段を作動させる。制御ユニットは、最初に、可動ユニットの選択された目標場所への移動に関する移動すべき距離、又は、推定移動時間といった好適な基準を参照して測定される負担を決定することが好適である。

本発明の１つの実施例では、可動ユニットは、いつも目標場所に移動するとは限らない。負担が所定の最大閾値より大きい場合には、ユニットを移動させるのではなく、ユーザにメッセージが与えられる。このようにすると、ユーザは、可動ユニットはそのとき音声コマンドを受信することができないこと、又は、受信したとしても認識品質が低いことを理解することができる。この場合、ユーザは、例えば、より適した場所を選択するか、又は、例えば、ラジオを消すことによって干渉源の影響を低減する等反応することができる。

可動ユニットは、幾つかのマイクロホンを有することが好適である。複数のマイクロホンを用いることによって、捕捉される信号の発生点の位置を突き止めることが可能である。例えば、音声コマンドの発生点（即ち、ユーザの位置）の位置を突き止めることが可能である。同様に、音響干渉源の位置も決定することが可能である。複数のマイクロホンがある場合、所望の信号は、ビームを形成することによって感知マイクロホン群によって所与の嗜好性が得られるよう捕捉されることが好適である。このことは、ビーム領域外の干渉源の影響かなり低減することができる。しかし、一方、ビーム領域内にある干渉源は、非常に強い影響を有する。従って、好適な目標場所を決定する際に、位置のみならず方向についても許容差が与えられる。

可動ユニットは、そのワールドのモデルを有することが好適である。これは、可動ユニットの３次元環境についての情報がメモリ内に格納されることを意味する。格納される情報は、一方で、予め格納される場合もある。例えば、部屋のサイズ、部屋の中にある固定の対象物の形状及び位置についての情報は、家庭用ロボットに意図的に伝送され得る。或いは、又は、更に、ワールドモデルの情報は、このような種類のメモリに絶えずロードする及び／又は更新するためにセンサからのデータを用いて獲得することも可能である。このセンサからのデータは、例えば、光学センサ（カメラ、画像認識設備）又は音響センサ（マイクロホンアレイ、シグナルロケーション設備）からもたらされ得る。

可動ユニットのワールドモデルの一部として、メモリは、音響干渉源の位置と、必要な場合には音響干渉源の方向と、少なくとも１人のユーザの位置及び視線方向と、物理的障害物の位置及び形状を有する。可動ユニットの現在位置及び方向もクエリーされることが可能である。各実施において上述した全ての情報が格納される必要はない。ユーザの位置に対する可動ユニットの位置及び方向を決定可能であればよい。

本発明の音声認識手段及び認識品質を評価する手段と、制御ユニットは、単純に機能ユニットとして理解すべきである。事実、実際の実施では、これらのユニットは、別々のサブ組立体の形であり得る。しかし、これらの機能ユニットが、上述した全ての機能性を組合わせるプログラムを実行するマイクロプロセッサ又はシグナルプロセッサを有する電子回路によって実施されることが好適である。

本発明の上述の及び他の面は、以下に説明する実施例を参照しながら明らかにし且つ説明する。

図１は、部屋１０を示す平面図である。部屋１０の中には、ロボット１２の形の可動ユニットがある。図１には、ロボット１２は、ある動きを説明することを可能にするための別の位置１２ａにある様子も示す。

部屋１０内には、音声コマンドでロボット１２を制御するユーザ２４がいる。

部屋１０には、ロボットにとって幾つかの物理的障害物、即ち、テーブル１４、ソファ１６、及び食器棚１８がある。

部屋１０の中には更に、ここでは、スピーカ２０、２２の形である音響干渉源がある。スピーカ２０、２２は、ユーザ２４からの音声信号上に重なる音響信号を再生し、ユーザ２４からロボット１２への伝送路上の妨害因子として明らかとなる。本願の例では、スピーカ２０、２２は、指向性を有する。エンクロージャ２０、２２から放射された干渉信号が顕著な干渉を引き起こす振幅を有する領域は、図１に、スピーカ２０、２２から出る線によって示す。

概略的にのみ示すロボット１２は、ここでは、その下面にある駆動され操縦可能な車輪の形である駆動手段を有する。ロボット１２は更に、ここでは、カメラの形である光学感知手段も有する。ロボット１２によって使用される音響捕捉手段は、幾つかのマイクロホンである（ロボットのこれらの詳細はいずれも図面には示していない）。

駆動手段は、制御のために、ロボット１２の中央制御ユニットに接続される。マイクロホン及びカメラによって捕捉された信号も、中央制御ユニットに与えられる。中央処理ユニットは、マイクロコンピュータ、即ち、マイクロプロセッサ又はシグナルプロセッサ、データ又はプログラムメモリ、及び、入力／出力インタフェースを有する電気回路である。本願に記載したロボット１２の全ての機能性は、中央制御ユニット上で実行されるプログラムの形で実施される。

ロボット１２の中央制御ユニット内には、図１に示すようなロボット１２の物理的環境がマッピングされるワールドモデルが実装される。図１に示す対象物は全て、それぞれその形状、方向、座標系における位置と共に中央制御ユニットに属するメモリ内に記録される。例えば、部屋１０の大きさ、障害物１４、１６、及び１８の場所及び形状、干渉源２０、２２の位置及び干渉源２０、２２によって影響を受ける領域が格納される。ロボット１２は更に、部屋１０におけるその現在位置と方向を決定することも常に可能である。ユーザ２４の位置及び視野方向も絶えず更新され、ロボット１２の光学及び音響感知手段を介してワールドモデルに入力される。ワールドモデルも、継続的に更新される。例えば、追加の物理的障害物が、音響感知手段を介して感知される、又は、音響感知手段が、新しい音響干渉源の位置を突き止める場合、この情報は、ワールドモデルを保持するメモリに入力される。

ロボット１２の機能のうちの１つは、音響信号を捕捉し且つ処理することである。音響信号は、ロボット１２の既知の位置に取付けられた様々なマイクロホンによって絶えず捕捉される。これらの音響信号の発生源、即ち、干渉信号及び所望の信号の発生源は、様々なマイクロホンによって捕捉されたときのトランジット時間における差から位置が突き止められ、ワールドモデルに入力される。カメラによって供給される画像データとも適合が取られ、それにより、例えば、干渉源の場所を突き止める、認識する、及び特徴付けることを可能にする。

所望の信号は、マイクロホンを介して絶えず捕捉される。この場合において指向性を得るためには、「ビーム形成」技法が用いられる。この技法は周知であるので、詳細には説明しない。その結果、信号は、図１に斜線で示す領域２６から基本的に捕捉される。

ロボット１２の更なる機能は、音声認識である。領域２６から捕捉された所望の信号は、音声認識アルゴリズムによって処理され、それにより、所望の信号内に含まれる音響音声信号が、関連付けられる単語又は単語列に相関されることを可能にする。話者依存型及び話者独立型認識を含む音声認識のために様々な技法が用いられ得る。このような種類の技法は当業者には周知であるので、ここではこれ以上詳しく説明はしない。

音声認識において、音響音声信号に対応する単語又は単語列だけが生成されるのではなく、認識された各単語について、解析される音響音声信号と予め格納されたマスタパターンとの一致の度合いを示す信頼インジケータも生成される。従って、この信頼インジケータは、認識が正しいことの確率を評価する基礎を与える。信頼インジケータの例としては、例えば、最高と評価される仮定と、２番目に最高の仮定との間のスコア差、又は、それとＮ個の次に最高の仮定の平均との間のスコア差が挙げられる。ここでは、Ｎの数は、好適に選択される。他のインジケータは、単語グラフにおける仮定の「安定性」（ある仮定が他の認識領域に比べて所与の認識領域において発生する頻度）に基づくか、又は、異なる音声モデル評価（音声モデル重み付けスキームが僅かに変更される場合、最良の仮定は変更するか又はそのままかどうか）によって与えられる。信頼インジケータの目的は、認識処理の一種の全体像を見ることにより、処理の的確さ、又は、評価が略同じである多数の仮定の有無について言及することを可能にし、それにより、得られる結果は、ランダムな性質のものであり間違っている場合があるという疑いを喚起する。幾つかの個々の信頼インジケータを組合わせて、全体の決断を行うことは珍しいことではない（この決断は、通常、データを訓練することにより行う）。

本願の場合では、信頼インジケータは、例えば、線形であり、また、その値は０と１００％の間である。本願の例では、信頼インジケータが５０％以下である場合は、認識は恐らく正しくないと考える。しかし、この値は、この例における説明を明確にすることのみを意図する。実際の適用では、当業者が、適切な信頼インジケータを決定することができ、また、その信頼インジケータに対して閾値を決定することができ、その閾値より上である場合は、認識が正しいことの適切な確率があると当業者は考える。

図１を最初に参照しながら、ユーザ２４からの音声信号を認識してロボット１２が動作する方法を説明する。本願の場合、ロボット１２は、ユーザ２４がそのビーム領域にいるよう最初に方向付けられる。ユーザ２４が音声コマンドを与えると、この音声コマンドは、ロボット１２のマイクロホンによって捕捉され、そして処理される。所定の音声認識を信号に適用することによって、音響音声信号の予想される意味が与えられる。

正しく認識された音声信号は、ロボット１２によって、制御コマンドとして理解され、実行される。

しかし、図１に示すように、ビーム領域内に干渉源、即ち、ここでは、スピーカ２２がある。従って、ユーザ２４からの音声信号は、その上に干渉信号が重なっている。従って、図示する例では、幾何学的配置は好適である（ロボット１２とユーザ２４間の距離が比較的小さく、ユーザ２４とロボット１２は互いに面している）が、この場合、音声認識は満足のいくものではなく、このことは、低すぎる信頼インジケータから明らかとなる。

このような場合、ロボット１２の中央制御ユニットは、認識品質はあまり良好ではないと判断する。その場合、中央制御ユニットのメモリ（ワールドモデル）にある情報を使用して、認識品質が恐らくより良いユニット１２の別の場所を計算する。メモリ内には更に、スピーカ２２の位置とスピーカ２２によって影響を受ける領域と、更に、音声信号の位置を突き止めることによって決定されるユーザ２４の位置も格納される。更に、制御ユニットは、ロボット１２のビーム領域２６も知っている。

この情報から、ロボット１２の中央制御ユニットは、認識品質が恐らくより良い場所のセットを決定する。このような種類の場所は、幾何学的因子に基づいて決定することができる。ここでは、ユーザ２４がビーム領域２６内にいるがそのビーム領域２６内には干渉源２０、２２がない部屋１０の中のロボット１２の全ての位置及び関連付けられる方向が決定され得る。例えば、ビームの中心線とユーザ２４の視線方向との間の角度が９０°以上であってはならないといった他の基準も適用してもよい。ワールドモデルからの他の情報も、適切な目標位置を決定するために用いてもよく、このときに決定し得る追加の要件は、例えば、ロボット１２とユーザ２４との間には物理的障害物１４、１６、及び１８があってはならないとし得る。更に、ユーザ２４とロボット１２との間の最小及び／又は最大距離が決定されてもよく、これから外れる場合、経験から、認識品質はひどく低下することが示されている。当業者は、上述の考慮すべき事項に基づいて如何なる特定の適用において選択されるべき基準を決定することができるであろう。

本願の例では、目標位置の領域２８は、斜線で示すように形成される。ロボット１２が適切な方向に合わされている、即ち、ユーザ２４に面していると仮定すると、干渉源２２の影響は、この領域ではかなり小さくなる。

目標領域２８内で決定される目標位置のうち、ロボット１２の中央制御ユニットは、１つの目標位置を選択する。この目標位置を選択することを可能にするために様々な基準が適用され得る。例えば、数値を有する負担インジケータ（burden indicator）が決定され得る。この負担インジケータは、例えば、ロボット１２が所与の位置に移動し、そこで回転するために恐らく必要な時間を示し得る。他の負担インジケータも考えることが可能である。

図１に示す例では、中央制御ユニットが領域２８内において選択した目標位置は、１２ａとしてロボット１２が２回目に示される位置である。物理的障害物１４、１６、１８のどれもが、ここでは、ロボット１２のこの位置への移動を妨害しないので、中央制御ユニットは、図１に矢印によって示すロボット１２の移動及び回転が行われるよう移動運動手段を作動させる。

この目標位置では、ロボット１２ａは、ユーザ２４と一列に並ぶ。ビーム領域２６ａ内には干渉源はない。ユーザ２４からの音声コマンドは、任意の干渉信号が重なることなくロボット１２ａによって捕捉されることが可能であり、従って、高い確実性で認識されることが可能である。このことは、高い信頼インジケータによって表される。

図１と同じ構成要素を有する第２の部屋３０における光景を図２に示す。ここでも、物理的障害物（ソファ１６、テーブル１４、食器棚１８）と干渉源２０、２２が部屋３０内にある。ロボット１２とユーザ２４の開始位置は、図１と同じである。干渉源２２がビーム領域２６内にあるので、ユーザ２４によって話される音声コマンドの認識品質は、信頼インジケータの所定の閾値（５０％）より下である。

図１に示す光景と同様に、ロボット１２の中央制御ユニットは、ビーム領域２６内に干渉源２０、２２が入ることなくビーム領域２６内にユーザ２４を含むよう位置付けられるロボット１２の場所のセットとして領域２８を決定する。

しかし、図２に示す光景では、領域２８の一部は、物理的障害物（テーブル１４）によって遮られている。物理的障害物の位置及び大きさは、ロボット１２のワールドモデル内に、特定のデータ入力の結果として、又は、ロボット１２自体のセンサ（例えば、カメラや可能であれば接触センサ）によって障害物が感知された結果として格納される。

目標領域２８を決定した段階の後、中央制御ユニットは、次に、領域２８内の多数の目標点のうちロボット１２が目指す目標点を決定する。しかし、既知の物理的障害物１４によって、その領域２８の直接的な近接には障害がある。ロボット１２の中央制御ユニットは、自由に近接できる領域２８内の位置に到達するためには障害物１４を回る迂回路（点線矢印）を取らなければならないことを認識する。

図１に関連して既に説明したように、この場合、例えば、移動しなければならない距離に関連して、負担インジケータが決定される。この第２の状況では、この距離は、比較的大きい（破線矢印）。負担インジケータが最大閾値（例えば、３ｍを超える移動距離）を超える場合は、ロボット１２の中央制御ユニットは、ロボット１２の（厄介な）移動ではなく、ユーザ２４にメッセージを送信することを決定する。このことは、例えば、音響又は視覚的信号の形で行われ得る。このようにして、ロボット１２は、ユーザ２４に、認識品質が恐らくより良い位置に移動すべきであることを伝える。ここでは、ユーザ２４が位置２４ａに動くことを意味する。ロボット１２は、１２ａに示すように同時に回転し、それにより、ユーザ２４ａがビーム領域２６ａ内にいるようになる。ここでは、ユーザ２４ａからの音声コマンドは、適切な品質基準で受信され、処理され、且つ、認識されることが可能である。

図１及び２に関連して、ここまでは、ロボット１２の行動は、受信した音声コマンドに対する反応として示してきた。しかし、これに加えて、ロボット１２は、スタンバイ状態、即ち、音声コマンドを受信するよう準備が整えられている状態においても動き、このような音声コマンドがユーザ２４から受信される場合に、可能な限り最良の方法で受信されることを確実にする。

ロボット１２の位置及び向き（従って、ビーム領域２６の場所）に関する情報を与えるロボット１２のワールドモデル、ユーザ２４の位置及び方向、及び、干渉源２０、２２の場所に基づいて、ロボット１２の中央制御ユニットは、音声コマンドを受信する前でも、予想される伝送品質を計算することができる。伝送品質に影響を与え得る因子は、特に、ロボット１２とユーザ２４間の距離、ユーザ２４とロボット１２間の音声減衰障害物（例えば、ソファ１６）の位置、干渉源２０、２２の影響、及び、ロボット１２が向いている方向（ビーム領域２６）とユーザ２４が向いている方向である。しかし、上述した因子のうちの幾つかしか考慮されないロボット用の比較的粗いワールドモデルからでさえも、伝送の前に予想可能な問題及び音声コマンドの認識を予測することができる。この場合に考慮される点は、伝送品質が十分に良好となり得る場所を決定する際に考慮される上述した点と同じである。従って、ロボット１２の中央制御ユニットのオペレーティングプログラム内の同じプログラムモジュールを、可能な目標場所の決定と、予想される伝送品質の予測の両方に用いることが可能である。純粋に幾何学的な配慮すべき事項（ビーム領域内には干渉源がなく、ユーザはビーム領域内である）以外、重要なパラメータは、適切な目標位置を決定するよう計算することが可能である。予想される伝送品質を評価するために用いることのできる重要パラメータは、例えば、ＳＮＲ（ロボットによって特別に放射される試験信号に支援されて可能）又はノイズの直接測定の推定値である。

このことも、図１を参照しながら説明することができる。ロボットが、ユーザ２４に対して図１に示す位置にある場合、ロボット１２の中央制御ユニットは、ユーザ２４からロボット１２への伝送品質は、音声コマンドの適切な認識のためには恐らく十分に適切ではないことを、音声コマンドを受信することなく認識することができる。この場合、ロボット１２の中央制御ユニットは、人２４は、ビーム領域２６内にいるが、干渉源２２もビーム領域２６内にあることを認識する。図１に関連して既に説明したように、従って、中央制御ユニットは、目標領域２８を決定し、目標領域内のより適した位置１２ａを選択し、ロボット１２をその位置に動かす。

ロボット１２がスタンバイモードにあるとき、中央制御ユニットは、ユーザ２４の位置を絶えずモニタリングし、予想される伝送品質を決定する。このようにすることによって、制御ユニットが、予想伝送品質は最低閾値（当業者によって実際の適用のために容易に決定可能な基準及び適切な最小閾値）より下であると結論付けると、ロボット１２は、より適切な位置に動くか、又は、適切な方向に回転する。

本発明において、ロボット１２のような可動ユニットと、可動ユニットを制御する方法を記載したとまとめることができる。可動ユニットは、移動運動する手段を有し、音声信号を獲得且つ認識することができる。例えば、可動ユニットのユーザ２４からの距離によって、又は、音響干渉源２０、２２によって、可動ユニット１２の位置は、ユーザ２４からの音声コマンドが適当な品質標準で伝送される又は認識するのに適切ではない場合、認識又は伝送の品質が恐らくより良い少なくとも１つの目標位置２８が決定される。その後、可動ユニット１２は、１つの目標位置２８に動かされる。

この場合、可動ユニット１２は、ユーザからの音声信号の予想される伝送品質を絶えず決定してもよい。同様に、認識品質は、音声信号が受信され認識された後でのみ決定されてもよい。認識品質又は予想される伝送品質が所定の閾値より低い場合、可動ユニット１２が移動するための目標場所２８が決定される。しかし、１つの実施例では、目標位置２８への移動のために決定された負担が大きすぎる場合には、可動ユニット１２の移動を中止することも可能である。この場合は、メッセージがユーザ２４に伝えられる。

ロボットとユーザのいる部屋を示す図である。ロボットとユーザのいる更なる部屋を示す図である。

Claims

可動ユニットを動かす手段と、
音声信号を獲得且つ認識する手段と、
認識品質が十分に良好であるか否か評価する評価手段と、
を有し、
前記認識品質が十分に良好でない場合、前記認識品質が恐らくより良い前記可動ユニットのための少なくとも１つの目標場所を決定し、その場合、前記制御ユニットは、前記可動ユニットが、決定された前記目標場所に移動するよう前記移動運動手段を作動させる、可動ユニット。
可動ユニットを動かす手段と、
少なくとも一人のユーザからの音声信号を獲得且つ認識する手段と、
前記ユーザから前記可動ユニットへの伝送の品質が、音声認識のために恐らく十分に良好であるか否かを決定し、前記伝送品質が恐らく十分に良好でない場合、前記伝送品質が恐らくより良い前記可動ユニットのための少なくとも１つの目標場所を決定する制御ユニットと、
を有し、
前記伝送品質が恐らくより良い前記可動ユニットのための少なくとも１つの目標場所を決定する場合、前記制御ユニットは、前記可動ユニットが、決定された前記目標場所に移動するよう前記移動運動手段を作動させる、可動ユニット。
請求項１及び２に記載に記載する可動ユニット。
前記制御ユニットは、
複数の目標場所を有するセットを決定し、
前記決定された目標場所について、前記可動ユニットの前記当該の目標場所への移動に関連する負担を決定し、
前記目標場所のセットから、前記負担に関して好適である目標場所を選択する、請求項１乃至３のうちいずれか一項記載の可動ユニット。
前記制御ユニットは、前記可動ユニットの前記決定された目標場所への移動に関連する前記負担を決定し、前記負担が、最大閾値を超える場合、前記移動運動手段は作動されずにユーザへのメッセージが生成される請求項１乃至４のうちいずれか一項記載の可動ユニット。
捕捉される音響信号の発生点の位置を突き止める手段が設けられる請求項１乃至５のうちいずれか一項記載の可動ユニット。
音響干渉源の位置、前記ユーザの位置、物理的障害物の位置、前記可動ユニットの位置、及び、方向のうち少なくとも１つのタイプの情報が格納されるメモリが設けられる請求項１乃至６のうちいずれか一項記載の可動ユニット。
可動ユニットを制御する方法であって、
音声信号を捕捉する段階と、
前記音声信号に音声認識を行う段階と、
を有し、
前記音声信号に音声認識を行うことによって、認識品質を評価し、
前記認識品質が十分に良好でない場合、前記認識品質が恐らくより良い前記可動ユニットのための少なくとも１つの目標場所が決定され、前記可動ユニットは、前記目標場所に動かされる、方法。
可動ユニットは、ユーザから前記可動ユニットへの音声信号の予想される伝送品質を絶えず決定し、前記伝送品質が恐らく十分に良好でない場合、前記伝送品質が恐らくより良い前記可動ユニットのための少なくとも１つの目標場所が決定され、前記可動ユニットは、前記目標場所に動かされる、可動ユニットを制御する方法。