JP4821489B2 - ロボット装置及びロボット装置の制御方法 - Google Patents

ロボット装置及びロボット装置の制御方法 Download PDF

Info

Publication number
JP4821489B2
JP4821489B2 JP2006213195A JP2006213195A JP4821489B2 JP 4821489 B2 JP4821489 B2 JP 4821489B2 JP 2006213195 A JP2006213195 A JP 2006213195A JP 2006213195 A JP2006213195 A JP 2006213195A JP 4821489 B2 JP4821489 B2 JP 4821489B2
Authority
JP
Japan
Prior art keywords
voice
voice input
priority
unit
input means
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006213195A
Other languages
English (en)
Other versions
JP2008040075A (ja
Inventor
奨 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Priority to JP2006213195A priority Critical patent/JP4821489B2/ja
Publication of JP2008040075A publication Critical patent/JP2008040075A/ja
Application granted granted Critical
Publication of JP4821489B2 publication Critical patent/JP4821489B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Toys (AREA)
  • Manipulator (AREA)

Description

本発明は、音声認識結果に基づき自律的に動作するロボット装置及びロボット装置の制御方法に関する。
従来、自律移動型のロボットに対し、教示信号として音声を使用し、ロボットに音声認識させ、音声認識結果に基づき移動等の動作をさせるものがある。しかし、現状の音声認識技術では、周囲の環境によっては音声認識精度が上がらず、音声を認識できない、又は誤認識する場合があるため、認識率を向上するため、背景ノイズを十分に抑える必要がある。そこで、マイクアレイなどを使用した信号処理によりノイズを抑制する手法も開発されているが、この場合であっても、マイクから数メートル離れただけで認識率が低下する。このように、環境に左右されず、ロボットに適切な指示を音声によって与えるためには、ロボットに内蔵したマイクだけで音声認識を行なうには限界がある。
そこで、このようにロボット内蔵のマイクで認識できない場合には、ロボットの周囲に別途マイク(以下、外部マイクという。)を設置し、背景ノイズを収集したり、ロボットから離れた位置で集音することが考えられる。しかし、この場合、外部マイクの設置場所が固定されていると、ロボットの移動範囲が制限されてしまうため、オペレータの音声をロボットに対し無線で伝送することが行なわれている。
しかし、ロボットの音声指示がオペレータのみによって与えられるのであれば、オペレータの音声入力を無線等でロボットに直接入力すればよいが、この方式ではオペレータ以外の音声入力を受け付けることができなくなる。したがって、オペレータとロボットの近くにいる人との両方の音声を認識することができることが望ましいが、従来、ロボットに対し無線で伝送した音声信号と、内蔵マイクとの切替手段が確立しておらず、手動で切替が行なわれていた。
これに対し、内蔵マイクからの入力と、無線通信を介して受信した音声情報とに基づき音声認識を行なうロボット装置が特許文献1に開示されている。この特許文献1に記載のロボット装置においては、無線通信を介して送信されるユーザの発話内容を受信する受信手段と、ロボット装置に組み込まれた内蔵マイク機器から入力した音声内容に代えて又は当該音声内容と共に、受信手段から受信した音声情報に基づく発話内容を認識する音声認識手段とを設ける。この構成により、ユーザとスムーズかつ自然にインタラクティブな対話をすることができるロボット装置を提供する。
特開2005−202075号公報
しかしながら、特許文献1のロボット装置においては、複数の内蔵マイクを有する場合、どの内蔵マイクを使用して音声認識すればよいのか判断することができない。例えば、順次選択して、音声認識できればその内蔵マイクを使用する、などの選択の方法も考えられるものの、最適なマイクを判断して選択することができれば、音声認識率を向上させることができる。
本発明は、このような事情に鑑みてなされたものであり、音声認識率を向上させることができるロボット装置及びその制御方法を提供することを目的とする。
本発明に係るロボット装置は、音声認識結果に基づき自律的に移動するロボット装置であって、優先度が設定された第1及び第2の音声入力手段と、前記優先度に基づき前記第1又は第2の音声入力手段からの入力を切替選択する音声信号切替手段と、前記音声信号切替手段により切替選択された前記第1又は第2の音声入力手段から入力された音声を認識する音声認識手段と、前記音声認識手段の音声認識結果に基づき行動選択する行動選択手段とを備え、前記音声信号切替手段は、前記音声入力手段からの音声の音声認識率が所定の閾値以上であるか否かの判定結果に基づき前記第1の音声入力手段及び/又は第2の音声入力手段の優先度を更新するものである。
本発明においては、音声認識率の良否に基づき音声信号入力手段を選択する優先度を更新するため、音声認識率が良好な音声が入力される音声入力手段を自動的に選択することができる。
本発明に係るロボット装置は、音声認識結果に基づき自律的に移動するロボット装置であって、優先度が設定された第1及び第2の音声入力手段と、前記優先度に基づき前記第1又は第2の音声入力手段からの入力を切替選択する音声信号切替手段と、前記音声信号切替手段により切替選択された前記第1又は第2の音声入力手段から入力された音声を認識する音声認識手段と、前記音声認識手段の音声認識結果に基づき行動選択する行動選択手段と、前記音声入力手段からの音声の信号対雑音比が所定の閾値以上であるか否かを判定するS/N比判定手段と、前記音声入力手段からの音声の音声認識率が所定の閾値以上であるか否かを判定する認識率判定手段と、前記S/N比判定手段及び前記認識率判定手段の判定結果に基づき前記第1の音声入力手段及び/又は第2の音声入力手段の優先度を更新する優先度更新手段とを有するものである。
本発明においては、S/N比の良否や、音声認識率の良否に基づき、音声入力手段を選択する優先度を更新するため、音声認識率が高い音声入力手段を自動的に選択することができる。
また、前記優先度更新手段は、前記S/N比が所定の閾値未満である場合、及び前記音声認識率が所定の閾値未満である場合に、前記優先度を更新することができ、これにより、音声認識する確率が低い音声入力手段の優先順位を下げることができる。
更に、前記第1の音声入力手段は、無線信号を受信する音声受信手段であり、前記第2の音声入力手段は、1又は複数のマイクロフォンであって、前記第1の音声入力手段の優先度の初期値が前記第2の音声入力手段の優先度の初期値より高く設定されるものとすることができる。これにより、初期設定時には、必ず無線信号による入力を選択させることができる。
更にまた、前記第1の音声入力手段は、無線信号を受信する音声受信手段であり、前記第2の音声入力手段は、1又は複数のマイクロフォンであって、前記第1の音声入力手段の優先度の初期値が前記第2の音声入力手段の優先度の初期値より高く設定され、前記音声受信手段に設定された優先度は固定値であ、前記優先度更新手段は、前記複数のマイクロフォンから入力される音声信号の信号対雑音比及び音声認識率に基づき、当該複数のマイクロフォンに設定された優先度を、前記固定値を上回らない範囲で更新することができる。これにより、入力があれば必ず選択される無線信号により、例えば重要な指示を送ることができる。
また、前記音声入力手段に設定される優先度は、リセット信号の入力又は所定のタイミングで前記初期値にリセットされるものとすることができる。
本発明に係るロボット装置の制御方法は、音声認識結果に基づき自律的に移動するロボット装置の制御方法であって、第1及び第2の音声入力手段に設定される優先度に基づき当該第1又は第2の音声入力手段からの入力を切替選択する音声入力選択工程と、前記切替選択された前記第1又は第2の音声入力手段から入力された音声を認識する音声認識工程と、前記音声認識工程における音声認識結果に基づき行動選択する行動選択工程とを備え、前記音声入力選択工程は、前記音声入力手段からの音声の信号対雑音比が所定の閾値以上であるか否かを判定するS/N比判定工程、及び/又は前記音声入力手段からの音声の音声認識率が所定の閾値以上であるか否かを判定する認識率判定工程と、前記S/N比判定工程及び/又は認識率判定工程の判定結果に基づき前記第1の音声入力手段及び/又は第2の音声入力手段の優先度を更新する優先度更新工程とを有する。
また、本発明にかかるロボット装置の制御方法においては、前記音声入力選択工程は、前記音声入力手段からの音声の信号対雑音比が所定の閾値以上であるか否かを判定するS/N比判定工程を更に有し、前記優先度更新工程では、前記S/N比判定工程及び認識率判定工程の判定結果に基づき前記第1の音声入力手段及び/又は第2の音声入力手段の優先度を更新することを特徴とする。


本発明においては、S/N比又は認識率に応じて、複数の音声入力手段のいずれかを選択する優先順位を変更することができ、S/N比や、認識率が良好なものを自動的に選択することができる。
本発明によれば、音声認識率を向上させることができるロボット装置及びその動作制御方法を提供することができる。
以下、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。図1は、本発明の実施の形態にかかる2足歩行タイプのロボットを示す斜視図である。図1に示すように、ロボット1は、体幹部ユニット1cの所定の位置に頭部ユニット1a、左右2つの腕部ユニット1b、左右2つの脚部ユニット1dが連結されている。なお、本実施の形態においては、2足歩行タイプのロボットとして説明するが、4足歩行等であってもよく、又は脚部は、車輪等からなるものであってもよい。
図2は、本実施の形態にかかるロボットを示すブロック図である。ロボット1は、制御部101、入出力部102、駆動部103、電源部104、及び外部記憶部105などを有している。
入出力部102は、周囲の映像を取得するためのCCD(Charge Coupled Device)などからなるカメラ121、周囲の音を集音するための1又は複数の内蔵マイク122、音声を出力してユーザと対話等を行なうためのスピーカ123、ユーザへの応答や感情等を表現するためのLED124、タッチセンサなどからなるセンサ部125などを備える。
また、駆動部103は、モータ131及びモータを駆動するドライバ132などを有し、ユーザの指示などに従って脚部ユニット1dや腕部ユニット1bを動作させる。電源部104は、バッテリ141及びその放充電を制御するバッテリ制御部142を有し、各部に電源を供給する。
外部記憶部105は、着脱可能なHDD、光ディスク、光磁気ディスク等からなり、各種プログラムや制御パラメータなどを記憶し、そのプログラムやデータを必要に応じて制御部101内のメモリ(不図示)等に供給する。
制御部は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)、無線通信用のインターフェースなどを有し、ロボット1の各種動作を制御する。そして、この制御部101は、例えばROMに格納された制御プログラムに従って音声認識を行なう音声認識モジュール12、認識結果に基づきユーザに発話動作をする音声発話モジュール13、カメラ121により取得した映像を解析する画像認識モジュール14、各種認識結果に基づきとるべき行動を選択する行動決定モジュール15などを有する。
ここで、本実施の形態にかかるロボット1は、ユーザ又はオペレータの呼びかけ等の音声を認識し、音声認識結果に基づき動作するものである。次に、本実施の形態にかかるロボット1の動作制御方法について詳細に説明する。
図3は、本実施の形態にかかるロボットにおいて、音声認識にかかわる部分のみを抜き出して示すブロック図である。図3に示すように、ロボット1は、上述したように入出力部として複数の内蔵マイク及びスピーカからなる音声入出力経路を有する。すなわち、本実施の形態においては、正面内蔵マイク21及びスピーカ22を使用する音声入出力経路A2、左側内蔵マイク41及びスピーカを使用する音声入出力経路A3、並びに右側内蔵マイク51及びスピーカを使用する音声入出力経路A4の3つの音声入出力経路A2〜A4を有している。なお、音声入出力経路は3つに限るものではない。更に、本ロボット1は、無線LAN31を有し、オペレータによって外部から当該無線LAN31を介して音声入力が可能な音声入出力経路A1も有している。
さらに、ロボット1の制御部101は、これら音声入出力経路A1〜A4のいずれを使用するかを選択する音声信号切替器11を有している。音声信号切替器11は、音声入出力経路A1〜A4のいずれかを選択し、当該経路と音声認識モジュール12とを接続する。
本実施の形態においては、内蔵マイク21、41、51から音声を入力するのが顧客であり、無線LAN31を介して音声入力するのがオペレータである場合について説明する。オペレータは、例えばマイク74、及びスピーカ75を有する遠隔操作用PC(Personal Computer)71を使用して無線LAN73を制御し、ロボット1に教示信号を入力する。例えば、オペレータは、遠隔操作用PC71に接続されたヘッドセットや、タイピンマイク及びイヤホンなどの入力手段を使用して音声情報を入力したり、又はキーボードなどの入力手段により文字情報を入力したりすることで、ロボット1に教示信号を入力することができる。一方で、ロボット1は、内蔵マイク21、41、51及びスピーカ22、42、52を使用して顧客と対話をすることができる。
ロボット1内の音声信号切替器11は、音声入出力経路A1〜A4のいずれかを、各経路A1〜A4に設定された優先度に基づいて選択する。ここで、本実施の形態においては、無線LAN31を介して音声が入力される音声入出力経路A1の優先度を固定とし、かつ最も高い優先度とする。一方、内蔵マイクによる音声入出力経路A2〜A4の優先度は可変となっている。
図4は、音声信号切替器11及び音声認識モジュール12の詳細を示すブロック図である。図4に示すように、音声信号切替器11は、図4に示すように、優先度更新部201を有し、内蔵マイクにより構成される音声入出力経路A2〜A4の優先度を後述する方法により更新する。
音声認識モジュール12は、S/N比判定部211及び音声認識率判定部212を有する。S/N比判定部211は、入力される音声のS/N比の良否を判定する。また、音声認識率判定部212は、入力される音声の認識率の良否を判定する。優先度更新部201は、S/N比判定部211のS/N比判定結果、音声認識率判定部212の音声認識率判定結果に基づき、音声入出力経路A2〜A4の優先度を更新する。
このように設定された優先度により、オペレータからの音声入力があると、同時に顧客からの音声入力があっても、常に優先度の高い音声入出力経路A1が選択されることとなる。一方、オペレータからの音声入力がなく、顧客がロボット1に話かけた場合には、音声入出力経路A2〜A4のうち、その時点で優先度が最も高い音声入出力経路が選択されることとなる。本例においては、初期設定としては、音声入出力経路A2の優先度>経路A3の優先度>経路A4の優先度とするものとする。
次に、優先度の更新方法について説明する。先ず、第1の優先度更新方法として、音声の信号対雑音比(S/N比)が所定の値未満である場合、その優先度を下げる方法がある。S/N比が小さければ、音声を正確に認識できる確率が小さく、正確な音声指示を行なうことができない可能性があるからである。よって、音声認識モジュール12のS/N比判定部211により、入力された音声信号のS/N比が所定の閾値未満であるか否かを判定し、その結果を優先度更新部201に通知する。優先度更新部201は、この判定結果に基づき優先度を再設定する。
また、第2の優先度更新方法として、音声認識の認識率が所定の閾値以下であった場合に、その優先度を下げる方法がある。音声認識手法としては、DP(Dynamic Programming)マッチングによる方法、HMM(隠れマルコフモデル:Hidden Markov Model)による方法等、公知の手法を利用することができる。そして、音声認識率としては、これらの確率モデルの結果算出される尤度を使用することができる。この場合、音声認識モジュール12の音声認識率判定部212により、音声認識率が所定の閾値未満であるか否かを判定し、その結果を優先度更新部201に通知する。優先度更新部201は、この判定結果に基づき優先度を再設定する。
なお、本実施の形態においては、音声信号切替器11内に優先度更新部201を有し、音声認識モジュール12がS/N比判定部211、音声認識率判定部212を有するものとして説明するが、優先度更新部、S/N比判定部、音声認識率判定部を別途設けるようにしてもよいことは言うまでもない。
次に、音声信号切替器11の優先度更新方法について図5を参照して詳細に説明する。図5は、本実施の形態にかかる優先度更新方法を示すフローチャートである。先ず、音声信号切替器11に、音声入出力経路A1〜A4の初期優先度を設定する(ステップS1)。このとき上述したように、同時に音声入力があった場合に音声入出力経路A1が優先的に選択されるよう優先度が設定されている。また、本実施の形態においては、内蔵マイクを使用する音声入出力経路が複数存在するため、これらの音声入出力経路の優先度は個別に設定される。
そして、音声入力があれば(ステップS2:Yes)、このとき最も高い優先度の音声入力を、音声認識モジュール12に接続する(ステップS3)。本実施の形態においては、無線LAN31を介した音声入出力経路A1の優先度が常に最も高く、内蔵マイクを介した音声入出力経路A2〜A4の優先度は、音声入出力経路A1の優先度を上回らない範囲で更新される。よって、無線LAN31を介して音声入力があった場合には、内蔵マイク21等に音声入力があっても、無線LAN31による音声入出力経路A1からの入力が音声認識モジュール12へ供給される。すなわち、ロボット1と顧客が対話をしている場合であっても、オペレータがいつでも介入することができる。例えば、ロボット1と顧客の対話中に、ロボット1が顧客の指示を誤認識するなどして危険な動作を開始した場合には、オペレータが音声コマンドによりロボットに動作停止を命令することができる。また、ロボットと顧客の対話環境の背景ノイズが大きく音声認識に失敗してしまうような場合には、顧客に代わってオペレータが指示を出すことができる。
音声入力があると、次にS/N比判定部211により、入力された音声情報のS/N比が所定の閾値以上であるか否かを判定する。この際、例えば、S/N比が所定の閾値未満である場合には、入力された音声認識を中止し、音声発話モジュール13により、再度命令してもらうよう発話する等してもよい。
S/N比が所定の閾値以上ある場合には(ステップS4:Yes)、音声認識率が所定の閾値以上であるか否かを、音声認識率判定部212が判定する。音声認識率、例えば確率モデルの結果算出される尤度が所定の閾値以上である場合には、その音声認識結果に基づき、音声発話モジュール13により発話を行なったり、その他、手を振るなどの動作を発現したりする(ステップS6)。
一方、音声入力はないが(ステップS2:No)、リセット信号が入力された場合(ステップS7:Yes)、音声信号切替器11は、各音声入出力経路A1〜A4の優先度を初期値に再設定する。また、音声入力があった場合であって、S/N比が所定の閾値未満であった場合(ステップS:No)及び認識率が所定の閾値未満であった場合(ステップS5:No)は、当該音声入出力経路の優先度が可変であれば(ステップS9:Yes)、当該優先度を下げる。また、優先度が固定の場合には、ステップS2の処理に戻る。内蔵スピーカの音声入出力経路A2〜A4の優先度を可変にすることで、S/N比が良好になる顧客に最も近い側の内蔵マイクの入出力経路が自動的に選択される。また、顧客に取り囲まれてそれぞれが良好なS/N比でロボット1に問いかける場合には、確率モデルの尤度が高い、すなわち認識しやすい発音をしている顧客側の内蔵マイクの入出力経路が自動的に選択されることとなる。
このように、音声信号切替器11の優先度更新部201は、入力音声のS/N比が小さかったり、認識率が悪かった場合にその入力ラインの優先度を下げることで、誤認識しやすい、質が低い音声入力を選択しないようにすることができる。なお、更新された優先度は、リセット信号の入力により初期値に戻されるものとしたが、所定時間音声入力がない場合に優先度を初期値にするよう制御することも可能である。
次に、本発明の実施の形態の変形例について説明する。図3に示すロボット1においては、オペレータが無線LANを使用して音声指示を送るものとして説明したが、携帯電話を使用して音声指示を送ることも可能である。
図6は、本実施の形態の変形例にかかるロボットの音声認識に関わる要部を抜き出して示すブロック図である。図6に示すように、ロボット1は、通信手段として電話機61を備える。その他の構成は、実施の形態1と同様であり、同一構成要素には同一の符号を付しその詳細な説明は省略する。
オペレータは、携帯電話機81を介してロボット1に音声信号を入力することができる。音声信号切替器11は、実施の形態1と同様に、優先度が固定の音声入出力経路A1として、電話機61を介したオペレータからの音声入力経路を有している。また、上述と同様、優先度が可変の内蔵マイク及びスピーカによる音声入出力経路A2〜A4を有しており、音声信号切替器11が音声認識モジュール12との接続を優先度に応じて切り替える。本変形例においても、電話機61から入力があった場合には、これを優先的に選択するよう、優先度が設定されるものとする。そして、音声信号切替器11は、S/N比の大きさや音声認識率に基づき、音声入出力経路A2〜A4の優先度を更新する。
本実施の形態においては、無線通信による音声入力の優先度を固定かつ最も高いものとし、複数の内蔵マイクの音声入力はその優先度に応じて適宜選択するものとしたので、例えば顧客の指示を誤って認識して誤動作した場合には、オペレータが無線通信による音声入力により、その動作を直ちに停止又は修正することができる。また、複数の内蔵マイクのうち、優先度に応じて良好なS/N比を有するもの、良好な認識率を示すものが自動的に選択されるので、認識率を向上させることができる。
なお、本発明は上述した実施の形態のみに限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能であることは勿論である。例えば、本実施の形態においては、各内蔵マイクに対応するスピーカを有するものとして説明したが、スピーカは1つであってもよい。また、正面内蔵マイク、右側内蔵マイク、左側内蔵マイクを複数設け、複数の正面内蔵マイク、右側内蔵マイク、左側内蔵マイクに対して優先度を設定・更新するようにしてもよい。更に、本実施の形態においては、無線通信を介して入力される音声信号の入出力経路の優先度を固定としたが可変としてもよい。
本発明の実施の形態にかかる2足歩行タイプのロボットを示す斜視図である。 本発明の実施の形態にかかるロボットを示すブロック図である。 本発明の実施の形態にかかるロボットにおいて、音声認識にかかわる部分のみを抜き出して示すブロック図である。 本発明の実施の形態にかかるロボット装置における音声信号切替器及び音声認識モジュールの詳細を示すブロック図である。 本発明の実施の形態にかかる優先度更新方法を示すフローチャートである。 本発明の実施の形態の変形例にかかるロボットの音声認識に関わる要部を抜き出して示すブロック図である。
符号の説明
1 ロボット
1a 頭部ユニット
1b 腕部ユニット
1c 体幹部ユニット
1d 脚部ユニット
11 音声信号切替器
12 音声認識モジュール
13 音声発話モジュール
14 画像認識モジュール
15 行動決定モジュール
21、41、51 内蔵マイク
22、42、52、75 スピーカ
61 電話機
74 マイク
81 携帯電話機
101 制御部
102 入出力部
103 駆動部
104 電源部
105 外部記憶部
121 カメラ
122 内蔵マイク
125 センサ部
131 モータ
132 ドライバ
141 バッテリ
142 バッテリ制御部
201 優先度更新部
211 比判定部
212 音声認識率判定部

Claims (8)

  1. 音声認識結果に基づき自律的に移動するロボット装置であって、
    優先度が設定された第1及び第2の音声入力手段と、
    前記優先度に基づき前記第1又は第2の音声入力手段からの入力を切替選択する音声信号切替手段と、
    前記音声信号切替手段により切替選択された前記第1又は第2の音声入力手段から入力された音声を認識する音声認識手段と、
    前記音声認識手段の音声認識結果に基づき行動選択する行動選択手段とを備え、
    前記音声信号切替手段は、前記音声入力手段からの音声の音声認識率が所定の閾値以上であるか否かの判定結果に基づき前記第1の音声入力手段及び/又は第2の音声入力手段の優先度を更新するロボット装置。
  2. 音声認識結果に基づき自律的に移動するロボット装置であって、
    優先度が設定された第1及び第2の音声入力手段と、
    前記優先度に基づき前記第1又は第2の音声入力手段からの入力を切替選択する音声信号切替手段と、
    前記音声信号切替手段により切替選択された前記第1又は第2の音声入力手段から入力された音声を認識する音声認識手段と、
    前記音声認識手段の音声認識結果に基づき行動選択する行動選択手段と、
    前記音声入力手段からの音声の信号対雑音比が所定の閾値以上であるか否かを判定するS/N比判定手段と、
    前記音声入力手段からの音声の音声認識率が所定の閾値以上であるか否かを判定する認識率判定手段と、
    前記S/N比判定手段及び前記認識率判定手段の判定結果に基づき前記第1の音声入力手段及び/又は第2の音声入力手段の優先度を更新する優先度更新手段とを有するロボット装置。
  3. 前記優先度更新手段は、前記S/N比が所定の閾値未満である場合、及び前記音声認識率が所定の閾値未満である場合に、前記優先度を更新する
    ことを特徴とする請求項2記載のロボット装置。
  4. 前記第1の音声入力手段は、無線信号を受信する音声受信手段であり、前記第2の音声入力手段は、1又は複数のマイクロフォンであって、
    前記第1の音声入力手段の優先度の初期値が前記第2の音声入力手段の優先度の初期値より高く設定される
    ことを特徴とする請求項1乃至3のいずれか1項記載のロボット装置。
  5. 前記第1の音声入力手段は、無線信号を受信する音声受信手段であり、前記第2の音声入力手段は、1又は複数のマイクロフォンであって、
    前記第1の音声入力手段の優先度の初期値が前記第2の音声入力手段の優先度の初期値より高く設定され、
    前記音声受信手段に設定された優先度は固定値であ
    前記優先度更新手段は、前記複数のマイクロフォンから入力される音声信号の信号対雑音比及び音声認識率に基づき、当該複数のマイクロフォンに設定された優先度を、前記固定値を上回らない範囲で更新する
    ことを特徴とする請求項2又は3記載のロボット装置。
  6. 前記音声入力手段に設定される優先度は、リセット信号の入力又は所定のタイミングで前記初期値にリセットされる
    ことを特徴とする請求項4又は5記載のロボット装置。
  7. 音声認識結果に基づき自律的に移動するロボット装置の制御方法であって、
    第1及び第2の音声入力手段に設定される優先度に基づき当該第1又は第2の音声入力手段からの入力を切替選択する音声入力選択工程と、
    前記切替選択された前記第1又は第2の音声入力手段から入力された音声を認識する音声認識工程と、
    前記音声認識工程における音声認識結果に基づき行動選択する行動選択工程と、を備え、
    前記音声入力選択工程は、
    前記音声入力手段からの音声の音声認識率が所定の閾値以上であるか否かを判定する認識率判定工程と、
    前記認識率判定工程の判定結果に基づき前記第1の音声入力手段及び/又は第2の音声入力手段の優先度を更新する優先度更新工程とを有するロボット装置の制御方法。
  8. 前記音声入力選択工程は、前記音声入力手段からの音声の信号対雑音比が所定の閾値以上であるか否かを判定するS/N比判定工程を更に有し、
    前記優先度更新工程では、前記S/N比判定工程及び認識率判定工程の判定結果に基づき前記第1の音声入力手段及び/又は第2の音声入力手段の優先度を更新する
    ことを特徴とする請求項7記載のロボット装置の制御方法。
JP2006213195A 2006-08-04 2006-08-04 ロボット装置及びロボット装置の制御方法 Expired - Fee Related JP4821489B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006213195A JP4821489B2 (ja) 2006-08-04 2006-08-04 ロボット装置及びロボット装置の制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006213195A JP4821489B2 (ja) 2006-08-04 2006-08-04 ロボット装置及びロボット装置の制御方法

Publications (2)

Publication Number Publication Date
JP2008040075A JP2008040075A (ja) 2008-02-21
JP4821489B2 true JP4821489B2 (ja) 2011-11-24

Family

ID=39175164

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006213195A Expired - Fee Related JP4821489B2 (ja) 2006-08-04 2006-08-04 ロボット装置及びロボット装置の制御方法

Country Status (1)

Country Link
JP (1) JP4821489B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10026399B2 (en) * 2015-09-11 2018-07-17 Amazon Technologies, Inc. Arbitration between voice-enabled devices
US9875081B2 (en) 2015-09-21 2018-01-23 Amazon Technologies, Inc. Device selection for providing a response
JP2019015950A (ja) * 2017-07-05 2019-01-31 パナソニックIpマネジメント株式会社 音声認識方法、プログラム、音声認識装置、及びロボット
US10482904B1 (en) 2017-08-15 2019-11-19 Amazon Technologies, Inc. Context driven device arbitration

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04212600A (ja) * 1990-12-05 1992-08-04 Oki Electric Ind Co Ltd 音声入力装置
JPH08314489A (ja) * 1995-05-16 1996-11-29 Nec Robotics Eng Ltd 音声認識装置
JP3357629B2 (ja) * 1999-04-26 2002-12-16 旭化成株式会社 設備制御システム
JP2002372991A (ja) * 2001-06-13 2002-12-26 Olympus Optical Co Ltd 音声制御装置
JP2005202075A (ja) * 2004-01-14 2005-07-28 Sony Corp 対話制御システム及びその方法並びにロボット装置

Also Published As

Publication number Publication date
JP2008040075A (ja) 2008-02-21

Similar Documents

Publication Publication Date Title
JP4837917B2 (ja) 音声に基づく装置制御
JP4086280B2 (ja) 音声入力システム、音声入力方法及び音声入力プログラム
KR101818980B1 (ko) 다중 화자 음성 인식 수정 시스템
CN106782589B (zh) 移动终端及其语音输入方法和装置
JP2005084253A (ja) 音響処理装置、方法、プログラム及び記憶媒体
JP6844608B2 (ja) 音声処理装置および音声処理方法
JP2005529421A (ja) 可動ユニット及び可動ユニットを制御する方法
CN108665907B (zh) 声音识别装置、声音识别方法、记录介质以及机器人
JP2007190641A (ja) コミュニケーションロボット
JP4821489B2 (ja) ロボット装置及びロボット装置の制御方法
WO2005004111A1 (en) Method for controlling a speech dialog system and speech dialog system
JPWO2008001492A1 (ja) ロボット、ロボット制御方法、および、ロボット制御プログラム
CN111421557A (zh) 电子装置及其控制方法
JP2006243555A (ja) 対応決定システム、ロボット、イベント出力サーバ、および対応決定方法
JP2008168375A (ja) ボディランゲージロボット、ボディランゲージロボットの制御方法及び制御プログラム
JP2007155986A (ja) 音声認識装置および音声認識装置を備えたロボット
KR20140117771A (ko) 움직임 센서 기반의 휴대용 자동 통역 장치 및 그의 제어방법
JP4410378B2 (ja) 音声認識方法および装置
JP7435641B2 (ja) 制御装置、ロボット、制御方法およびプログラム
JP2001188551A (ja) 情報処理装置および方法、並びに記録媒体
JP2004283927A (ja) ロボット制御装置および方法、記録媒体、並びにプログラム
JP2005335001A (ja) ロボット制御装置および方法、記録媒体、並びにプログラム
JP6908636B2 (ja) ロボットおよびロボットの音声処理方法
JP2004318026A (ja) セキュリティペットロボット及びその装置に関する信号処理方法
JP5610283B2 (ja) 外部機器制御装置、その外部機器制御方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081020

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100928

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101112

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110419

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110517

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110809

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110822

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140916

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees