JP2019219509A

JP2019219509A - ロボット、ロボットの制御方法及びプログラム

Info

Publication number: JP2019219509A
Application number: JP2018116650A
Authority: JP
Inventors: 哲司牧野; Tetsuji Makino; 英里奈市川; Erina Ichikawa
Original assignee: Casio Computer Co Ltd
Current assignee: Casio Computer Co Ltd
Priority date: 2018-06-20
Filing date: 2018-06-20
Publication date: 2019-12-26
Anticipated expiration: 2038-06-20
Also published as: JP7176244B2

Abstract

【課題】対話時の音声認識精度が高いロボット、ロボットの制御方法及びプログラムを提供する。【解決手段】ロボット１００は、動作手段と、判定手段と、制御手段と、を備える。動作手段は、自装置に動作をさせる。判定手段は、自装置が所定の対象から話しかけがあった場合、自装置と所定の対象との間の音声認識精度の向上が可能であるか否かを判定する。制御手段は、判定手段により自装置と所定の対象との間の音声認識精度の向上が可能でないと判定された場合に、所定の対象に話しかけの中断をさせるための第１の応答をするように動作手段を制御する。【選択図】図２

Description

本発明は、ロボット、ロボットの制御方法及びプログラムに関する。

一般家庭等において音声対話を目的としたロボットが用いられている。音声対話を目的としたロボットの普及には、ロボットと、ユーザを含む所定の対象と、の対話の精度を向上させることが重要な点となっている。ロボットと所定の対象との距離が、ロボットと所定の対象との対話に必要な対話距離よりも離れている場合、又は、雑音が大きい場合には、ロボットと所定の対象との対話が困難である。

例えば、特許文献１は、所定の対象からの音源方向を推定して、推定された音源方向へロボットを移動させて、所定の対象と対話をする対話型ロボットを開示する。

特開２００６−１８１６５１号公報

しかしながら、特許文献１の技術においては、所定の対象から音源方向へロボットを移動させて、所定の対象と対話をするだけであるため、対話距離よりも離れている所定の対象から話しかけられた場合や、雑音が大きいときに所定の対象から話しかけられた場合に、ロボットと所定の対象との対話時の音声認識精度を向上させることが困難であるという問題がある。

本発明は、前記のような課題を解決するためになされたものであり、対話時の音声認識精度が高いロボット、ロボットの制御方法及びプログラムを提供することを目的とする。

本発明の目的を達成するため、本発明に係るロボットの一様態は、
自装置に動作をさせる動作手段と、
前記自装置が所定の対象から話しかけがあった場合、前記自装置と前記所定の対象との間の音声認識精度の向上が可能であるか否かを判定する判定手段と、
前記判定手段により前記自装置と前記所定の対象との間の前記音声認識精度の向上が可能でないと判定された場合に、前記所定の対象に前記話しかけの中断をさせるための第１の応答をするように前記動作手段を制御する制御手段と、
を備える、
ことを特徴とする。

本発明の目的を達成するため、本発明に係るロボットの制御方法の一様態は、
自装置に動作をさせる動作手段を備えるロボットの制御方法であって、
前記自装置が所定の対象から話しかけがあった場合、前記自装置と前記所定の対象との間の音声認識精度の向上が可能であるか否かを判定する判定ステップと、
前記判定ステップにより前記自装置と前記所定の対象との間の前記音声認識精度の向上が可能でないと判定された場合に、前記所定の対象に前記話しかけの中断をさせるための第１の応答をするように前記動作手段を制御する制御ステップと、
を含む、
ことを特徴とする。

本発明の目的を達成するため、本発明に係るプログラムの一様態は、
自装置に動作をさせる動作手段を備えるロボットを制御するコンピュータを、
前記自装置が所定の対象から話しかけがあった場合、前記自装置と前記所定の対象との間の音声認識精度の向上が可能であるか否かを判定する判定手段、
前記判定手段により前記自装置と前記所定の対象との間の前記音声認識精度の向上が可能でないと判定された場合に、前記所定の対象に前記話しかけの中断をさせるための第１の応答をするように前記動作手段を制御する制御手段、
として機能させる、
ことを特徴とする。

本発明によれば、対話時の音声認識精度が高いロボット、ロボットの制御方法及びプログラムを提供することができる。

本発明の第１の実施の形態に係るロボットを示す図である。本発明の第１の実施の形態に係るロボットの構成を示すブロック図である。本発明の第１の実施の形態に係る第１の対話処理を示すフローチャートである。本発明の第１の実施の形態に係る第１の対話処理を説明する図である。本発明の第１の実施の形態に係る第１の対話処理を説明する図である。本発明の第１の実施の形態に係る第１の対話処理を説明する図である。本発明の第１の実施の形態に係る第１の対話処理を説明する図である。本発明の第２の実施の形態に係るロボットの構成を示すブロック図である。本発明の第２の実施の形態に係る第２の対話処理を示すフローチャートである。本発明の変形例に係る対話可能距離と雑音の音量との関係を示す図である。本発明の変形例に係る雑音の音量の基準値と、ユーザとロボットとの距離と、の関係を示す図である。

以下、本発明を実施するための形態に係るロボットを、図面を参照しながら説明する。

（第１の実施の形態）
第１の実施の形態に係るロボット１００は、図１に示すように、人をデフォルメした形状を有し、目と口と鼻とを模した部材が配置された頭部１０１と、足を模した部材が配置された胴体部（筐体）１０２と、胴体部１０２に配置された手部１０３と、頭部１０１に配置されたマイク（マイクロフォン）１０４と、撮像部１０５と、スピーカ１０６と、表示部１０７と、底部に配置された移動部１０８と、胴体部１０２の背中に設けられた操作ボタン１２０と、を備え、胴体部１０２の内部には、制御部１１０と電源部１３０とを有する。手部１０３とマイク１０４と撮像部１０５とスピーカ１０６と表示部１０７とは、動作手段として機能する。

手部１０３は、制御部１１０の制御に基づいて、図示しない駆動部により動作する。例えば、手部１０３を耳の後ろにあてる動作で、音声が聞こえないことをジェスチャーにより表現する。

マイク１０４は、頭部１０１の右耳、左耳及び後頭部に配置され、音声を収音する。右耳に配置されたマイク１０４は、右前方から発せられた音声を集音する。左耳に配置されたマイク１０４は、左前方から発せられた音声を集音する。後頭部に配置されたマイク１０４は、後ろから発せられた音声を集音する。マイク１０４は、収音した音声を制御部１１０に出力する。このように、マイク１０４は、音声を入力する音声入力手段として機能する。

撮像部１０５は、頭部１０１の鼻の位置に設けられたカメラである。撮像部１０５は、ユーザＵなどの所定の対象を撮像し、撮像された画像を示すデータを制御部１１０に出力する。このように、撮像部１０５は、画像を撮像する撮像手段として機能する。

スピーカ１０６は、頭部１０１の口の位置に設けられ、制御部１１０の制御に基づいて、音声を発話する。このように、スピーカ１０６は、音声を出力する音声出力手段として機能する。

表示部１０７は、頭部１０１の目の位置に設けられ、制御部１１０の制御に基づいて、目の画像を表示する。

移動部１０８は、モータとタイヤとから構成され、制御部１１０の制御に基づいて、ロボット１００を自律移動するものである。移動部１０８は、ロボット１００を前進、後退、右折、左折、右旋回及び左旋回する。このように、移動部１０８は、移動手段として機能する。

制御部１１０は、ＣＰＵ（Central Processing Unit）、ＲＯＭ（Read Only Memory）、ＲＡＭ（Random Access Memory）から構成される。ＲＯＭは、フラッシュメモリ等の不揮発性メモリから構成され、制御部１１０が各種機能を実現するためのプログラム及び呼びかけ音声の音声パターンを示すデータ、対話を開始する通知を示す音声データ及び移動中話しかけ対策のための音声データを記憶する。ＲＡＭは、揮発性メモリから構成され、制御部１１０が各種処理を行うためのプログラムを実行するための作業領域として用いられる。また、ＲＡＭは、移動中話しかけＦｌａｇがＯＮであるかＯＦＦであるかを記憶する。制御部１１０は、ＣＰＵがＲＯＭに記憶されたプログラムを読み出してＲＡＭ上で実行することにより、図２に示すように、音声解析部１１１と、移動制御部１１２と、判定部１１３と、対話制御部１１４として機能する。移動制御部１１２と対話制御部１１４とは、制御手段として機能する。

音声解析部１１１は、ユーザＵから発せられた音声を検出し、ユーザＵから発せられた音声に、予め登録された呼びかけ音声を含んでいるか否かを判定する。呼びかけ音声は、例えば、ロボットの名前、「おーい」、「ちょっと聞いて」などが含まれる。呼びかけ音声は、予め登録されている音声パターンと照合するため、対話可能距離Ｄを超えて離れていても検出可能である。また、音声解析部１１１は、呼びかけ音声が発せられた音源の方向を検出する。具体的には、音声解析部１１１は、呼びかけ音声が発せられた音源の方向を、頭部１０１の右耳に配置されたマイク１０４、左耳に配置されたマイク１０４、及び後頭部に配置されたマイク１０４で収音した呼びかけ音声の音量差又は位相差により検出する。また、音声解析部１１１は、移動中にユーザＵから話しかけられているか否かを判定する。移動中にユーザＵから話しかけられていると判定すると、音声解析部１１１は、移動中話しかけＦｌａｇをＯＮにする。

移動制御部１１２は、移動部１０８を制御し、呼びかけ音声が発せられた音源の方向にロボット１００が向くように旋回する。具体的には、移動制御部１１２は、音声解析部１１１で検出された方向、又は撮像部１０５で検出したユーザＵの顔の方向にロボット１００を右旋回又は左旋回し、呼びかけ音声が発せられた音源の方向に向ける。また、移動制御部１１２は、移動部１０８を制御し、ロボット１００をユーザＵに向けて移動する。また、対話可能距離Ｄを超えていた位置から、ロボット１００がユーザＵに向けて移動をするように移動部１０８を制御した後において、移動制御部１１２は、ロボット１００が対話可能距離Ｄ以下に近づいたと判定された場合に、ロボット１００を停止するように移動部１０８を制御する。

判定部１１３は、ユーザＵからロボット１００に話しかけられた場合、ユーザＵとロボット１００との対話が可能であるか否かを判定する。撮像部１０５が撮像した画像からユーザＵの顔を検出し、ユーザＵの顔までの距離を検出する。判定部１１３は、顔の大きさから距離を検出してもよく、左右の目の間の距離からユーザＵの顔までの距離を検出してもよい。その後、判定部１１３は、ユーザＵとロボット１００との対話が可能であるか否かを、ユーザＵの顔までの距離が対話可能距離Ｄ以下であるか否かにより判定する。対話可能距離Ｄは、音声パターンが予め登録されていなくても、マイク１０４で集音した音声を文字情報に変換できる程度に音声を認識できる距離である。対話可能距離Ｄは、例えば１ｍである。このように、判定部１１３は、判定手段として機能する。

対話制御部１１４は、対話の開始を阻止する動作（対話の中断をさせるための第１の応答）、対話を開始する通知（第１の応答とは異なる対話を継続する第２の応答）、移動中話しかけ対策及び対話の実行を行う。対話制御部１１４は、ロボット１００とユーザＵとの間の対話が可能になるまでの間、対話の開始を阻止する動作を実行する。具体的には、対話制御部１１４は、対話の開始を阻止する動作として、「ハーイただいま」「ちょっと待って」などの対話の開始を阻止する音声を発話する、又は手部１０３を耳の後ろに当てて聞こえないジェスチャーを実行する。また、対話制御部１１４は、対話の開始を阻止する動作を実行した後、ロボット１００とユーザＵとの間の対話が可能になったと判定されると、対話を開始する通知を実行する。対話制御部１１４は、対話を開始する通知として、スピーカ１０６からユーザＵの名前、「何でしょうか」などの対話を開始する通知を音声により発話してもよく、手部１０３を前に出して対話を開始するジェスチャーを実行してもよい。また、対話制御部１１４は、移動中話しかけＦｌａｇがＯＮであるか否かを判定し、移動中話しかけＦｌａｇがＯＮであると判定されると、スピーカ１０６から移動中話しかけ対策のための音声を発話する。移動中話しかけ対策のための音声は、「聞こえなかった」、「もう一回言って」などを含む。

操作ボタン１２０は、胴体部１０２の背中に設けられ、ロボット１００を操作するためのボタンであり、電源ボタンを含む。

電源部１３０は、胴体部１０２に内蔵された充電池から構成され、ロボット１００の各部に電力を供給する。

次に、以上の構成を有するロボット１００が実行する第１の対話処理について説明する。第１の対話処理は、ユーザＵとロボット１００との距離が対話可能距離Ｄ以上離れている場合、対話の開始を阻止し、対話可能距離Ｄ以下に近づくと対話を開始する通知を実行する処理である。

ユーザＵが操作ボタン１２０を操作し電源をＯＮにすると、ロボット１００は電源をＯＮにする指示に応答し、図３に示す第１の対話処理を開始する。以下、ロボット１００が実行する第１の対話処理を、フローチャートを用いて説明する。

まず、音声解析部１１１は、ユーザＵから発せられた音声を検出する（ステップＳ１０１）。次に、音声解析部１１１は、ユーザＵから発せられた音声に、予め登録された呼びかけ音声を含んでいるか否かを判定する（ステップＳ１０２）。呼びかけ音声は、例えば、ロボットの名前、「おーい」、「ちょっと聞いて」などが含まれる。呼びかけ音声が含まれていないと判定されると（ステップＳ１０２；Ｎｏ）、ステップＳ１０１〜ステップＳ１０２を繰り返す。

ユーザＵから発せられた音声に、呼びかけ音声が含まれていると判定されると（ステップＳ１０２；Ｙｅｓ）、音声解析部１１１は、移動中話しかけＦｌａｇをＯＦＦにする（ステップＳ１０３）。次に、音声解析部１１１は、呼びかけ音声が発せられた音源の方向を検出する（ステップＳ１０４）。具体的には、音声解析部１１１は、呼びかけ音声が発せられた音源の方向を、頭部１０１の右耳に配置されたマイク１０４、左耳に配置されたマイク１０４、及び後頭部に配置されたマイク１０４で収音した呼びかけ音声の音量差又は位相差により検出する。次に、移動制御部１１２は、呼びかけ音声が発せられた音源の方向にロボット１００が向くように旋回する（ステップＳ１０５）。具体的には、移動制御部１１２は、移動部１０８を制御し、ロボット１００を右旋回又は左旋回し、呼びかけ音声が発せられた音源の方向に向ける。次に、判定部１１３は、ユーザＵの顔を検出する（ステップＳ１０６）。次に、判定部１１３は、ユーザＵの顔までの距離を検出する（ステップＳ１０７）。判定部１１３は、顔の大きさから距離を検出してもよく、左右の目の間の距離からユーザＵの顔までの距離を検出してもよい。

次に、判定部１１３は、ユーザＵの顔までの距離が対話可能距離Ｄ以下であるか否かを判定する（ステップＳ１０８）。対話可能距離Ｄは、例えば１ｍである。ユーザＵの顔までの距離が対話可能距離Ｄ以下でないと判定されると（ステップＳ１０８；Ｎｏ）、対話制御部１１４は、対話の開始を阻止する動作を行う（ステップＳ１０９）。対話の開始を阻止する動作には、スピーカ１０６から「ハーイただいま」「ちょっと待って」などの対話の開始を阻止する音声を発話してもよく、手部１０３を耳の後ろに当てて聞こえないジェスチャーを実行してもよい。次に、移動制御部１１２は、移動部１０８を制御し、ロボット１００をユーザＵに向けて移動する（ステップＳ１１０）。次に、音声解析部１１１は、移動中にユーザＵから話しかけられているか否かを判定する（ステップＳ１１１）。移動中にユーザＵから話しかけられていると判定すると（ステップＳ１１１；Ｙｅｓ）、音声解析部１１１は、移動中話しかけＦｌａｇをＯＮにし（ステップＳ１１２）、ステップＳ１０６に戻る。移動中にユーザＵから話しかけられていないと判定すると（ステップＳ１１１；Ｎｏ）、ステップＳ１０６に戻る。

ユーザＵの顔までの距離が対話可能距離Ｄ以下であると判定されると（ステップＳ１０８；Ｙｅｓ）、対話制御部１１４は、対話を開始する通知を行う（ステップＳ１１３）。具体的には、対話制御部１１４は、スピーカ１０６から「何でしょうか」などの対話を開始する通知を音声により発話してもよく、手部１０３を前に出して対話を開始するジェスチャーを実行してもよい。このとき、移動制御部１１２は、ロボット１００を停止するように移動部１０８を制御する。次に、対話制御部１１４は、移動中話しかけＦｌａｇがＯＮであるか否かを判定する（ステップＳ１１４）。移動中話しかけＦｌａｇがＯＮであると判定されると（ステップＳ１１４；Ｙｅｓ）、スピーカ１０６から移動中話しかけ対策のための音声を発話する（ステップＳ１１５）。移動中話しかけ対策のための音声は、「聞こえなかった」、「もう一回言って」などを含む。次に、対話制御部１１４は、対話を実行する（ステップＳ１１６）。移動中話しかけＦｌａｇがＯＮでないと判定されると（ステップＳ１１４；Ｎｏ）、対話制御部１１４は、対話を実行する（ステップＳ１１６）。その後、音声解析部１１１は、終了指示を受け付けたか否かを判定する（ステップＳ１１７）。終了指示を受け付けていないと判定すると（ステップＳ１１７；Ｎｏ）、ステップＳ１０１に戻り、ステップＳ１０１からステップＳ１１７を繰り返す。対話中に終了指示を受け付けたと判定すると（ステップＳ１１７；Ｙｅｓ）、第１の対話処理を終了する。

次に、本実施の形態に係るロボット１００が実行する第１の対話処理を具体例に基づいて図４〜図７を参照しながら説明する。

ユーザＵが操作ボタン１２０を操作し電源をＯＮにすると、ロボット１００は電源をＯＮにする指示に応答し第１の対話処理を開始する。ロボット１００は、自走しユーザＵから対話可能距離Ｄを超えて離れた位置に移動したとする。

ユーザＵが図４に示すロボット１００に「ちょっと聞いて」と呼びかけると、音声解析部１１１は、ユーザＵから発せられた音声を検出する（ステップＳ１０１；図３）。ユーザＵから発せられた音声に、「ちょっと聞いて」という音声を含んでいるので、音声解析部１１１は、予め登録された呼びかけ音声を含んでいると判定する（ステップＳ１０２；Ｙｅｓ；図３）。

次に、音声解析部１１１は、移動中話しかけＦｌａｇをＯＦＦにする（ステップＳ１０３；図３）。次に、音声解析部１１１は、呼びかけ音声が発せられた音源の方向を検出する（ステップＳ１０４；図３）。このときユーザＵは、ロボット１００からみて右に位置するので、音声解析部１１１は、右耳、左耳、後頭部に配置されたマイク１０４で収音した呼びかけ音声の音量差又は位相差により、呼びかけ音声が発せられた音源の方向は、右であると検出する。次に、移動制御部１１２は、図５に示すように、呼びかけ音声が発せられた音源の方向にロボット１００が向くように右旋回する（ステップＳ１０５；図３）。次に、判定部１１３は、ユーザの顔を検出する（ステップＳ１０６；図３）。次に、判定部１１３は、ユーザの顔までの距離Ｄ１を検出する（ステップＳ１０７；図３）。

次に、判定部１１３は、ユーザの顔までの距離が対話可能距離Ｄ以下であるか否かを判定する（ステップＳ１０８；図３）。このとき、距離Ｄ１は、対話可能距離Ｄよりも大きいので、ユーザの顔までの距離が対話可能距離Ｄ以下でないと判定され（ステップＳ１０８；Ｎｏ；図３）、対話制御部１１４は、対話の開始を阻止する動作を行う（ステップＳ１０９；図３）。対話の開始を阻止する動作として、図６に示すように、手部１０３を耳の後ろに当てて聞こえないジェスチャーを実行する、又はスピーカ１０６から「ハーイただいま」「ちょっと待って」などの対話の開始を阻止する音声を発話する。次に、移動制御部１１２は、移動部１０８を制御し、ロボット１００をユーザに向けて移動する（ステップＳ１１０；図３）。次に、移動中にユーザＵから話しかけられると、音声解析部１１１は、移動中にユーザから話しかけられていると判定する（ステップＳ１１１；Ｙｅｓ；図３）。次に、音声解析部１１１は、移動中話しかけＦｌａｇをＯＮにし（ステップＳ１１２；図３）、ステップＳ１０６に戻る。

ロボット１００が図７に示す位置まで移動すると、判定部１１３は、ユーザの顔までの距離Ｄ２が対話可能距離Ｄ以下であると判定する（ステップＳ１０８；Ｙｅｓ；図３）。次に、対話制御部１１４は、対話を開始する通知を行う（ステップＳ１１３；図３）。具体的には、対話制御部１１４は、手部１０３を前に出して対話を開始するジェスチャーを実行し、スピーカ１０６から「何でしょうか」などの対話を開始する通知を音声により発話する。次に、対話制御部１１４は、移動中話しかけＦｌａｇがＯＮであると判定し（ステップＳ１１４；Ｙｅｓ；図３）、スピーカ１０６から移動中話しかけ対策のための音声「聞こえなかった」を発話（ステップＳ１１５；図３）する。次に、対話制御部１１４は、対話を実行する（ステップＳ１１６；図３）。その後、音声解析部１１１は、対話中に終了指示を受け付けたと判定すると（ステップＳ１１７；Ｙｅｓ；図３）、第１の対話処理を終了する。

以上のように、本実施の形態のロボット１００によれば、呼びかけ音声を検出し、ユーザＵとロボット１００の距離が、対話の音声認識精度が確保できる対話可能距離Ｄよりも大きい場合に、明示的にまだ対話出来ない旨を表し、ユーザＵに対話可能距離Ｄ以下の位置まで近づくまで不用な対話開始を阻止することで、音声認識精度を向上することができる。また、ロボット１００が対話を開始する通知を行うことで、移動後の対話をスムーズに行うことを可能にする。

（第２の実施の形態）
第１の実施の形態に係るロボット１００は、移動部１０８により自律移動し、ユーザＵがロボット１００に呼びかけたとき、ロボット１００がユーザＵから離れているとユーザＵに移動して近づくものである。これに対して、第２の実施の形態に係るロボット２００は、自律移動せず、雑音の音量がユーザＵと対話をすることができる基準値以上である場合、雑音の音量が基準値以下になるまでの間、ユーザＵに対話の開始を阻止する動作を実行する。

第２の実施の形態に係るロボット２００は、図８に示すように、ロボット１００の構成で有していた移動部１０８及び移動制御部１１２を有さず、ロボット１００の構成に加えて、唇動作検出部１１５を備える。

音声解析部１１１は、ユーザＵから発せられた音声を検出し、ユーザＵから発せられた音声に、予め登録された呼びかけ音声を含んでいるか否かを判定する。また、音声解析部１１１は、ユーザＵから発せられた音声以外の音を雑音として検出する。また、音声解析部１１１は、雑音がテレビジョン、オーディオ機器、楽器などの音響機器から発せられた音であるか否かを判定する。音響機器から発せられた音か否かは、音に音声又は楽器の音を含むか、音にリズムを有するか、等により判定する。

判定部１１３は、音声解析部１１１により検出された雑音の音量がユーザＵと対話をすることができる基準値以下である場合に、ロボット２００とユーザＵとの間の対話が可能であると判定する。判定部１１３は、唇動作検出部１１５により検出されたユーザＵの唇の動作により、ユーザＵがロボット２００に呼びかけたか否かを判定する。具体的には、判定部１１３は、ユーザＵの唇の動作にロボットの名前、「おーい」、「ちょっと聞いて」と発音したときの動きが含まれるか否かにより判定する。

対話制御部１１４は、判定部１１３により雑音の音量が基準値を超えると判定された場合に、雑音の音量が基準値以下になるまでの間、ユーザＵへ対話の開始を阻止する動作を実行する。また、対話制御部１１４は、音声解析部１１１により雑音がテレビジョン、オーディオ機器、楽器などの音響機器から発せられたものであると判定されると、音響機器からの音量を下げる指示を示す音声を発話する。

唇動作検出部１１５は、撮像部１０５により撮像された画像からユーザＵの顔を検出し、ユーザＵの唇の動作を検出する。このように、唇動作検出部１１５は、唇動作検出手段として機能する。

次に、第２の実施の形態に係るロボット２００が実行する第２の対話処理を説明する。

ユーザＵが操作ボタン１２０を操作し電源をＯＮにすると、ロボット２００は電源をＯＮにする指示に応答し、図９に示す第２の対話処理を開始する。以下、ロボット２００が実行する第２の対話処理を、フローチャートを用いて説明する。

まず、音声解析部１１１は、ユーザＵから発せられた音声を検出する（ステップＳ２０１）。次に、音声解析部１１１は、ユーザＵから発せられた音声に、予め登録された呼びかけ音声を含んでいるか否かを判定する（ステップＳ２０２）。呼びかけ音声は、例えば、ロボット２００の名前、「おーい」、「ちょっと聞いて」などが含まれる。呼びかけ音声が含まれていないと判定されると（ステップＳ２０２；Ｎｏ）、唇動作検出部１１５は、撮像部１０５により撮像された画像からユーザＵの顔を検出する（ステップＳ２０３）。次に、唇動作検出部１１５は、ユーザＵの唇の動作を検出する（ステップＳ２０４）。次に、判定部１１３は、ユーザＵの唇の動作により、ユーザＵがロボット２００に呼びかけたか否かを判定する（ステップＳ２０５）。具体的には、判定部１１３は、ユーザＵの唇の動作にロボット２００の名前、「おーい」、「ちょっと聞いて」と発音したときの動きが含まれるか否かにより判定する。呼びかけがなかったと判定されると（ステップＳ２０５；Ｎｏ）、ステップＳ２０１〜ステップＳ２０４を繰り返す。

音声解析部１１１により呼びかけ音声が含まれていると判定される（ステップＳ２０２；Ｙｅｓ）、又は判定部１１３により、ユーザＵがロボット２００に呼びかけたと判定されると（ステップＳ２０５；Ｙｅｓ）、音声解析部１１１は、ユーザＵから発せられた音声以外の音を雑音として検出する（ステップＳ２０６）。次に、判定部１１３は、音声解析部１１１により検出された雑音の音量がユーザＵと対話をすることができる基準値以下であるか否かを判定する（ステップＳ２０７）。

判定部１１３により、雑音の音量が基準値以下でないと判定されると（ステップＳ２０７；Ｎｏ）、対話制御部１１４は、対話の開始を阻止する動作を行う（ステップＳ２０８）。対話の開始を阻止する動作には、スピーカ１０６から「ハーイただいま」「ちょっと待って」などの対話の開始を阻止する音声を発話してもよく、手部１０３を耳の後ろに当てて聞こえないジェスチャーを実行してもよい。音声解析部１１１は、雑音がテレビジョン、オーディオ機器、楽器などの音響機器から発せられた音であるか否かを判定する（ステップＳ２０９）。音響機器から発せられた音か否かは、音に音声又は楽器の音を含むか、音にリズムを有するか、等により判定する。雑音が音響機器から発せられた音であると判定されると（ステップＳ２０９；Ｙｅｓ）、対話制御部１１４は、音響機器からの音量を下げる指示、例えば「ボリュームを下げて」を示す音声を発話し（ステップＳ２１０）、ステップＳ２０６に戻る。雑音が音響機器から発せられた音でないと判定されると（ステップＳ２０９；Ｎｏ）、ステップＳ２０６に戻る。

判定部１１３により、雑音の音量が基準値以下であると判定されると（ステップＳ２０７；Ｙｅｓ）、対話制御部１１４は、対話を開始する通知を行う（ステップＳ２１１）。具体的には、対話制御部１１４は、スピーカ１０６から「何でしょうか」などの対話を開始する通知を音声により発話してもよく、手部１０３を前に出して対話を開始するジェスチャーを実行してもよい。次に、対話制御部１１４は、対話を実行する（ステップＳ２１２）。その後、音声解析部１１１は、終了指示を受け付けたか否かを判定する（ステップＳ２１３）。終了指示を受け付けていないと判定すると（ステップＳ２１３；Ｎｏ）、ステップＳ２０１に戻り、ステップＳ２０１からステップＳ２１３を繰り返す。対話中に終了指示を受け付けたと判定すると（ステップＳ２１３；Ｙｅｓ）、第２の対話処理を終了する。

以上のように、第２の実施の形態のロボット２００によれば、雑音の音量が基準値を超える場合、対話の開始を阻止する動作を行う。これにより、雑音により対話が困難である場合に対話が中止されるため、音声認識精度を向上することができる。また、ロボット２００が対話を開始する通知を行うことで、移動後の対話をスムーズに行うことを可能にする。また、唇動作検出部１１５は、撮像部１０５により撮像された画像からユーザＵの唇の動作を検出し、判定部１１３は、ユーザＵの唇の動作により、ユーザＵがロボット２００に呼びかけたか否かを判定する。これにより、雑音が大きい場合でもロボット２００は、ユーザＵがロボット２００に呼びかけたか否かを判定できる。

（変形例）
前述の実施の形態では、第１の実施の形態に係るロボット１００の判定部１１３は、ユーザＵとの距離が対話可能距離Ｄを超えるか否かで、対話が困難であるか否かを判定した。第２の実施の形態に係るロボット２００の判定部１１３は、雑音の音量が基準値を超えるか否かにより、対話が困難であるか否かを判定した。ロボット１００、２００の判定部１１３は、対話が困難であるか否かを判定できればよい。例えば、ロボット１００、２００の判定部１１３は、ユーザＵとの距離と、雑音と、により対話が困難であるか否かを判定してもよい。例えば、ユーザＵとの距離が対話可能距離Ｄを超え、且つ雑音の音量が基準値を超えた場合に、対話が困難であるか否かを判定してもよい。また、雑音の音量レベルに応じて対話可能距離Ｄを変更してもよい。例えば、図１０に示すように、雑音の音量が大きいとき、対話可能距離Ｄを小さくし、雑音の音量が小さいとき、対話可能距離Ｄを大きくする。この場合、ロボット１００、２００は、対話可能距離Ｄを関数により算出してもよく、対話可能距離ＤをあらかじめＲＯＭに記憶したテーブルにより得てもよい。また、ユーザＵと対話をすることができる雑音の音量の基準値は、ユーザＵとロボット１００、２００の距離により変化してもよい。例えば、図１１に示すように、ユーザＵとロボット１００、２００の距離が大きいとき、雑音の音量の基準値を小さくする。この場合、ロボット１００、２００は、雑音の音量の基準値を関数により算出してもよく、雑音の音量の基準値をあらかじめＲＯＭに記憶したテーブルにより得てもよい。また、ロボット１００、２００の判定部１１３は、ユーザＵの声の大きさ、音声認識で文字データに変換できる割合、対話に用いる言語などにより対話が困難であるか否かを判定してもよい。

前述の実施の形態のロボット１００、２００の対話制御部１１４は、目を表す表示部１０７とユーザＵの目とがアイコンタクトをするように、表示部１０７に目の画像を表示してもよい。このようにすることで、ロボット１００、２００がより人間に近い動作を表現できる。対話制御部１１４が行う対話の開始を阻止する動作は、マイク１０４が配置さていている耳部及び目部に配置された表示部１０７に目をとじた画像を表示し、ロボット１００、２００が音声を聞いておらず且つユーザＵも見ていないようなふりをしてもよい。

前述の第１の実施の形態では、移動制御部１１２が、移動部１０８を制御し、ロボット１００をユーザＵに向けて移動し、対話可能距離Ｄ以下に近づくと、ロボット１００を停止するように移動部１０８を制御する例について説明した。移動制御部１１２は、ロボット１００を対話可能距離Ｄ以下に近づくように制御すればよい。例えば、判定部１１３によりロボット１００とユーザＵとの距離が対話可能距離Ｄを超えると判定された場合に、移動制御部１１２は、ロボット１００が任意の方向に移動をしている場合にはロボット１００が移動の方向を変更してユーザＵに向けて移動をするように移動部１０８を制御して、ロボット１００が停止をしている場合にはロボット１００がユーザＵに向けて移動を始めるように移動部１０８を制御してもよい。判定部１１３によりロボット１００とユーザＵとの距離が対話可能距離以下であると判定された場合に、移動制御部１１２は、ロボット１００が移動をしている場合にはロボット１００を停止するように移動部１０８を制御して、ロボット１００が停止をしている場合にはロボット１００の停止を維持するように移動部を制御してもよい。この場合、対話制御部１１４は、ユーザＵに対話の継続をさせるための応答をするように動作手段を制御してもよい。

前述の実施の形態では、撮像部１０５が、頭部１０１の鼻の位置に設けられたカメラである例について説明した。撮像部１０５は、頭部１０１の片方の目の位置に設けられたカメラでもよく、両目に設けられたステレオカメラであってもよい。

前述の実施の形態では、ロボット１００、２００とユーザＵの顔との距離を、撮像部１０５が撮像した画像に写るユーザＵの顔の大きさ、又は左右の目の間の距離から検出する例について説明した。ロボット１００、２００とユーザＵの顔との距離を測定する方法は限定されず、非接触距離センサにより測定されてもよい。非接触距離センサは、例えば、ロボット１００、２００の胴体部１０２に設置された超音波センサ又はレーザーセンサである。撮像部１０５にステレオカメラを用いた場合、ステレオカメラで撮像した画像からロボット１００、２００とユーザＵの顔との距離を検出してもよい。

前述の実施の形態では、所定の対象がユーザＵである例について説明した。所定の対象は、ロボット１００と対話できるものであればよく、人であってもよく、犬や猫などの動物であってもよく、ロボット１００以外の他のロボットであってもよい。

前述の実施の形態では、移動部１０８が、モータとタイヤとから構成される例について説明した。移動部１０８は、ロボット１００を移動することができればよく、例えば、複数の足と足を動かすモータとから構成されてもよい。このようにすることで、ロボット１００の形状を人や動物により近づけることができる。

前述の実施の形態では、ロボット１００、２００が、人を模した形状を有する例について説明したが、ロボット１００、２００の形状は、特に限定されず、例えば、犬又は猫を含む動物を模した形状を有してもよく、アニメーションのキャラクタや想像上の生き物を模した形状であってもよい。また、ロボット１００、２００は、対話機能を有するものであればよく、自律走行して床などを掃除する掃除ロボット、巡回監視などを行う警備ロボットなどを含む。

前述の実施の形態では、判定手段は、ロボットが所定の対象から話しかけられた場合、ロボットと所定の対象との間の対話が可能であるか否かを判定したが、対話に限定されず、判定手段は、ロボットが所定の対象から話しかけがあった場合、ロボットと所定の対象との間の音声認識精度の向上が可能であるか否かを判定してもよい。

また、前述の実施の形態では、制御手段は、判定手段によりロボットと所定の対象との間の対話が可能でないと判定された場合に、対話の中断をさせるための第１の応答をするように動作手段を制御したが、同様に対話に限定されず、制御手段は判定手段によりロボットと所定の対象との間の音声認識精度の向上が可能でないと判定された場合に、所定の対象に話しかけの中断をさせるための第１の応答をしてもよい。

また、第１の応答は、所定の対象に対話の中断を促す、音声出力手段による音声の出力、又は、所定の対象に対話の中断を促す、動作手段による姿勢の出力を含んでもよい。また、第１の応答は、音声入力手段及び撮像手段が意図的に機能していないふりをして、ロボット１００、２００が音声を聞いておらず、且つ、画像も見ていないような感情表現をすることを含んでもよい。

また、第２の応答は、所定の対象に対話の継続を促す、音声出力手段による音声の出力、又は、所定の対象に対話の継続を促す、動作手段による姿勢の出力を含んでもよい。また、第２の応答は、音声入力手段及び撮像部１０５が意図的に機能しているふりをして、ロボット１００、２００が音声を聞いており、且つ、画像も見ているような感情表現をすることを含んでもよい。

また、前述の実施の形態では、ロボットを例として説明したが、ロボットに限定されず、ＡＩ（Artificial Intelligence）スピーカ等の電子機器でもよい。

また、ＣＰＵ、ＲＡＭ、ＲＯＭ等から構成される制御部１１０が実行する処理を行う中心となる部分は、専用のシステムによらず、通常の情報携帯端末（スマートフォン、タブレットＰＣ（Personal Computer））、パーソナルコンピュータなどを用いて実行可能である。たとえば、前述の動作を実行するためのコンピュータプログラムを、コンピュータが読み取り可能な記録媒体（フレキシブルディスク、ＣＤ−ＲＯＭ（Compact Disc Read Only Memory）、ＤＶＤ−ＲＯＭ（Digital Versatile Disc Read Only Memory）等）に格納して配布し、このコンピュータプログラムを情報携帯端末などにインストールすることにより、前述の処理を実行する情報端末を構成してもよい。また、インターネット等の通信ネットワーク上のサーバ装置が有する記憶装置にこのコンピュータプログラムを格納しておき、通常の情報処理端末などがダウンロード等することで情報処理装置を構成してもよい。

また、制御部１１０の機能を、ＯＳ（Operating System）とアプリケーションプログラムとの分担、又はＯＳとアプリケーションプログラムとの協働により実現する場合などには、アプリケーションプログラム部分のみを記録媒体や記憶装置に格納してもよい。

また、搬送波にコンピュータプログラムを重畳し、通信ネットワークを介して配信することも可能である。例えば、通信ネットワーク上の掲示板（ＢＢＳ：Bulletin Board System）にこのコンピュータプログラムを掲示し、ネットワークを介してこのコンピュータプログラムを配信してもよい。そして、このコンピュータプログラムを起動し、ＯＳの制御下で、他のアプリケーションプログラムと同様に実行することにより、前述の処理を実行できるように構成してもよい。

本発明は、本発明の広義の精神と範囲とを逸脱することなく、様々な実施形態及び変形が可能とされるものである。また、前述した実施形態は、本発明を説明するためのものであり、本発明の範囲を限定するものではない。つまり、本発明の範囲は、実施形態ではなく、請求の範囲によって示される。そして、請求の範囲内及びそれと同等の発明の意義の範囲内で施される様々な変形が、本発明の範囲内とみなされる。以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。

（付記１）
自装置に動作をさせる動作手段と、
前記自装置が所定の対象から話しかけがあった場合、前記自装置と前記所定の対象との間の音声認識精度の向上が可能であるか否かを判定する判定手段と、
前記判定手段により前記自装置と前記所定の対象との間の前記音声認識精度の向上が可能でないと判定された場合に、前記所定の対象に前記話しかけの中断をさせるための第１の応答をするように前記動作手段を制御する制御手段と、
を備える、
ことを特徴とするロボット。

（付記２）
前記判定手段は、前記自装置が前記所定の対象から話しかけられた場合、前記自装置と前記所定の対象との間の対話が可能であるか否かを判定し、
前記制御手段は、前記判定手段により前記自装置と前記所定の対象との間の前記対話が可能でないと判定された場合に、前記対話の前記中断をさせるための前記第１の応答をするように前記動作手段を制御する、
ことを特徴とする付記１に記載のロボット。

（付記３）
前記制御手段は、前記自装置と前記所定の対象との間の前記対話が可能になるまでの間、前記対話の前記中断をさせるための前記第１の応答をするように前記動作手段を制御する、
ことを特徴とする付記２に記載のロボット。

（付記４）
前記制御手段が、前記第１の応答をするように前記動作手段を制御した後、前記判定手段が前記自装置と前記所定の対象との間の前記対話が可能であると判定すると、前記制御手段は、前記第１の応答とは異なる前記所定の対象に前記対話の継続をさせるための第２の応答をするように前記動作手段を制御する、
ことを特徴とする付記２又は３に記載のロボット。

（付記５）
前記判定手段は、前記自装置が前記所定の対象から話しかけられた場合、前記自装置と前記所定の対象との距離を検出し、前記距離が前記所定の対象と前記対話をするために必要な対話可能距離を超える場合に、前記自装置と前記所定の対象との間の前記対話が可能でないと判定する、
ことを特徴とする付記２乃至４の何れか１つに記載のロボット。

（付記６）
前記自装置を移動させる移動手段を更に備え、
前記制御手段は、前記判定手段により前記距離が前記対話可能距離を超えると判定された場合に、前記自装置が前記所定の対象に向けて移動をするように前記移動手段を制御する、
ことを特徴とする付記５に記載のロボット。

（付記７）
前記距離が前記対話可能距離以下になるまでの間、前記第１の応答をするように前記動作手段を制御する、
ことを特徴とする付記５又は６に記載のロボット。

（付記８）
音声を入力する音声入力手段と、
前記音声入力手段により入力された音声を解析する音声解析手段と、
を更に備え、
前記判定手段は、前記音声解析手段により解析された雑音の音量が前記所定の対象と前記対話をすることができる基準値を超える場合に、前記自装置と前記所定の対象との間の前記対話が可能でないと判定し、
前記制御手段は、前記判定手段により前記雑音の音量が前記基準値を超えると判定された場合に、前記雑音の音量が前記基準値以下になるまでの間、前記第１の応答をするように前記動作手段を制御する、
ことを特徴とする付記２乃至７の何れか１つに記載のロボット。

（付記９）
画像を撮像する撮像手段と、
前記撮像手段により撮像された画像から前記所定の対象の顔を検出し、検出された前記顔に含まれる唇動作を検出する唇動作検出手段と、
を更に備え、
前記判定手段は、前記唇動作検出手段により検出された前記唇動作により前記所定の対象から話しかけられたか否かを判定する、
ことを特徴とする付記２乃至８の何れか１つに記載のロボット。

（付記１０）
前記判定手段により前記自装置と前記所定の対象との距離が対話可能距離を超えると判定された場合に、
前記制御手段は、前記自装置が任意の方向に移動をしている場合には前記自装置が移動の方向を変更して前記所定の対象に向けて移動をするように移動手段を制御して、前記自装置が停止をしている場合には前記自装置が前記所定の対象に向けて移動を始めるように前記移動手段を制御する、
ことを特徴とする付記２乃至９の何れか１つに記載のロボット。

（付記１１）
前記判定手段により前記自装置と前記所定の対象との距離が対話可能距離以下であると判定された場合に、
前記制御手段は、前記自装置が移動をしている場合には前記自装置を停止するように移動手段を制御して、前記自装置が停止をしている場合には前記自装置の停止を維持するように前記移動手段を制御して、
前記制御手段は、前記所定の対象に前記対話の継続をさせるための第２の応答をするように前記動作手段を制御する、
ことを特徴とする付記２乃至１０の何れか１つに記載のロボット。

（付記１２）
音声を出力する音声出力手段を更に備え、
前記第１の応答は、前記所定の対象に前記対話の前記中断を促す、前記音声出力手段による音声の出力、又は、前記所定の対象に前記対話の前記中断を促す、前記動作手段による姿勢の出力を含む、
ことを特徴とする付記２に記載のロボット。

（付記１３）
音声を出力する音声出力手段を更に備え、
前記第２の応答は、前記所定の対象に前記対話の前記継続を促す、前記音声出力手段による音声の出力、又は、前記所定の対象に前記対話の前記継続を促す、前記動作手段による姿勢の出力を含む、
ことを特徴とする付記４又は１１に記載のロボット。

（付記１４）
音声を入力する音声入力手段と、
画像を撮像する撮像手段と、
を更に備え、
前記第１の応答は、前記音声入力手段及び前記撮像手段が意図的に機能していないふりをして、前記自装置が音声を聞いておらず、且つ、画像も見ていないような感情表現をすることを含む、
ことを特徴とする付記２に記載のロボット。

（付記１５）
音声を入力する音声入力手段と、
画像を撮像する撮像手段と、
を更に備え、
前記第２の応答は、前記音声入力手段及び前記撮像手段が意図的に機能しているふりをして、前記自装置が音声を聞いており、且つ、画像も見ているような感情表現をすることを含む、
ことを特徴とする付記４又は１１に記載のロボット。

（付記１６）
前記所定の対象は、人又は動物又は他のロボットを含む、
ことを特徴とする付記１乃至１５の何れか１つに記載のロボット。

（付記１７）
自装置に動作をさせる動作手段を備えるロボットの制御方法であって、
前記自装置が所定の対象から話しかけがあった場合、前記自装置と前記所定の対象との間の音声認識精度の向上が可能であるか否かを判定する判定ステップと、
前記判定ステップにより前記自装置と前記所定の対象との間の前記音声認識精度の向上が可能でないと判定された場合に、前記所定の対象に前記話しかけの中断をさせるための第１の応答をするように前記動作手段を制御する制御ステップと、
を含む、
ことを特徴とするロボットの制御方法。

（付記１８）
自装置に動作をさせる動作手段を備えるロボットを制御するコンピュータを、
前記自装置が所定の対象から話しかけがあった場合、前記自装置と前記所定の対象との間の音声認識精度の向上が可能であるか否かを判定する判定手段、
前記判定手段により前記自装置と前記所定の対象との間の前記音声認識精度の向上が可能でないと判定された場合に、前記所定の対象に前記話しかけの中断をさせるための第１の応答をするように前記動作手段を制御する制御手段、
として機能させる、
ことを特徴とするプログラム。

１００、２００…ロボット、１０１…頭部、１０２…胴体部、１０３…手部、１０４…マイク、１０５…撮像部、１０６…スピーカ、１０７…表示部、１０８…移動部、１１０…制御部、１１１…音声解析部、１１２…移動制御部、１１３…判定部、１１４…対話制御部、１１５…唇動作検出部、１２０…操作ボタン、１３０…電源部

Claims

自装置に動作をさせる動作手段と、
前記自装置が所定の対象から話しかけがあった場合、前記自装置と前記所定の対象との間の音声認識精度の向上が可能であるか否かを判定する判定手段と、
前記判定手段により前記自装置と前記所定の対象との間の前記音声認識精度の向上が可能でないと判定された場合に、前記所定の対象に前記話しかけの中断をさせるための第１の応答をするように前記動作手段を制御する制御手段と、
を備える、
ことを特徴とするロボット。
前記判定手段は、前記自装置が前記所定の対象から話しかけられた場合、前記自装置と前記所定の対象との間の対話が可能であるか否かを判定し、
前記制御手段は、前記判定手段により前記自装置と前記所定の対象との間の前記対話が可能でないと判定された場合に、前記対話の前記中断をさせるための前記第１の応答をするように前記動作手段を制御する、
ことを特徴とする請求項１に記載のロボット。
前記制御手段は、前記自装置と前記所定の対象との間の前記対話が可能になるまでの間、前記対話の前記中断をさせるための前記第１の応答をするように前記動作手段を制御する、
ことを特徴とする請求項２に記載のロボット。
前記制御手段が、前記第１の応答をするように前記動作手段を制御した後、前記判定手段が前記自装置と前記所定の対象との間の前記対話が可能であると判定すると、前記制御手段は、前記第１の応答とは異なる前記所定の対象に前記対話の継続をさせるための第２の応答をするように前記動作手段を制御する、
ことを特徴とする請求項２又は３に記載のロボット。
前記判定手段は、前記自装置が前記所定の対象から話しかけられた場合、前記自装置と前記所定の対象との距離を検出し、前記距離が前記所定の対象と前記対話をするために必要な対話可能距離を超える場合に、前記自装置と前記所定の対象との間の前記対話が可能でないと判定する、
ことを特徴とする請求項２乃至４の何れか１項に記載のロボット。
前記自装置を移動させる移動手段を更に備え、
前記制御手段は、前記判定手段により前記距離が前記対話可能距離を超えると判定された場合に、前記自装置が前記所定の対象に向けて移動をするように前記移動手段を制御する、
ことを特徴とする請求項５に記載のロボット。
前記距離が前記対話可能距離以下になるまでの間、前記第１の応答をするように前記動作手段を制御する、
ことを特徴とする請求項５又は６に記載のロボット。
音声を入力する音声入力手段と、
前記音声入力手段により入力された音声を解析する音声解析手段と、
を更に備え、
前記判定手段は、前記音声解析手段により解析された雑音の音量が前記所定の対象と前記対話をすることができる基準値を超える場合に、前記自装置と前記所定の対象との間の前記対話が可能でないと判定し、
前記制御手段は、前記判定手段により前記雑音の音量が前記基準値を超えると判定された場合に、前記雑音の音量が前記基準値以下になるまでの間、前記第１の応答をするように前記動作手段を制御する、
ことを特徴とする請求項２乃至７の何れか１項に記載のロボット。
画像を撮像する撮像手段と、
前記撮像手段により撮像された画像から前記所定の対象の顔を検出し、検出された前記顔に含まれる唇動作を検出する唇動作検出手段と、
を更に備え、
前記判定手段は、前記唇動作検出手段により検出された前記唇動作により前記所定の対象から話しかけられたか否かを判定する、
ことを特徴とする請求項２乃至８の何れか１項に記載のロボット。
前記判定手段により前記自装置と前記所定の対象との距離が対話可能距離を超えると判定された場合に、
前記制御手段は、前記自装置が任意の方向に移動をしている場合には前記自装置が移動の方向を変更して前記所定の対象に向けて移動をするように移動手段を制御して、前記自装置が停止をしている場合には前記自装置が前記所定の対象に向けて移動を始めるように前記移動手段を制御する、
ことを特徴とする請求項２乃至９の何れか１項に記載のロボット。
前記判定手段により前記自装置と前記所定の対象との距離が対話可能距離以下であると判定された場合に、
前記制御手段は、前記自装置が移動をしている場合には前記自装置を停止するように移動手段を制御して、前記自装置が停止をしている場合には前記自装置の停止を維持するように前記移動手段を制御して、
前記制御手段は、前記所定の対象に前記対話の継続をさせるための第２の応答をするように前記動作手段を制御する、
ことを特徴とする請求項２乃至１０の何れか１項に記載のロボット。
音声を出力する音声出力手段を更に備え、
前記第１の応答は、前記所定の対象に前記対話の前記中断を促す、前記音声出力手段による音声の出力、又は、前記所定の対象に前記対話の前記中断を促す、前記動作手段による姿勢の出力を含む、
ことを特徴とする請求項２に記載のロボット。
音声を出力する音声出力手段を更に備え、
前記第２の応答は、前記所定の対象に前記対話の前記継続を促す、前記音声出力手段による音声の出力、又は、前記所定の対象に前記対話の前記継続を促す、前記動作手段による姿勢の出力を含む、
ことを特徴とする請求項４又は１１に記載のロボット。
音声を入力する音声入力手段と、
画像を撮像する撮像手段と、
を更に備え、
前記第１の応答は、前記音声入力手段及び前記撮像手段が意図的に機能していないふりをして、前記自装置が音声を聞いておらず、且つ、画像も見ていないような感情表現をすることを含む、
ことを特徴とする請求項２に記載のロボット。
音声を入力する音声入力手段と、
画像を撮像する撮像手段と、
を更に備え、
前記第２の応答は、前記音声入力手段及び前記撮像手段が意図的に機能しているふりをして、前記自装置が音声を聞いており、且つ、画像も見ているような感情表現をすることを含む、
ことを特徴とする請求項４又は１１に記載のロボット。
前記所定の対象は、人又は動物又は他のロボットを含む、
ことを特徴とする請求項１乃至１５の何れか１項に記載のロボット。
自装置に動作をさせる動作手段を備えるロボットの制御方法であって、
前記自装置が所定の対象から話しかけがあった場合、前記自装置と前記所定の対象との間の音声認識精度の向上が可能であるか否かを判定する判定ステップと、
前記判定ステップにより前記自装置と前記所定の対象との間の前記音声認識精度の向上が可能でないと判定された場合に、前記所定の対象に前記話しかけの中断をさせるための第１の応答をするように前記動作手段を制御する制御ステップと、
を含む、
ことを特徴とするロボットの制御方法。
自装置に動作をさせる動作手段を備えるロボットを制御するコンピュータを、
前記自装置が所定の対象から話しかけがあった場合、前記自装置と前記所定の対象との間の音声認識精度の向上が可能であるか否かを判定する判定手段、
前記判定手段により前記自装置と前記所定の対象との間の前記音声認識精度の向上が可能でないと判定された場合に、前記所定の対象に前記話しかけの中断をさせるための第１の応答をするように前記動作手段を制御する制御手段、
として機能させる、
ことを特徴とするプログラム。