JP4433273B2

JP4433273B2 - ロボット装置及びロボット装置の制御方法

Info

Publication number: JP4433273B2
Application number: JP2003295617A
Authority: JP
Inventors: 敬一山田; 一美青山; 秀樹下村
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2003-08-19
Filing date: 2003-08-19
Publication date: 2010-03-17
Anticipated expiration: 2023-08-19
Also published as: JP2005059185A

Description

本発明はロボット装置及びロボット装置の制御方法に関し、例えばヒューマノイドロボットに適用して好適なものである。

近年、２足歩行型のヒューマノイドロボットが多くの企業等において開発され、商品化されている。そしてこのようなヒューマノイドロボットの中には、ＣＣＤ（Charge Coupled Device）カメラやマイクロホン等の各種外部センサが搭載され、これら外部センサの出力に基づいて外部状況を認識し、認識結果に基づいて自律的に行動し得るようになされたものなどもある。

このような自律型のヒューマノイドロボット（以下、単にロボットと呼ぶ）には、ユーザからの音声指令に応答して、当該指令内容に応じた動作を行う音声認識機能を備えたものが提案されている。例えばユーザから「前に歩け」という音声指令が与えられると、ロボットは前方へ向かって歩行動作を行う。
特開平２００２−１４００９２号公報（図１）

ところで、かかる音声認識機能を有するロボットの場合、ユーザからの音声指令に応じた適切な動作を行う際、ユーザからの音声指令が必ずしも十分でなくても、融通性の高い動作を行うことが望ましい。

このことはロボットがユーザの意図に反する動作を繰り返していると、ユーザはロボットに対して飽きてしまうおそれがあり、またロボットの開発目的である人間と同じ環境下での共生を達成し難くなるおそれがあることによる。

ところが、従来のロボットに搭載されている音声認識機能は、予め設定された特定の指令語をそのまま認識して、その指令語に直接対応した特定の動作を実行させることができるに過ぎないものが大半を占めていた。

このためかかるロボットでは、ユーザによる音声指令を受けたときに、単純な動作以上の複雑な動作を発展させて実行することは非常に困難であった。一方、ユーザも特定の表現からなる指令語を予め覚えておく必要があるという煩雑さがあった。

本発明は以上の点を考慮してなされたもので、エンターテインメント性を格段と向上し得るロボット装置及びロボット装置の制御方法を提案しようとするものである。

かかる課題を解決するため本発明においては、ユーザの発話から指令音声を認識して、当該指令音声に応じた単数又は複数の音声指令文に変換する音声認識手段と、音声指令文から文節単位で複数の音声指令語を抽出し、抽出した結果の音声指令語を音声指令解析第１変換テーブルにより、複数の音声指令語に対応して設定された指令内容を表す音声指令タグに変換し、変換された音声指令タグを音声指令解析第２変換テーブルによりユーザの音声指令のうちロボットの基本動作に相当する指令内容を表す音声指令タグが対応付けられた音声指令コマンド及びユーザの音声指令のうちロボットの基本動作以外のものに相当する指令内容を表す音声指令タグが対応付けられた音声指令パラメータに分類する音声指令解析手段と、音声指令解析手段により分類された音声指令コマンド及び音声指令パラメータの組み合わせに基づいて、ロボットの動作指令情報となる動作指令コマンド及び動作指令パラメータの組み合わせを決定する動作指令決定手段と、動作指令決定手段により決定された動作指令コマンド及び動作指令パラメータの組み合わせに応じた動作を発現させる動作発現手段とを具え、音声指令解析手段は、音声指令コマンドに予め優先度を設定し、動作指令決定手段は、複数の動作指令コマンドが存在する場合、音声指令コマンドに設定された優先度に従って優先度の高い音声指令コマンドに対応する動作指令コマンドを選択するようにした。

この結果このロボット装置では、ユーザからの音声指令が複雑な動作を要求する内容であっても、ユーザの音声指令のうちロボットの基本動作に相当する指令内容を表す音声指令タグが対応付けられた音声指令コマンド及びユーザの音声指令のうちロボットの基本動作以外のものに相当する指令内容を表す音声指令タグが対応付けられた音声指令パラメータの組み合わせに応じた動作を発現することができるので、単純な動作以上の複雑な動作を発展させて実行することができる。

上述のように本発明によれば、ユーザの発話から指令音声を認識して、当該指令音声に応じた単数又は複数の音声指令文に変換する音声認識手段と、音声指令文から文節単位で複数の音声指令語を抽出し、抽出した結果の音声指令語を音声指令解析第１変換テーブルにより、複数の音声指令語に対応して設定された指令内容を表す音声指令タグに変換し、変換された音声指令タグを音声指令解析第２変換テーブルによりユーザの音声指令のうちロボットの基本動作に相当する指令内容を表す音声指令タグが対応付けられた音声指令コマンド及びユーザの音声指令のうちロボットの基本動作以外のものに相当する指令内容を表す音声指令タグが対応付けられた音声指令パラメータに分類する音声指令解析手段と、音声指令解析手段により分類された音声指令コマンド及び音声指令パラメータの組み合わせに基づいて、ロボットの動作指令情報となる動作指令コマンド及び動作指令パラメータの組み合わせを決定する動作指令決定手段と、動作指令決定手段により決定された動作指令コマンド及び動作指令パラメータの組み合わせに応じた動作を発現させる動作発現手段とを具え、音声指令解析手段は、音声指令コマンドに予め優先度を設定し、動作指令決定手段は、複数の動作指令コマンドが存在する場合、音声指令コマンドに設定された優先度に従って優先度の高い音声指令コマンドに対応する動作指令コマンドを選択するようにしたことにより、ユーザからの音声指令が複雑な動作を要求する内容であっても、ユーザの音声指令のうちロボットの基本動作に相当する指令内容を表す音声指令タグが対応付けられた音声指令コマンド及びユーザの音声指令のうちロボットの基本動作以外のものに相当する指令内容を表す音声指令タグが対応付けられた音声指令パラメータの組み合わせに応じた動作を発現することができるので、単純な動作以上の複雑な動作を発展させて実行することができ、さらに優先度にしたがって最優先の動作を選択できるのでユーザの好ましいと思う方の動作に発現でき、かくしてエンターテインメント性を格段と向上し得るロボット装置を実現できる。

以下図面について、本発明の一実施の形態を詳述する。

（１）本実施の形態によるロボット１の全体構成
図１及び図２において、１は全体として本実施の形態によるロボットを示し、胴体部ユニット２の上部に首部３を介して頭部ユニット４が連結されると共に、当該胴体部ユニット２の上部左右両側面にそれぞれ腕部ユニット５Ａ、５Ｂが連結され、かつ当該胴体部ユニット２の下部に一対の脚部ユニット６Ａ、６Ｂが連結されることにより構成されている。

この場合、首部３は、図３に示すように、首関節ピッチ軸１０回り、首関節ヨー軸１１回り及び首関節ピッチ軸１２回りの自由度を有する首関節機構部１３により保持されている。また頭部ユニット４は、この首部３の先端部に図３のように首部ロール軸１４回りの自由度をもって取り付けられている。これによりこのロボット１においては、頭部ユニット４を前後、左右及び斜めの所望方向に向かせることができるようになされている。

また各腕部ユニット５Ａは、図１及び図２において明らかなように、上腕部ブロック１５、前腕部ブロック１６及び手先部ブロック１７の３つのブロックから構成され、上腕部ブロック１５の上端部が図３のように肩ピッチ軸１８回り及び肩ロール軸１９回りの自由度を有する肩関節機構部２０を介して胴体部ユニット２に連結されている。

このとき前腕部ブロック１６は、図３のように上腕部ブロック１５に上腕ヨー軸２１回りの自由度をもって連結されている。また手先部ブロック１７は、図３のように前腕部ブロック１６に手首ヨー軸２２回りの自由度をもって連結されている。さらに前腕部ブロック１６には、肘ピッチ軸２３回りの自由度を有する肘関節機構部２４が設けられている。

これによりロボット１においては、これら腕部ユニット５Ａ、５Ｂを全体としてほぼ人間の腕部と同様の自由度をもって動かすことができ、かくして片手を上げた挨拶や腕部ユニット５Ａ、５Ｂを振り回すダンスなどの当該腕部ユニット５Ａ、５Ｂを用いた各種行動を行い得るようになされている。

さらに手先部ブロック１７の先端部には、５本の指部２５がそれぞれ屈曲及び伸長自在に取り付けられており、これによりこれら指部を使って物を摘んだり、把持することができるようになされている。

他方、各脚部ユニット６Ａ、６Ｂは、図１及び図２において明らかなように、大腿部ブロック３０、脛部ブロック３１及び足平部ブロック３２の３つのブロックから構成され、大腿部ブロック３０の上端部が図３のように股関節ヨー軸３３回り、股関節ロール軸３４回り及び股関節ピッチ軸３５回りの自由度を有する股関節機構部３６を介して胴体部ユニット２に連結されている。

このとき大腿部ブロック３０及び脛部ブロック３１は、図３のように脛ピッチ軸３７回りの自由度を有する膝関節機構部３８を介して連結されると共に、脛ブロック３１及び足平ブロック３２は、図３のように足首ピッチ軸３９回り及び足首ロール軸４０回りの自由度を有する足首関節機構部４１を介して連結されている。

これによりロボット１においては、これら脚部ユニット６Ａ、６Ｂを人間の脚部とほぼ同様の自由度をもって動かすことができ、かくして歩行やボールを蹴るなどの脚部ユニット６Ａ、６Ｂを用いた各種行動を行い得るようになされている。

さらに胴体部ユニット２の後側上部には、首部３を囲むようにグリップハンドル２Ａが設けられており、ユーザが当該グリップハンドル２Ａを把持して持ち上げることにより、ロボット１全体を持ち上げることができるようになされている。

なおこのロボット１の場合、各股関節機構部３６は、図３のように体幹ロール軸４２回り及び体幹ピッチ軸４３回りの自由度を有する腰関節機構部４４により支持されており、これにより胴体部ユニット２を前後、左右方向に自在に傾かせることもできるようになされている。

ここでロボット１においては、上述のように頭部ユニット４、各腕部ユニット５Ａ、５Ｂ、各脚部ユニット６Ａ、６Ｂ及び胴体部ユニット２を動かすための動力源として、図４に示すように、首関節機構部１３及び肩関節機構部２０等の各関節機構部を含む各自由度を有する部位に、それぞれその自由度数分のアクチュエータＡ１〜Ａ１７が配設されている。

また胴体部ユニット２には、当該ロボット１全体の動作制御を司るメイン制御部５０と、電源回路及び通信回路などの周辺回路５１と、バッテリ５２（図５）となどが収納されると共に、各構成ユニット（胴体部ユニット２、頭部ユニット４、各腕部ユニット５Ａ、５Ｂ及び各脚部ユニット６Ａ、６Ｂ）内には、それぞれメイン制御部５０と電気的に接続されたサブ制御部５３Ａ〜５３Ｄが収納されている。

さらに頭部ユニット４には、図５に示すように、このロボット１の「目」として機能する一対のＣＣＤ（Charge Coupled Device）カメラ６０Ａ、６０Ｂ及び「耳」として機能するマイクロホン６１などの各種外部センサと、「口」として機能するスピーカ６２となどがそれぞれ所定位置に配設されている。また各脚部ユニット６Ａ、６Ｂにおける足平部ブロック３２の裏面等の各所定部位には外部センサとしてのタッチセンサ６３が配設されている。

さらに胴体部ユニット２内には、バッテリセンサ６４及び加速度センサ６５などの各種内部センサが配設されると共に、各構成ユニット内には、それぞれ各アクチュエータＡ１〜Ａ１７にそれぞれ対応させて、対応するアクチュエータＡ１〜Ａ１７の出力軸の回転角度を検出する内部センサとしてのポテンショメータＰ１〜Ｐ１７が設けられている。

そして各ＣＣＤカメラ６０Ａ、６０Ｂは、周囲の状況を撮像し、得られた画像信号Ｓ１Ａをサブ制御部５３Ｂ（図５において図示せず）を介してメイン制御部５０に送出する一方、マイクロホン６１は、各種外部音を集音し、かくして得られた音声信号Ｓ１Ｂをサブ制御部５３Ｂを介してメイン制御部５０に送出する。また各タッチセンサ６３は、ユーザからの物理的な働きかけや、外部との物理的な接触を検出し、検出結果を圧力検出信号Ｓ１Ｃとして対応するサブ制御部５３Ａ〜５３Ｄ（図５において図示せず）を介してメイン制御部５０に送出する。

さらにバッテリセンサ６４は、バッテリ５２のエネルギ残量を所定周期で検出し、検出結果をバッテリ残量信号Ｓ２Ａとしてメイン制御部５０に送出する一方、加速度センサ６５は、３軸（ｘ軸、ｙ軸及びｚ軸）の加速度を所定周期で検出し、検出結果を加速度検出信号Ｓ２Ｂとしてメイン制御部５０に送出する。また各ポテンショメータＰ１〜Ｐ１７は、対応するアクチュエータＡ１〜Ａ１７の出力軸の回転角度を検出し、検出結果を所定周期で角度検出信号Ｓ２Ｃ１〜Ｓ２Ｃ１７として対応するサブ制御部５３Ａ〜５３Ｄを介してメイン制御部５０に送出する。

メイン制御部５０は、ＣＣＤカメラ６０Ａ、６０Ｂ、マイクロホン６１及び各タッチセンサ６３等の各種外部センサからそれぞれ供給される画像信号Ｓ１Ａ、音声信号Ｓ１Ｂ及び圧力検出信号Ｓ１Ｃ等の外部センサ信号と、バッテリセンサ６４、加速度センサ６５及び各ポテンショメータＰ１〜Ｐ１７等の各種内部センサからそれぞれ供給されるエネルギ残量信号Ｓ２Ａ、加速度検出信号Ｓ２Ｂ及び各角度検出信号Ｓ２Ｃ１〜Ｓ２Ｃ１７等の内部センサ信号とに基づいて、ロボット１の外部及び内部の状況や、ユーザの物理的な働きかけの有無等を判断する。

そしてメイン制御部５０は、この判断結果と、予め内部メモリ５０Ａに格納されている制御プログラムと、そのとき装填されている外部メモリ６６に格納されている各種制御パラメータとなどに基づいて続くロボット１の行動を決定し、当該決定結果に基づく制御コマンドを対応するサブ制御部５３Ａ〜５３Ｄ（図４）に送出する。

この結果、この制御コマンドに基づき、そのサブ制御部５３Ａ〜５３Ｄの制御のもとに、対応するアクチュエータＡ１〜Ａ１７が駆動され、かくして頭部ユニット４を上下左右に揺動させたり、腕部ユニット５Ａ、５Ｂを上に上げたり、歩行するなどの各種行動がロボット１により発現される。

このようにしてこのロボット１においては、外部及び内部の状況等に基づいて自律的に行動することができるようになされている。

（２）音声動作指令機能に関するメイン制御部５０の処理
次にこのロボット１に搭載された音声動作指令機能について説明する。このロボット１には、マイクロホン６１から得られる音声信号Ｓ１Ｂに基づくユーザからの発話音声のうち、ロボット１に対する指令音声を認識して、当該指令音声に対応する動作をロボットに発現させ得る音声動作指令機能が搭載されている。そしてこの音声動作指令機能は、メイン制御部５０における各種処理により実現されている。

ここで、かかる音声動作指令機能に関するメイン制御部５０の処理内容を機能的に分類すると、図６に示すように、音声指令文生成部７０、音声指令文解析部７１及び音声指令情報変換部７２に分けることができる。

音声指令文生成部７０は、マイクロホン６１（図５）から得られる音声信号Ｓ１Ｂに基づく音声を、所定の音声認識処理により文字情報でなる音声指令文に置き換えた後、当該音声指令文を音声指令文情報Ｄ１として音声指令文解析部７１に送出する。

この場合、音声認識処理として、例えば隠れマルコフ・モデル（ＨＭＭ：Hidden Markov Model）などのアルゴリズムが適用される。この隠れマルコフ・モデルは、音素や単語の内部での特徴の時間的な変化を幾つかの状態で表現して、その状態間の遷移と各状態でのスペクトル特徴量の様子とを確率的にモデル化したものである。隠れマルコフ・モデルは、音声信号Ｓ１Ｂの変動を確率的に取り扱うため、いわゆるＤＰ（Dynamic Programming）マッチング法と比較して入力音声の揺らぎなどを好適に表現することができる。

音声指令文解析部７１は、入力された音声指令文情報Ｄ１に基づく音声指令文から文節単位で順次音声指令語を抽出した後、当該各音声指令語を、音声指令解析テーブル７３を用いた所定の解析処理を行い、その結果得られる所定の言語フォーマットでなる音声指令情報Ｄ２を音声指定情報変換部７２に送出する。

この音声指令解析テーブル７３は、音声指令文から抽出された複数の音声指令語と、当該各音声指令語に対応して設定された音声指令タグとの対応関係が記述された第１の変換テーブル７３Ａと、複数の音声指令タグと、当該各音声指令タグに対応する音声指令コマンド及び音声指令パラメータとの対応関係が記述された第２の変換テーブル７３Ｂとからなる。

実際にまず音声指令文解析部７１は、音声指令文から順次抽出された複数の音声指令語を、音声指令解析テーブル７３のうち第１の変換テーブル７３Ａを用いて、当該各音声指令語の最長語との一致性から、それぞれ対応する音声指令タグに変換する。

この第１の変換テーブル７３Ａにおいて、図７に示すように、各音声指令タグには、同一の指令内容で複数通りの音声指令語が対応付けられている。具体的には、動詞の語尾、名詞に付加された助詞、前後左右の方向、速度や程度を表す言い回し、歩数や距離、回数等の度合いなどが、音声指令語としてそれぞれ複数種類ある場合でも、同一の指令内容に相当するものとして、同一の音声指令タグに対応付けられるように設定されている。このうち歩数や距離、回数等の度合いには、当該度合いを表す文言の前後に数字を表す文言が入るが、当該数字を含めて指令内容が認識されるように設定されている。

例えば「前に３歩進め」という音声指令文の場合には、音声指令文解析部７１は、図８（Ａ）に示すように、当該音声指令文を「前に」、「３歩」及び「進め」という音声指令語列に分割した後、「SPTag_Fore」、「SPTag_Step(3)」及び「SPTag_GoOn」という音声指令タグ列に変換する。

その際、音声指令タグ「SPTag_Step(3)」は、最後尾に「３」と数字が付加されているが、これは検出された音声指令語に数字が含まれている場合には、その数字を音声指令タグのサブ情報として付帯するルールに基づくものである。

続いて音声指令文解析部７１は、これら複数の音声指令タグからなる音声指令タグ列を、音声指令解析テーブル７３のうち第２の変換テーブル７３Ｂを用いて、順次当該各音声指令タグに対応する音声指令コマンド又は音声指令パラメータに分類する。

この第２の変換テーブル７３Ｂにおいて、図９（Ａ）に示すように、各音声指令コマンドには、ユーザによる音声指令のうちロボット１の基本動作に相当する指令内容を表す音声指令タグが対応付けられている。また図９（Ｂ）に示すように、各音声指令パラメータには、ユーザによる音声指令のうち上述の基本動作以外のものに相当する指令内容を表す音声指令タグが対応付けられている。

音声指令コマンドには、同一の基本動作で単数又は複数通りの音声指令タグが対応付けられている。具体的には、「進む」の意味を表す「SPTag_GoOn」と「歩く」の意味を表す「SPTag_Walk」とが、同一の音声指令コマンドである「SPCom_Walk」に対応付けられるようになされている。

また音声指令パラメータである「SPPrm_Direction」、「SPPrm_Distance」、「SPPrm_Time」、「SPPrm_Speed」、「SPPrm_Repetition」及び「SPPrm_Angle」は、それぞれ「方向」、「距離」、「時間」、「速度」、「回数」及び「角度」といったロボット１の具体的な動作を指定するためのパラメータとしての代表的なカテゴリが割り当てられており、当該動作ごとに単数又は複数通りの音声指令タグが対応付けられている。

具体的には、「前後左右」の意味を表す「SPTag_Fore」、「SPTag_Back」、「SPTag_Left」及び「SPTag_Right」が、同一の音声指令パラメータである「SPPrm_Direction」に対応付けられるようになされている。また音声指令パラメータには、サブ情報として、初期の基準値となるデフォルト値や動作の範囲となる変化幅が予め数値設定されており、さらに当該デフォルト値及び変化幅を直接その値とする絶対値「absolute」か、現在の状態との比較において値を付加する相対値「relative」が予め設定されている。

本実施の形態の場合、音声指令タグから音声指令パラメータへの変換において、音声指令タグ自体にサブ情報が付加されていない場合には、音声指令解析テーブル７３のうち第２の変換テーブル７３Ｂに記述されているデフォルト値をサブ情報として採用するようになされている。

音声指令文解析部７１は、音声指令タグ列を音声指令コマンド又は音声指令パラメータに分類した後、さらにこのうち音声指令パラメータには元の音声指令タグ及びこれに付随するサブ情報を付加して、これらを音声指令情報Ｄ２として音声指令情報変換部７２に送出する。

音声指令情報変換部７２は、入力される音声指令情報Ｄ２について、音声動作指令対応テーブル７４を用いて、当該音声指令情報Ｄ２を構成する音声指令コマンド及び音声指令パラメータの組み合わせに応じた所定の判断処理を行い、その結果得られる所定の言語フォーマットでなる動作指令情報Ｄ３を各種対応するサブ制御部５３Ａ〜５３Ｄ（図４）に送出する。

この音声動作指令対応テーブル７４には、図１０に示すように、ロボット１の各種動作ごとに動作指令コマンド及び動作指令パラメータの組み合わせが予め設定されており、当該組み合わせに対応する音声指令コマンド音声指令パラメータの組み合わせとの対応関係が記述されている。具体的にはロボット１の各種動作として、歩行（前方に１歩、後方に１歩又は横方向に１歩）、首振り及び旋回等が挙げられる。

実際に音声指令情報変換部７２は、音声指令情報Ｄ２を構成する複数の音声指令コマンド及び音声指令パラメータについて、音声動作指令対応テーブル７４を用いて、ロボット１の各種動作ごとに設定された動作指令コマンド及び動作指令パラメータの組み合わせとの一致性に基づいて、所定数の音声指令コマンド及び音声指令パラメータの組み合わせを判断する。

この音声動作指令対応テーブル７４において、音声指令コマンド及び音声指令パラメータの組み合わせのうち、複数の音声指令パラメータが存在する場合には、必ず必要な動作指令パラメータであるかを表す「must」又は必ずしも必要でない動作指令パラメータであるかを表す「option」を任意に設定できるようになされている。また実際にロボット１の動作を実行するにあたって、人間らしさの表現及び安全性の確保を考慮して、動作指令パラメータに最大値を数値設定し得るようになされている。

さらに音声指令情報Ｄ２によって音声指令コマンド及び音声指令パラメータの組み合わせのうち、対応する動作指令コマンド及び動作指令パラメータの組み合わせが複数存在することにより、ロボット１の動作に複数の候補が存在する場合には、その全ての音声指令情報Ｄ２に組み込まれる。

そしてこれら複数の候補について、予めロボット１の動作に優先順位を設定しておくことにより、当該優先順位に対応する音声指令コマンド及び音声指令パラメータの組み合わせに優先度を数値設定し得るようになされている。

さらに音声指令情報変換部７２は、上述の音声動作指令対応テーブル７４に加えて、前回生成した動作指令情報Ｄ３を記憶する実行履歴情報記憶部７５を用いて、再度の動作要求があったときに実行履歴情報記憶部７５から対応する動作指令情報Ｄ３を履歴情報（以下、これを実行履歴情報と呼ぶ）として読み出すことにより、再度の動作を補完し得るようになされている。

音声指令情報変換部７２は、次に受け取った音声指令情報Ｄ２が音声指令パラメータのみで音声指令コマンドが含まれていない場合でも、実行履歴情報記憶部７５から読み出した実行履歴情報のうち対応する音声指令パラメータとの一致性に基づいて、不足している音声動作コマンドや他の音声動作パラメータを当該実行履歴情報から補うことにより、動作指令情報Ｄ３を補完し得る。

このようにメイン制御部５０においては、音声動作指令機能を実行することにより、マイクロホン６１から得られる音声信号Ｓ１Ｂからユーザの発話音声のうちの指令音声を認識した後、当該指令音声を予め設定された各種コマンド及びパラメータに変換しながら、ロボット１が実行可能な動作を絞り込んで決定することができる。

上述の図８（Ａ）に示すように、「前に３歩進め」という音声指令文が変換された音声指令タグ列「SPTag_Fore」、「SPTag_Step(3)」及び「SPTag_GoOn」については、音声指令文解析部７１は、音声指令解析テーブル７３のうち第２の変換テーブル７３Ｂを用いて、かかる音声指令タグ列のうち音声指令タグ「SPTag_Fore」を音声指令パラメータ「SPPrm_Direction(SPTag_Fore(0))」及び「SPPrm_Angle(SPTag_Fore(0))」に変換すると共に、音声指令タグ「SPTag_Step(3)」を音声指令パラメータ「SPPrm_Repetition(SPTag_Fore(3))」に変換し、音声指令タグ「SPTag_GoOn」を音声指令コマンド「SPCom_Walk」に変換するようにして音声指令情報Ｄ２を得る。

ここで、音声指令情報Ｄ２において、音声指令タグ「SPTag_Fore」に対応する音声指令パラメータ「SPPrm_Direction(SPTag_Fore(0))」及び「SPPrm_Angle(SPTag_Fore(0))」には、「SPTag_Fore」に０というサブ情報が付加されているが、このサブ情報は、上述した図９（Ｂ）におけるデフォルト値が採用されたことによるものである。

この後、図８（Ｂ）に示すように、音声指令情報変換部７２において、音声指令情報Ｄ２が音声指令コマンド「SPCom_Walk」と、音声指令パラメータ「SPPrm_Direction(SPTag_Fore(0))」及び「SPPrm_Repetition(SPTag_Step(0))」との組み合わせでなることから、音声動作指令対応テーブル７４を用いて、当該組み合わせに一致する動作指令コマンド及び動作指令パラメータの組み合わせを判断すると、動作指令コマンド「MTCom_WalkForeStep」と、動作指令パラメータ「MTPrm_Direction(0)」及び「MTPrm_Repetition(3)」との組み合わせでなる動作指令情報Ｄ３を得る。

以上のようにして、メイン制御部５０では、入力された指令音声を動作指令情報Ｄ３に変換した後に対応するサブ制御部５３Ａ〜５３Ｄ（図４）に送出することにより、当該サブ制御部５３Ａ〜５３Ｄの制御の下に、前方に３歩歩行するなどの適切な行動がロボット１において発現させることができる。

（３）音声動作指令機能における具体例
メイン制御部５０は、上述した音声動作指令機能について、「前に３歩進め」といった基本的な指令音声に対する変換以外にも、以下に述べるような種々の音声指令を動作指令情報Ｄ３に変換することができる。

（３−１）最大値による動作指令パラメータの調整を行う場合
例えば「右を向け」という音声指令文の場合には、音声指令文解析部７１は、図１１（Ａ）に示すように、当該音声指令文を「右を」及び「向け」という音声指令語列に分割した後、「SPTag_Right」及び「SPTag_Turn」という音声指令タグ列に変換する。続いて音声指令文解析部７１は、音声指令解析テーブル７３のうち第２の変換テーブル７３Ｂを用いて、かかる音声指令タグ列のうち音声指令タグ「SPTag_Right」を音声指令パラメータ「SPPrm_Direction(SPTag_Right(25))」及び「SPPrm_Angle(SPTag_Right(10))」に変換すると共に、音声指令タグ「SPTag_Turn」を音声指令コマンド「SPCom_Turn(SPTag_Turn)」に変換するようにして音声指令情報Ｄ２を得る。

ここで、音声指令情報Ｄ２において、音声指令タグ「SPTag_Right」に対応する音声指令パラメータ「SPPrm_Direction(SPTag_Right(25))」及び「SPPrm_Angle(SPTag_Right(10))」には、「SPTag_Right」に「25」及び「10」というサブ情報が付加されているが、このサブ情報は、上述した図９（Ｂ）におけるデフォルト値が採用されたことによるものである。

この後、図１１（Ｂ）に示すように、音声指令情報変換部７２において、音声指令情報Ｄ２が音声指令コマンド「SPCom_Turn」と、音声指令パラメータ「SPPrm_Direction(SPTag_Right(25))」及び「SPPrm_Angle(SPTag_Right(10))」との組み合わせでなることから、音声動作指令対応テーブル７４を用いて、当該組み合わせに一致する動作指令コマンド及び動作指令パラメータの組み合わせを判断すると、動作指令コマンド「MTCom_MoveHeadYaw」と、動作指令パラメータ「MTPrm_Angle(36)」との組み合わせでなる動作指令情報Ｄ３を得る。

その際、上述した図１０に示すように動作指令パラメータに設定された最大値が「360」であることから、音声指令パラメータ「SPPrm_Angle(SPTag_Right (10))」のサブ情報である「10」から、動作指令パラメータ「MTPrm_Angle(36)」のサブ情報は、「36（＝10×360／100）」ように、人間らしさの表現及び安全性の確保を考慮して設定された最大値を考慮した数値に自動的に調整することができる。

（３−２）優先度により動作指令情報の選択を行う場合
例えば「左を向け」という音声指令文の場合には、音声指令文解析部７１は、図１２（Ａ）に示すように、当該音声指令文を「左を」及び「向け」という音声指令語列に分割した後、「SPTag_Left」と「SPTag_Turn」及び「SPTag_TurnRound」という音声指令タグ列に変換する。

続いて音声指令文解析部７１は、音声指令解析テーブル７３のうち第２の変換テーブル７３Ｂを用いて、かかる音声指令タグ列のうち音声指令タグ「SPTag_Left」を音声指令パラメータ「SPPrm_Direction(SPTag_Left(-25))」及び「SPPrm_Angle(SPTag_Left(-10))」に変換すると共に、音声指令タグ「SPTag_Turn」及び「SPTag_TurnRound」を音声指令コマンド「SPCom_Turn(SPTag_Turn)」及び「SPCom_Turn(SPTag_TurnRound)」に変換するようにして音声指令情報Ｄ２を得る。

ここで、音声指令情報Ｄ２において、音声指令タグ「SPTag_Left」に対応する音声指令パラメータ「SPPrm_Direction(SPTag_Left(-25))」及び「SPPrm_Angle(SPTag_Left(-10))」には、「SPTag_Left」に「-25」及び「-10」というサブ情報が付加されているが、このサブ情報は、上述した図１０（Ｂ）におけるデフォルト値が採用されたことによるものである。

この後、図１２（Ｂ）に示すように、音声指令情報変換部７２において、音声指令情報Ｄ２が音声指令コマンド「SPCom_Turn」及び「SPCom_TurnRound」と、音声指令パラメータ「SPPrm_Direction(SPTag_Right (25))」及び「SPPrm_Angle(SPTag_Right (10))」との組み合わせでなることから、音声動作指令対応テーブル７４を用いて、当該組み合わせに一致する動作指令コマンド及び動作指令パラメータの組み合わせを判断する。

このとき音声指令コマンドには「SPCom_Turn」及び「SPCom_TurnRound」と２種類存在するため、動作指令コマンドも「MTCom_MoveHeadYaw」及び「MTCom_WalkStepYaw」の２種類となる。このため予め設定された優先度に基づいて音声指令コマンド「SPCom_Turn」に対応する動作指令コマンド「MTCom_MoveHeadYaw」が選択される。この結果、動作コマンド「MTCom_MoveHeadYaw」と、動作指令パラメータ「MTPrm_Angle(36)」との組み合わせでなる動作指令情報Ｄ３が得られる。

このように複数の動作指令コマンドが存在する場合には予め設定しておいて優先度に従って、特定の動作指令コマンドを選択するようにして、ユーザが好ましいと思う方の動作をロボット１に発現させることができる。

（３−３）実行履歴情報を用いる場合
例えばユーザが「前に３歩進め」という指令音声を発した後に、続いて「もう１歩」という指令音声を発した場合には、当該「前に３歩進め」の音声指令文に基づく動作指令情報Ｄ３の変換は、上述した図８（Ａ）及び（Ｂ）と対応する図１３（Ａ）及び（Ｂ）に示す通りである。

この「もう一歩」という音声指令語について、音声指令解析部７１は、図１３（Ｃ）に示すように、「SPTag_Step」という音声指令タグに変換する。続いて音声指令解析部７１は、音声指令解析テーブル７３のうち第２の変換テーブル７３Ｂを用いて、かかる音声指令タグ「SPTag_Step」を音声指令パラメータ「SPPrm_Repetition(SPTag_Step(1))」に変換するようにして音声指令情報Ｄ２を得る。

この後、図１３（Ｄ）に示すように、音声指令情報変換部７２において、音声指令情報Ｄ２が音声指令パラメータのみからなり音声指令コマンドを含んでいないことから、実行履歴情報記憶部７５を用いて、対応する動作指令情報Ｄ３を実行履歴情報として読み出して、当該動作指令情報Ｄ３を構成する音声指令パラメータ「SPPrm_Repetition(SPTag_Step(1))」との一致性に基づいて、不足している音声指令コマンドや他の音声指令パラメータを当該実行履歴情報から補完することにより、動作指令コマンド「MTCom_WalkForeStep」と、動作指令パラメータ「MTPrm_Direction(0)」及び「MTPrm_Repetition(3)」との組み合わせでなる動作指令情報Ｄ３を得ることができる。

このようにユーザが「前に３歩進め」という指令音声を発した後で、さらに「もう一歩」という指令音声を発したときでも、当該「前に３歩進め」に応じた動作指令情報Ｄ３を「もう一歩」に応じた動作指令情報Ｄ３に反映させることができる。

（３−４）実行履歴情報の動作指令パラメータを調整して用いる場合
例えばユーザが「右を向け」という指令音声を発した後に、続いて「もうちょっと」という音声指令を発した場合には、当該「右を向け」の音声指令文に基づく動作指令情報Ｄ３の変換は、上述した図１１（Ａ）及び（Ｂ）と対応する図１４（Ａ）及び（Ｂ）に示す通りである。

この「もうちょっと」という音声指令語について、音声指令解析部７１は、図１４（Ｃ）に示すように、「SPTag_LittleMore」という音声指令タグに変換する。続いて音声指令解析部７１は、音声指令解析テーブル７３のうち第２の変換テーブル７３Ｂを用いて、かかる音声指令タグ「SPTag_LittleMore」を音声指令パラメータ「SPCom_LittleMore(SPTag_LittleMore)」に変換するようにして音声指令情報Ｄ２を得る。

この後、図１４（Ｄ）に示すように、音声指令情報変換部７２において、音声指令情報Ｄ２が音声指令パラメータのみからなり音声指令コマンドを含んでいないことから、実行履歴情報記憶部７５を用いて、対応する動作指令情報Ｄ３を実行履歴情報として読み出して、当該動作指令情報Ｄ３を構成する音声指令コマンドや他の音声指令パラメータを当該実行履歴情報から補完することにより、動作指令コマンド「MTCom_MoveHeadYaw」と、動作指令パラメータ「MTPrm_Angle(54)」との組み合わせでなる動作指令情報Ｄ３を得ることができる。

その際、上述した図９（Ｂ）において音声指令パラメータ「SPPrm_Angle(SPTag_ Right (10,5))」には、相対値「relative」であること、デフォルト値が「10」及び変化幅が「５」と設定されており、これが実行履歴情報として得られることから、当該デフォルト値に変化幅を加算した値「15」が動作指令パラメータ「MTPrm_Angle(SPPrm_Angle(SPTag_
Right (15))のサブ情報として得られる。

この結果、上述した図１０に示すように動作指令パラメータに設定された最大値が「360」であることから、音声指令パラメータ「SPPrm_Angle(SPTag_Right (15))」のサブ情報である「15」から、動作指令パラメータ「MTPrm_Angle(54)」のサブ情報は、「54（＝15×360／100）」ように、人間らしさの表現及び安全性の確保を考慮して設定された最大値を考慮した数値に自動的に調整することができる。

このようにユーザが「右を向け」という指令音声を発した後で、さらに「もうちょっと」という指令音声を発したときでも、当該「右を向け」に応じた動作指令情報Ｄ３を「もうちょっと」という表現に対応した所望のルールに基づいて動作指令パラメータを調整することにより、当該動作指令情報Ｄ３に反映させることができる。

（４）音声動作指令処理手順
上述の音声動作指令機能に関するメイン制御部５０の処理は、図１５に示す音声動作指令処理手順ＲＴ１として統括的に表され、メイン制御部５０は、当該処理手順ＲＴ１をステップＳＰ０から開始することにより、ユーザが発した指令音声を、その指令音声の種類やロボット１に対する設定内容を反映させながら、動作指令情報Ｄ３に変換することができる。

メイン制御部５０は、ステップＳＰ１において、マイクロホン６１を介して得られるユーザの発話内容から指令音声に対応する音声指令文を抽出した後、ステップＳＰ２に進んで当該音声指令文を構成する複数の音声指令語が、所定のテーブル変換処理によって音声指令タグ列に変換可能か否かを判断する。

このステップＳＰ２において肯定結果が得られると、メイン制御部５０は、音声指令文を構成する各音声指令語を音声指令タグ列にテーブル変換した後、ステップＳＰ４に進む一方、否定結果が得られると、そのままステップＳＰ１４に進んで当該音声動作指令処理手順ＲＴ１を終了する。

続いてステップＳＰ４において、メイン制御部５０は、音声指令タグ列を所定のテーブル変換処理によって、順次当該各音声指令タグに対応する音声指令コマンド又は音声指令パラメータに変換可能か否かを判断する。

このステップＳＰ４において肯定結果が得られると、メイン制御部５０は、ステップＳＰ５に進んで、音声指令タグ列を音声指令情報Ｄ２にテーブル変換した後、ステップＳＰ６に進む一方、否定結果が得られると、そのままステップＳＰ１４に進んで当該音声指令動作処理手順ＲＴ１を終了する。

このステップＳＰ６において、メイン制御部５０は、音声指令情報Ｄ２に基づいて、当該音声指令情報Ｄ２に音声指令コマンドが含まれているか否かを判断することにより、実行履歴情報を必要としているか否かを判断する。

このステップＳＰ６において否定結果が得られると、メイン制御部５０は、音声指令情報Ｄ２を動作指令情報Ｄ３に変換可能か否かを判断し、肯定結果が得られたときにはステップＳＰ８に進む一方、否定結果が得られたときにはそのままステップＳＰ１４に進んで当該音声動作指令処理手順ＲＴ１を終了する。

続いてステップＳＰ８において、メイン制御部５０は、音声指令情報Ｄ２を動作指令情報Ｄ３に変換した後、ステップＳＰ１０に進んで、当該動作指令情報Ｄ３に複数の動作指令コマンドが存在するか否かを判断する。

このステップＳＰ１０において否定結果が得られると、このことは動作指令情報Ｄ３に基づく動作指令コマンドに複数の候補が存在することを表しており、このときメイン制御部５０は、ステップＳＰ１１に進んで、予め設定されている優先度に基づいて１つの動作指令コマンドに基づく動作指令情報Ｄ３を選択した後、ステップＳＰ１２に進む。

一方ステップＳＰ１０において肯定結果が得られると、このことは動作指令情報Ｄ３に基づく動作指令コマンドが単一であることを表しており、メイン制御部５０は、ステップＳＰ１２に進む。

このステップＳＰ１２において、メイン制御部５０は、必要に応じて動作指令情報Ｄ３に基づく動作指令パラメータを調整した後、ステップＳＰ１３に進んで、当該動作指令情報Ｄ３を対応するサブ制御部５３Ａ〜５３Ｄ（図４）に供給することにより、当該サブ制御部５３Ａ〜５３Ｄの制御の下にロボット１に適切な行動を発現させた後、ステップＳＰ１４に進んで、当該音声動作指令処理手順ＲＴ１を終了する。

これに対して上述したステップＳＰ６において肯定結果が得られると、このことは音声指令情報Ｄ２に音声指令コマンドが含まれていないことを表しており、このときメイン制御部５０は、実行履歴情報を必要としていると判断してステップＳＰ１５に進む。

このステップＳＰ１５において、メイン制御部５０は、実行履歴情報が対応する動作指令情報Ｄ３を補完することができるか否かを判断し、肯定結果が得られた場合にはステップＳＰ１６に進んで、音声指令情報Ｄ２を実行履歴情報を用いた補完を行うようにして動作指令情報Ｄ３に変換した後、ステップＳＰ１３に進む。これに対してステップＳＰ１５において否定結果が得られると、メイン制御部５０は、ステップＳＰ１４に進んで、当該音声動作指令処理手順ＲＴ１を終了する。

（５）本実施の形態による動作及び効果
以上の構成において、ロボット１では、メイン制御部５０の制御の下に音声動作指令機能を実行することにより、ユーザが発した指令音声を表す音声指令文を音声指令タグ列に変換して、当該音声指令タグ列を音声指令コマンド及び音声指令パラメータに分類した後、当該音声指令コマンド及び音声指令パラメータの組み合わせの一致性に応じて判断した動作指令コマンド及び動作指令パラメータに基づいて、当該ロボット１が実行可能な動作を絞り込んで決定する。

従って、このロボット１は、ユーザからの音声指令が複雑な動作を要求する内容であっても、当該音声指令に応じた単純な動作以上の複雑な動作を発展させて実行することができる。

これに加えてロボット１では、メイン制御部５０により音声動作指令機能を実行する際に、ロボット１の動作に対応する関節機構の可動範囲に最大値を設定しておき、音声指令に応じた動作を決定する際に、当該最大値を考慮して調整するようにしたことより、ロボット１の動作に人間らしい表現及び安全性の確保を反映させることができる。

さらにこのロボット１では、当該ロボット１の動作に複数の候補が存在する場合には、予め設定しておいた優先度に従って最優先の動作を選択することにより、ユーザが好ましいと思う方の動作をロボット１に発現させることができる。

さらにこのロボット１では、ユーザが指令音声を発した後に続いて当該指令音声と同じ動作内容で歩数や距離、回数等の度合いを表す指令音声を発した場合には、先の指令音声に応じた動作指令情報Ｄ３を実行履歴情報として保存しておき、当該実行履歴情報を用いて同じ動作のまま、次の指令音声に含まれる各種の度合いを反映させることができる。

この場合このロボット１では、ユーザが先の指令音声に続いて発した指令音声が不明確な度合いを表している場合には、当該度合いの表現に対応した所望のルールに基づいて動作に反映させる度合いを調整するようにしたことにより、より一層ユーザが意図した動作を発現することができる。

またユーザの発話内容から指令音声を表す音声指令文を抽出するようにしたことにより、予め設定された特定の指令語の集まりに限らず自由な発話内容で済むことから、ユーザは従来のような特定の指令語群を予め覚えておく手間がかからないといった利便性を得ることができる。

以上の構成によれば、ロボット１が、ユーザが発した指令音声を表す音声指令文を音声指令タグ列に変換して、当該音声指令タグ列を音声指令コマンド及び音声指令パラメータに分類した後、当該音声指令コマンド及び音声指令パラメータの組み合わせの一致性に応じて判断した動作指令コマンド及び動作指令パラメータに基づいて、当該ロボット１が実行可能な動作を絞り込んで決定するようにしたことにより、ユーザからの音声指令が複雑な動作を要求する内容であっても、当該音声指令に応じた単純な動作以上の複雑な動作を発展させて実行することができ、ユーザがロボット１に対する親近感を向上させることができ、かくして一段とエンターテインメント性の高いロボット１を実現できる。

（６）他の実施の形態
なお上述の実施の形態においては、本発明を図１〜図５のように構成されたヒューマノイド型のロボット１に適用するようにした場合について述べたが、本発明はこれに限らず、この他種々の構成の装置に広く適用することができる。

また上述の実施の形態においては、ユーザの発話から指令音声を認識して、当該指令音声に応じた単数又は複数の音声指令語に変換する音声認識手段として、図６に示すメイン制御部５０の機能ブロックのうちの音声指令文生成部７０を適用するようにした場合について述べたが、本発明はこれに限らず、この他種々の構成のものに広く適用するようにしても良い。

さらに上述の実施の形態においては、音声指令文生成部（音声認識手段）７０により変換された各音声指令語を解析して、当該解析結果に基づいて、ロボット１の基本動作ごとに設定された指令内容を表す音声指令コマンド及び当該音声指令コマンドに属する音声指令パラメータを生成する音声指令解析手段として、図６に示すメイン制御部５０の機能ブロックのうちの音声指令文解析部７１及び音声指令解析テーブル７３を適用するようにした場合について述べたが、本発明はこれに限らず、テーブル変換処理以外にも種々の構成からなる音声指令解析手段に広く適用するようにしても良い。

この場合、本実施の形態では、音声指令解析テーブル７３を第１及び第２の変換テーブル７３Ａ、７３Ｂの２段階に分けた場合について述べたが、このようなテーブル変換処理を１段階でも３段階以上でも自由に設定するようにしても良い。

さらに上述の実施の形態においては、音声指令文解析部７１及び音声指令解析テーブル７３（音声指令解析手段）により生成された音声指令コマンド及び音声指令パラメータの組み合わせに基づいて、ロボット１の基本動作を表す動作指令コマンド及び動作指令パラメータの組み合わせを決定する動作指令決定手段として、図６に示すメイン制御部５０の機能ブロックのうちの音声指令情報変換部７２及び音声動作指令対応テーブル７４を適用するようにした場合について述べたが、本発明はこれに限らず、テーブル変換処理以外にも種々の構成からなる動作指令決定手段に広く適用するようにしても良い。

さらに上述の実施の形態においては、音声指令情報変換部７２及び音声動作指令対応テーブル７４（動作指令決定手段）により決定された動作指令コマンド及び動作指令パラメータの組み合わせに応じた動作を発現させる動作発現手段として、図４に示すサブ制御部５３Ａ〜５３Ｄを適用するようにした場合について述べたが、本発明はこれに限らず、ロボット１の動作を発現させることができれば、この他種々の構成からなる動作発現手段に広く適用するようにしても良い。

さらに上述の実施の形態においては、音声指令文解析部７１及び音声指令解析テーブル７３（音声指令解析手段）は、ロボット１の動作に対応する関節機構の可動範囲に基づいて、音声指令パラメータに最大値を設定しておき、音声指令情報変換部７２及び音声動作指令対応テーブル７４（動作指令決定手段）は、動作指令パラメータを音声指令パラメータの最大値に基づいて調整するようにしたが、要は、ロボット１が音声指令に応じた動作を決定する際に、ロボット１の動作に人間らしい表現及び安全性の確保を反映させることができれば、最大値以外にも種々の値を任意に設定するようにしても良い。

さらに上述の実施の形態においては、音声指令文解析部７１及び音声指令解析テーブル７３（音声指令解析手段）は、各音声指令コマンドに優先度を設定しておき、音声指令情報変換部７２及び音声動作指令対応テーブル７４（動作指令決定手段）は、音声指令解析手段から複数の音声指令コマンドが与えられたとき、当該各音声指令コマンドのうち優先度の高い音声指令コマンドを選択するようにしたが、要は、ロボット１の動作に複数の候補が存在する場合にユーザが好ましいと思う方の動作をロボット１に発現させることができれば、この他種々の方法を適用するようにしても良い。

さらに上述の実施の形態においては、音声指令情報変換部７２及び音声動作指令対応テーブル７４（動作指令決定手段）により決定された動作指令コマンド及び動作指令パラメータの組み合わせを実行履歴情報（履歴情報）として記憶する履歴情報記憶手段として、図６に示すメイン制御部５０の機能ブロックのうちの実行履歴情報記憶部７５を適用し、音声指令情報変換部７２及び音声動作指令対応テーブル７４（動作指令決定手段）は、音声指令文解析部７１及び音声指令解析テーブル７３（音声指令解析手段）から音声指令パラメータのみが得られた場合、実行履歴情報記憶部（履歴情報記憶手段）７５から音声指令パラメータに対応する実行履歴情報（履歴情報）を読み出して、音声指令パラメータに応じて決定した動作指令パラメータ以外を当該実行履歴情報（履歴情報）によって補完するようにした場合について述べたが、本発明はこれに限らず、要は、ユーザが指令音声を発した後に続いて当該指令音声と同じ動作内容で歩数や距離、回数等の度合いを表す指令音声を発した場合に、同じ動作のまま次の指令音声に含まれる各種の度合いを反映させることができれば、この他種々の方法を適用するようにしても良い。

さらに上述の実施の形態においては、音声指令文解析部７１及び音声指令解析テーブル７３（音声指令解析手段）は、ロボット１の動作に対応する関節機構の可動範囲に基づいて、音声指令パラメータに最大値を設定しておき、音声指令情報変換部７２及び音声動作指令対応テーブル７４（動作指令決定手段）は、履歴情報によって動作指令パラメータを補完する際に、当該動作指令パラメータを音声指令パラメータの最大値に基づいて調整するようにしたが、要は、ユーザが先の指令音声に続いて発した指令音声が不明確な度合いを表している場合には、当該度合いの表現に対応した所望のルールに基づいて動作に反映させる度合いを調整することができれば、この他種々の方法を適用するようにしても良い。

ロボット装置及びその制御方法において、アミューズメントロボットや介護ロボットなどに適用することができる。

本実施の形態によるロボットの外観構成を示す斜視図である。本実施の形態によるロボットの外観構成を示す斜視図である。本実施の形態によるロボットの内部構成を示す概念図である。本実施の形態によるロボットの内部構成を示すブロック図である。本実施の形態によるロボットの内部構成を示すブロック図である。音声動作指令機能に関するメイン制御部の処理の説明に供する概念図である。音声指令解析テーブル（第１の変換テーブル）の説明に供する図表である。音声指令文から動作指令情報への変換処理の遷移状態を表す概念図である。音声指令解析テーブル（第２の変換テーブル）の説明に供する図表である。音声動作指令対応テーブルの説明に供する図表である。音声指令文から動作指令情報への変換処理の遷移状態を表す概念図である。音声指令文から動作指令情報への変換処理の遷移状態を表す概念図である。音声指令文から動作指令情報への変換処理の遷移状態を表す概念図である。音声指令文から動作指令情報への変換処理の遷移状態を表す概念図である。線的な概念図である。音声動作指令処理手順の説明に供するフローチャートである。

符号の説明

１……ロボット、２……胴体部ユニット、３……首部、４……頭部ユニット、５Ａ、５Ｂ……腕部ユニット、６Ａ、６Ｂ……脚部ユニット、１３……首関節機構部、２０……肩関節機構部、２４……肘関節、３２……足平部ブロック、３６……股関節機構部、３８……膝関節機構部、４１……足首関節機構部、５０……メイン制御部、５３Ａ〜５３Ｄ……サブ制御部、７０……音声指令文生成部、７１……音声指令文解析部、７２……音声指令情報変換部、７３……音声指令解析テーブル、７３Ａ……第１の変換テーブル、７３Ｂ……第２の変換テーブル、７４……音声動作指令対応テーブル、７５……実行履歴情報記憶部、Ａ１〜Ａ１７……アクチュエータ、ＲＴ１……音声動作指令処理手順。

Claims

ユーザの発話から指令音声を認識して、当該指令音声に応じた単数又は複数の音声指令文に変換する音声認識手段と、
上記音声指令文から文節単位で複数の音声指令語を抽出し、抽出した結果の上記音声指令語を音声指令解析第１変換テーブルにより、上記複数の音声指令語に対応して設定された指令内容を表す音声指令タグに変換し、変換された上記音声指令タグを音声指令解析第２変換テーブルによりユーザの音声指令のうちロボットの基本動作に相当する指令内容を表す音声指令タグが対応付けられた音声指令コマンド及びユーザの音声指令のうち上記ロボットの基本動作以外のものに相当する指令内容を表す音声指令タグが対応付けられた音声指令パラメータに分類する音声指令解析手段と、
上記音声指令解析手段により分類された上記音声指令コマンド及び上記音声指令パラメータの組み合わせに基づいて、上記ロボットの動作指令情報となる動作指令コマンド及び動作指令パラメータの組み合わせを決定する動作指令決定手段と、
上記動作指令決定手段により決定された上記動作指令コマンド及び上記動作指令パラメータの組み合わせに応じた動作を発現させる動作発現手段と
を具え、
上記音声指令解析手段は、
上記音声指令コマンドに予め優先度を設定し、
上記動作指令決定手段は、
複数の上記動作指令コマンドが存在する場合、上記音声指令コマンドに設定された上記優先度に従って上記優先度の高い上記音声指令コマンドに対応する上記動作指令コマンドを選択する
ロボット装置。
上記音声指令解析第１変換テーブルは、
上記音声指令文から順次抽出された複数の音声指令語と各音声指令語に対応して設定された上記音声指令タグとの対応関係が記述されており、
上記音声指令解析第２変換テーブルは、
複数の音声指令タグと各音声指令タグに対応する上記音声指令コマンド及び上記音声指令パラメータとの対応関係が記述されている
請求項１に記載のロボット装置。
上記音声指令コマンドは、
同一の基本動作で単数又は複数の上記音声指令タグが対応付けられている
請求項１に記載のロボット装置。
上記音声指令解析手段は、
上記ロボットの動作に対応する関節機構の可動範囲に基づいて、上記音声指令パラメータに最大値を設定しておき、
上記動作指令決定手段は、
上記動作指令パラメータを上記音声指令パラメータの上記最大値に基づいて調整する
請求項１に記載のロボット装置。
上記動作指令決定手段により決定された上記動作指令コマンド及び上記動作指令パラメータの組み合わせを履歴情報として記憶する履歴情報記憶手段
を具え、
上記動作指令決定手段は、
上記音声指令解析手段から上記音声指令パラメータのみが得られた場合、上記履歴情報記憶手段から上記音声指令パラメータに対応する上記履歴情報を読み出して、上記音声指令パラメータに応じて決定した上記動作指令パラメータ以外を当該履歴情報によって補完する
請求項１に記載のロボット装置。
上記音声指令解析手段は、
上記ロボットの動作に対応する関節機構の可動範囲に基づいて、上記音声指令パラメータに最大値を設定しておき、
上記動作指令決定手段は、
上記履歴情報によって上記動作指令パラメータを補完する際に、当該動作指令パラメータを上記音声指令パラメータの上記最大値に基づいて調整する
請求項５に記載のロボット装置。
音声認識手段により、ユーザの発話から指令音声を認識して、当該指令音声に応じた単数又は複数の音声指令文に変換する音声認識ステップと、
音声指令解析手段により、上記音声指令文から文節単位で複数の音声指令語を抽出し、抽出した結果の上記音声指令語を音声指令解析第１変換テーブルにより、上記複数の音声指令語に対応して設定された指令内容を表す音声指令タグに変換し、変換された上記音声指令タグを音声指令解析第２変換テーブルによりユーザの音声指令のうちロボットの基本動作に相当する指令内容を表す音声指令タグが対応付けられた音声指令コマンド及びユーザの音声指令のうち上記ロボットの基本動作以外のものに相当する指令内容を表す音声指令タグが対応付けられた音声指令パラメータに分類する音声指令解析ステップと、
動作指令決定手段により、上記音声指令コマンド及び上記音声指令パラメータの組み合わせに基づいて、上記ロボットの動作指令情報となる動作指令コマンド及び動作指令パラメータの組み合わせを決定する動作指令決定ステップと、
動作発現手段により、上記動作指令コマンド及び上記動作指令パラメータの組み合わせに応じた動作を発現させる動作発現ステップと
を具え、
上記音声指令解析ステップは、
上記音声指令コマンドに予め優先度を設定し、
上記動作指令決定ステップは、
複数の上記動作指令コマンドが存在する場合、上記音声指令コマンドに設定された上記優先度に従って上記優先度の高い上記音声指令コマンドに対応する上記動作指令コマンドを選択する
ロボット装置の制御方法。