JP2003271196A

JP2003271196A - ロボット装置及びその制御方法

Info

Publication number: JP2003271196A
Application number: JP2002074905A
Authority: JP
Inventors: Takashi Toyoda; 崇豊田; Seiichi Aoyanagi; 誠一青柳; Toshimitsu Tsuboi; 利充坪井; Kazuhiro Yamaguchi; 一博山口
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2002-03-18
Filing date: 2002-03-18
Publication date: 2003-09-25
Anticipated expiration: 2022-03-18
Also published as: JP4210897B2

Abstract

(57)【要約】【課題】本発明は、ロボット装置に関し、音声の取得を
一段と高品質に行うことを提案する。【解決手段】互いに近接して配置された第１のマイク群
７２、７３、７４、７５と、互いに近接しないように配
置された第２のマイク群７０、７１と、各マイクから入
力される音声信号に対して所定の音声認識処理を施す音
声認識手段６０とを設けることにより、音源方向を一段
と正確に検出し得ると共にＳ／Ｎ比を向上させることが
でき、従って音声の取得を一段と高品質に行い得るロボ
ット装置を実現できる。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明はロボット装置及びそ
の制御方法に関し、例えば２足歩行型のロボットに適用
して好適なものである。

【０００２】

【従来の技術】近年、人間の外観形状を模ったヒューマ
ノイドタイプのロボットや、一般家庭でペットとして飼
育される犬や猫の外観形状を模った４脚歩行型のペット
ロボット等の各種エンターテインメントロボットが開発
され、商品化されている。

【０００３】そしてこれらのエンターテインメントロボ
ットとしては、ユーザからの指令や周囲の状況などに応
じて自律的に行動し得るようになされたものや、ユーザ
操作に応動してその操作に予め対応付けられた１つの動
作を発現するようになされたものなど、種々のものが存
在している。

【０００４】

【発明が解決しようとする課題】ところでエンターテイ
ンメントロボットにおいては、頭部の所定位置にマイク
が取り付けられ、当該マイクによって音源から発せられ
る音声を集音するようになされたものが開発されている
が、よりエンターテインメント性を向上させるために
は、当該音源の方向を検出することが必要となる。

【０００５】この音源方向を検出する方法としては、種
々の方法が提案及び開発されているが、エンターテイン
メントロボットは多様な動作を行うことから、音源方向
検出方法としていずれか１つの方法を採用しても、多様
な動作に対応して確実に音源方向を検出することは難し
いと考えられる。

【０００６】すなわち、マイクは障害物のない自由空間
に複数個配置することが望ましいが、エンターテインメ
ントロボットに音源方向検出機能を搭載する場合には、
当該エンターテインメントロボットの筐体によってマイ
クの配置位置に制限を受ける。特に当該エンターテイン
メントロボットでは、そのデザインが優先され、マイク
を障害物のない自由空間に配置することが困難である。

【０００７】例えばエンターテインメントロボットにお
いては、「耳」の位置にマイクを配置することが望まし
いが、当該位置は自由空間でなく、頭部の筐体の回折の
影響を強く受けることになり、これでは音源方向を正し
く検出し得ない問題がある。

【０００８】ところで、音源方向検出方法としては、音
源から発せられる音声を複数のマイクによって集音し、
音声が当該各マイクに到達した時間の時間差を検出する
ことにより音源方向を検出する方法が採用されている。

【０００９】この場合、各マイク間の距離は、各マイク
における音声の到達時間差を基に音源方向を検出するこ
ととの関係上、音源から発せられる音声信号の周波数成
分の１周期に相当する１波長の１／２以下の長さである
ことが必要とされる。従って、かかる音源方向検出方法
では、マイク間距離が小さい場合には、当該マイク間距
離が大きい場合に比して、より高い周波数成分の音声信
号を取得することができる。

【００１０】しかしながら、かかる音源方向検出方法で
は、マイク間距離が小さくなると、入力される音声信号
の信号レベルの差も小さくなるため、信号対雑音比（Ｓ
／Ｎ比）が劣化するという問題が生じる。

【００１１】本発明は以上の点を考慮してなされたもの
で、音声の取得を一段と高品質に行い得るロボット装置
及びその制御方法を提案しようとするものである。

【００１２】

【課題を解決するための手段】かかる課題を解決するた
め本発明においては、ロボット装置において、互いに近
接して配置された第１のマイク群と、互いに近接しない
ように配置された第２のマイク群と、各マイクから入力
される音声信号に対して所定の音声認識処理を施す音声
認識手段とを設けるようにした。この結果、音源方向を
一段と正確に検出し得ると共にＳ／Ｎ比を向上させるこ
とができる。

【００１３】また本発明においては、ロボット装置の制
御方法において、互いに近接して配置された第１のマイ
ク群と、互いに近接しないように配置された第２のマイ
ク群とからそれぞれ入力される音声信号に対して所定の
音声認識処理を施すようにした。この結果、音源方向を
一段と正確に検出し得ると共にＳ／Ｎ比を向上させるこ
とができる。

【００１４】

【発明の実施の形態】以下図面について、本発明の一実
施の形態を詳述する。

【００１５】（１）本実施の形態によるロボットの構成（１−１）ロボットの構成図１及び図２において、１は全体として本実施の形態に
よる２足歩行型のロボットを示し、胴体部ユニット２の
上部に頭部ユニット３が配設されると共に、当該胴体部
ユニット２の上部左右にそれぞれ同じ構成の腕部ユニッ
ト４Ａ、４Ｂがそれぞれ配設され、かつ胴体部ユニット
２の下部左右にそれぞれ同じ構成の脚部ユニット５Ａ、
５Ｂがそれぞれ所定位置に取り付けられることにより構
成されている。

【００１６】胴体部ユニット２においては、体幹上部を
形成するフレーム１０及び体幹下部を形成する腰ベース
１１が腰関節機構１２を介して連結することにより構成
されており、体幹下部の腰ベース１１に固定された腰関
節機構１２の各アクチュエータＡ1、Ａ2をそれぞれ駆動
することによって、体幹上部を図３に示す直交するロー
ル軸１３及びピッチ軸１４の回りにそれぞれ独立に回転
させることができるようになされている。

【００１７】また頭部ユニット３は、フレーム１０の上
端に固定された肩ベース１５の上面中央部に首関節機構
１６を介して取り付けられており、当該首関節機構１６
の各アクチュエータＡ3、Ａ4をそれぞれ駆動することに
よって、図３に示す直交するピッチ軸１７及びヨー軸１
８の回りにそれぞれ独立に回転させることができるよう
になされている。

【００１８】さらに各腕部ユニット４Ａ、４Ｂは、それ
ぞれ肩関節機構１９を介して肩ベース１５の左右に取り
付けられており、対応する肩関節機構１９の各アクチュ
エータＡ5、Ａ6をそれぞれ駆動することによって図３に
示す直交するピッチ軸２０及びロール軸２１の回りにそ
れぞれ独立に回転させることができるようになされてい
る。

【００１９】この場合、各腕部ユニット４Ａ、４Ｂは、
それぞれ上腕部を形成するアクチュエータＡ7の出力軸
に肘関節機構２２を介して前腕部を形成するアクチュエ
ータＡ8が連結され、当該前腕部の先端に手部２３が取
り付けられることにより構成されている。

【００２０】そして各腕部ユニット４Ａ、４Ｂでは、ア
クチュエータＡ7を駆動することによって前腕部を図３
に示すヨー軸２４の回りに回転させ、アクチュエータＡ
８を駆動することによって前腕部を図３に示すピッチ軸
２５の回りにそれぞれ回転させることができるようにな
されている。

【００２１】これに対して各脚部ユニット５Ａ、５Ｂに
おいては、それぞれ股関節機構２６を介して体幹下部の
腰ベース１１にそれぞれ取り付けられており、それぞれ
対応する股関節機構２６の各アクチュエータをＡ９〜Ａ
１１それぞれ駆動することによって、図３に示す互いに
直交するヨー軸２７、ロール軸２８及びピッチ軸２９の
回りにそれぞれ独立に回転させることができるようにな
されている。

【００２２】この場合各脚部ユニット５Ａ、５Ｂは、そ
れぞれ大腿部を形成するフレーム３０の下端に膝関節機
構３１を介して下腿部を形成するフレーム３２が連結さ
れると共に、当該フレーム３２の下端に足首関節機構３
３を介して足部３４が連結されることにより構成されて
いる。

【００２３】これにより各脚部ユニット５Ａ、５Ｂにお
いては、膝関節機構３１を形成するアクチュエータＡ１
２を駆動することによって、下腿部を図３に示すピッチ
軸３５の回りに回転させることができ、また足首関節機
構３３のアクチュエータＡ１３、Ａ１４をそれぞれ駆動
することによって、足部３４を図３に示す直交するピッ
チ軸３６及びロール軸３７の回りにそれぞれ独立に回転
させることができるようになされている

【００２４】一方、胴体部ユニット２の体幹下部を形成
する腰ベース１１の背面側には、図４に示すように、当
該ロボット１全体の動作制御を司るメイン制御部４０
と、電源回路及び通信回路などの周辺回路４１と、バッ
テリ４５（図５）となどがボックスに収納されてなる制
御ユニット４２が配設されている。

【００２５】そしてこの制御ユニット４２は、各構成ユ
ニット（胴体部ユニット２、頭部ユニット３、各腕部ユ
ニット４Ａ、４Ｂ及び各脚部ユニット５Ａ、５Ｂ）内に
それぞれ配設された各サブ制御部４３Ａ〜４３Ｄと接続
されており、これらサブ制御部４３Ａ〜４３Ｄに対して
必要な電源電圧を供給したり、これらサブ制御部４３Ａ
〜４３Ｄと通信を行なったりすることができるようにな
されている。

【００２６】また各サブ制御部４３Ａ〜４３Ｄは、それ
ぞれ対応する構成ユニット内の各アクチュエータＡ1〜
Ａ14と接続されており、当該構成ユニット内の各アクチ
ュエータＡ1〜Ａ14をメイン制御部４０から与えられる
各種制御コマンドに基づいて指定された状態に駆動し得
るようになされている。

【００２７】さらに頭部ユニット３には、図５に示すよ
うに、このロボット１の「目」として機能するＣＣＤ
（Charge Coupled Device ）カメラ５０、「耳」とし
て機能するマイク部５１及びタッチセンサ５２などから
なる外部センサ部５３と、「口」として機能するスピー
カ５４となどがそれぞれ所定位置に配設され、制御ユニ
ット４２内には、バッテリセンサ５５及び加速度センサ
５６などからなる内部センサ部５７が配設されている。

【００２８】そして外部センサ部５３のＣＣＤカメラ５
０は、周囲の状況を撮像し、得られた画像信号Ｓ１Ａを
メイン制御部に送出する一方、マイク部５１は、ユーザ
から音声入力として与えられる「歩け」、「伏せ」又は
「ボールを追いかけろ」等の各種命令音声を集音し、か
くして得られた音声信号Ｓ１Ｂをメイン制御部４０に送
出するようになされている。

【００２９】またタッチセンサ５２は、図１及び図２に
おいて明らかなように頭部ユニット３の上部に設けられ
ており、ユーザからの「撫でる」や「叩く」といった物
理的な働きかけにより受けた圧力を検出し、検出結果を
圧力検出信号Ｓ１Ｃとしてメイン制御部４０に送出す
る。

【００３０】さらに内部センサ部５７のバッテリセンサ
５５は、バッテリ４５のエネルギ残量を所定周期で検出
し、検出結果をバッテリ残量検出信号Ｓ２Ａとしてメイ
ン制御部４０に送出する一方、加速度センサ５６は、３
軸方向（ｘ軸、ｙ軸及びｚ軸）の加速度を所定周期で検
出し、検出結果を加速度検出信号Ｓ２Ｂとしてメイン制
御部４０に送出する。

【００３１】メイン制御部部４０は、外部センサ部５３
のＣＣＤカメラ５０、マイク部５１及びタッチセンサ５
２等からそれぞれ供給される画像信号Ｓ１Ａ、音声信号
Ｓ１Ｂ及び圧力検出信号Ｓ１Ｃ等（以下、これらをまと
めて外部センサ信号Ｓ１と呼ぶ）と、内部センサ部５７
のバッテリセンサ５５及び加速度センサ等からそれぞれ
供給されるバッテリ残量検出信号Ｓ２Ａ及び加速度検出
信号Ｓ２Ｂ等（以下、これらをまとめて内部センサ信号
Ｓ２と呼ぶ）に基づいて、ロボット１の周囲及び内部の
状況や、ユーザからの指令、ユーザからの働きかけの有
無などを判断する。

【００３２】そしてメイン制御部４０は、この判断結果
と、予め内部メモリ４０Ａに格納されている制御プログ
ラムと、そのとき装填されている外部メモリ５８に格納
されている各種制御パラメータとに基づいて続く行動を
決定し、決定結果に基づく制御コマンダを対応するサブ
制御部４３Ａ〜４３Ｄに送出する。この結果、この制御
コマンダに基づき、そのサブ制御部４３Ａ〜４３Ｄの制
御のもとに、対応するアクチュエータＡ1〜Ａ14が駆動
され、かくして頭部ユニット３を上下左右に揺動させた
り、腕部ユニット４Ａ、４Ｂを上にあげたり、歩行する
などの行動がロボットにより発現されることとなる。

【００３３】またこの際メイン制御部４０は、必要に応
じて所定の音声信号Ｓ３をスピーカ５４に与えることに
より当該音声信号Ｓ３に基づく音声を外部に出力させた
り、外見上の「目」として機能する頭部ユニット３の所
定位置に設けられたＬＥＤに駆動信号を出力することに
よりこれを点滅させる。

【００３４】このようにしてこのロボット１において
は、周囲及び内部の状況や、ユーザからの指令及び働き
かけの有無などに基づいて自律的に行動することができ
るようになされている。

【００３５】（１−２）メイン制御部の処理ここでこのようなロボット１の行動生成に関するメイン
制御部４０の処理について説明する。

【００３６】図６に示すように、ロボット１の行動生成
に関するメイン制御部４０の処理内容を機能的に分類す
ると、外部及び内部の状態を認識する状態認識部６０
と、状態認識部６０の認識結果等に基づいて感情及び本
能の状態を決定する感情・本能モデル６１と、状態認識
部６０の認識結果及び感情・本能モデル６１において決
定された感情・本能の状態に基づいて次の行動を決定す
る行動決定部６２と、行動決定部６２の決定結果に基づ
いて実際にロボット１に行動を発現させる行動生成部６
３とに分けることができる。以下、これら状態認識部６
０、感情・本能モデル部６１、行動決定部６２及び行動
生成部６３について説明する。

【００３７】（１−２−１）状態認識部６０の処理状態認識部６０は、外部センサ部５３から与えられる外
部センサ信号Ｓ１及び内部センサ部５７から与えられる
内部センサ信号Ｓ２に基づいて特定の状態を認識し、認
識結果を状態認識情報Ｄ１として感情・本能モデル６１
及び行動決定部６２に通知する。

【００３８】具体的に情報認識部６０は、外部センサ部
５３のＣＣＤカメラ５０から与えられる画像信号Ｓ１Ａ
を常時監視し、当該画像信号Ｓ１Ａに基づく画像内に例
えば「赤い丸いもの」や「進行方向に位置する物体」を
検出したときには「ボールがある」、「障害物がある」
と認識して、当該認識結果を感情・本能モデル６１及び
行動決定部６２に通知する。

【００３９】また状態認識部６０は、マイク部５１から
与えられる音声信号Ｓ１Ｂを常時監視し、ＨＭＭ（Hidd
en Markov Model ）法などの音声認識手法により「歩
け」、「伏せ」、「ボールを追いかけろ」等の各種音声
を認識したときには、これを感情・本能モデル６１及び
行動決定部６２に通知する。

【００４０】さらに状態認識部６０は、タッチセンサ５
２から与えられる圧力検出信号Ｓ１Ｃを常時監視し、当
該圧力検出信号Ｓ１Ｃに基づいて所定の閾値以上のかつ
短時間（例えば２秒未満）の圧力を検出したときには
「叩かれた（叱られた）」と認識し、所定の閾値未満の
かつ長時間（例えば２秒以上）の圧力を検出したときに
は「撫でられた（誉められた）」と認識し、認識結果を
感情・本能モデル部６１及び行動決定部６２に通知す
る。

【００４１】さらに状態認識部６０は、内部センサ部５
７の加速度センサ５６から与えられる加速度検出信号Ｓ
２Ｂを常時監視し、当該加速度検出信号Ｓ２Ｂに基づい
て転倒等を検出したときには、これを感情・本能モデル
部６１及び行動決定部６２に通知する。

【００４２】（１−２−２）感情・本能モデル部６１の
処理感情・本能モデル部６１は、「喜び」、「悲しみ」、
「驚き」、「恐怖」、「嫌悪」及び怒り」の合計６つの
情動について、これら情動ごとの強さを表すパラメータ
を保持している。そして感情・本能モデル部６１は、こ
れら各情動のパラメータ値を、それぞれ状態認識部６０
から状態認識情報Ｄ１として与えられる「誉められ
た」、「叱られた」などの特定の認識結果に基づいて順
次変更する。

【００４３】具体的に感情・本能モデル部６１は、状態
認識情報Ｄ１に基づき得られる認識結果及び行動決定部
６２から行動決定情報Ｄ２として通知されるロボット１
の直前の出力行動がその情動に対して作用する度合い
（予め設定されている）と、他の情動から受ける抑制及
び刺激の度合いと、経過時間となどに基づいて所定の演
算式により算出されるその情動の変化量をΔＥ〔ｔ〕、
現在のその情動のパラメータ値をＥ〔ｔ〕、認識結果等
に応じてその情動を変化させる割合を表す係数をｋ_ｅと
して、所定周期で次式

【００４４】

【数１】

【００４５】を用いて次の周期におけるその情動のパラ
メータ値Ｅ〔ｔ＋１〕を算出する。

【００４６】そして感情・本能モデル部６１は、この演
算結果を現在のその情動のパラメータ値Ｅ〔ｔ〕と置き
換えるようにしてその情動のパラメータ値を更新する。
なお各認識結果や各出力行動に対してどの情動のパラメ
ータ値を更新するかは予め定められており、例えば「叩
かれた」といった認識結果が与えられた場合には「怒
り」の情動のパラメータ値が上がり、「撫でられた」と
いった認識結果が与えられた場合には、「喜び」の情動
のパラメータ値が上がる。

【００４７】これと同様にして、感情・本能モデル部６
１は、「愛情欲」、「探索欲」、「運動欲」、「充電
欲」及び「睡眠欲」の互いに独立した５つの欲求につい
て、これら欲求ごとにその欲求の強さを表すパラメータ
を保持している。そして感情・本能モデル部６１は、こ
れら各欲求のパラメータ値を、それぞれ状態認識部６０
からの認識結果や経過時間等に基づいて順次更新する。

【００４８】体的には感情・本能モデル部６１は、「愛
情欲」、「探索欲」及び「運動欲」については、ロボッ
ト１の出力行動、経過時間及び認識結果などに基づいて
所定の演算式により算出されるその欲求の変化量をΔＩ
〔ｋ〕、現在のその欲求のパラメータ値をＩ〔ｋ〕、そ
の欲求の感度を表す係数をｋｉとして、所定周期で次式

【００４９】

【数２】

【００５０】を用いて次の周期におけるその欲求のパラ
メータ値Ｉ〔ｋ＋１〕を算出し、この演算結果を現在の
その欲求のパラメータ値Ｉ〔ｋ〕と置き換えるようにし
てその欲求のパラメータ値を更新する。この場合、出力
行動や認識結果等に対してどの欲求のパラメータ値を変
化させるかは予め定められており、例えば行動決定部６
１から何らかの行動を行ったとの通知があったときは
「運動欲」のパラメータ値が下がることとなる。

【００５１】また感情・本能モデル部６１は、「食欲」
については、状態認識部６０を介して与えられるバッテ
リ残量検出信号Ｓ２Ａに基づいて、バッテリ残量をＢＬ
として所定周期で次式

【００５２】

【数３】

【００５３】により「食欲」のパラメータ値Ｉ〔ｋ＋
１〕を算出し、この演算結果を現在の食欲のパラメータ
値Ｉ〔ｋ〕を置き換えるようにして当該「食欲」のパラ
メータ値を更新する。

【００５４】なお本実施の形態においては、各情動及び
各欲求のパラメータ値がそれぞれ０から100 までの範囲
で変動するように規制されており、また係数ｋｅ、ｋ
ｉの値も各情動及び各欲求ごとにそれぞれ個別に設定さ
れている。

【００５５】因みに、上述のように各認識結果や各出力
行動に対してどの情動又は欲求のパラメータ値をどの程
度増減させるかは予め設定されているが、これもその後
のユーザからの働きかけや、自己の行動結果等に応じて
順次変更される。

【００５６】実際上、感情・本能モデル部６１は、例え
ば状態認識部６０から当該ロボット１が好きな色やボー
ル等のアイテム等を見ているとの状態認識情報Ｄ１が与
えられると、初期時には「喜び」の情動のパラメータ値
を増加させるように更新するが、このときに「叩かれ
た」という状態認識情報Ｄ１が与えられた場合には、
「喜び」の係数Ｋｅを下げると共に、「怒り」の係数Ｋ
ｅを上げるようにこれらの係数値を更新する。

【００５７】この結果、ロボット１が好きな色やアイテ
ム等を見ているときに「叩く」という働きかけが何度も
行われると、その色やアイテム等に対する「喜び」の係
数Ｋｅが徐々に小さくなると共に、「怒り」の係数Ｋ
ｅが徐々に大きくなり、やがてその色やアイテム等を見
ると「怒り」のパラメータ値が大きくなるように更新さ
れることにより、後述のようにロボット１が怒ったよう
な行動を発現するようになる。

【００５８】また感情・本能モデル部６１は、状態認識
部６０から『大きなボールがある』ということを意味す
る「ボール（大）」という状態認識情報Ｄ１が与えられ
た後、行動決定部６２から『ボールをキックする』とい
うことを意味する「キック」という行動決定情報Ｄ２が
与えられ、さらにこの後状態認識部６０から『小さなボ
ールがある』ということを意味する「ボール（小）」と
いう状態認識情報Ｄ１が与えられた場合には、『ボール
を蹴るのに成功した』と判断し、その事象と関連する
『ボール』というアイテムに対する「喜び」の係数Ｋｅ
と、「運動欲」の係数Ｋｉとをそれぞれ上げるようにこ
れらの係数値を更新する。

【００５９】この結果、ロボット１がボールを蹴る動作
を何度も成功すると、『ボール』に対する「喜び」の係
数Ｋｅと「運動欲」の係数Ｋｉとがそれぞれ徐々に大き
くなり、やがてボールを見ると「喜び」及び「運動欲」
のパラメータ値が徐々に大きくなるように更新されるこ
とにより、後述のようにロボット１がボールを見ると喜
んだ行動を発現したり、ボール遊びをよくするようにな
る。

【００６０】これとは逆に、感情・本能モデル部６１
は、状態認識部６０から「ボール（大）」という状態認
識部Ｄ１が与えられた後、行動決定部６２から「キッ
ク」という行動決定情報Ｄ２が与えられ、さらにこの後
状態認識部６０から「ボール（大）」という状態認識情
報Ｄ１が与えられた場合には、『ボールを蹴るのに失敗
した』と判断し、『ボール』に対する「喜び」の係数Ｋ
ｅと、「運動欲」の係数Ｋｉとをそれぞれ下げるように
これらの係数値を更新する。

【００６１】この結果、ロボット１がボールを蹴る動作
を何度も失敗すると、『ボール』に対する「喜び」の係
数ｋｅと「運動欲」の係数Ｋｉとがそれぞれ徐々に小さ
くなり、やがてボールを見ると「喜び」及び「運動欲」
のパラメータ値が小さくなるように更新されることによ
り、後述のようにロボット１がボールを見ても無反応と
なったり、ボール遊びをあまりしないようになる。

【００６２】このようにして、このロボット１において
は、ユーザからの働きかけや、自己の行動結果等に応じ
て性格を変化させ得るようになされている。

【００６３】（１−２−３）行動決定部６２の処理一方、行動決定部６２は、状態認識部６０から状態認識
情報Ｄ１が与えられたときや、現在の行動に移ってから
一定時間経過したとき、感情・本能モデル部６１におけ
るいずれかの情動又は本能のパラメータ値が閾値を超え
たときなどに、内部メモリ４０Ａに格納されている制御
プログラム及び外部メモリ５８に格納されている制御パ
ラメータに基づいて次の行動を決定する。

【００６４】具体的に行動決定部６２は、次の行動を決
定する手法として、図７に示すように、状態をノードＮ
ＯＤＥ0〜ＮＯＤＥｎとして表現し、１つのノードＮＯ
ＤＥ0〜ＮＯＤＥｎから次のどのノードＮＯＤＥ0〜ＮＯ
ＤＥｎに遷移するかを、自ノードＮＯＤＥ0〜ＮＯＤＥ
ｎにおいて完結し又は各ノードＮＯＤＥ0〜ＮＯＤＥｎ
間を接続するアークＡＲＣ0〜ＡＲＣｎに対してそれぞ
れ設定された遷移確率Ｐ0〜Ｐｎに基づいて確率的に決
定する確率オートマトンと呼ばれるアルゴリズムを用い
る。

【００６５】この場合この確率オートマトンにおける各
ノードＮＯＤＥ0〜ＮＯＤＥｎ間の接続関係や、各アー
クＡＲＣ0〜ＡＲＣｎに対する遷移確率Ｐ0〜Ｐｎ及び各
アークＡＲＣ0〜ＡＲＣｎにそれぞれ対応付けられた動
作が制御パラメータ（行動モデル）として外部メモリ５
８に格納されている。

【００６６】そして行動決定部６２は、例えば状態認識
部６０から状態認識情報Ｄ１が与えられたときや、現在
のノード（ＮＯＤＥ0）に移ってから一定時間が経過し
たとき、感情・本能モデル部６１におけるいずれかの情
動又は本能のパラメータ値が閾値を超えたときなどに、
かかる確率オートマトンにおける次の遷移先のノード
（ＮＯＤＥ0〜ＮＯＤＥｎ）を各アークＡＲＣ0〜ＡＲＣ
ｎに対する遷移確率Ｐ0〜Ｐｎに基づいて確率的に決定
し、このとき決定したノード（ＮＯＤＥ0〜ＮＯＤＥ
ｎ）と元のノード（ＮＯＤＥ0）をと接続するアーク
（ＡＲＣ0〜ＡＲＣｎ）に対応付けられた行動を次に発
現すべき行動として、行動決定情報Ｄ２として行動生成
部に通知する。

【００６７】（１−２−４）行動生成部６３の処理行動生成部６３においては、行動決定部６２から行動決
定情報Ｄ２が与えられると、当該行動決定情報Ｄ２に基
づく行動をロボットに発現させるための制御コマンドＣ
ＯＭを対応するサブ制御部４３Ａ〜４３Ｄにそれぞれ出
力する。

【００６８】具体的に、行動生成部６３は、「歩く」、
「座る」、「ダンスする」等の各動作にそれぞれ対応さ
せて、その動作をロボット１に発現させるためにどのア
クチュエータＡ1〜Ａ14（図１及び図２）の出力軸をど
のタイミングでどのくらいの角度だけ回転駆動させるか
といった、動作ごとの各アクチュエータＡ1〜Ａ14の時
系列的な制御内容を規定したファイル（以下、これをモ
ーションファイルと呼ぶ）を外部メモリ５８内に有して
いる。

【００６９】そして行動生成部６３は、行動決定部６２
から行動決定情報Ｄ２が与えられるごとに、対応するモ
ーションファイルを順次再生して当該モーションファイ
ルに格納された制御パラメータに基づく制御コマンドＣ
ＯＭを生成し、当該制御コマンドＣＯＭを対応するサブ
制御部４３Ａ〜４３Ｄに送出する。

【００７０】この結果この制御コマンドＣＯＭに基づい
て、対応するサブ制御部４３Ａ〜４３Ｄによって対応す
るアクチュエータＡ1〜Ａ14が順次駆動され、かくして
ロボット１がかかる動作を発言することとなる。

【００７１】また行動生成部６３は、各種音のＷＡＶＥ
ファイルである複数の音声ファイルと、上述した外見上
の「目」として機能するＬＥＤの駆動データが格納され
た複数のＬＥＤ駆動ファイルを外部メモリ５８内に有し
ており、かかるモーションファイルの再生時等にそのモ
ーションファイルと対応付けられた音声ファイル及び又
はＬＥＤ駆動ファイルを同時に再生することにより、ロ
ボット１に動作と合わせてスピーカ５４（図５）から音
声を出力させたり、当該ＬＥＤを点滅駆動させる。

【００７２】このようにしてメイン制御部４０において
は、外部及び内部の状況や、ユーザからの指令及び働き
かけの有無等に応じてロボット１を自律的に行動させ得
るようになされている。

【００７３】（２）音源方向検出処理ところでこのロボット１の頭部ユニット３には、図８
（Ａ）〜（Ｃ）に示すように、その前面上部に正面マイ
ク７０、後面上部に後部マイク７１が配置されると共
に、右面に右マイク７２及び７３が近接して配置される
ことにより右マイク群が形成され、左面に左マイク７４
及び７５が近接して配置されることにより左マイク群が
形成されている。

【００７４】また図９に示すように、各マイク７０〜７
５にはぞれぞれアナログディジタル（Ａ／Ｄ）変換回路
８０〜８５が接続されることによりマイク部５１が構成
され、当該各Ａ／Ｄ変換回路８０〜８５は、各マイク７
０〜７５によって集音された音声信号をディジタル信号
にそれぞれ変換した後、これらを音声信号Ｓ１Ｂとして
メイン制御部４０に送出するようになされている。

【００７５】メイン制御部４０の状態認識部６０は、こ
の音声信号Ｓ１Ｂに基づいて、音声を発している音源の
左右方向、すなわち音源がロボット１を基準として左右
いずれの方向に位置しているかを判断すると共に、音源
の前後方向、すなわち音源がロボット１を基準として前
後いずれの方向に位置しているかを判断することによ
り、当該音源の方向を検出し、その検出結果を感情・本
能モデル部６１及び行動決定部６２に通知する。以下、
この音源方向検出処理における左右方向検出処理及び前
後方向検出処理について具体的に説明する。

【００７６】（２−１）左右方向検出処理ここで、正面マイク７０、後部マイク７１、右マイク７
２及び７３からなる右マイク群並びに左マイク７４及び
７５からなる左マイク群の間の各マイク間距離は、音声
信号の高周波成分に着目すると、音声信号の高周波成分
の１周期に相当する１波長の１／２を超える距離になっ
てしまい、また音声信号の高周波成分は、頭部ユニット
３の回折の影響を強く受け、音源方向を正確に検出こと
が困難である。

【００７７】従って、この場合、状態認識部６０は、マ
イク間距離が１波長の１／２以下であって、かつ頭部回
折の影響が比較的少ない低域の周波数帯域成分を抽出す
ることにより音源方向の検出を行う。

【００７８】すなわち状態認識部６０は、図１０に示す
ように、左マイク群のうちの例えば左マイク７４から入
力された入力信号Ｌｉ（ｔ）をローパスフィルタ（ＬＰ
Ｆ）９０に供給し、当該入力信号Ｌｉ（ｔ）に対して、
次式

【００７９】

【数４】

【００８０】によって表される伝達関数Ｈ（ｚ）を乗算
することにより、低周波数帯域成分が抽出された入力信
号Ｌｌ（ｔ）を得る。

【００８１】同様にして状態認識部６０は、右マイク群
のうちの右マイク７２から入力された入力信号Ｒｉ
（ｔ）に対して、上述の（４）式によって表される伝達
関数Ｈ（ｚ）を乗算することにより、低周波数帯域成分
が抽出された入力信号Ｒｌ（ｔ）を得る。

【００８２】次いで状態認識部６０は、音声が左マイク
７４に到達した時間を基準とした場合の音声到達時間差
ｔに対する、入力信号Ｌｌ（ｔ）及び入力信号Ｒｌ
（ｔ）の相互相関値Ｌ（ｔ）を、次式

【００８３】

【数５】

【００８４】によって算出すると共に、右マイク７２へ
の到達時間を基準とした音声到達時間差ｔに対する、入
力信号Ｌｌ（ｔ）及び入力信号Ｒｌ（ｔ）の相互相関値
Ｒ（ｔ）を、次式

【００８５】

【数６】

【００８６】によって算出する。

【００８７】かくして得られた音声到達時間差ｔ（０〜
ＴＬＬ）に対する相互相関値Ｌ（ｔ）の関係を図１１
（Ａ）に示すと共に、音声到達時間差ｔ（０〜ＴＬＲ）
に対する相互相関値Ｒ（ｔ）の関係を図１１（Ｂ）に示
す。ここでＴＬＬ及びＴＬＲは、初期値として１０が予
め設定されており、音声到達時間差ｔ（０）〜ｔ（ＴＬ
Ｌ）までの範囲を、相互相関値Ｌ（ｔ）における音源方
向の仮説時間範囲と呼び、音声到達時間差ｔ（０）〜ｔ
（ＴＬＲ）までの範囲を、相互相関値Ｒ（ｔ）における
音源方向の仮説時間範囲と呼ぶ。

【００８８】ところで各マイク７０〜７５から得られる
音声信号は、頭部の筐体の回折の影響を強く受け、音源
を基準として頭部の反対側に位置するマイクでは、信号
レベルが減衰した音声信号が得られることになる。特
に、音声信号のうち例えば１〔ｋＨｚ〕以上の高域の周
波数帯域成分は、低域の周波数帯域成分と比較して信号
レベルの減衰の度合いが大きく、当該信号レベルの減衰
の度合いは、マイク間距離に比例して大きくなることが
わかっている。

【００８９】このため状態認識部６０は、音声信号のう
ち高域の周波数帯域成分に着目して、各マイク間におけ
る高域の周波数帯域成分の信号レベル比に基づいて音源
方向の検出を行うようになされている。

【００９０】すなわち、状態認識部６０は、図１２に示
すように、左マイク群のうちの例えば左マイク７４から
入力された入力信号Ｌｉ（ｔ）をハイパスフィルタ（Ｈ
ＰＦ）９１に供給し、当該入力信号Ｌｉ（ｔ）に対し
て、次式

【００９１】

【数７】

【００９２】によって表される伝達関数Ｈ（ｚ）を乗算
することにより、高周波数帯域成分が抽出された入力信
号ＬＨ（ｔ）を得る。

【００９３】同様にして状態認識部６０は、右マイク群
のうちの右マイク７２から入力された入力信号Ｒｉ
（ｔ）に対して、上述の（７）式によって表される伝達
関数Ｈ（ｚ）を乗算することにより、高周波数帯域成分
が抽出された入力信号ＲＨ（ｔ）を得る。

【００９４】そして状態認識部６０は、高周波数帯域成
分が抽出された入力信号ＬＨ（ｔ）の振幅の平均値であ
る高域平均振幅ＹＬＨを、次式

【００９５】

【数８】

【００９６】によって算出すると共に、高周波数帯域成
分が抽出された入力信号ＲＨ（ｔ）の高域平均振幅ＹＲ
Ｈを、上述の（８）式によって算出する。

【００９７】次いで状態認識部６０は、高域平均振幅Ｙ
ＬＨ及びＹＲＨの比である高域振幅比ＲＨ＿ｌｒを、次
式

【００９８】

【数９】

【００９９】によって算出することにより、高域の音声
信号の信号レベル比を求める。

【０１００】そして状態認識部６０は、高域振幅比ＲＨ
＿ｌｒが２．０よりも大きいと判断した場合にはＴＬＬ
に０を設定することにより、仮説時間範囲を、図１１
（Ｂ）に示す音声到達時間差ｔ（０）〜ｔ（１０）の範
囲に狭め、高域振幅比ＲＨ＿ｌｒが１．３よりも大きく
かつ２．０よりも小さいと判断した場合にはＴＬＬに２
を設定することにより、仮説時間範囲を、図１１（Ａ）
に示す音声到達時間差ｔ（０）〜ｔ（２）の範囲と図１
１（Ｂ）に示す音声到達時間差ｔ（０）〜ｔ（１０）の
範囲に狭める。

【０１０１】また状態認識部６０は、高域振幅比ＲＨ＿
ｌｒが０．５よりも小さいと判断した場合にはＴＬＲに
０を設定することにより、仮説時間範囲を、図１１
（Ａ）に示す音声到達時間差ｔ（０）〜ｔ（１０）の範
囲に狭め、高域振幅比ＲＨ＿ｌｒが０．７５よりも小さ
くかつつ０．５よりも大きいと判断した場合にはＴＬＲ
に２を設定することにより、仮説時間範囲を、図１１
（Ａ）に示す音声到達時間差ｔ（０）〜ｔ（１０）の範
囲と１１（Ｂ）に示す音声到達時間差ｔ（０）〜ｔ
（２）の範囲に狭める。

【０１０２】そして状態認識部６０は、当該得られた仮
説時間範囲の中から相互相関値が最大となる音声到達時
間差ｔを探索し、予め用意されているテーブルに基づい
て当該探索された音声到達時間差ｔに対応する音源の左
右方向の角度を得る。

【０１０３】（２−２）前後方向検出処理この場合、状態認識部６０は、正面マイク７０から入力
された入力信号Ｆｉ（ｔ）に対して、上述の（４）式に
よって表される伝達関数Ｈ（ｚ）を乗算することによ
り、低周波数帯域成分が抽出された入力信号Ｆｌ（ｔ）
を得る。

【０１０４】同様にして状態認識部６０は、後部マイク
７１から入力された入力信号Ｂｉ（ｔ）に対して、上述
の（４）式によって表される伝達関数Ｈ（ｚ）を乗算す
ることにより、低周波数帯域成分が抽出された入力信号
Ｂｌ（ｔ）を得る。

【０１０５】次いで状態認識部６０は、音声が正面マイ
ク７０に到達した時間を基準とした場合の音声到達時間
差ｔに対する、入力信号Ｆｌ（ｔ）及び入力信号Ｂｌ
（ｔ）の相互相関値Ｆ（ｔ）を、上述の（５）式と同様
の演算式によって算出すると共に、後部マイク７１への
到達時間を基準とした音声到達時間差ｔに対する、入力
信号Ｆｌ（ｔ）及び入力信号Ｂｌ（ｔ）の相互相関値Ｂ
（ｔ）を、上述の（６）式と同様の演算式によって算出
する。

【０１０６】かくして得られた音声到達時間差ｔ（０〜
ＴＬＦ）に対する相互相関値Ｆ（ｔ）の関係を図１３
（Ａ）に示すと共に、音声到達時間差ｔ（０〜ＴＬＢ）
に対する相互相関値Ｂ（ｔ）の関係を図１３（Ｂ）に示
す。ここでＴＬＦ及びＴＬＢは、初期値として１０が予
め設定されており、音声到達時間差ｔ（０）〜ｔ（ＴＬ
Ｆ）までの範囲を、相互相関値Ｆ（ｔ）における音源方
向の仮説時間範囲と呼び、音声到達時間差ｔ（０）〜ｔ
（ＴＬＢ）までの範囲を、相互相関値Ｂ（ｔ）における
音源方向の仮説時間範囲と呼ぶ。

【０１０７】ところで、右マイク群を形成する右マイク
７２及び７３と、左マイク群を形成する左マイク７４及
び７５は、それぞれ近接しマイク間距離が小さいため、
マイク間距離が大きい場合に比して、より広い周波数帯
域の音声信号を用いて音源方向の検出を行うことができ
る。

【０１０８】この場合、状態認識部６０は、右マイク群
を形成する右マイク７２及び７３と左マイク群を形成す
る左マイク７４及び７５とを用いて指向性マイクを形成
することにより音源方向を検出するようになされてい
る。

【０１０９】すなわち、状態認識部６０は、図１４に示
すような機能ブロックからなる指向性マイクを形成し、
右マイク群のうち前方に位置する右マイク７２から入力
された入力信号を遅延回路１００に供給すると共に、右
マイク群のうち後方に位置する右マイク７３から入力さ
れた入力信号を遅延回路１０１に供給する。

【０１１０】遅延回路１００は、供給される入力信号を
遅延させることなく後段の加算回路１０２に送出し、遅
延回路１０１は、供給される入力信号を、右マイク７２
と右マイク７３との間の距離に相当する時間だけ遅延さ
せた後、後段の加算回路１０２に送出する。

【０１１１】加算回路１０２は、遅延回路１００及び１
０ｌから供給される入力信号を加算することにより、ロ
ボット１を基準として後方から発せられる音声を打ち消
し、その結果得られた入力信号をＬＰＦ１０３に送出す
る。

【０１１２】ＬＰＦ１０３は、供給される入力信号に対
して、次式

【０１１３】

【数１０】

【０１１４】によって表される伝達関数を乗算すること
により、当該入力信号の周波数特性を補正する。

【０１１５】平均振幅算出回路１０４は、当該周波数特
性が補正された入力信号に対して、次式

【０１１６】

【数１１】

【０１１７】によって表される演算式を用いて、前方指
向性振幅Ａｆを算出する。

【０１１８】また、状態認識部６０は、右マイク群のう
ち前方に位置する右マイク７２から入力された入力信号
を遅延回路１１０に供給すると共に、右マイク群のうち
後方に位置する右マイク７３から入力された入力信号を
遅延回路１１１に供給する。

【０１１９】遅延回路１１０は、供給される入力信号
を、右マイク７２と右マイク７３との間の距離に相当す
る時間だけ遅延させた後、後段の加算回路１１２に送出
し、遅延回路１１１は、供給される入力信号を遅延させ
ることなく後段の加算回路１１２に送出する。

【０１２０】加算回路１１２は、遅延回路１１０及び１
１１から供給される入力信号を加算することにより、ロ
ボット１を基準として前方から発せられる音声を打ち消
し、当該加算された入力信号をＬＰＦ１１３及び平均振
幅算出回路１１４に順次送出して後方指向性振幅Ａｂを
算出する。

【０１２１】振幅比算出回路１１５は、前方指向性振幅
Ａｆ及び後方指向性振幅Ａｂを基に前後振幅比Ｒｆｂ
を、次式

【０１２２】

【数１２】

【０１２３】によって算出する。

【０１２４】そして状態認識部６０は、前後振幅比Ｒｆ
ｂが２．０よりも大きいと判断した場合にはＴＬＢに０
を設定することにより、仮説時間範囲を、図１３（Ａ）
に示す音声到達時間差ｔ（０）〜ｔ（１０）の範囲に狭
め、前後振幅比Ｒｆｂが１．３よりも大きくかつ２．０
よりも小さいと判断した場合にはＴＬＢに２を設定する
ことにより、仮説時間範囲を、図１１（Ａ）に示す音声
到達時間差ｔ（０）〜ｔ（１０）の範囲と図１１（Ｂ）
に示す音声到達時間差ｔ（０）〜ｔ（２）の範囲に狭め
る。

【０１２５】また状態認識部６０は、前後振幅比Ｒｆｂ
が０．５よりも小さいと判断した場合にはＴＬＦに０を
設定することにより、仮説時間範囲を、図１１（Ｂ）に
示す音声到達時間差ｔ（０）〜ｔ（１０）の範囲に狭
め、前後振幅比Ｒｆｂが０．７５よりも小さくかつ０．
５よりも大きいと判断した場合にはＴＬＦに２を設定す
ることにより、仮説時間範囲を、図１１（Ａ）に示す音
声到達時間差ｔ（０）〜ｔ（２）の範囲と図１１（Ｂ）
に示す音声到達時間差ｔ（０）〜ｔ（１０）の範囲に狭
める。

【０１２６】そして状態認識部６０は、当該得られた仮
説時間範囲の中から相互相関値が最大となる音声到達時
間差ｔを探索し、予め用意されているテーブルに基づい
て当該探索された音声到達時間差ｔに対応する音源の前
後方向の角度を得る。

【０１２７】なお状態認識部６０は、当該得られた仮説
時間範囲の中から相互相関値が最大となる音声到達時間
差ｔを検出できないと判断した場合には、前後振幅比Ｒ
ｆｂを基に音源の前後方向の角度を直接得ることにす
る。

【０１２８】すなわち状態認識部６０は、前後振幅比Ｒ
ｆｂが２．０よりも大きいと判断した場合には、音源の
前後方向の角度を０〔°〕に設定し、前後振幅比Ｒｆｂ
が１．０よりも大きくかつ２．０よりも小さいと判断し
た場合には、音源の前後方向の角度を３０〔°〕に設定
する。

【０１２９】また状態認識部６０は、前後振幅比Ｒｆｂ
が０．５よりも小さいと判断した場合には、音源の前後
方向の角度を１８０〔°〕に設定し、前後振幅比Ｒｆｂ
が０．７５よりも小さくかつ０．５よりも大きいと判断
した場合には、音源の前後方向の角度を１３５〔°〕に
設定し、前後振幅比Ｒｆｂが１．０よりも小さくかつ
０．７５よりも大きいと判断した場合には、音源の前後
方向の角度を９０〔°〕に設定する。

【０１３０】このようにして状態認識部６０は、ロボッ
ト１を基準として左右方向に着目した場合に検出された
音源の左右方向の角度と、前後方向に着目した場合に検
出さされた音源の前後方向の角度とを基に、音源方向の
角度を検出するようになされている。

【０１３１】（３）指向性マイク生成処理ところで、状態認識部６０は、ＣＣＤカメラ５０から得
られる画像信号Ｓ１Ａを解析することにより音源の位置
を特定し、当該特定された音源の方向に対する指向性マ
イクを生成し得るようになされている。

【０１３２】すなわち、状態認識部６０は、始めにＣＣ
Ｄカメラ５０から得られる画像信号Ｓ１Ａを解析するこ
とにより例えば対話相手の位置を特定する。そして状態
認識部６０は、特定された対話相手が当該ロボット１を
基準として正面に位置すると判断した場合には、右マイ
ク群のうち前方に位置する右マイク７２から入力される
音声信号と、後方に位置する右マイク７３から入力され
る音声信号を所定時間遅延させた音声信号とを加算する
ことにより、ロボット１の後方から発せられる音声信号
を打ち消す。

【０１３３】同様に状態認識部６０は、左マイク群のう
ち前方に位置する左マイク７４から入力される音声信号
と、後方に位置する左マイク７５から入力される音声信
号を所定時間遅延させた音声信号とを加算することによ
り、ロボット１の後方から発せられる音声信号を打ち消
す。

【０１３４】このように状態認識部６０は、特定された
音源の方向に対する指向性マイクを生成し得、Ｓ／Ｎ比
を向上させることができる。

【０１３５】（４）本実施の形態の動作及び効果以上の構成において、このロボット１の頭部ユニット３
には、その前面上部に正面マイク７０、後面上部に後部
マイク７１が配置されると共に、右面に右マイク７２及
び７３が近接して配置され、左面に左マイク７４及び７
５が近接して配置されている。

【０１３６】状態認識部６０は、右マイク７２及び左マ
イク７４から入力される音声信号の低域の周波数成分に
着目し、音声の各マイクへの到達時間差を検出すること
により、音源の左右方向を仮説する。この場合、音源方
向の仮説に利用し得る周波数帯域が制限されるが、マイ
ク間距離が大きいためＳ／Ｎ比の劣化を回避することが
できる。

【０１３７】次いで状態認識部６０は、右マイク７２及
び左マイク７４から入力される音声信号の高域の周波数
成分に着目し、その信号レベル比を算出することによ
り、音源の左右方向を仮説する。この場合、マイク間距
離が大きいため信号レベルの減衰も大きく、これにより
明らかに音源が存在しない方向を排除することができ
る。

【０１３８】そして状態認識部６０は、音声信号の低域
の周波数成分に着目した場合に得られた音源の左右方向
の仮説と、音声信号の高域の周波数成分に着目した場合
に得られた音源の左右方向の仮説とに基づいて、音源の
左右方向の角度を正しく検出し得る。

【０１３９】また、状態認識部６０は、右マイク７２及
び左マイク７４から入力される音声信号の低域の周波数
成分に着目し、音声の各マイクへの到達時間差を検出す
ることにより、マイク間距離を１／２波長以下にしつつ
かつ頭部回折の影響を回避しながら音源の前後方向を仮
説する。この場合、音源方向の仮説に利用し得る周波数
帯域が制限されるが、マイク間距離が大きいためＳ／Ｎ
比の劣化を回避することができる。

【０１４０】次いで状態認識部６０は、右マイク群を形
成する右マイク７２及び７３と左マイク群を形成する左
マイク７４及び７５とによって指向性マイクを形成する
ことにより、より広い周波数帯域の音声信号を用いて音
源の前後方向を仮説する。この場合、頭部回折の影響を
回避することができる。

【０１４１】そして状態認識部６０は、音声信号の低域
の周波数成分に着目した場合に得られた音源の前後方向
の仮説と、音声信号の広い周波数成分に着目した場合に
得られた音源の前後方向の仮説とに基づいて、音源の前
後方向の角度を正確に検出し得る。

【０１４２】このように状態認識部６０は、音源の左右
方向の角度を正確に検出し得ると共に、音源の前後方向
の角度を正確に検出し得、従って音源方向検出処理の信
頼性を一段と向上することができる。

【０１４３】また状態認識部６０は、ＣＣＤカメラ５０
から得られる画像信号Ｓ１Ａを基に音源の位置を特定
し、当該特定された音源方向の指向性マイクを生成する
ことにより、Ｓ／Ｎ比を向上させることができる。

【０１４４】以上の構成によれば、ロボット１の頭部ユ
ニット３の前面上部に正面マイク７０を配置すると共に
後面上部に後部マイク７１を配置し、さらに右面に右マ
イク７２及び７３を近接して配置すると共に、左面に左
マイク７４及び７５を近接して配置し、各マイク７０〜
７５から得られる音声信号に基づいて音源の方向を検出
することにより、複数の音源方向検出方法を用いて音源
方向を検出し得、従って音源方向を一段と正確に検出し
得る。

【０１４５】（５）他の実施の形態なお上述の実施の形態においては、本発明を図１及び図
２のように構成された２足歩行型のロボット１に適用す
るようにした場合について述べたが、本発明はこれに限
らず、例えば４足歩行型のペットロボットや、この他種
々のロボット装置に広く適用することができる。

【０１４６】また上述の実施の形態においては、第１の
マイク群として、頭部ユニット３の右面に近接して配置
された右マイク７２及び７３からなる右マイク群と、左
面に近接して配置された左マイク７４及び７５からなる
左マイク群とを適用する場合について述べたが、本発明
はこれに限らず、互いに近接して配置された他の種々の
第１のマイク群を適用するようにしても良い。

【０１４７】また上述の実施の形態においては、第２の
マイク群として、頭部ユニット３の前面上部に配置され
た正面マイク７０と、後面上部に配置された後部マイク
７１とを適用する場合について述べたが、本発明はこれ
に限らず、互いに近接しないように配置された他の種々
の第２のマイク群を適用するようにしても良い。

【０１４８】さらに上述の実施の形態においては、音声
認識手段として状態認識部６０を適用した場合について
述べたが、本発明はこれに限らず、各マイクから入力さ
れる音声信号に対して所定の音声認識処理を施す他の種
々の音声認識手段を適用するようにしても良い。

【０１４９】

【発明の効果】上述のように本発明によれば、ロボット
装置において、互いに近接して配置された第１のマイク
群と、互いに近接しないように配置された第２のマイク
群と、各マイクから入力される音声信号に対して所定の
音声認識処理を施す音声認識手段とを設けることによ
り、音源方向を一段と正確に検出し得ると共にＳ／Ｎ比
を向上させることができ、従って音声の取得を一段と高
品質に行い得るロボット装置を実現できる。

【０１５０】また本発明においては、ロボット装置の制
御方法において、互いに近接して配置された第１のマイ
ク群と、互いに近接しないように配置された第２のマイ
ク群とからそれぞれ入力される音声信号に対して所定の
音声認識処理を施すことにより、音源方向を一段と正確
に検出し得ると共にＳ／Ｎ比を向上させることができ、
従って音声の取得を一段と高品質に行い得るロボット装
置の制御方法を実現できる。

【図面の簡単な説明】

【図１】本実施の形態によるロボットの外部構成を示す
斜視図である。

【図２】ロボットの外部構成を示す斜視図である。

【図３】ロボットの外部構成の説明に供する略線図であ
る。

【図４】ロボットの内部構成の説明に供するブロック図
である。

【図５】ロボットの内部構成の説明に供するブロック図
である。

【図６】メイン制御部の処理内容の説明に供するブロッ
ク図である。

【図７】確率オートマトンの説明に供する概念図であ
る。

【図８】頭部ユニットの外観構成の説明に供する略線図
である。

【図９】マイク部の構成の説明に供する略線図である。

【図１０】ＬＰＦの説明に供する略線図である。

【図１１】時間差ｔに対する相互相関値の説明に供する
略線図である。

【図１２】ＨＰＦの説明に供する略線図である。

【図１３】時間差ｔに対する相互相関値の説明に供する
略線図である。

【図１４】指向性マイクの構成の説明に供する略線図で
ある。

【符号の説明】

１……ロボット、２……胴体部ユニット、３……頭部ユ
ニット、４Ａ、４Ｂ……腕部ユニット、５Ａ、５Ｂ……
脚部ユニット、４０……メイン制御部、５０……ＣＣ
Ｄ、５１……マイク部、５２……タッチセンサ、５４…
…スピーカ、５５……バッテリセンサ、５６……加速度
センサ、５８……外部メモリ、６０……状態認識部、７
０……正面マイク、７１……後部マイク、７２、７３…
…右マイク、７４、７５……左マイク。

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩテーマコート゛(参考）Ｇ１０Ｌ 21/02 Ｇ１０Ｌ 3/00 ５５１Ｈ (72)発明者坪井利充東京都品川区北品川６丁目７番35号ソニー株式会社内 (72)発明者山口一博東京都品川区北品川６丁目７番35号ソニー株式会社内Ｆターム(参考） 3C007 AS36 CS08 HS09 HS27 KS00 KS23 KS31 KS39 KT01 KX02 LT06 MT14 WA03 WA13 5D015 DD02 KK01 LL07

Claims

【特許請求の範囲】

【請求項１】互いに近接して配置された第１のマイク群
と、互いに近接しないように配置された第２のマイク群と、上記各マイクから入力される音声信号に対して所定の音
声認識処理を施す音声認識手段とを具えることを特徴と
するロボット装置。
【請求項２】上記音声認識手段は、上記各マイクから入力される音声信号に基づいて音源方
向を検出する音源方向検出手段を具えることを特徴とす
る請求項１に記載のロボット装置。
【請求項３】上記音源方向検出手段は、上記第２のマイク群から入力される音声信号の低域の周
波数成分を抽出し、当該抽出された音声信号が上記第２
のマイク群を構成する各マイクに到達する時間の時間差
を検出すると共に、上記第２のマイク群から入力される
音声信号の高域の周波数成分を抽出し、当該抽出された
音声信号の信号レベル比を算出することにより、音源の
左右方向を検出する左右方向検出手段と、上記第２のマイク群から入力される音声信号の低域の周
波数成分を抽出し、当該抽出された音声信号が上記第２
のマイク群を構成する各マイクに到達する時間の時間差
を検出すると共に、上記第１のマイク群から入力される
音声信号に対して所定の信号処理を施し、指向性マイク
を形成することにより、音源の前後方向を検出する前後
方向検出手段とを具えることを特徴とする請求項２に記
載のロボット装置。
【請求項４】周囲の状況を撮像する撮像手段を具え、上記音声認識手段は、上記撮像手段から得られる画像信号を基に音源の位置を
特定する位置特定手段と、上記第１のマイク群から入力される音声信号に対して所
定の信号処理を施すことにより、上記特定された音源の
方向に対する指向性マイクを形成する指向性マイク形成
手段とを具えることを特徴とする請求項１に記載のロボ
ット装置。
【請求項５】互いに近接して配置された第１のマイク群
と、互いに近接しないように配置された第２のマイク群
とからそれぞれ入力される音声信号に対して所定の音声
認識処理を施す第１のステップを具えることを特徴とす
るロボット装置の制御方法。
【請求項６】上記第１のステップでは、上記各マイクから入力される音声信号に基づいて音源方
向を検出することを特徴とする請求項５に記載のロボッ
ト装置の制御方法。
【請求項７】上記第１のステップでは、上記第２のマイク群から入力される音声信号の低域の周
波数成分を抽出し、当該抽出された音声信号が上記第２
のマイク群を構成する各マイクに到達する時間の時間差
を検出すると共に、上記第２のマイク群から入力される
音声信号の高域の周波数成分を抽出し、当該抽出された
音声信号の信号レベル比を算出することにより、音源の
左右方向を検出し、上記第２のマイク群から入力される音声信号の低域の周
波数成分を抽出し、当該抽出された音声信号が上記第２
のマイク群を構成する各マイクに到達する時間の時間差
を検出すると共に、上記第１のマイク群から入力される
音声信号に対して所定の信号処理を施し、指向性マイク
を形成することにより、音源の前後方向を検出すること
を特徴とする請求項６に記載のロボット装置の制御方
法。
【請求項８】上記第１のステップでは、周囲の状況を撮像する撮像手段から得られる画像信号を
基に音源の位置を特定し、上記第１のマイク群から入力される音声信号に対して所
定の信号処理を施すことにより、上記特定された音源の
方向に対する指向性マイクを形成することを特徴とする
請求項５に記載のロボット装置の制御方法。