JP4210897B2 - 音源方向判断装置及び音源方向判断方法 - Google Patents

音源方向判断装置及び音源方向判断方法 Download PDF

Info

Publication number
JP4210897B2
JP4210897B2 JP2002074905A JP2002074905A JP4210897B2 JP 4210897 B2 JP4210897 B2 JP 4210897B2 JP 2002074905 A JP2002074905 A JP 2002074905A JP 2002074905 A JP2002074905 A JP 2002074905A JP 4210897 B2 JP4210897 B2 JP 4210897B2
Authority
JP
Japan
Prior art keywords
calculating
amplitude
frequency
sound source
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002074905A
Other languages
English (en)
Other versions
JP2003271196A (ja
Inventor
崇 豊田
誠一 青柳
利充 坪井
一博 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2002074905A priority Critical patent/JP4210897B2/ja
Publication of JP2003271196A publication Critical patent/JP2003271196A/ja
Application granted granted Critical
Publication of JP4210897B2 publication Critical patent/JP4210897B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Manipulator (AREA)

Description

【0001】
【発明の属する技術分野】
本発明はロボット装置及びその制御方法に関し、例えば2足歩行型のロボットに適用して好適なものである。
【0002】
【従来の技術】
近年、人間の外観形状を模ったヒューマノイドタイプのロボットや、一般家庭でペットとして飼育される犬や猫の外観形状を模った4脚歩行型のペットロボット等の各種エンターテインメントロボットが開発され、商品化されている。
【0003】
そしてこれらのエンターテインメントロボットとしては、ユーザからの指令や周囲の状況などに応じて自律的に行動し得るようになされたものや、ユーザ操作に応動してその操作に予め対応付けられた1つの動作を発現するようになされたものなど、種々のものが存在している。
【0004】
【発明が解決しようとする課題】
ところでエンターテインメントロボットにおいては、頭部の所定位置にマイクが取り付けられ、当該マイクによって音源から発せられる音声を集音するようになされたものが開発されているが、よりエンターテインメント性を向上させるためには、当該音源の方向を検出することが必要となる。
【0005】
この音源方向を検出する方法としては、種々の方法が提案及び開発されているが、エンターテインメントロボットは多様な動作を行うことから、音源方向検出方法としていずれか1つの方法を採用しても、多様な動作に対応して確実に音源方向を検出することは難しいと考えられる。
【0006】
すなわち、マイクは障害物のない自由空間に複数個配置することが望ましいが、エンターテインメントロボットに音源方向検出機能を搭載する場合には、当該エンターテインメントロボットの筐体によってマイクの配置位置に制限を受ける。特に当該エンターテインメントロボットでは、そのデザインが優先され、マイクを障害物のない自由空間に配置することが困難である。
【0007】
例えばエンターテインメントロボットにおいては、「耳」の位置にマイクを配置することが望ましいが、当該位置は自由空間でなく、頭部の筐体の回折の影響を強く受けることになり、これでは音源方向を正しく検出し得ない問題がある。
【0008】
ところで、音源方向検出方法としては、音源から発せられる音声を複数のマイクによって集音し、音声が当該各マイクに到達した時間の時間差を検出することにより音源方向を検出する方法が採用されている。
【0009】
この場合、各マイク間の距離は、各マイクにおける音声の到達時間差を基に音源方向を検出することとの関係上、音源から発せられる音声信号の周波数成分の1周期に相当する1波長の1/2以下の長さであることが必要とされる。従って、かかる音源方向検出方法では、マイク間距離が小さい場合には、当該マイク間距離が大きい場合に比して、より高い周波数成分の音声信号を取得することができる。
【0010】
しかしながら、かかる音源方向検出方法では、マイク間距離が小さくなると、入力される音声信号の信号レベルの差も小さくなるため、信号対雑音比(S/N比)が劣化するという問題が生じる。
【0011】
本発明は以上の点を考慮してなされたもので、音声の取得を一段と高品質に行い得るロボット装置及びその制御方法を提案しようとするものである。
【0012】
【課題を解決するための手段】
かかる課題を解決するため本発明においては、互いに近接しない第 1 の所定距離に配置された第1マイクロホン及び第2マイクロホンによって検出される第1音声信号及び第2音声信号のそれぞれから、第 1 の所定距離とその1/2波長が等しくなる周波数の低域成分である第 1 低域信号及び第 2 低域信号を抽出する低域信号抽出手段と、第 1 低域信号及び上記第2低域信号を基に相互相関関数式を用いることによってそれぞれ第 1 相互相関値及び第2相互相関値を算出する相互相関値算出手段と、第 1 相互相関値及び第2相互相関値に基づいて音源の方向を算出する第 1 方向算出手段と、第1音声信号及び第2音声信号からそれぞれ第 1 高域信号及び第 2 高域信号を抽出する高域信号抽出手段と第 1 高域信号及び第 2 高域信号を基に所定の計算式を用いてそれぞれ第 1 高域平均振幅値及び第 2 高域平均振幅値を算出する高域平均振幅算出手段と、第 1 高域平均振幅値と第 2 高域平均振幅値との比をとることによって高域振幅比を算出する高域振幅算出手段と、第 1 の所定のテーブルと高域振幅比とに基づいて音源の方向を算出する第 2 方向算出手段と、互いに近接している第 2 の所定距離に配置された第 3 マイクロホン及び第 4 マイクロホンによって検出される第3音声信号及び第4音声信号のうち一方に対し第 2 の距離に相当する遅延時間だけ遅延させて他方と加算する第 1 加算手段と、一方と他方に対し遅延時間だけ遅延させて加算する第 2 加算手段と、第 1 加算手段及び第2加算手段によって得られた音声信号を基に第 3 の計算式を用いてそれぞれ前方指向性振幅及び後方指向性振幅を算出する指向特性振幅算出手段と、前方指向性振幅と後方指向性振幅との比をとることによって前後振幅比を算出する前後振幅比算出手段と、第2の所定のテーブルと前後振幅比とに基づいて音源の方向を算出する第 3 方向算出手段とを具え、第 1 方向算出手段、第 2 方向算出手段及び第 3 方向算出手段を併用することにより、総合的に音源の方向判断を行うようにした。この結果、回折の影響及び外部ノイズの影響を避けることができ、音源の方向を一段と正確に判断することができる。
【0013】
また本発明においては、互いに近接しない第 1 の所定距離に配置された第1マイクロホン及び第2マイクロホンによって検出される第1音声信号及び第2音声信号のそれぞれから、第 1 の所定距離とその1/2波長が等しくなる周波数の低域成分である第 1 低域信号及び第 2 低域信号を抽出する低域信号抽出ステップと、第 1 低域信号及び上記第2低域信号を基に相互相関関数式を用いることによってそれぞれ第 1 相互相関値及び第2相互相関値を算出する相互相関値算出ステップと、第 1 相互相関値及び第2相互相関値に基づいて音源の方向を算出する第 1 方向算出ステップと、第1音声信号及び第2音声信号からそれぞれ第 1 高域信号及び第 2 高域信号を抽出する高域信号抽出ステップと第 1 高域信号及び第 2 高域信号を基に所定の計算式を用いてそれぞれ第 1 高域平均振幅値及び第 2 高域平均振幅値を算出する高域平均振幅算出ステップと、第 1 高域平均振幅値と第 2 高域平均振幅値との比をとることによって高域振幅比を算出する高域振幅算出ステップと、第 1 の所定のテーブルと高域振幅比とに基づいて音源の方向を算出する第 2 方向算出ステップと、互いに近接している第 2 の所定距離に配置された第 3 マイクロホン及び第 4 マイクロホンによって検出される第3音声信号及び第4音声信号のうち一方に対し第 2 の距離に相当する遅延時間だけ遅延させて他方と加算する第 1 加算ステップと、一方と他方に対し遅延時間だけ遅延させて加算する第 2 加算ステップと、第 1 加算ステップ及び第2加算ステップによって得られた音声信号を基に第 3 の計算式を用いてそれぞれ前方指向性振幅及び後方指向性振幅を算出する指向特性振幅算出ステップと、前方指向性振幅と後方指向性振幅との比をとることによって前後振幅比を算出する前後振幅比算出ステップと、第2の所定のテーブルと前後振幅比とに基づいて音源の方向を算出する第 3 方向算出ステップとを具え、第 1 方向算出ステップ、第 2 方向算出ステップ及び第 3 方向算出ステップを併用することにより、総合的に音源の方向判断を行うようにした。この結果、回折の影響及び外部ノイズの影響を避けることができ、音源の方向を一段と正確に判断することができる。
【0014】
【発明の実施の形態】
以下図面について、本発明の一実施の形態を詳述する。
【0015】
(1)本実施の形態によるロボットの構成
(1−1)ロボットの構成
図1及び図2において、1は全体として本実施の形態による2足歩行型のロボットを示し、胴体部ユニット2の上部に頭部ユニット3が配設されると共に、当該胴体部ユニット2の上部左右にそれぞれ同じ構成の腕部ユニット4A、4Bがそれぞれ配設され、かつ胴体部ユニット2の下部左右にそれぞれ同じ構成の脚部ユニット5A、5Bがそれぞれ所定位置に取り付けられることにより構成されている。
【0016】
胴体部ユニット2においては、体幹上部を形成するフレーム10及び体幹下部を形成する腰ベース11が腰関節機構12を介して連結することにより構成されており、体幹下部の腰ベース11に固定された腰関節機構12の各アクチュエータA1、A2をそれぞれ駆動することによって、体幹上部を図3に示す直交するロール軸13及びピッチ軸14の回りにそれぞれ独立に回転させることができるようになされている。
【0017】
また頭部ユニット3は、フレーム10の上端に固定された肩ベース15の上面中央部に首関節機構16を介して取り付けられており、当該首関節機構16の各アクチュエータA3、A4をそれぞれ駆動することによって、図3に示す直交するピッチ軸17及びヨー軸18の回りにそれぞれ独立に回転させることができるようになされている。
【0018】
さらに各腕部ユニット4A、4Bは、それぞれ肩関節機構19を介して肩ベース15の左右に取り付けられており、対応する肩関節機構19の各アクチュエータA5、A6をそれぞれ駆動することによって図3に示す直交するピッチ軸20及びロール軸21の回りにそれぞれ独立に回転させることができるようになされている。
【0019】
この場合、各腕部ユニット4A、4Bは、それぞれ上腕部を形成するアクチュエータA7の出力軸に肘関節機構22を介して前腕部を形成するアクチュエータA8が連結され、当該前腕部の先端に手部23が取り付けられることにより構成されている。
【0020】
そして各腕部ユニット4A、4Bでは、アクチュエータA7を駆動することによって前腕部を図3に示すヨー軸24の回りに回転させ、アクチュエータA8 を駆動することによって前腕部を図3に示すピッチ軸25の回りにそれぞれ回転させることができるようになされている。
【0021】
これに対して各脚部ユニット5A、5Bにおいては、それぞれ股関節機構26を介して体幹下部の腰ベース11にそれぞれ取り付けられており、それぞれ対応する股関節機構26の各アクチュエータをA9〜A11それぞれ駆動することによって、図3に示す互いに直交するヨー軸27、ロール軸28及びピッチ軸29の回りにそれぞれ独立に回転させることができるようになされている。
【0022】
この場合各脚部ユニット5A、5Bは、それぞれ大腿部を形成するフレーム30の下端に膝関節機構31を介して下腿部を形成するフレーム32が連結されると共に、当該フレーム32の下端に足首関節機構33を介して足部34が連結されることにより構成されている。
【0023】
これにより各脚部ユニット5A、5Bにおいては、膝関節機構31を形成するアクチュエータA12を駆動することによって、下腿部を図3に示すピッチ軸35の回りに回転させることができ、また足首関節機構33のアクチュエータA13、A14をそれぞれ駆動することによって、足部34を図3に示す直交するピッチ軸36及びロール軸37の回りにそれぞれ独立に回転させることができるようになされている
【0024】
一方、胴体部ユニット2の体幹下部を形成する腰ベース11の背面側には、図4に示すように、当該ロボット1全体の動作制御を司るメイン制御部40と、電源回路及び通信回路などの周辺回路41と、バッテリ45(図5)となどがボックスに収納されてなる制御ユニット42が配設されている。
【0025】
そしてこの制御ユニット42は、各構成ユニット(胴体部ユニット2、頭部ユニット3、各腕部ユニット4A、4B及び各脚部ユニット5A、5B)内にそれぞれ配設された各サブ制御部43A〜43Dと接続されており、これらサブ制御部43A〜43Dに対して必要な電源電圧を供給したり、これらサブ制御部43A〜43Dと通信を行なったりすることができるようになされている。
【0026】
また各サブ制御部43A〜43Dは、それぞれ対応する構成ユニット内の各アクチュエータA1〜A14と接続されており、当該構成ユニット内の各アクチュエータA1〜A14をメイン制御部40から与えられる各種制御コマンドに基づいて指定された状態に駆動し得るようになされている。
【0027】
さらに頭部ユニット3には、図5に示すように、このロボット1の「目」として機能するCCD(Charge Coupled Device )カメラ50、「耳」として機能するマイク部51及びタッチセンサ52などからなる外部センサ部53と、「口」として機能するスピーカ54となどがそれぞれ所定位置に配設され、制御ユニット42内には、バッテリセンサ55及び加速度センサ56などからなる内部センサ部57が配設されている。
【0028】
そして外部センサ部53のCCDカメラ50は、周囲の状況を撮像し、得られた画像信号S1Aをメイン制御部に送出する一方、マイク部51は、ユーザから音声入力として与えられる「歩け」、「伏せ」又は「ボールを追いかけろ」等の各種命令音声を集音し、かくして得られた音声信号S1Bをメイン制御部40に送出するようになされている。
【0029】
またタッチセンサ52は、図1及び図2において明らかなように頭部ユニット3の上部に設けられており、ユーザからの「撫でる」や「叩く」といった物理的な働きかけにより受けた圧力を検出し、検出結果を圧力検出信号S1Cとしてメイン制御部40に送出する。
【0030】
さらに内部センサ部57のバッテリセンサ55は、バッテリ45のエネルギ残量を所定周期で検出し、検出結果をバッテリ残量検出信号S2Aとしてメイン制御部40に送出する一方、加速度センサ56は、3軸方向(x軸、y軸及びz軸)の加速度を所定周期で検出し、検出結果を加速度検出信号S2Bとしてメイン制御部40に送出する。
【0031】
メイン制御部部40は、外部センサ部53のCCDカメラ50、マイク部51及びタッチセンサ52等からそれぞれ供給される画像信号S1A、音声信号S1B及び圧力検出信号S1C等(以下、これらをまとめて外部センサ信号S1と呼ぶ)と、内部センサ部57のバッテリセンサ55及び加速度センサ等からそれぞれ供給されるバッテリ残量検出信号S2A及び加速度検出信号S2B等(以下、これらをまとめて内部センサ信号S2と呼ぶ)に基づいて、ロボット1の周囲及び内部の状況や、ユーザからの指令、ユーザからの働きかけの有無などを判断する。
【0032】
そしてメイン制御部40は、この判断結果と、予め内部メモリ40Aに格納されている制御プログラムと、そのとき装填されている外部メモリ58に格納されている各種制御パラメータとに基づいて続く行動を決定し、決定結果に基づく制御コマンダを対応するサブ制御部43A〜43Dに送出する。この結果、この制御コマンダに基づき、そのサブ制御部43A〜43Dの制御のもとに、対応するアクチュエータA1〜A14が駆動され、かくして頭部ユニット3を上下左右に揺動させたり、腕部ユニット4A、4Bを上にあげたり、歩行するなどの行動がロボットにより発現されることとなる。
【0033】
またこの際メイン制御部40は、必要に応じて所定の音声信号S3をスピーカ54に与えることにより当該音声信号S3に基づく音声を外部に出力させたり、外見上の「目」として機能する頭部ユニット3の所定位置に設けられたLEDに駆動信号を出力することによりこれを点滅させる。
【0034】
このようにしてこのロボット1においては、周囲及び内部の状況や、ユーザからの指令及び働きかけの有無などに基づいて自律的に行動することができるようになされている。
【0035】
(1−2)メイン制御部の処理
ここでこのようなロボット1の行動生成に関するメイン制御部40の処理について説明する。
【0036】
図6に示すように、ロボット1の行動生成に関するメイン制御部40の処理内容を機能的に分類すると、外部及び内部の状態を認識する状態認識部60と、状態認識部60の認識結果等に基づいて感情及び本能の状態を決定する感情・本能モデル61と、状態認識部60の認識結果及び感情・本能モデル61において決定された感情・本能の状態に基づいて次の行動を決定する行動決定部62と、行動決定部62の決定結果に基づいて実際にロボット1に行動を発現させる行動生成部63とに分けることができる。以下、これら状態認識部60、感情・本能モデル部61、行動決定部62及び行動生成部63について説明する。
【0037】
(1−2−1)状態認識部60の処理
状態認識部60は、外部センサ部53から与えられる外部センサ信号S1及び内部センサ部57から与えられる内部センサ信号S2に基づいて特定の状態を認識し、認識結果を状態認識情報D1として感情・本能モデル61及び行動決定部62に通知する。
【0038】
具体的に情報認識部60は、外部センサ部53のCCDカメラ50から与えられる画像信号S1Aを常時監視し、当該画像信号S1Aに基づく画像内に例えば「赤い丸いもの」や「進行方向に位置する物体」を検出したときには「ボールがある」、「障害物がある」と認識して、当該認識結果を感情・本能モデル61及び行動決定部62に通知する。
【0039】
また状態認識部60は、マイク部51から与えられる音声信号S1Bを常時監視し、HMM(Hidden Markov Model )法などの音声認識手法により「歩け」、「伏せ」、「ボールを追いかけろ」等の各種音声を認識したときには、これを感情・本能モデル61及び行動決定部62に通知する。
【0040】
さらに状態認識部60は、タッチセンサ52から与えられる圧力検出信号S1Cを常時監視し、当該圧力検出信号S1Cに基づいて所定の閾値以上のかつ短時間(例えば2秒未満)の圧力を検出したときには「叩かれた(叱られた)」と認識し、所定の閾値未満のかつ長時間(例えば2秒以上)の圧力を検出したときには「撫でられた(誉められた)」と認識し、認識結果を感情・本能モデル部61及び行動決定部62に通知する。
【0041】
さらに状態認識部60は、内部センサ部57の加速度センサ56から与えられる加速度検出信号S2Bを常時監視し、当該加速度検出信号S2Bに基づいて転倒等を検出したときには、これを感情・本能モデル部61及び行動決定部62に通知する。
【0042】
(1−2−2)感情・本能モデル部61の処理
感情・本能モデル部61は、「喜び」、「悲しみ」、「驚き」、「恐怖」、「嫌悪」及び怒り」の合計6つの情動について、これら情動ごとの強さを表すパラメータを保持している。そして感情・本能モデル部61は、これら各情動のパラメータ値を、それぞれ状態認識部60から状態認識情報D1として与えられる「誉められた」、「叱られた」などの特定の認識結果に基づいて順次変更する。
【0043】
具体的に感情・本能モデル部61は、状態認識情報D1に基づき得られる認識結果及び行動決定部62から行動決定情報D2として通知されるロボット1の直前の出力行動がその情動に対して作用する度合い(予め設定されている)と、他の情動から受ける抑制及び刺激の度合いと、経過時間となどに基づいて所定の演算式により算出されるその情動の変化量をΔE〔t〕、現在のその情動のパラメータ値をE〔t〕、認識結果等に応じてその情動を変化させる割合を表す係数をkとして、所定周期で次式
【0044】
【数1】
Figure 0004210897
【0045】
を用いて次の周期におけるその情動のパラメータ値E〔t+1〕を算出する。
【0046】
そして感情・本能モデル部61は、この演算結果を現在のその情動のパラメータ値E〔t〕と置き換えるようにしてその情動のパラメータ値を更新する。なお各認識結果や各出力行動に対してどの情動のパラメータ値を更新するかは予め定められており、例えば「叩かれた」といった認識結果が与えられた場合には「怒り」の情動のパラメータ値が上がり、「撫でられた」といった認識結果が与えられた場合には、「喜び」の情動のパラメータ値が上がる。
【0047】
これと同様にして、感情・本能モデル部61は、「愛情欲」、「探索欲」、「運動欲」、「充電欲」及び「睡眠欲」の互いに独立した5つの欲求について、これら欲求ごとにその欲求の強さを表すパラメータを保持している。そして感情・本能モデル部61は、これら各欲求のパラメータ値を、それぞれ状態認識部60からの認識結果や経過時間等に基づいて順次更新する。
【0048】
体的には感情・本能モデル部61は、「愛情欲」、「探索欲」及び「運動欲」については、ロボット1の出力行動、経過時間及び認識結果などに基づいて所定の演算式により算出されるその欲求の変化量をΔI〔k〕、現在のその欲求のパラメータ値をI〔k〕、その欲求の感度を表す係数をkiとして、所定周期で次式
【0049】
【数2】
Figure 0004210897
【0050】
を用いて次の周期におけるその欲求のパラメータ値I〔k+1〕を算出し、この演算結果を現在のその欲求のパラメータ値I〔k〕と置き換えるようにしてその欲求のパラメータ値を更新する。この場合、出力行動や認識結果等に対してどの欲求のパラメータ値を変化させるかは予め定められており、例えば行動決定部61から何らかの行動を行ったとの通知があったときは「運動欲」のパラメータ値が下がることとなる。
【0051】
また感情・本能モデル部61は、「食欲」については、状態認識部60を介して与えられるバッテリ残量検出信号S2Aに基づいて、バッテリ残量をBLとして所定周期で次式
【0052】
【数3】
Figure 0004210897
【0053】
により「食欲」のパラメータ値I〔k+1〕を算出し、この演算結果を現在の食欲のパラメータ値I〔k〕を置き換えるようにして当該「食欲」のパラメータ値を更新する。
【0054】
なお本実施の形態においては、各情動及び各欲求のパラメータ値がそれぞれ0から100 までの範囲で変動するように規制されており、また係数ke 、ki の値も各情動及び各欲求ごとにそれぞれ個別に設定されている。
【0055】
因みに、上述のように各認識結果や各出力行動に対してどの情動又は欲求のパラメータ値をどの程度増減させるかは予め設定されているが、これもその後のユーザからの働きかけや、自己の行動結果等に応じて順次変更される。
【0056】
実際上、感情・本能モデル部61は、例えば状態認識部60から当該ロボット1が好きな色やボール等のアイテム等を見ているとの状態認識情報D1が与えられると、初期時には「喜び」の情動のパラメータ値を増加させるように更新するが、このときに「叩かれた」という状態認識情報D1が与えられた場合には、「喜び」の係数Keを下げると共に、「怒り」の係数Keを上げるようにこれらの係数値を更新する。
【0057】
この結果、ロボット1が好きな色やアイテム等を見ているときに「叩く」という働きかけが何度も行われると、その色やアイテム等に対する「喜び」の係数Ke が徐々に小さくなると共に、「怒り」の係数Keが徐々に大きくなり、やがてその色やアイテム等を見ると「怒り」のパラメータ値が大きくなるように更新されることにより、後述のようにロボット1が怒ったような行動を発現するようになる。
【0058】
また感情・本能モデル部61は、状態認識部60から『大きなボールがある』ということを意味する「ボール(大)」という状態認識情報D1が与えられた後、行動決定部62から『ボールをキックする』ということを意味する「キック」という行動決定情報D2が与えられ、さらにこの後状態認識部60から『小さなボールがある』ということを意味する「ボール(小)」という状態認識情報D1が与えられた場合には、『ボールを蹴るのに成功した』と判断し、その事象と関連する『ボール』というアイテムに対する「喜び」の係数Keと、「運動欲」の係数Kiとをそれぞれ上げるようにこれらの係数値を更新する。
【0059】
この結果、ロボット1がボールを蹴る動作を何度も成功すると、『ボール』に対する「喜び」の係数Keと「運動欲」の係数Kiとがそれぞれ徐々に大きくなり、やがてボールを見ると「喜び」及び「運動欲」のパラメータ値が徐々に大きくなるように更新されることにより、後述のようにロボット1がボールを見ると喜んだ行動を発現したり、ボール遊びをよくするようになる。
【0060】
これとは逆に、感情・本能モデル部61は、状態認識部60から「ボール(大)」という状態認識部D1が与えられた後、行動決定部62から「キック」という行動決定情報D2が与えられ、さらにこの後状態認識部60から「ボール(大)」という状態認識情報D1が与えられた場合には、『ボールを蹴るのに失敗した』と判断し、『ボール』に対する「喜び」の係数Keと、「運動欲」の係数Kiとをそれぞれ下げるようにこれらの係数値を更新する。
【0061】
この結果、ロボット1がボールを蹴る動作を何度も失敗すると、『ボール』に対する「喜び」の係数keと「運動欲」の係数Kiとがそれぞれ徐々に小さくなり、やがてボールを見ると「喜び」及び「運動欲」のパラメータ値が小さくなるように更新されることにより、後述のようにロボット1がボールを見ても無反応となったり、ボール遊びをあまりしないようになる。
【0062】
このようにして、このロボット1においては、ユーザからの働きかけや、自己の行動結果等に応じて性格を変化させ得るようになされている。
【0063】
(1−2−3)行動決定部62の処理
一方、行動決定部62は、状態認識部60から状態認識情報D1が与えられたときや、現在の行動に移ってから一定時間経過したとき、感情・本能モデル部61におけるいずれかの情動又は本能のパラメータ値が閾値を超えたときなどに、内部メモリ40Aに格納されている制御プログラム及び外部メモリ58に格納されている制御パラメータに基づいて次の行動を決定する。
【0064】
具体的に行動決定部62は、次の行動を決定する手法として、図7に示すように、状態をノードNODE0〜NODEnとして表現し、1つのノードNODE0〜NODEnから次のどのノードNODE0〜NODEnに遷移するかを、自ノードNODE0〜NODEnにおいて完結し又は各ノードNODE0〜NODEn間を接続するアークARC0〜ARCnに対してそれぞれ設定された遷移確率P0〜Pnに基づいて確率的に決定する確率オートマトンと呼ばれるアルゴリズムを用いる。
【0065】
この場合この確率オートマトンにおける各ノードNODE0〜NODEn間の接続関係や、各アークARC0〜ARCnに対する遷移確率P0〜Pn及び各アークARC0〜ARCnにそれぞれ対応付けられた動作が制御パラメータ(行動モデル)として外部メモリ58に格納されている。
【0066】
そして行動決定部62は、例えば状態認識部60から状態認識情報D1が与えられたときや、現在のノード(NODE0)に移ってから一定時間が経過したとき、感情・本能モデル部61におけるいずれかの情動又は本能のパラメータ値が閾値を超えたときなどに、かかる確率オートマトンにおける次の遷移先のノード(NODE0〜NODEn)を各アークARC0〜ARCnに対する遷移確率P0〜Pnに基づいて確率的に決定し、このとき決定したノード(NODE0〜NODEn)と元のノード(NODE0)をと接続するアーク(ARC0〜ARCn)に対応付けられた行動を次に発現すべき行動として、行動決定情報D2として行動生成部に通知する。
【0067】
(1−2−4)行動生成部63の処理
行動生成部63においては、行動決定部62から行動決定情報D2が与えられると、当該行動決定情報D2に基づく行動をロボットに発現させるための制御コマンドCOMを対応するサブ制御部43A〜43Dにそれぞれ出力する。
【0068】
具体的に、行動生成部63は、「歩く」、「座る」、「ダンスする」等の各動作にそれぞれ対応させて、その動作をロボット1に発現させるためにどのアクチュエータA1〜A14(図1及び図2)の出力軸をどのタイミングでどのくらいの角度だけ回転駆動させるかといった、動作ごとの各アクチュエータA1〜A14の時系列的な制御内容を規定したファイル(以下、これをモーションファイルと呼ぶ)を外部メモリ58内に有している。
【0069】
そして行動生成部63は、行動決定部62から行動決定情報D2が与えられるごとに、対応するモーションファイルを順次再生して当該モーションファイルに格納された制御パラメータに基づく制御コマンドCOMを生成し、当該制御コマンドCOMを対応するサブ制御部43A〜43Dに送出する。
【0070】
この結果この制御コマンドCOMに基づいて、対応するサブ制御部43A〜43Dによって対応するアクチュエータA1〜A14が順次駆動され、かくしてロボット1がかかる動作を発言することとなる。
【0071】
また行動生成部63は、各種音のWAVEファイルである複数の音声ファイルと、上述した外見上の「目」として機能するLEDの駆動データが格納された複数のLED駆動ファイルを外部メモリ58内に有しており、かかるモーションファイルの再生時等にそのモーションファイルと対応付けられた音声ファイル及び又はLED駆動ファイルを同時に再生することにより、ロボット1に動作と合わせてスピーカ54(図5)から音声を出力させたり、当該LEDを点滅駆動させる。
【0072】
このようにしてメイン制御部40においては、外部及び内部の状況や、ユーザからの指令及び働きかけの有無等に応じてロボット1を自律的に行動させ得るようになされている。
【0073】
(2)音源方向検出処理
ところでこのロボット1の頭部ユニット3には、図8(A)〜(C)に示すように、その前面上部に正面マイク70、後面上部に後部マイク71が配置されると共に、右面に右マイク72及び73が近接して配置されることにより右マイク群が形成され、左面に左マイク74及び75が近接して配置されることにより左マイク群が形成されている。
【0074】
また図9に示すように、各マイク70〜75にはぞれぞれアナログディジタル(A/D)変換回路80〜85が接続されることによりマイク部51が構成され、当該各A/D変換回路80〜85は、各マイク70〜75によって集音された音声信号をディジタル信号にそれぞれ変換した後、これらを音声信号S1Bとしてメイン制御部40に送出するようになされている。
【0075】
メイン制御部40の状態認識部60は、この音声信号S1Bに基づいて、音声を発している音源の左右方向、すなわち音源がロボット1を基準として左右いずれの方向に位置しているかを判断すると共に、音源の前後方向、すなわち音源がロボット1を基準として前後いずれの方向に位置しているかを判断することにより、当該音源の方向を検出し、その検出結果を感情・本能モデル部61及び行動決定部62に通知する。以下、この音源方向検出処理における左右方向検出処理及び前後方向検出処理について具体的に説明する。
【0076】
(2−1)左右方向検出処理
ここで、正面マイク70、後部マイク71、右マイク72及び73からなる右マイク群並びに左マイク74及び75からなる左マイク群の間の各マイク間距離は、音声信号の高周波成分に着目すると、音声信号の高周波成分の1周期に相当する1波長の1/2を超える距離になってしまい、また音声信号の高周波成分は、頭部ユニット3の回折の影響を強く受け、音源方向を正確に検出ことが困難である。
【0077】
従って、この場合、状態認識部60は、マイク間距離が1波長の1/2以下であって、かつ頭部回折の影響が比較的少ない低域の周波数帯域成分を抽出することにより音源方向の検出を行う。
【0078】
すなわち状態認識部60は、図10に示すように、左マイク群のうちの例えば左マイク74から入力された入力信号Li(t)をローパスフィルタ(LPF)90に供給し、当該入力信号Li(t)に対して、次式
【0079】
【数4】
Figure 0004210897
【0080】
によって表される伝達関数H(z)を乗算することにより、低周波数帯域成分が抽出された入力信号Ll(t)を得る。
【0081】
同様にして状態認識部60は、右マイク群のうちの右マイク72から入力された入力信号Ri(t)に対して、上述の(4)式によって表される伝達関数H(z)を乗算することにより、低周波数帯域成分が抽出された入力信号Rl(t)を得る。
【0082】
次いで状態認識部60は、音声が左マイク74に到達した時間を基準とした場合の音声到達時間差tに対する、入力信号Ll(t)及び入力信号Rl(t)の相互相関値L(t)を、次式
【0083】
【数5】
Figure 0004210897
【0084】
によって算出すると共に、右マイク72への到達時間を基準とした音声到達時間差tに対する、入力信号Ll(t)及び入力信号Rl(t)の相互相関値R(t)を、次式
【0085】
【数6】
Figure 0004210897
【0086】
によって算出する。
【0087】
かくして得られた音声到達時間差t(0〜TLL)に対する相互相関値L(t)の関係を図11(A)に示すと共に、音声到達時間差t(0〜TLR)に対する相互相関値R(t)の関係を図11(B)に示す。ここでTLL及びTLRは、初期値として10が予め設定されており、音声到達時間差t(0)〜t(TLL)までの範囲を、相互相関値L(t)における音源方向の仮説時間範囲と呼び、音声到達時間差t(0)〜t(TLR)までの範囲を、相互相関値R(t)における音源方向の仮説時間範囲と呼ぶ。
【0088】
ところで各マイク70〜75から得られる音声信号は、頭部の筐体の回折の影響を強く受け、音源を基準として頭部の反対側に位置するマイクでは、信号レベルが減衰した音声信号が得られることになる。特に、音声信号のうち例えば1〔kHz〕以上の高域の周波数帯域成分は、低域の周波数帯域成分と比較して信号レベルの減衰の度合いが大きく、当該信号レベルの減衰の度合いは、マイク間距離に比例して大きくなることがわかっている。
【0089】
このため状態認識部60は、音声信号のうち高域の周波数帯域成分に着目して、各マイク間における高域の周波数帯域成分の信号レベル比に基づいて音源方向の検出を行うようになされている。
【0090】
すなわち、状態認識部60は、図12に示すように、左マイク群のうちの例えば左マイク74から入力された入力信号Li(t)をハイパスフィルタ(HPF)91に供給し、当該入力信号Li(t)に対して、次式
【0091】
【数7】
Figure 0004210897
【0092】
によって表される伝達関数H(z)を乗算することにより、高周波数帯域成分が抽出された入力信号LH(t)を得る。
【0093】
同様にして状態認識部60は、右マイク群のうちの右マイク72から入力された入力信号Ri(t)に対して、上述の(7)式によって表される伝達関数H(z)を乗算することにより、高周波数帯域成分が抽出された入力信号RH(t)を得る。
【0094】
そして状態認識部60は、高周波数帯域成分が抽出された入力信号LH(t)の振幅の平均値である高域平均振幅YLHを、次式
【0095】
【数8】
Figure 0004210897
【0096】
によって算出すると共に、高周波数帯域成分が抽出された入力信号RH(t)の高域平均振幅YRHを、上述の(8)式によって算出する。
【0097】
次いで状態認識部60は、高域平均振幅YLH及びYRHの比である高域振幅比RH_lrを、次式
【0098】
【数9】
Figure 0004210897
【0099】
によって算出することにより、高域の音声信号の信号レベル比を求める。
【0100】
そして状態認識部60は、高域振幅比RH_lrが2.0よりも大きいと判断した場合にはTLLに0を設定することにより、仮説時間範囲を、図11(B)に示す音声到達時間差t(0)〜t(10)の範囲に狭め、高域振幅比RH_lrが1.3よりも大きくかつ2.0よりも小さいと判断した場合にはTLLに2を設定することにより、仮説時間範囲を、図11(A)に示す音声到達時間差t(0)〜t(2)の範囲と図11(B)に示す音声到達時間差t(0)〜t(10)の範囲に狭める。
【0101】
また状態認識部60は、高域振幅比RH_lrが0.5よりも小さいと判断した場合にはTLRに0を設定することにより、仮説時間範囲を、図11(A)に示す音声到達時間差t(0)〜t(10)の範囲に狭め、高域振幅比RH_lrが0.75よりも小さくかつつ0.5よりも大きいと判断した場合にはTLRに2を設定することにより、仮説時間範囲を、図11(A)に示す音声到達時間差t(0)〜t(10)の範囲と11(B)に示す音声到達時間差t(0)〜t(2)の範囲に狭める。
【0102】
そして状態認識部60は、当該得られた仮説時間範囲の中から相互相関値が最大となる音声到達時間差tを探索し、予め用意されているテーブルに基づいて当該探索された音声到達時間差tに対応する音源の左右方向の角度を得る。
【0103】
(2−2)前後方向検出処理
この場合、状態認識部60は、正面マイク70から入力された入力信号Fi(t)に対して、上述の(4)式によって表される伝達関数H(z)を乗算することにより、低周波数帯域成分が抽出された入力信号Fl(t)を得る。
【0104】
同様にして状態認識部60は、後部マイク71から入力された入力信号Bi(t)に対して、上述の(4)式によって表される伝達関数H(z)を乗算することにより、低周波数帯域成分が抽出された入力信号Bl(t)を得る。
【0105】
次いで状態認識部60は、音声が正面マイク70に到達した時間を基準とした場合の音声到達時間差tに対する、入力信号Fl(t)及び入力信号Bl(t)の相互相関値F(t)を、上述の(5)式と同様の演算式によって算出すると共に、後部マイク71への到達時間を基準とした音声到達時間差tに対する、入力信号Fl(t)及び入力信号Bl(t)の相互相関値B(t)を、上述の(6)式と同様の演算式によって算出する。
【0106】
かくして得られた音声到達時間差t(0〜TLF)に対する相互相関値F(t)の関係を図13(A)に示すと共に、音声到達時間差t(0〜TLB)に対する相互相関値B(t)の関係を図13(B)に示す。ここでTLF及びTLBは、初期値として10が予め設定されており、音声到達時間差t(0)〜t(TLF)までの範囲を、相互相関値F(t)における音源方向の仮説時間範囲と呼び、音声到達時間差t(0)〜t(TLB)までの範囲を、相互相関値B(t)における音源方向の仮説時間範囲と呼ぶ。
【0107】
ところで、右マイク群を形成する右マイク72及び73と、左マイク群を形成する左マイク74及び75は、それぞれ近接しマイク間距離が小さいため、マイク間距離が大きい場合に比して、より広い周波数帯域の音声信号を用いて音源方向の検出を行うことができる。
【0108】
この場合、状態認識部60は、右マイク群を形成する右マイク72及び73と左マイク群を形成する左マイク74及び75とを用いて指向性マイクを形成することにより音源方向を検出するようになされている。
【0109】
すなわち、状態認識部60は、図14に示すような機能ブロックからなる指向性マイクを形成し、右マイク群のうち前方に位置する右マイク72から入力された入力信号を遅延回路100に供給すると共に、右マイク群のうち後方に位置する右マイク73から入力された入力信号を遅延回路101に供給する。
【0110】
遅延回路100は、供給される入力信号を遅延させることなく後段の加算回路102に送出し、遅延回路101は、供給される入力信号を、右マイク72と右マイク73との間の距離に相当する時間だけ遅延させた後、後段の加算回路102に送出する。
【0111】
加算回路102は、遅延回路100及び10lから供給される入力信号を加算することにより、ロボット1を基準として後方から発せられる音声を打ち消し、その結果得られた入力信号をLPF103に送出する。
【0112】
LPF103は、供給される入力信号に対して、次式
【0113】
【数10】
Figure 0004210897
【0114】
によって表される伝達関数を乗算することにより、当該入力信号の周波数特性を補正する。
【0115】
平均振幅算出回路104は、当該周波数特性が補正された入力信号に対して、次式
【0116】
【数11】
Figure 0004210897
【0117】
によって表される演算式を用いて、前方指向性振幅Afを算出する。
【0118】
また、状態認識部60は、右マイク群のうち前方に位置する右マイク72から入力された入力信号を遅延回路110に供給すると共に、右マイク群のうち後方に位置する右マイク73から入力された入力信号を遅延回路111に供給する。
【0119】
遅延回路110は、供給される入力信号を、右マイク72と右マイク73との間の距離に相当する時間だけ遅延させた後、後段の加算回路112に送出し、遅延回路111は、供給される入力信号を遅延させることなく後段の加算回路112に送出する。
【0120】
加算回路112は、遅延回路110及び111から供給される入力信号を加算することにより、ロボット1を基準として前方から発せられる音声を打ち消し、当該加算された入力信号をLPF113及び平均振幅算出回路114に順次送出して後方指向性振幅Abを算出する。
【0121】
振幅比算出回路115は、前方指向性振幅Af及び後方指向性振幅Abを基に前後振幅比Rfbを、次式
【0122】
【数12】
Figure 0004210897
【0123】
によって算出する。
【0124】
そして状態認識部60は、前後振幅比Rfbが2.0よりも大きいと判断した場合にはTLBに0を設定することにより、仮説時間範囲を、図13(A)に示す音声到達時間差t(0)〜t(10)の範囲に狭め、前後振幅比Rfbが1.3よりも大きくかつ2.0よりも小さいと判断した場合にはTLBに2を設定することにより、仮説時間範囲を、図11(A)に示す音声到達時間差t(0)〜t(10)の範囲と図11(B)に示す音声到達時間差t(0)〜t(2)の範囲に狭める。
【0125】
また状態認識部60は、前後振幅比Rfbが0.5よりも小さいと判断した場合にはTLFに0を設定することにより、仮説時間範囲を、図11(B)に示す音声到達時間差t(0)〜t(10)の範囲に狭め、前後振幅比Rfbが0.75よりも小さくかつ0.5よりも大きいと判断した場合にはTLFに2を設定することにより、仮説時間範囲を、図11(A)に示す音声到達時間差t(0)〜t(2)の範囲と図11(B)に示す音声到達時間差t(0)〜t(10)の範囲に狭める。
【0126】
そして状態認識部60は、当該得られた仮説時間範囲の中から相互相関値が最大となる音声到達時間差tを探索し、予め用意されているテーブルに基づいて当該探索された音声到達時間差tに対応する音源の前後方向の角度を得る。
【0127】
なお状態認識部60は、当該得られた仮説時間範囲の中から相互相関値が最大となる音声到達時間差tを検出できないと判断した場合には、前後振幅比Rfbを基に音源の前後方向の角度を直接得ることにする。
【0128】
すなわち状態認識部60は、前後振幅比Rfbが2.0よりも大きいと判断した場合には、音源の前後方向の角度を0〔°〕に設定し、前後振幅比Rfbが1.0よりも大きくかつ2.0よりも小さいと判断した場合には、音源の前後方向の角度を30〔°〕に設定する。
【0129】
また状態認識部60は、前後振幅比Rfbが0.5よりも小さいと判断した場合には、音源の前後方向の角度を180〔°〕に設定し、前後振幅比Rfbが0.75よりも小さくかつ0.5よりも大きいと判断した場合には、音源の前後方向の角度を135〔°〕に設定し、前後振幅比Rfbが1.0よりも小さくかつ0.75よりも大きいと判断した場合には、音源の前後方向の角度を90〔°〕に設定する。
【0130】
このようにして状態認識部60は、ロボット1を基準として左右方向に着目した場合に検出された音源の左右方向の角度と、前後方向に着目した場合に検出さされた音源の前後方向の角度とを基に、音源方向の角度を検出するようになされている。
【0131】
(3)指向性マイク生成処理
ところで、状態認識部60は、CCDカメラ50から得られる画像信号S1Aを解析することにより音源の位置を特定し、当該特定された音源の方向に対する指向性マイクを生成し得るようになされている。
【0132】
すなわち、状態認識部60は、始めにCCDカメラ50から得られる画像信号S1Aを解析することにより例えば対話相手の位置を特定する。そして状態認識部60は、特定された対話相手が当該ロボット1を基準として正面に位置すると判断した場合には、右マイク群のうち前方に位置する右マイク72から入力される音声信号と、後方に位置する右マイク73から入力される音声信号を所定時間遅延させた音声信号とを加算することにより、ロボット1の後方から発せられる音声信号を打ち消す。
【0133】
同様に状態認識部60は、左マイク群のうち前方に位置する左マイク74から入力される音声信号と、後方に位置する左マイク75から入力される音声信号を所定時間遅延させた音声信号とを加算することにより、ロボット1の後方から発せられる音声信号を打ち消す。
【0134】
このように状態認識部60は、特定された音源の方向に対する指向性マイクを生成し得、S/N比を向上させることができる。
【0135】
(4)本実施の形態の動作及び効果
以上の構成において、このロボット1の頭部ユニット3には、その前面上部に正面マイク70、後面上部に後部マイク71が配置されると共に、右面に右マイク72及び73が近接して配置され、左面に左マイク74及び75が近接して配置されている。
【0136】
状態認識部60は、右マイク72及び左マイク74から入力される音声信号の低域の周波数成分に着目し、音声の各マイクへの到達時間差を検出することにより、音源の左右方向を仮説する。この場合、音源方向の仮説に利用し得る周波数帯域が制限されるが、マイク間距離が大きいためS/N比の劣化を回避することができる。
【0137】
次いで状態認識部60は、右マイク72及び左マイク74から入力される音声信号の高域の周波数成分に着目し、その信号レベル比を算出することにより、音源の左右方向を仮説する。この場合、マイク間距離が大きいため信号レベルの減衰も大きく、これにより明らかに音源が存在しない方向を排除することができる。
【0138】
そして状態認識部60は、音声信号の低域の周波数成分に着目した場合に得られた音源の左右方向の仮説と、音声信号の高域の周波数成分に着目した場合に得られた音源の左右方向の仮説とに基づいて、音源の左右方向の角度を正しく検出し得る。
【0139】
また、状態認識部60は、右マイク72及び左マイク74から入力される音声信号の低域の周波数成分に着目し、音声の各マイクへの到達時間差を検出することにより、マイク間距離を1/2波長以下にしつつかつ頭部回折の影響を回避しながら音源の前後方向を仮説する。この場合、音源方向の仮説に利用し得る周波数帯域が制限されるが、マイク間距離が大きいためS/N比の劣化を回避することができる。
【0140】
次いで状態認識部60は、右マイク群を形成する右マイク72及び73と左マイク群を形成する左マイク74及び75とによって指向性マイクを形成することにより、より広い周波数帯域の音声信号を用いて音源の前後方向を仮説する。この場合、頭部回折の影響を回避することができる。
【0141】
そして状態認識部60は、音声信号の低域の周波数成分に着目した場合に得られた音源の前後方向の仮説と、音声信号の広い周波数成分に着目した場合に得られた音源の前後方向の仮説とに基づいて、音源の前後方向の角度を正確に検出し得る。
【0142】
このように状態認識部60は、音源の左右方向の角度を正確に検出し得ると共に、音源の前後方向の角度を正確に検出し得、従って音源方向検出処理の信頼性を一段と向上することができる。
【0143】
また状態認識部60は、CCDカメラ50から得られる画像信号S1Aを基に音源の位置を特定し、当該特定された音源方向の指向性マイクを生成することにより、S/N比を向上させることができる。
【0144】
以上の構成によれば、ロボット1の頭部ユニット3の前面上部に正面マイク70を配置すると共に後面上部に後部マイク71を配置し、さらに右面に右マイク72及び73を近接して配置すると共に、左面に左マイク74及び75を近接して配置し、各マイク70〜75から得られる音声信号に基づいて音源の方向を検出することにより、複数の音源方向検出方法を用いて音源方向を検出し得、従って音源方向を一段と正確に検出し得る。
【0145】
(5)他の実施の形態
なお上述の実施の形態においては、本発明を図1及び図2のように構成された2足歩行型のロボット1に適用するようにした場合について述べたが、本発明はこれに限らず、例えば4足歩行型のペットロボットや、この他種々のロボット装置に広く適用することができる。
【0146】
また上述の実施の形態においては、第1のマイク群として、頭部ユニット3の右面に近接して配置された右マイク72及び73からなる右マイク群と、左面に近接して配置された左マイク74及び75からなる左マイク群とを適用する場合について述べたが、本発明はこれに限らず、互いに近接して配置された他の種々の第1のマイク群を適用するようにしても良い。
【0147】
また上述の実施の形態においては、第2のマイク群として、頭部ユニット3の前面上部に配置された正面マイク70と、後面上部に配置された後部マイク71とを適用する場合について述べたが、本発明はこれに限らず、互いに近接しないように配置された他の種々の第2のマイク群を適用するようにしても良い。
【0148】
さらに上述の実施の形態においては、音声認識手段として状態認識部60を適用した場合について述べたが、本発明はこれに限らず、各マイクから入力される音声信号に対して所定の音声認識処理を施す他の種々の音声認識手段を適用するようにしても良い。
【0149】
【発明の効果】
互いに近接しない2つのマイクロホンによって検出される第 1 の音声信号及び第 2 の音声信号から抽出した第 1 の低域信号と第 2 の低域信号とを基に相互相関関数式を用いて相互相関値を算出し、相互相関値から音源の方向を算出するようにしたことにより、マイクロホン付近の回折の影響及び外部ノイズの影響を避けることができるので音源の方向を正確に検出でき、また第 1 の音声信号及び第 2 の音声信号から高域成分を抽出した高域振幅比を基に音源の方向を算出するようにしたことにより、 2 つのマイクロホン間の音声信号レベル比が大きいため明らかに音源が存在しない方向を排除でき、さらに互いに近接した2つのマイクロホンによって検出された第 3 音声信号及び第 4 音声信号を用いた処理で指向性の強いマイクロホンを形成することにより、指向性によって音源の方向を正確に検出できるという、以上の3つの音源検出方法を併用し、総合的に音源の方向を判断するようにしたことにより、回折の影響及び外部ノイズの影響が避けられS/Nが向上することができるので音源の方向を一段と正確に判断でき、かくして音源に対して3つの方向判断方法を併用し、総合的に判断することで音源の方向を一段と正確に判断できる音源方向判断装置を実現できる
【0150】
また本発明においては、ロボット装置の制御方法において、互いに近接して配置された第1のマイク群と、互いに近接しないように配置された第2のマイク群とからそれぞれ入力される音声信号に対して所定の音声認識処理を施すことにより、音源方向を一段と正確に検出し得ると共にS/N比を向上させることができ、従って音声の取得を一段と高品質に行い得るロボット装置の制御方法を実現できる。
【図面の簡単な説明】
【図1】本実施の形態によるロボットの外部構成を示す斜視図である。
【図2】ロボットの外部構成を示す斜視図である。
【図3】ロボットの外部構成の説明に供する略線図である。
【図4】ロボットの内部構成の説明に供するブロック図である。
【図5】ロボットの内部構成の説明に供するブロック図である。
【図6】メイン制御部の処理内容の説明に供するブロック図である。
【図7】確率オートマトンの説明に供する概念図である。
【図8】頭部ユニットの外観構成の説明に供する略線図である。
【図9】マイク部の構成の説明に供する略線図である。
【図10】LPFの説明に供する略線図である。
【図11】時間差tに対する相互相関値の説明に供する略線図である。
【図12】HPFの説明に供する略線図である。
【図13】時間差tに対する相互相関値の説明に供する略線図である。
【図14】指向性マイクの構成の説明に供する略線図である。
【符号の説明】
1……ロボット、2……胴体部ユニット、3……頭部ユニット、4A、4B……腕部ユニット、5A、5B……脚部ユニット、40……メイン制御部、50……CCD、51……マイク部、52……タッチセンサ、54……スピーカ、55……バッテリセンサ、56……加速度センサ、58……外部メモリ、60……状態認識部、70……正面マイク、71……後部マイク、72、73……右マイク、74、75……左マイク。

Claims (2)

  1. 互いに近接しない第 1 の所定距離に配置された第1マイクロホン及び第2マイクロホンによって検出される第1音声信号及び第2音声信号のそれぞれから、上記第 1 の所定距離とその1/2波長が等しくなる周波数の低域成分である第 1 低域信号及び第 2 低域信号を抽出する低域信号抽出手段と、
    上記第 1 低域信号及び上記第2低域信号を基に相互相関関数式を用いることによってそれぞれ第 1 相互相関値及び第2相互相関値を算出する相互相関値算出手段と、
    上記第 1 相互相関値及び上記第2相互相関値に基づいて上記音源の方向を算出する第 1 方向算出手段と、
    上記第1音声信号及び上記第2音声信号からそれぞれ第 1 高域信号及び第 2 高域信号を抽出する高域信号抽出手段と
    上記第 1 高域信号及び上記第 2 高域信号を基に第1の計算式を用いてそれぞれ第 1 高域平均振幅値及び第 2 高域平均振幅値を算出する高域平均振幅算出手段と、
    上記第 1 高域平均振幅値と上記第 2 高域平均振幅値との比を求めることによって高域振幅比を算出する高域振幅算出手段と、
    所定の第 1 のテーブルと上記高域振幅比とに基づいて上記音源の方向を算出する第 2 方向算出手段と、
    互いに近接している第 2 の所定距離に配置された第 3 マイクロホン及び第 4 マイクロホンによって検出される第3音声信号及び第4音声信号の一方に対し、上記第 2 の所定距離に相当する遅延時間だけ遅延させて他方と加算する第 1 加算手段と、
    上記一方と上記遅延時間だけ遅延させた上記他方とを加算する第 2 加算手段と、
    上記第 1 加算手段及び上記第2加算手段によって得られた値を基に第2の計算式を用いてそれぞれ前方指向性振幅及び後方指向性振幅を算出する指向特性振幅算出手段と、
    上記前方指向性振幅と上記後方指向性振幅との比を求めることによって前後振幅比を算出する前後振幅比算出手段と、
    所定の第2のテーブルと上記前後振幅比とに基づいて上記音源の方向を算出する第 3 方向算出手段とを具え、
    上記第 1 方向算出手段、上記第 2 方向算出手段及び上記第 3 方向算出手段を併用することにより、総合的に上記音源の方向を判断する
    ことを特徴とする音源方向判断装置。
  2. 互いに近接しない第 1 の所定距離に配置された第1マイクロホン及び第2マイクロホンによって検出される第1音声信号及び第2音声信号のそれぞれから、上記第 1 の所定距離とその1/2波長が等しくなる周波数の低域成分である第 1 低域信号及び第 2 低域信号を抽出する低域信号抽出ステップと、
    上記第 1 低域信号及び上記第2低域信号を基に相互相関関数式を用いることによってそれぞれ第 1 相互相関値及び第2相互相関値を算出する相互相関値算出ステップと、
    上記第 1 相互相関値及び上記第2相互相関値に基づいて上記音源の方向を算出する第 1 方向算出ステップと、
    上記第1音声信号及び上記第2音声信号からそれぞれ第 1 高域信号及び第 2 高域信号を抽出する高域信号抽出ステップと
    上記第 1 高域信号及び上記第 2 高域信号を基に所定の計算式を用いてそれぞれ第 1 高域平均振幅値及び第 2 高域平均振幅値を算出する高域平均振幅算出ステップと、
    上記第 1 高域平均振幅値と上記第 2 高域平均振幅値との比をとることによって高域振幅比を算出する高域振幅算出ステップと、
    所定のテーブルと上記高域振幅比とに基づいて上記音源の方向を算出する第 2 方向算出ステップと、
    互いに近接している第 2 の所定距離に配置された第 3 マイクロホン及び第 4 マイクロホンによって検出される第3音声信号及び第4音声信号のうち一方の上記音声信号に対し上記 2 距離に相当する遅延時間遅延させて他方の音声信号と加算する第 1 加算ステップと、
    上記一方の音声信号と上記他方の音声信号に対し上記遅延時間遅延させて加算する第 2 加算ステップと、
    上記第 1 加算ステップ及び上記第2加算ステップによって得られた上記音声信号に対し第 3 の計算式を用いてそれぞれ前方指向性振幅及び後方指向性振幅を算出する指向特性振幅算出ステップと、
    上記前方指向性振幅及び上記後方指向性振幅の比をとることによって前後振幅比を算出する前後振幅比算出ステップと、
    上記前後振幅比を所定のテーブルと対応付けることによって上記音源の方向を算出する第 3 方向算出ステップとを具え、
    上記第 1 方向算出ステップ、上記第 2 方向算出ステップ及び上記第 3 方向算出ステップを併用することにより、総合的に上記音源の方向を判断する
    ことを特徴とする音源方向判断方法。
JP2002074905A 2002-03-18 2002-03-18 音源方向判断装置及び音源方向判断方法 Expired - Fee Related JP4210897B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002074905A JP4210897B2 (ja) 2002-03-18 2002-03-18 音源方向判断装置及び音源方向判断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002074905A JP4210897B2 (ja) 2002-03-18 2002-03-18 音源方向判断装置及び音源方向判断方法

Publications (2)

Publication Number Publication Date
JP2003271196A JP2003271196A (ja) 2003-09-25
JP4210897B2 true JP4210897B2 (ja) 2009-01-21

Family

ID=29204180

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002074905A Expired - Fee Related JP4210897B2 (ja) 2002-03-18 2002-03-18 音源方向判断装置及び音源方向判断方法

Country Status (1)

Country Link
JP (1) JP4210897B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4797330B2 (ja) * 2004-03-08 2011-10-19 日本電気株式会社 ロボット
KR100943224B1 (ko) 2007-10-16 2010-02-18 한국전자통신연구원 음원 추적이 가능한 지능형 로봇 및 방법
JP5298155B2 (ja) 2011-04-15 2013-09-25 トヨタ自動車株式会社 接近車両検出装置及び接近車両検出方法
KR102146462B1 (ko) * 2014-03-31 2020-08-20 삼성전자주식회사 음성 인식 시스템 및 방법
CN105810195B (zh) * 2016-05-13 2023-03-10 漳州万利达科技有限公司 一种智能机器人的多角度定位系统
CN114255749A (zh) * 2021-04-06 2022-03-29 北京安声科技有限公司 扫地机器人
US11934203B2 (en) * 2021-05-06 2024-03-19 Bear Robotics, Inc. Method, system, and non-transitory computer-readable recording medium for controlling a robot

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61105198A (ja) * 1984-10-29 1986-05-23 Kiyoaki Kakegawa 垂直方向の方向情報を再生音の音色特性として有する音声信号、およびこの検出方法
JPS63262577A (ja) * 1987-04-20 1988-10-28 Sony Corp マイクロホン装置
CA2069356C (en) * 1991-07-17 1997-05-06 Gary Wayne Elko Adjustable filter for differential microphones
JP3522954B2 (ja) * 1996-03-15 2004-04-26 株式会社東芝 マイクロホンアレイ入力型音声認識装置及び方法
JPH10332807A (ja) * 1997-06-05 1998-12-18 Fujitsu Ltd 音源方向検出装置
JP4005203B2 (ja) * 1998-02-03 2007-11-07 富士通テン株式会社 車載用音声認識装置
JP2000148184A (ja) * 1998-11-06 2000-05-26 Sanyo Electric Co Ltd 音声認識装置
JP2001215989A (ja) * 2000-01-31 2001-08-10 Japan Science & Technology Corp ロボット聴覚システム
DE60141403D1 (de) * 2000-06-09 2010-04-08 Japan Science & Tech Agency Hörvorrichtung für einen Roboter
JP2001356157A (ja) * 2000-06-14 2001-12-26 Sony Corp 相関性演算処理装置及び音源方向判定演算処理装置

Also Published As

Publication number Publication date
JP2003271196A (ja) 2003-09-25

Similar Documents

Publication Publication Date Title
US6889117B2 (en) Robot apparatus and method and system for controlling the action of the robot apparatus
JP5469247B2 (ja) 動かすことおよび取り外すことができる本体部品を有するインタラクティブな話す玩具
US6667593B2 (en) Robot apparatus
JP3855812B2 (ja) 距離計測方法、その装置、そのプログラム、その記録媒体及び距離計測装置搭載型ロボット装置
JP4131392B2 (ja) ロボット装置およびロボット制御方法、記録媒体、並びにプログラム
WO2000068880A1 (fr) Dispositif robot
JP4239635B2 (ja) ロボット装置、その動作制御方法、及びプログラム
JP2006289508A (ja) ロボット装置及びその表情制御方法
JP2004299033A (ja) ロボット装置、情報処理方法、およびプログラム
JP4210897B2 (ja) 音源方向判断装置及び音源方向判断方法
JP4179230B2 (ja) ロボット装置及びその動作制御方法
JP2024023193A (ja) 情報処理装置及び情報処理方法
JP2002144260A (ja) 脚式移動ロボット及びその制御方法
JP7363809B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP2006289507A (ja) ロボット装置及びその制御方法
JP2003191187A (ja) ロボット装置及びその制御方法
JP4433273B2 (ja) ロボット装置及びロボット装置の制御方法
JP4600736B2 (ja) ロボット制御装置および方法、記録媒体、並びにプログラム
JP2004283927A (ja) ロボット制御装置および方法、記録媒体、並びにプログラム
JP2004302645A (ja) 顔登録装置、顔登録方法、記録媒体、及びロボット装置
JP4281286B2 (ja) ロボット装置及びその制御方法
JP2004304714A (ja) 情報処理システム、情報処理装置、情報処理方法、およびプログラム
JP2003266353A (ja) ロボット装置及びその制御方法
JP2005335001A (ja) ロボット制御装置および方法、記録媒体、並びにプログラム
JP2003208161A (ja) ロボット装置及びその制御方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050304

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070702

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070713

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070911

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081002

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081015

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111107

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111107

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111107

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121107

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees