JP2006167833A - ロボット - Google Patents

ロボット Download PDF

Info

Publication number
JP2006167833A
JP2006167833A JP2004361236A JP2004361236A JP2006167833A JP 2006167833 A JP2006167833 A JP 2006167833A JP 2004361236 A JP2004361236 A JP 2004361236A JP 2004361236 A JP2004361236 A JP 2004361236A JP 2006167833 A JP2006167833 A JP 2006167833A
Authority
JP
Japan
Prior art keywords
microphone
robot
head
speaker
front upper
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004361236A
Other languages
English (en)
Inventor
Yuichi Yoshida
雄一 吉田
Yasuhiro Yamazaki
安弘 山崎
Jun Hayashi
順 林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honda Motor Co Ltd
Original Assignee
Honda Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honda Motor Co Ltd filed Critical Honda Motor Co Ltd
Priority to JP2004361236A priority Critical patent/JP2006167833A/ja
Publication of JP2006167833A publication Critical patent/JP2006167833A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Manipulator (AREA)

Abstract

【課題】 話者の呼びかけ等に対する音源定位を全周にわたり高精度で行うことのできるロボットを提供する。
【解決手段】 頭部3は、樹脂等を素材する頭部筐体31を外殻としており、頭部筐体31内の前部に設置された左右一対のカメラ32,33の他、頭部筐体31内の前部上方に設置された前部上マイク34と、前部上マイク34に対して左側に設置された左マイク35と、前部上マイク34に対して右側に設置された右マイク36と、頭部筐体31内の前部下方に設置された前部下マイク37と、頭部筐体31内の後部に設置された後部マイク38とを備えている。
【選択図】図4

Description

本発明は、対話型のロボットに係り、詳しくは円滑な対話を実現する技術に関する。
近年、塗装作業や組立作業に供される産業用ロボットに加え、種々の人間型ロボットが開発されている。人間型ロボットは、二足による自立歩行や腕を用いての各種作業等を行うものが一般的であるが、胸部に設置されたマイクとスピーカとによって人間と対話を行うものも存在する(特許文献1参照)。この種の人間型ロボットには、頭部に設置された一対の外部マイクと頭部筐体内に設置された内部マイクとを用い、内部の駆動機構が発生するノイズを除去するもの(特許文献2参照)や、周囲の人間(話者)から呼びかけられた場合、頭部に設置されたマイクによって話者の方向を認識して振り向いたり、更にカメラによって話者を見分けたりするもの(特許文献3参照)も存在する。
特開2002−154079号公報(段落0015〜0018、図3) 特開2001−157988号公報(段落0020〜0025、図3) 特開2003−62777号公報(段落0020〜0022、図1)
上述の人間型ロボットでは、胸部に設置された一つのマイク(特許文献1)や頭部に設置された左右一対のマイク(特許文献2,3)によって話者の音声を認識するため、前後方向および上下方向での話者の方向判定(音源定位)を高精度で行うことができない。そのため、話者に後方から呼びかけられた場合や、背の低い小児から呼びかけられた場合に等には、話者の方向を誤認識してしまい、円滑な対話が行えなくなることがあった。
本発明は、このような状況に鑑みなされたもので、話者の呼びかけ等に対する音源定位を全周にわたり高精度で行うことのできるロボットを提供することを目的とする。
上記課題を解決すべく、請求項1の発明に係るロボットは、胴体に対して鉛直軸周りに所定の角度範囲で回動可能な頭部筐体と、当該頭部筐体内に設置された音声検出用の複数のマイクと、当該頭部筐体に設置された前方画像撮像用のカメラとを有する頭部を備え、前記複数のマイクの検出結果に基づいて話者の音声認識と方向認識とを行うロボットであって、前記複数のマイクが、前記頭部筐体の前部上方に設置された前部上マイクと、前記前部上マイクに対して左側に設置された左マイクと、前記前部上マイクに対して右側に設置された右マイクと、前記頭部筐体の前部下方に設置された前部下マイクと、前記頭部筐体の後部に設置された後部マイクとを含むことを特徴とするロボット。
また、請求項2の発明に係るロボットは、請求項1に記載のロボットにおいて、前部左マイクが前記前部上マイクに対して左側にθmの設置角度をもって設置され、前部右マイクが前記前部上マイクに対して右側にθmの設置角度をもって設置され、前記カメラの視野角をθc、前記頭部筐体の鉛直軸周りでの最大回動角度をθzとしたとき、2θm>θc、かつ、θm+θz>π/2であることを特徴とする。
また、請求項3の発明に係るロボットは、請求項1または請求項2に記載のロボットにおいて、前記複数のマイクのうち、前記話者に最も近い方向に位置するものにより前記音声認識を行うことを特徴とする。
また、請求項4の発明に係るロボットは、請求項1から請求項3のいずれか一項に記載のロボットにおいて、前記話者の方向を認識した後、前記頭部を当該話者の方向に向けることを特徴とする。
請求項1の発明に係るロボットによれば、話者からの呼びかけがあった場合、例えば、左マイクから入力した音声信号と右マイクから入力した音声信号との強弱および到達時間差を比較することにより左右方向を判定し、前部上マイクから入力した音声信号と後部マイクから入力した音声信号との強弱および到達時間差を比較することにより前後方向を判定し、前部上マイクから入力した音声信号と前部下マイクから入力した音声信号との強弱および到達時間差を比較することにより上下方向を判定することができる。また、請求項2の発明に係るロボットによれば、ロボットは、真横に存在する話者の姿をカメラでとらえながら、左右マイクでその話者と対話することができる。また、請求項3の発明に係るロボットによれば、音声信号の最も強いマイクを用いるために、音声認識を正確に行うことができる。また、請求項4の発明に係るロボットによれば、呼びかけに応じてロボットが振り向くことになるため、話者は違和感をもたずに対話を行うことができる。
以下、図面を参照して、本発明のマイク配置を適用した人間型ロボットの一実施形態を説明する。図1は実施形態に係る人間型ロボットの正面図であり、図2は実施形態に係る人間型ロボットの側面図であり、図3は実施形態に係るロボットの頭部を示す斜視図であり、図4は実施形態に係るロボットの頭部を示す側面図であり、図5は実施形態に係るロボットの頭部を示す平面図である。
《実施形態の構成》
図1,図2に示すように、実施形態に係る人間型ロボット(以下、単にロボットと記す)1は、胴体2、頭部3、左右の腕4L,4R、左右の脚5L,5Rを備えるとともに、胴体2の背部に電装品ボックス6を背負っている。腕4L(4R)は、上腕部7L(7R)と、下腕部8L(8R)と、手部9L(9R)とから構成されている。また、脚5L(5R)は、腿部10L(10R)と、脛部11L(11R)と、足部12L(12R)とから構成されている。なお、本実施形態のロボット1は、その身長が人間の成人の身長より低く設定されている。
胴体2と頭部3は首関節21によって連結されている。頭部3は、左右方向にそれぞれ所定の最大回頭角度θz(本実施形態の場合、60°)をもって、胴体2に対して回動する。また、上腕部7L(7R)は肩関節22によって胴体2に連結され、上腕部7L(7R)と8L(8R)とは肘関節23によって連結され、下腕部8L(8R)と手部9L(9R)とは手関節24によって連結されている。そして、上腕部7L(7R)には、その長手方向中間部に上腕関節25が設けられており、上半分に対して下半分を回転させることができるようになっている。一方、腿部10L(10R)は股関節26によって胴体2に連結され、腿部10L(10R)と脛部11L(11R)とは膝関節27によって連結され、脛部11L(11R)と足部12L(12R)とは足関節28によって連結されている。なお、図1,図2において、各関節22〜28はその中心部を破線の円で示してある。
図3〜図5に示すように、頭部3は、樹脂等を素材する頭部筐体31を外殻としており、頭部筐体31内の前部に設置された左右一対のカメラ(CCDカメラ)32,33の他、頭部筐体31内の前部上方に設置された前部上マイク34と、前部上マイク34に対して左側に設置された左マイク35と、前部上マイク34に対して右側に設置された右マイク36と、頭部筐体31内の前部下方に設置された前部下マイク37と、頭部筐体31内の後部に設置された後部マイク38とを備えている。
図5に示すように、両カメラ32,33は、左右方向に所定の視野角θc(通常は60°〜80°、本実施形態では75°とした)をもって前方の対象物を撮像し、胴体2内に設けられた図示しない画像信号処理回路に画像信号を出力する。
各マイク34〜38は、周囲の音声を集音し、胴体2内に設けられた図示しない音声信号処理回路に音声信号を出力する。前部上マイク34は斜め上向きに設置され、前部下マイク37は下向きに設置されている。また、図5に示すように、左マイク35と右マイク36とは、前部上マイク34に対してそれぞれ所定の設置角θm(通常は40°〜50°、本実施形態では45°とした)をもっている。なお、各マイク34〜38は、頭部筐体31内の振動や騒音からの遮断を図るべく、ゲル素材を介して図示しないケーシングに封入されている
《実施形態の作用》
図6に示すように、前方に立っている話者41からロボット1に呼びかけが行われた場合、頭部筐体31内の各マイク34〜38は、話者の音声を集音して音声信号処理回路に音声信号を出力する。ロボット1は、音声信号処理回路により各マイク34〜38からの音声信号(音圧レベル)の強弱および到達時間差を比較し、話者41が前方に存在することを判定する。しかる後、音声信号処理回路は、前部上マイク34からの音声信号のみを用いて音声認識を行い、両カメラ32,33の視野にいる話者41と前部上マイク34と図示しないスピーカ等を用いて対話を行う。なお、話者41からの呼びかけは、ロボット1を中心とする所定半径(例えば、5m)の円内から行われ、話者41との対話はロボット1を中心とする前方180°の所定半径(例えば、2m)の半円内で行われる。
また、図7に示すように、ロボット1は、斜め前方に立っている話者41からロボット1に呼びかけが行われ、音声信号の強弱および到達時間差により話者41が斜め前方に存在することを判定すると、話者41の方に振り向くように頭部3を回転させた後に話者41と対話を行う。これにより、自分の呼びかけにロボット1が反応したことを話者41が認識できるため、話者41とロボット1との間で円滑な対話が行われる。なお、この場合においても、ロボット1は、前部上マイク34からの音声信号のみを用いて音声認識を行う。
また、図8に示すように、ロボット1は、右真横に立っている話者41からロボット1に呼びかけが行われ、音声信号の強弱および到達時間差により話者41が真横に存在することを判定すると、最大回頭角度θzをもって頭部3を回転させて話者41と対話を行う。この場合も、話者41が自分の呼びかけにロボット1が反応したことを認識する一方で、ロボット1は両カメラ32,33の視野の右端に話者41をとらえることができる。ロボット1は、話者41に最も近い右マイク36からの音声信号のみを用いて音声認識を行う。なお、後方に立っている話者41からロボット1に呼びかけが行われた場合、ロボット1は、音声信号の強弱および到達時間差により話者41が後方に存在することを判定すると、前に回って欲しいとの要望を話者41に伝える、もしくは、脚5L,5Rを用いて話者41の方に振り返る。
ロボット1は、両カメラ32,33の視野に存在する話者41との間で対話を行うことが望ましく、そのためには、設置角θmと視野角θcとが2θm>θcの関係を満たせばよい。また、ロボット1が真横に存在する話者41と対話するためには、設置角θmと最大回頭角度θzとの和(θm+θz)を180°より大きくする必要がある。
以上で具体的実施形態の説明を終えるが、本発明は前記実施形態に限定されることなく幅広く変形実施することができる。例えば、上記実施形態ではロボットの頭部筐体に設置されるマイクを5個としたが、6個以上であってもよい。その他、ロボット各部の構成や形状等についても本発明の趣旨を逸脱しない範囲で適宜変更可能である。
実施形態に係る人間型ロボットの正面図である。 実施形態に係る人間型ロボットの側面図である。 実施形態に係るロボットの頭部を示す斜視図である。 実施形態に係るロボットの頭部を示す側面図である。 実施形態に係るロボットの頭部を示す平面図である。 実施形態の作用を説明するための図である。 実施形態の作用を説明するための図である。 実施形態の作用を説明するための図である。
符号の説明
1 ロボット
2 胴体
3 頭部
31 頭部筐体
32,33 カメラ
34 前部上マイク
35 左マイク
36 右マイク
37 前部下マイク
38 後部マイク
41 話者
180 前方

Claims (4)

  1. 胴体に対して鉛直軸周りに所定の角度範囲で回動可能な頭部筐体と、当該頭部筐体内に設置された音声検出用の複数のマイクと、当該頭部筐体に設置された前方画像撮像用のカメラとを有する頭部を備え、前記複数のマイクの検出結果に基づいて話者の音声認識と方向認識とを行うロボットであって、
    前記複数のマイクが、
    前記頭部筐体の前部上方に設置された前部上マイクと、
    前記前部上マイクに対して左側に設置された左マイクと、
    前記前部上マイクに対して右側に設置された右マイクと、
    前記頭部筐体の前部下方に設置された前部下マイクと、
    前記頭部筐体の後部に設置された後部マイクと
    を含むことを特徴とするロボット。
  2. 前部左マイクが前記前部上マイクに対して左側にθmの設置角度をもって設置され、
    前部右マイクが前記前部上マイクに対して右側にθmの設置角度をもって設置され、
    前記カメラの視野角をθc、前記頭部筐体の鉛直軸周りでの最大回動角度をθzとしたとき、2θm>θc、かつ、θm+θz>π/2であることを特徴とする、請求項1に記載のロボット。
  3. 前記複数のマイクのうち、前記話者に最も近い方向に位置するものにより前記音声認識を行うことを特徴とする、請求項1または請求項2に記載のロボット。
  4. 前記話者の方向を認識した後、前記頭部を当該話者の方向に向けることを特徴とする、請求項1から請求項3のいずれか一項に記載のロボット。
JP2004361236A 2004-12-14 2004-12-14 ロボット Pending JP2006167833A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004361236A JP2006167833A (ja) 2004-12-14 2004-12-14 ロボット

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004361236A JP2006167833A (ja) 2004-12-14 2004-12-14 ロボット

Publications (1)

Publication Number Publication Date
JP2006167833A true JP2006167833A (ja) 2006-06-29

Family

ID=36669118

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004361236A Pending JP2006167833A (ja) 2004-12-14 2004-12-14 ロボット

Country Status (1)

Country Link
JP (1) JP2006167833A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013508177A (ja) * 2009-10-21 2013-03-07 セコルポラ, エセ. エレ. ソーシャルロボット
US9103903B2 (en) 2011-04-15 2015-08-11 Toyota Jidosha Kabushiki Kaisha Approaching vehicle detecting system and approaching vehicle detecting method
CN108189047A (zh) * 2018-02-06 2018-06-22 苏州功业肆点零智能科技有限公司 一种机器人头部旋转装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013508177A (ja) * 2009-10-21 2013-03-07 セコルポラ, エセ. エレ. ソーシャルロボット
US9103903B2 (en) 2011-04-15 2015-08-11 Toyota Jidosha Kabushiki Kaisha Approaching vehicle detecting system and approaching vehicle detecting method
CN108189047A (zh) * 2018-02-06 2018-06-22 苏州功业肆点零智能科技有限公司 一种机器人头部旋转装置
CN108189047B (zh) * 2018-02-06 2020-11-27 苏州功业肆点零智能科技有限公司 一种机器人头部旋转装置

Similar Documents

Publication Publication Date Title
CN105263083B (zh) 喇叭模块、显示装置、调整系统及控制方法、同播方法
JP4857242B2 (ja) ロボット
JP3706113B2 (ja) コミュニケーションロボット
TW544380B (en) Two feet walking robot resembling a man
CN103596088A (zh) 具有枢轴部件的耳机
JP2004216513A (ja) コミュニケーションロボット
JP2008126329A (ja) 音声認識ロボットおよび音声認識ロボットの制御方法
JP2008149399A (ja) 移動ロボットおよび移動速度推定方法
JP6565853B2 (ja) コミュニケーション装置
JP4716291B2 (ja) 人工耳を有するロボットヘッド
JP2006251266A (ja) 視聴覚連携認識方法および装置
WO2018123431A1 (ja) 対話型ロボット
JP2006167837A (ja) 物品運搬システム
JP4524435B2 (ja) コミュニケーションロボット
JP2006167833A (ja) ロボット
JP4677593B2 (ja) コミュニケーションロボット
JP3942599B2 (ja) コミュニケーションロボット
JP2007155986A (ja) 音声認識装置および音声認識装置を備えたロボット
JP2003195886A (ja) ロボット
JP5324956B2 (ja) 道案内ロボット
JP3277279B2 (ja) ロボット聴覚装置
JP4873607B2 (ja) 皮膚センサを有する電子機器
JP4655572B2 (ja) 信号処理方法および信号処理装置、ならびに、ロボット
JP4210897B2 (ja) 音源方向判断装置及び音源方向判断方法
JP2006187825A (ja) ロボット装置およびその制御方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061201

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080724

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080729

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20081125