JP2003122394A - 識別対象を認識する方法と装置及び該装置を搭載したロボット - Google Patents

識別対象を認識する方法と装置及び該装置を搭載したロボット

Info

Publication number
JP2003122394A
JP2003122394A JP2001318494A JP2001318494A JP2003122394A JP 2003122394 A JP2003122394 A JP 2003122394A JP 2001318494 A JP2001318494 A JP 2001318494A JP 2001318494 A JP2001318494 A JP 2001318494A JP 2003122394 A JP2003122394 A JP 2003122394A
Authority
JP
Japan
Prior art keywords
sound
identification
camera
identification target
sound source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001318494A
Other languages
English (en)
Inventor
Atsushi Akiyama
淳 秋山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Azbil Corp
Original Assignee
Azbil Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Azbil Corp filed Critical Azbil Corp
Priority to JP2001318494A priority Critical patent/JP2003122394A/ja
Publication of JP2003122394A publication Critical patent/JP2003122394A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Studio Devices (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
  • Manipulator (AREA)
  • Image Input (AREA)
  • Image Processing (AREA)

Abstract

(57)【要約】 【課題】 不特定位置に存在する特定の形状を有しかつ
音を発する識別対象を認識する際に、その識別対象から
発せられる音以外の音が発生する環境であっても、大き
な時間遅れが発生することなく、その識別対象を認識可
能にする方法と装置及び該装置を搭載したロボットを提
供する。 【解決手段】 上記の識別対象を認識する装置は、複数
の音源同定用マイクロホン1a,1b,1cと、全方向
を撮影可能な少なくとも1個のカメラ4と、音源同定用
マイクロホン1a,1b,1cより入力された音に基づ
き、識別対象が存在する方向を概略的に決定する音源同
定処理手段2と、決定された方向にカメラ4の撮影方向
を合わせる方向制御手段3と、カメラ4から画像情報を
取り込んで識別対象を抽出する識別対象抽出処理手段5
とを備える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、不特定位置に存在
する特定の形状を有しかつ音を発する識別対象を認識す
る方法、装置及び該装置を搭載したロボットに関する。
【0002】
【従来の技術】人間とのコミュニケーションを目的とし
たロボットや自動ドアその他の自動制御装置では、その
コミュニケーションの対象である人間を認識するため
に、種々の認識システムが搭載されている。これらの認
識システムは、識別対象を認識するために音や画像を検
知するものであるが、通常はどちらか1つを利用してい
る。
【0003】音を利用する認識システムでは、例えば人
間から発せられる声を識別して人間の存在を認識する。
一方、画像を利用する認識システムでは、例えば人間を
カメラで撮影し、その撮影した画像を基に人間の存在を
認識する。
【0004】
【発明が解決しようとする課題】しかしながら、音を利
用した認識システムでは、マイクロホン等の入力手段か
らは人間の声以外の音も同時に入力されてしまうため、
人間の声を他の音と識別する必要があるが、その識別は
非常に困難である。従って、音を利用した認識システム
では、人間の声以外の音が発生する環境で利用すること
は現実的に難しい。
【0005】一方、画像を利用した認識システムでは、
カメラの撮影範囲が限られるため、マイクロホンに音が
入るように任意の方向から画像を取り込むことができ
ず、認識対象が概ねカメラの正面に存在していなければ
ならない。従って、認識対象をカメラで確実に捉えるた
めには、例えば、ロボットに搭載したカメラを回転させ
或いはロボットを円周方向に移動させながらロボットの
全方位(360°)の画像を順次スキャンするような構成
としたり、複数のカメラをロボットの円周方向に所定角
度間隔で設けるような構成とする必要がある。しかしな
がら、取り込んだ画像の量が膨大となるため、その画像
処理に時間がかかり、人間の存在を認識するまでに大き
な時間遅れが発生してしまうことがある。
【0006】また、音及び画像の両者を利用した認識シ
ステムもあるが、これらは音による認識処理と画像によ
る認識処理を並列で行い、その結果を基に確信度の高い
認識を行わせるものであり、音による認識と画像による
認識が組み合わされているだけである。すなわち、人間
の存在を認識するまでに大きな時間遅れが発生してしま
う等の問題点を解消するには至っていない。
【0007】本発明の目的は、不特定位置に存在する特
定の形状を有しかつ音を発する識別対象を認識する際
に、その識別対象から発せられる音以外の音が発生する
環境であっても、大きな時間遅れが発生することなく、
その識別対象を認識できる認識方法、装置及び該装置を
搭載したロボットを提供することである。
【0008】
【課題を解決するための手段】本発明は、不特定位置に
存在する特定の形状を有しかつ音を発する識別対象を認
識する方法であって、周辺の音を検知するステップと、
検知された音に基づき、識別対象の存在する方向を概略
的に決定するステップと、決定された方向にカメラを向
け画像情報を取り込むステップと、取り込まれた画像情
報から識別対象を抽出するステップとを備えたことを特
徴とする。
【0009】本発明の第2の態様は、不特定位置に存在
する特定の形状を有しかつ音を発する識別対象を認識す
る方法であって、周辺の音を検知するステップと、検知
された音のうち予め定められた閾値以上の音圧の音を抽
出するステップと、抽出された閾値以上の音圧の音の中
で最も音圧の高い音の発せられた方向を識別対象の存在
する方向として概略的に決定するステップと、決定され
た方向にカメラを向け画像情報を取り込むステップと、
取り込まれた画像情報から識別対象を抽出するステップ
とを備えたことを特徴とする。
【0010】本発明の第3の態様は、不特定位置に存在
する特定の形状を有しかつ音を発する識別対象を認識す
る方法であって、周辺の音を検知するステップと、検知
された音のうち予め定められた閾値以上の音圧の音を抽
出するステップと、抽出された閾値以上の音圧の音の中
で2番目に音圧の高い第2の音の音圧値を最も音圧の高
い第1の音の音圧値で除した値に応じて、第1の音の発
せられた方向又は第1の音の発せられた方向と第2の音
の発せられた方向との中間方向の何れかを識別対象の存
在する方向として概略的に決定するステップと、決定さ
れた方向にカメラを向けて画像情報を取り込むステップ
と、取り込まれた画像情報から識別対象を抽出するステ
ップとを備えたことを特徴とする。
【0011】ここで、識別対象とは、人間のほか、特定
の形状を有しかつ音を発する物体や生物である。
【0012】本発明の実施態様は、不特定位置に存在す
る特定の形状を有しかつ音を発する識別対象を認識する
装置であって、複数の音源同定用マイクロホンと、全方
向を撮影可能な少なくとも1個のカメラと、音源同定用
マイクロホンから入力された音に基づき、識別対象の存
在する方向を概略的に決定する音源同定処理手段と、決
定された方向にカメラの撮影方向を合わせる方向制御手
段と、カメラから画像情報を取り込んで識別対象を抽出
する識別対象抽出処理手段とを備えたことを特徴とす
る。
【0013】本発明の別の実施態様は、不特定位置に存
在する特定の形状を有しかつ音を発する識別対象を認識
する認識装置を搭載したロボットであって、認識装置
は、ロボットの外周に概ね等間隔に備えた複数の音源同
定用マイクロホンと、全方向を撮影可能な少なくとも1
個のカメラと、音源同定用マイクロホンから入力された
音に基づき、識別対象の存在する方向を概略的に決定す
る音源同定処理手段と、決定された方向にカメラの撮影
方向を合わせる方向制御手段と、上記カメラから画像情
報を取り込んで識別対象を抽出する識別対象抽出処理手
段とを備えたことを特徴とする。
【0014】
【作用及び効果】本発明によれば、検知された音によっ
て識別対象の位置する方向が概略的に特定され、最終的
な認識処理は、音ではなく画像情報を基に行われるの
で、確実に識別対象を認識することができる。また、検
知された音によってカメラの撮影範囲が特定の範囲に絞
り込まれるので、画像処理を行う画像情報の量が格段に
削減され、大きな時間遅れが発生することなく、識別対
象を認識することができる。
【0015】不特定位置に存在する人間を認識する場合
では、人間の声以外の音が発生する環境下であっても、
大きな時間遅れが発生することなく、識別対象の人間を
認識することが可能となる。これにより、不特定位置に
人間が存在する環境において、人間とのコミュニケーシ
ョンなどを目的として移動するロボットが実現できる。
例えば、不特定位置にいる人間から移動ロボットに話し
かけがあったとき、上記のような認識方法によってその
人間の位置、すなわち声の発生源の位置する方向を概略
的に絞り込むことができ、その方向の画像情報をカメラ
で取り込み処理することで、ロボットは話しかけられた
人間を認識することができる。
【0016】その他にも、音を出しかつ特定の形状を有
する、不特定位置に存在する物体や生物を認識する場合
であっても、認識対象から発せられる音以外の音が発生
する環境下において、大きな時間遅れが生じることな
く、認識対象を認識することができる。
【0017】
【発明の実施の形態】図1は、本発明の一例である認識
装置の構成例を示す。認識装置は、設置位置を異ならせ
た3台の音源同定用マイクロホン(以下「マイク」とい
う)1a,1b,1cと、この音源同定用マイク1a,
1b,1cから入力された音に基づき識別対象の存在す
る方向を概略的に決定する音源同定処理手段2と、識別
対象を撮影するためのカメラ4と、該カメラの撮影方向
を制御する方向制御手段3と、カメラ4から画像情報を
取り込んで識別対象を抽出する識別対象抽出処理手段5
とを備える。識別対象とは、特定の形状を有しかつ音を
発するもので、本実施例では、人間を識別対象とした場
合について説明する。
【0018】3つの音源同定用マイク1a,1b,1c
は、不特定方向から入ってくる音を確実に検出できるよ
うに、それぞれ離れた位置に配置される。この場合、音
源の方向によっては、その音源からの音を検出できない
マイクがあっても問題はない。また、1個のマイクのみ
がその音を検出することもある。例えば、この認識装置
をロボットに搭載した場合、そのロボットの胴体周りに
120°間隔で3つの音源同定用マイク1a,1b,1
cを配置し、ロボットの周囲にある音源から発せられる
音を確実に検出できるように構成する。
【0019】音源同定処理手段2は、これら3つの音源
同定用マイク1a,1b,1cから検出された音を解析
し、少なくとも1つのマイクから予め設定された閾値以
上の音圧の音が検出されたとき、そのマイクの設置方向
を音源の位置する方向として概略的に決定する。ここ
で、この決定された方向を「概略方向」という。例え
ば、閾値以上の音圧の音が検出されたマイクが一つのと
き、ロボットの周囲360°の範囲から、その一つのマ
イクの前方で広角度60°の範囲(後述の「特定の60
°範囲」)を音源の概略方向として絞り込む。また、閾
値以上の音圧の音が検出されたマイクが複数のとき、そ
のうち最も音圧の高いマイクの前方の広角度60°の範
囲(後述の「特定の60°範囲」)を音源の概略方向と
して絞り込む。すなわち、ロボットの周囲360°の範
囲の一部の60°の範囲が音源の概略方向として絞り込
まれる。具体的には、後述の「音源同定処理」で説明す
る。
【0020】カメラ4は、全方向を撮影可能とするた
め、360°回転可能な機構上に設置される。例えば、
この認識装置をロボットに搭載した場合では、回転駆動
するロボットの頭部に設けられる。方向制御手段3は、
音源同定処理手段2で絞り込まれた音源の概略方向が撮
影できるようにカメラ4の撮影方向を制御する。例え
ば、カメラ4が概略方向としての広角60°の範囲の中
央に位置するようにロボットの頭部を回転させる。ま
た、このような回転機構を用いずに、例えば、ロボット
の外周に複数(例えば6個)の固定カメラを等間隔で配
置し、絞り込まれた概略範囲が撮影可能なカメラを一つ
選択するような構成としてもよい。
【0021】識別対象抽出処理手段5は、撮影方向が決
定されたカメラ4からの画像情報を基に、音源である識
別対象(例えば人間)の形状を抽出する。具体的には、
カメラ4からの画像情報を所定の時間間隔で2回取り込
み、その2つの画像情報の差画像を取り、動いている部
分を抽出する。そして、予め用意しておいた識別対象に
ついての複数の形状テンプレートと比較し、両者の類似
度がある閾値を超えた場合、その部分を識別対象と判断
し、該識別対象の重心位置を求める。識別対象が人間で
ある場合は、差画像より抽出した「動いている部分」
を、予め用意しておいた複数の人間の形状テンプレート
と比較し、両者の類似度がある閾値を超えた場合、その
部分を人間と判断し、その人間の重心位置を求める。例
えば、人間とのコミュニケーションを図るロボットに、
この認識装置を搭載した場合は、ロボットが話しかける
人間の重心位置が識別対象抽出処理手段5によって求め
られる。具体的には、後述の「人間認識処理」で説明す
る。
【0022】次に、上記認識装置を、人間とのコミュニ
ケーションなどを目的として動作するロボット(以下、
「コミュニケーションロボット」という。)に搭載した
場合の実施例について説明する。従って、このコミュニ
ケーションロボットに搭載された認識装置の識別対象は
人間である。
【0023】図2は、認識装置を搭載したコミュニケー
ションロボットの構成例を示す。コミュニケーションロ
ボット11は、主に人間とのコミュニケーションをとる
ための各種装置が搭載された頭部12、認識装置を含む
当該ロボットの動作を制御する各種装置が搭載された胴
部13、及び、移動手段を構成する台車部14で構成さ
れる。
【0024】頭部12は、人間とのコミュニケーション
をとる際に人間からの音声を入力するマイク21と、カ
メラ4と、液晶表示装置(LCD)22と、スピーカ2
3と、頭部12を上下左右に移動或いは左右に回転させ
る首作動機構部24とを備えて構成されている。この首
作動機構24は、モータ等で構成される頭部駆動手段2
5によって作動し、この頭部駆動手段25を介して胴部
13と接続されている。
【0025】胴部13は、当該ロボットの動作の全体を
制御する主制御部31と、カメラ4から入力した画像情
報を基に人間を認識するための画像処理(後述の「人間
認識処理」)を行う画像処理制御部32と、後述の「音
源同定処理」に必要な周囲の音を取り込む3つの音源同
定用マイク1a,1b,1cと、該音源同定用マイク1
a,1b,1cから入力された音を基にカメラ4の撮影
方向を決定する処理(後述の「音源同定処理」)を行う
音源同定処理制御部33と、人間を検知するための赤外
線センサ34と、外部との衝突を検知するラバーセンサ
35と、頭部12に設けられたマイク21からの入力音
に応じたスピーカ23への出力音を制御する音源制御部
36とを備えて構成されている。主制御部31、画像処
理制御部32、音源同定処理制御部33及び音源制御部
36は、それぞれCPU,RAM,ROM等で構成され
た電気回路からなり、画像処理制御部32は、上記の識
別対象抽出処理手段5としての役割を果たし、音源同定
処理制御部33は、上記の音源同定処理手段2としての
役割を果たす。3つの音源同定用マイク1a,1b,1
cは、それぞれ胴部13の外周に120°間隔で取り付
けられる。赤外線センサ34は、人間が近付くと反応
し、周囲に人間がいることを検知する。
【0026】台車部14は、回転駆動によってロボット
全体を移動させる走行用のタイヤ41と、タイヤ41を
回転駆動させるモータ等からなる台車駆動手段42と、
CPU,RAM,ROM等で構成された電気回路からな
り主制御部31からの命令に応じて台車駆動手段42を
制御する台車制御部43と、衝突防止用の光電センサ4
4と、認識した人間との距離を計測する超音波センサ4
5と、外部との衝突を検知するラバーセンサ46とを備
えて構成されている。光電センサ44及び超音波センサ
45は、台車部14の外周に90°間隔で4個ずつ取り
付けられる。光電センサ44は、赤外線を投射し、障害
物に反射して戻ってきた赤外線を受信することで、障害
物の存在を検知する。超音波センサ45は、互いに対を
なす超音波送信素子と超音波受信素子とで構成され、超
音波送信素子から送信された超音波が物体(人間)に反
射されて超音波受信素子に戻るまでの時間から、物体
(人間)までの距離を計測することができる。例えば、
上記の画像処理制御部32で人間を認識したとき、その
人間との距離を超音波センサ45で計測し、その計測結
果を基に、コミュニケーションに必要な距離までロボッ
トを移動させる。タイヤ41は、前後に左右2個ずつ
(合計4個)設けられる。
【0027】図3のフローチャートは、人間の存在を認
識する処理(人間認識処理)の手順を示す。
【0028】3個の音源同定用マイク1a,1b,1c
のうちの少なくとも1個から音が入力されたかどうかを
判別する(ステップ[以下「ST」と略記する。]
1)。従って、この場合、音源の方向によっては、その
音源の音を検出できないマイクがあっても問題はなく、
また、1個のマイクのみがその音声を検出することもあ
る。
【0029】ST1で“YES”のときは、入力された
音のうちの少なくとも1つが予め設定された閾値以上の
音圧であるかどうかを判別する(ST2)。ここで“N
O”のときはST1の処理に戻り、“YES”のとき
は、ST3に移る。上記の閾値は、例えば、ロボットの
置かれる場所でロボットが人の声を認識できる値とす
る。従って、設置する場所が異なれば、閾値の値も変動
する。
【0030】ST3では、ST2で閾値以上の音圧と判
別された音に基づいて音源の概略方向(後述の「特定の
60°範囲」)を決定する「音源同定処理」を行う。
「音源同定処理」は、図4のフローチャートを参照して
後で説明する。
【0031】次に、「音源同定処理」で決定された「特
定の60°範囲」の中心位置にカメラ4が向くように、
頭部12を回転させる(ST4)。
【0032】最後に、カメラ4で画像情報を入力して人
間の存在を認識する「画像認識処理」を行う。「画像認
識処理」は、図5のフローチャートを参照して後で説明
する。
【0033】図4のフローチャートは、「音源同定処
理」の手順を示す。
【0034】ST2で検出された音のうち、最も高い音
圧値“a”の音が入力された音源同定用マイクを“A”
と特定する(ST11)。
【0035】次に、ST2で検出された音のうち、2番
目に高い音圧値“b”の音が入力された音源同定用マイ
クを“B”と特定する(ST12)。
【0036】次に、N=b/aを算出し(ST13)、
N<0.67のとき(ST14で“YES”のとき)は、S
T15に移り、N≧0.67のとき(ST14で“NO”の
とき)は、ST16に移る。
【0037】ST15の処理が行われる場合は、音源同
定用マイク“A”に対して特に高い音圧が検出されてい
るものと判定された場合であるので、音源同定用マイク
“A”の前方で広角度60°の範囲を、「特定の60°
の範囲」として決定する。
【0038】ST16の処理が行われる場合は、音源同
定用マイク“A”だけではなく、音源同定用マイク
“B”にも高い音圧が検出されているものと判定された
場合であるので、音源同定用マイク“A”と音源同定用
マイク“B”の中央位置の前方で広角度60°の範囲
を、「特定の60°の範囲」として決定する。
【0039】図5のフローチャートは、「画像認識処
理」の手順を示す。
【0040】上記の「音源同定処理」で絞り込まれた範
囲(特定の60°の範囲)に向けられたカメラ4から、
予め定められた時間間隔で画像を2回取り込む(ST2
1)。例えば、1秒間隔で画像を2回取り込む。
【0041】次に、取り込んだ画像情報から差画像を生
成し、「動いている部分」を抽出する(ST22)。
【0042】次に、抽出した「動いている部分」の画像
と複数の「人型テンプレート」画像とを比較する(ST
23)。ここで、「人型テンプレート」は、人間の型を
表す画像で構成され、画像処理制御部32内のROMに
格納される。例えば、男性別及び女性別に、人間を特徴
づける複数の画像を予め取り込み登録しておく。人間を
特徴づける複数の画像としては、顔の形(丸顔、四角
顔、卵形顔など)、髪型、目の形、鼻の形、口の形、耳
の形、体型(手の長さ、足の長さなど)などの画像で、
これらを組み合わせて生成される人間の画像が「人型テ
ンプレート」として用いられる。
【0043】抽出した「動いている部分」の画像と「人
型テンプレート」画像との比較の結果、類似度が所定の
閾値を超えた場合は(ST24で“YES”)、その部
分を人間と判断し、その人間の重心位置を求め、その位
置を主制御部31のRAMに記憶させる(ST25)。
ST23の比較の結果、類似度が所定の閾値以下の場合
は(ST24で“NO”)、その部分は人間と判断され
ない。
【0044】抽出した「動いている部分」の画像と「人
型テンプレート」画像との比較は、次の方法で行われ
る。例えば、特開平9−22406公報に開示されてい
る「位相限定相関法」を用いて、当該2つの画像につい
ての相関値を求め、その相関値が所定の閾値を超えてい
るかどうかを判定する。この相関値が所定の閾値を超え
ている場合は、その部分を人間と判断し、所定の閾値以
下の場合は、その部分は人間と判断されない。
【0045】上記の「位相限定相関法」によれば、次の
ような手順で相関値が求められる。照合する画像(本実
施例では「動いている部分」の画像)に2次元離散的フ
ーリエ変換を施し照合フーリエ画像データを作成する。
この照合フーリエ画像データと同様の処理を登録画像
(本実施例では「人型テンプレート」画像)についても
施し、登録フーリエ画像データを作成する。そして、照
合フーリエ画像データと登録フーリエ画像データを合成
した合成フーリエ画像データに対して振幅抑制処理を行
った上で2次元離散的フーリエ変換を施し、この2次元
離散的フーリエ変換が施された合成フーリエ画像データ
に出現する相関成分エリアからその相関成分の強度の高
い上位n画素(例えばn=8)を抽出する。この抽出さ
れたn画素の相関成分の強度の平均が相関値として求め
られる。
【0046】上記の手順において、照合フーリエ画像デ
ータをAeとし、登録フーリエ画像データをBe
とした場合、合成フーリエ画像データはABej(θ-φ)
で表される。但し、A,B,θ,φとも周波数(フーリ
エ)空間(u,v)の関数とする。
【0047】そして、合成フーリエ画像データは、 ABej(θ-φ)=ABcos(θ−φ)+jABsin(θ−φ)…(1) と表される。ここで、 Ae=α1+jβ1 Be=α2+jβ2 とすると、 A=(α1 2+β1 21/2 B=(α2 2+β2 21/2 θ=tan-1(β1/α1) φ=tan-1(β2/α2) となる。上記(1)式を計算することにより合成フーリ
エ画像データを得る。
【0048】また、人間の重心位置は、人間はほぼ左右
対称であると考えて、「動いている部分」の画像の中心
位置が重心位置として求められる。
【0049】このように、コミュニケーションロボット
11は、音源の方向である「特定の60°の範囲」に人
間の存在を認識したときは、上記「音源同定処理」で特
定された音源が人間であること、すなわち、その認識し
た人間から話しかけられたことを認識することができ
る。話しかけられた特定の人間を認識したコミュニケー
ションロボット11のその後の動作としては、例えば、
上記ST25で記憶された重心位置の方向に頭部12の
正面が向くように首作動機構部24を作動させ、その認
識した人間からの話しかけに応答する。人間に対する応
答としては、例えば、スピーカ23より音声を発生さ
せ、LCD22の画面上にアニメーションによる顔の表
情を表示する。
【0050】以上のように、不特定位置にいる人間から
コミュニケーションロボット11に話しかけがあったと
き、上記のような認識装置によってその人間の位置、す
なわち声の発生源の方向を「特定の60°の範囲」で絞
り込むことができ、その範囲の画像を取り込み処理する
ことで、コミュニケーションロボット11は話しかけら
れた人間を認識することができる。そして、コミュニケ
ーションロボット11は、その話しかけられた人間のい
る方向に頭部12を回転させ或いは移動し、その話しか
けに応答することができる。
【図面の簡単な説明】
【図1】本発明の一例の認識装置の構成例を示すブロッ
ク図。
【図2】認識装置を搭載したコミュニケーションロボッ
トの構成例を示すブロック図。
【図3】人間認識処理の手順を示すフローチャート。
【図4】音源同定処理の手順を示すフローチャート。
【図5】画像認識処理の手順を示すフローチャート。
【符号の説明】
1a,1b,1c…音源同定用マイク、2…音源同定処
理手段、3…方向制御手段、4…カメラ、5…識別対象
抽出処理手段、11…コミュニケーションロボット、1
2…頭部、13…胴部、14…台車部、21…マイク、
22…液晶表示装置(LCD)、23…スピーカ、24
…首作動機構部、31…主制御部、32…画像処理制御
部、33…音源同定処理制御部、34…赤外線センサ、
35,46…ラバーセンサ、36…音源制御部、41…
タイヤ、42…台車駆動手段、43…台車制御部、44
…光電センサ、45…超音波センサ。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 15/24 G10L 3/00 511 5J083 H04N 5/232 551H // B25J 5/00 571G Fターム(参考) 3C007 CS08 HS27 KS12 KS31 KS36 KS39 KT01 KT02 KT11 KV12 KV18 KX02 LT06 WA16 WB19 WB28 WC07 5B047 AA07 AB02 BB04 BC16 BC20 CB11 CB30 5B057 BA11 CH01 DA06 5C022 AB62 AB63 AC27 AC41 AC69 AC74 AC77 5D015 AA06 DD02 KK01 LL07 5J083 AA05 AB12 AC03 AD18 AE08 AF14 BC10 BE20 BE21

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】不特定位置に存在する特定の形状を有しか
    つ音を発する識別対象を認識する方法であって、 周辺の音を検知するステップと、 検知された音に基づき、前記識別対象の存在する方向を
    概略的に決定するステップと、 決定された方向にカメラを向け画像情報を取り込むステ
    ップと、 取り込まれた画像情報から前記識別対象を抽出するステ
    ップとを備えたことを特徴とする認識方法。
  2. 【請求項2】不特定位置に存在する特定の形状を有しか
    つ音を発する識別対象を認識する方法であって、 周辺の音を検知するステップと、 検知された音のうち予め定められた閾値以上の音圧の音
    を抽出するステップと、 抽出された閾値以上の音圧の音の中で最も音圧の高い音
    の発せられた方向を前記識別対象の存在する方向として
    概略的に決定するステップと、 決定された方向にカメラを向け画像情報を取り込むステ
    ップと、 取り込まれた画像情報から前記識別対象を抽出するステ
    ップとを備えたことを特徴とする認識方法。
  3. 【請求項3】不特定位置に存在する特定の形状を有しか
    つ音を発する識別対象を認識する方法であって、 周辺の音を検知するステップと、 検知された音のうち予め定められた閾値以上の音圧の音
    を抽出するステップと、 抽出された閾値以上の音圧の音の中で2番目に音圧の高
    い第2の音の音圧値を最も音圧の高い第1の音の音圧値
    で除した値に応じて、前記第1の音の発せられた方向又
    は前記第1の音の発せられた方向と前記第2の音の発せ
    られた方向との中間方向の何れかを前記識別対象の存在
    する方向として概略的に決定するステップと、 決定された方向にカメラを向けて画像情報を取り込むス
    テップと、 取り込まれた画像情報から前記識別対象を抽出するステ
    ップとを備えたことを特徴とする認識方法。
  4. 【請求項4】請求項1乃至3のいずれか記載の認識方法
    において、前記識別対象は、人間であることを特徴とす
    る。
  5. 【請求項5】不特定位置に存在する特定の形状を有しか
    つ音を発する識別対象を認識する装置であって、 複数の音源同定用マイクロホンと、 全方向を撮影可能な少なくとも1個のカメラと、 前記音源同定用マイクロホンから入力された音に基づ
    き、前記識別対象の存在する方向を概略的に決定する音
    源同定処理手段と、 決定された方向に前記カメラの撮影方向を合わせる方向
    制御手段と、 前記カメラから画像情報を取り込んで前記識別対象を抽
    出する識別対象抽出処理手段とを備えたことを特徴とす
    る認識装置。
  6. 【請求項6】不特定位置に存在する特定の形状を有しか
    つ音を発する識別対象を認識する認識装置を搭載したロ
    ボットであって、 前記認識装置は、 前記ロボットの外周に概ね等間隔に備えた複数の音源同
    定用マイクロホンと、 全方向を撮影可能な少なくとも1個のカメラと、 前記音源同定用マイクロホンから入力された音に基づ
    き、前記識別対象の存在する方向を概略的に決定する音
    源同定処理手段と、 決定された方向に前記カメラの撮影方向を合わせる方向
    制御手段と、 前記カメラから画像情報を取り込んで前記識別対象を抽
    出する識別対象抽出処理手段とを備えたことを特徴とす
    るロボット。
JP2001318494A 2001-10-16 2001-10-16 識別対象を認識する方法と装置及び該装置を搭載したロボット Pending JP2003122394A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001318494A JP2003122394A (ja) 2001-10-16 2001-10-16 識別対象を認識する方法と装置及び該装置を搭載したロボット

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001318494A JP2003122394A (ja) 2001-10-16 2001-10-16 識別対象を認識する方法と装置及び該装置を搭載したロボット

Publications (1)

Publication Number Publication Date
JP2003122394A true JP2003122394A (ja) 2003-04-25

Family

ID=19136187

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001318494A Pending JP2003122394A (ja) 2001-10-16 2001-10-16 識別対象を認識する方法と装置及び該装置を搭載したロボット

Country Status (1)

Country Link
JP (1) JP2003122394A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005250397A (ja) * 2004-03-08 2005-09-15 Nec Corp ロボット
JP2007025898A (ja) * 2005-07-13 2007-02-01 Sharp Corp 情報処理装置、情報処理装置の制御方法、情報処理装置の制御プログラム、および情報処理装置の制御プログラムを記録した記録媒体
WO2007132571A1 (ja) * 2006-05-16 2007-11-22 Murata Kikai Kabushiki Kaisha ロボット
JP2009296142A (ja) * 2008-06-03 2009-12-17 Canon Inc 撮像装置
US7672844B2 (en) 2003-08-04 2010-03-02 Sony Corporation Voice processing apparatus
WO2017000793A1 (zh) * 2015-06-30 2017-01-05 芋头科技(杭州)有限公司 一种通过语音指令快速定位拍照的方法及拍照系统
JP2017509981A (ja) * 2014-12-31 2017-04-06 エスゼット ディージェイアイ テクノロジー カンパニー リミテッドSz Dji Technology Co.,Ltd センサデータの選択的処理
US10713513B2 (en) 2017-03-28 2020-07-14 Casio Computer Co., Ltd. Object detection device, object detection method, and recording medium

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7672844B2 (en) 2003-08-04 2010-03-02 Sony Corporation Voice processing apparatus
JP2005250397A (ja) * 2004-03-08 2005-09-15 Nec Corp ロボット
JP2007025898A (ja) * 2005-07-13 2007-02-01 Sharp Corp 情報処理装置、情報処理装置の制御方法、情報処理装置の制御プログラム、および情報処理装置の制御プログラムを記録した記録媒体
WO2007132571A1 (ja) * 2006-05-16 2007-11-22 Murata Kikai Kabushiki Kaisha ロボット
JP4915417B2 (ja) * 2006-05-16 2012-04-11 村田機械株式会社 ロボット
US8272466B2 (en) 2006-05-16 2012-09-25 Murata Kikai Kabushiki Kaisha Robot
JP2009296142A (ja) * 2008-06-03 2009-12-17 Canon Inc 撮像装置
JP2017509981A (ja) * 2014-12-31 2017-04-06 エスゼット ディージェイアイ テクノロジー カンパニー リミテッドSz Dji Technology Co.,Ltd センサデータの選択的処理
US9778661B2 (en) 2014-12-31 2017-10-03 SZ DJI Technology Co., Ltd. Selective processing of sensor data
US10802509B2 (en) 2014-12-31 2020-10-13 SZ DJI Technology Co., Ltd. Selective processing of sensor data
WO2017000793A1 (zh) * 2015-06-30 2017-01-05 芋头科技(杭州)有限公司 一种通过语音指令快速定位拍照的方法及拍照系统
US10713513B2 (en) 2017-03-28 2020-07-14 Casio Computer Co., Ltd. Object detection device, object detection method, and recording medium

Similar Documents

Publication Publication Date Title
US6686844B2 (en) Human interface system using a plurality of sensors
US7680667B2 (en) Interactive robot, speech recognition method and computer program product
US7536029B2 (en) Apparatus and method performing audio-video sensor fusion for object localization, tracking, and separation
US6853880B2 (en) Autonomous action robot
EP1643769B1 (en) Apparatus and method performing audio-video sensor fusion for object localization, tracking and separation
US20050084179A1 (en) Method and apparatus for performing iris recognition from an image
JP2008087140A (ja) 音声認識ロボットおよび音声認識ロボットの制御方法
KR20100086262A (ko) 로봇 및 그 제어방법
JP2001243466A (ja) 顔認識装置およびその方法
US20040190754A1 (en) Image transmission system for a mobile robot
WO2004081683A1 (ja) 自律移動ロボット
JP2008126329A (ja) 音声認識ロボットおよび音声認識ロボットの制御方法
JP5036611B2 (ja) 画像認識装置
KR20200006757A (ko) 전자 장치의 객체 인증 장치 및 방법
JP2009045692A (ja) コミュニケーションロボットとその動作方法
JP2004298988A (ja) 移動ロボットの画像送信装置
JP2003122394A (ja) 識別対象を認識する方法と装置及び該装置を搭載したロボット
JP2002274265A (ja) ミラー調整装置
US20220172508A1 (en) Information processing apparatus, information processing method, and information processing system
JPH1124694A (ja) 命令認識装置
JP2007156689A (ja) 光源位置検出装置、これを用いた顔認識装置及び自走式ロボット
JP2737682B2 (ja) テレビ会議システム
JP2006263873A (ja) コミュニケーションロボットシステムおよびコミュニケーションロボット
KR102012719B1 (ko) 전방위 영상 기반 화상회의 발언자 인식 장치 및 방법
Feyrer et al. Tracking and pursuing persons with a mobile robot