JP6977448B2 - 機器制御装置、機器制御プログラム、機器制御方法、対話装置、及びコミュニケーションシステム - Google Patents

機器制御装置、機器制御プログラム、機器制御方法、対話装置、及びコミュニケーションシステム Download PDF

Info

Publication number
JP6977448B2
JP6977448B2 JP2017186313A JP2017186313A JP6977448B2 JP 6977448 B2 JP6977448 B2 JP 6977448B2 JP 2017186313 A JP2017186313 A JP 2017186313A JP 2017186313 A JP2017186313 A JP 2017186313A JP 6977448 B2 JP6977448 B2 JP 6977448B2
Authority
JP
Japan
Prior art keywords
power correction
target area
unit
correction coefficient
microphone array
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017186313A
Other languages
English (en)
Other versions
JP2019062435A (ja
Inventor
啓太 川端
茂 立澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2017186313A priority Critical patent/JP6977448B2/ja
Publication of JP2019062435A publication Critical patent/JP2019062435A/ja
Application granted granted Critical
Publication of JP6977448B2 publication Critical patent/JP6977448B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephone Function (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

本発明は、機器制御装置、機器制御プログラム、機器制御方法、対話装置、及びコミュニケーションシステムに関し、例えば、収音情報に基づいてテレプレゼンスロボットを制御するコミュニケーションシステムに適用し得る。
近年、遠隔地のユーザが遠隔操作によりロボット(対話装置)を制御し、対話装置を介して別の拠点に存在する他のユーザ(対話者)とコミュニケーションを図るコミュニケーションシステムが知られている。上記のようなコミュニケーションを主目的とした遠隔操作可能な対話装置は、特に、テレプレゼンスロボットとも呼ばれる。
ところで、テレプレゼンスロボットをはじめとする対話装置は、雑音を排除して対話者のみの声を収音できれば、その分だけ、コミュニケーションを円滑に図ることができる。例えば、特許文献1に示すようなエリア収音技術を対話装置に適用することが考えられる。エリア収音技術は、特定の範囲(以下、「目的エリア」)のみ収音することで背景の雑音などを抑制する技術である。
また、対話装置は、対話装置の位置を対話者と適切な位置に制御することが重要である。例えば、特許文献2では、対話装置と対話者の距離と、撮影した対話者の表示映像が適切な表示となるように、対話装置の位置の制御と、映像表示部の表示を制御することで、ユーザの操作を支援する方法が提案されている。また、特許文献3では、複数の収音ビームを用いて、収音した音の中で最もパワーの大きい収音範囲を、音源の位置として推定する音源位置推定が提案されている。
特許第5482854号公報 特開2016−225875号公報 特許第4867579号公報
しかしながら、上記特許文献1〜3に記載の技術を対話装置に適用したとしても、以下のような問題が存在する。
特許文献1に記載の技術は、目的エリアのみを収音するため、収音した音を聞き続けるためには音源(対話者)が常に目的エリア内に位置するようにしなければならない問題が存在する。
また、特許文献2に記載の技術では、映像が判断材料となるため、制御された対話装置の収音範囲に対話者が位置するとは限らない問題が存在する。特に、エリア収音装置(例えば、マイクロフォンアレイ)を収音装置として用いた場合、対話者を収音範囲に位置させることが困難である。
そして、特許文献3の技術は、収音ビームの収音範囲の外に音源があったときに位置推定が困難になる問題が存在する。
そのため、精度良く目的エリア内に音源が位置するように対話装置の位置を制御する機器制御装置、機器制御プログラム、機器制御方法、対話装置、及びコミュニケーションシステムが望まれている。
第1の本発明は、複数のマイクロホンアレイを用いて目的エリアを収音する収音部を備える機器を制御する機器制御装置であって、(1)上記目的エリア内に音源が存在するか否かを判定するエリア内有音判定部と、(2)上記目的エリア内に音源が存在しない場合、上記目的エリアの位置を変更することで、上記目的エリア内に音源を位置させる目的エリア変更部とを有し、(3)さらに、上記機器は、移動機構を備える移動機器であり、(4)上記目的エリア変更部によって変更した上記目的エリアの世界座標を維持したまま、上記移動機器の位置を制御する対目的エリア移動制御部と、(5)上記各マイクロホンアレイのビームフォーマ出力に含まれる目的エリア音のパワーを全て同じ大きさにするためのパワー補正係数を算出するパワー補正算出部と、(6)上記パワー補正算出部で算出された上記パワー補正係数を保持するパワー補正係数保持部と、(7)上記各マイクロホンアレイ中の1の対象マイクロホンアレイ方向に対して、上記パワー補正算出部で求められる上記パワー補正係数と、上記パワー補正係数保持部で保持していた過去の上記パワー補正係数の値とを比較する比較処理を行い、該比較処理の結果に応じて、上記移動機器の上記対象マイクロホンアレイ方向に対する移動方向を決定する移動方向決定部とを有することを特徴とする。
第2の本発明の機器制御プログラムは、複数のマイクロホンアレイを用いて目的エリアを収音する収音部を備える機器を制御する機器制御装置に搭載されるコンピュータを、(1)上記目的エリア内に音源が存在するか否かを判定するエリア内有音判定部と、(2)上記目的エリア内に音源が存在しない場合、上記目的エリアの位置を変更することで、上記目的エリア内に音源を位置させる目的エリア変更部として機能させ、(3)さらに、上記機器は、移動機構を備える移動機器であり、(4)上記目的エリア変更部によって変更した上記目的エリアの世界座標を維持したまま、上記移動機器の位置を制御する対目的エリア移動制御部と、(5)上記各マイクロホンアレイのビームフォーマ出力に含まれる目的エリア音のパワーを全て同じ大きさにするためのパワー補正係数を算出するパワー補正算出部と、(6)上記パワー補正算出部で算出された上記パワー補正係数を保持するパワー補正係数保持部と、(7)上記各マイクロホンアレイ中の1の対象マイクロホンアレイ方向に対して、上記パワー補正算出部で求められる上記パワー補正係数と、上記パワー補正係数保持部で保持していた過去の上記パワー補正係数の値とを比較する比較処理を行い、該比較処理の結果に応じて、上記移動機器の上記対象マイクロホンアレイ方向に対する移動方向を決定する移動方向決定部として機能させることを特徴とする。
第3の本発明は、複数のマイクロホンアレイを用いて目的エリアを収音する収音部を備える機器を制御する機器制御装置に使用する機器制御方法であって、エリア内有音判定部及び目的エリア変更部を有し、(1)上記エリア内有音判定部は、上記目的エリア内に音源が存在するか否かを判定し、(2)上記目的エリア変更部は、上記目的エリア内に音源が存在しない場合、上記目的エリアの位置を変更することで、上記目的エリア内に音源を位置させ、(3)さらに、上記機器は、移動機構を備える移動機器であり、対目的エリア移動制御部、パワー補正算出部、パワー補正係数保持部、及び移動方向決定部を有し、(4)上記対目的エリア移動制御部は、上記目的エリア変更部によって変更した上記目的エリアの世界座標を維持したまま、上記移動機器の位置を制御し、(5)上記パワー補正算出部は、上記各マイクロホンアレイのビームフォーマ出力に含まれる目的エリア音のパワーを全て同じ大きさにするためのパワー補正係数を算出し、(6)上記パワー補正係数保持部は、上記パワー補正算出部で算出された上記パワー補正係数を保持し、(7)上記移動方向決定部は、上記各マイクロホンアレイ中の1の対象マイクロホンアレイ方向に対して、上記パワー補正算出部で求められる上記パワー補正係数と、上記パワー補正係数保持部で保持していた過去の上記パワー補正係数の値とを比較する比較処理を行い、該比較処理の結果に応じて、上記移動機器の上記対象マイクロホンアレイ方向に対する移動方向を決定することを特徴とする。
第4の本発明は、複数のマイクロホンアレイを用いて目的エリアを収音する収音部と、移動機構とを備える対話装置であって、(1)上記目的エリア内に音源が存在するか否かを判定するエリア内有音判定部と、(2)上記目的エリア内に音源が存在しない場合、上記目的エリアの位置を変更することで、上記目的エリア内に音源を位置させる目的エリア変更部と、(3)上記目的エリア変更部によって変更した上記目的エリアの世界座標を維持したまま、当該対話装置の位置を制御する対目的エリア移動制御部と、(4)上記各マイクロホンアレイのビームフォーマ出力に含まれる目的エリア音のパワーを全て同じ大きさにするためのパワー補正係数を算出するパワー補正算出部と、(5)上記パワー補正算出部で算出された上記パワー補正係数を保持するパワー補正係数保持部と、(6)上記各マイクロホンアレイ中の1の対象マイクロホンアレイ方向に対して、上記パワー補正算出部で求められる上記パワー補正係数と、上記パワー補正係数保持部で保持していた過去の上記パワー補正係数の値とを比較する比較処理を行い、該比較処理の結果に応じて、当該対話装置の上記対象マイクロホンアレイ方向に対する移動方向を決定する移動方向決定部とを有することを特徴とする。
第5の本発明は、第1の対話装置および第2の対話装置を備え、少なくとも前記第1の対話装置および第2の対話装置それぞれの音声を他方の対話装置に出力するコミュニケーションシステムであって、前記第1の対話装置および第2の対話装置の少なくとも一方に第4の本発明の対話装置を適用したことを特徴とする。
本発明によれば、精度良く目的エリア内に音源が位置するように対話装置の位置を制御することができる。
実施形態に係る対話装置の機能的構成について示すブロック図である。 実施形態に係るコミュニケーションシステムの全体構成を示す図である。 実施形態に係る対話装置の処理を示すフローチャートである。 実施形態に係る各マイクロホンアレイの収音範囲と音源との位置関係を示す図である(その1)。 実施形態に係る各マイクロホンアレイの収音範囲と音源との位置関係を示す図である(その2)。 実施形態に係る目的エリアにおけるパワー補正係数の一例を示す図である。 実施形態に係る図6のパワー補正係数を基に、音源の位置が変化するイメージを示す図である。 実施形態に係るマイクロホンアレイの収音の音圧分布を示す図である。
(A)主たる実施形態
以下、本発明に係る機器制御装置、機器制御プログラム、機器制御方法、対話装置、及びコミュニケーションシステムの一実施形態を、図面を参照しながら説明する。
(A−1)実施形態の構成
(A−1−1)全体構成
図2は、実施形態に係るコミュニケーションシステムの全体構成を示す図である。図2において、コミュニケーションシステム1は、対話装置5と、情報端末20と、対話装置5及び情報端末20と通信可能なサーバ30とを有している。
コミュニケーションシステム1は、別の拠点にある対話者同士が、対話を行うことができ、さらに、一方の拠点側の情報端末20を操作する者が、他の拠点側の対話装置5を遠隔操作することができるシステムである。
情報端末20は、対話装置5を遠隔操作する側に設けられる対話装置である。例えば、情報端末20は、音声データをサーバ30に送信するとともに、サーバ30から送信されてきた音声データを出力する。また、情報端末20は、対話装置5を遠隔操作するための入力を受け付け、サーバ30に送信する。情報端末20としては、タブレット端末、スマートフォン、パーソナルコンピュータなどを適用することができる。
対話装置5は、例えば、テレプレゼンスロボットのような対話装置であって、対話装置5を移動させる移動機構と、エリア収音部と、エリア収音部の収音範囲内に音源が位置するように対話装置5を制御する制御部とを備える。対話装置5は、収音した音声データをサーバ30に送信するとともに、サーバ30から送信されてきた音声データを出力する。また、対話装置5は、遠隔操作するための信号をサーバ30から受信すると、その信号に従い動作する。なお、対話装置5及び上記情報端末20は、第1の対話装置又は第2の対話装置の一例である。
本実施形態の特徴を簡単に述べると、第1に対話装置5が特定の範囲のみを収音するエリア収音部を有することである。第2にエリア収音の目的エリア内に音源がないとき、目的エリアの位置を変更することで音源が目的エリア内に位置するように探索することである。第3にエリア収音の目的エリア内の音源の位置を、目的エリアの中心に位置するように対話装置5を制御することである。第4に、音源を発見すること、音源の位置を目的エリアの中心にすることのためにエリア収音部によって得られた情報(後述するパワー補正係数等)を用いることで、エリア収音部をセンサとして活用することである。次に上記特徴1〜4を有する対話装置5の詳細な構成について述べる。
(A−1−2)対話装置5の詳細な構成
図1は、実施形態に係る対話装置の機能的構成について示すブロック図である。
図1において、対話装置5は、エリア収音部10と、パワー補正係数保持部12と、移動方向決定部13と、移動制御部14と、移動機構15と、エリア内有音判定部16と、目的エリア変更部17と、対目的エリア移動制御部18とを有する。
エリア収音部10は、パワー補正係数算出部11を備え、複数のマイクロホンアレイmとその指向性ビームフォーマを用いて目的エリア内のエリア音を収音するものである。ここで、ビームフォーマ(BF)は、加算型の遅延和法、減算型のスペクトル減算法(以下、SSとも呼ぶ。)等の各種手法を用いることができる。この実施形態では、2つのマイクロホンアレイm1、m2を用いる例を示すが、マイクロホンアレイmの数は特に限定されるもので無い。
図8は、実施形態に係るマイクロホンアレイの収音の音圧分布を示す図である。図8で示すように、マイクロホンアレイm(m1、m2)は、マイクロホンアレイmの正面中央の範囲(範囲L1)では、音圧レベルが高く、マイクロホンアレイmに接近する左右の範囲(左下の範囲L2、右下の範囲L3)では音圧レベルが低い特性を示す。
また、エリア収音部10は、目的エリア変更部17から収音範囲を変更するためのマイクロホンアレイm1、m2のビームフォーマの指向性を決定するパラメータを受信し、受信したパラメータに従って、マイクロホンアレイm1、m2を制御する。エリア収音した音響信号は、エリア内有音判定部16に送信され、マイクロホンアレイm1、m2で収音した音響信号は、目的エリア変更部17に送信される。
エリア内有音判定部16は、エリア収音部10から受信した音響信号により(例えば、音響信号のパワーの大きさにより)、目的エリアに音源が存在するか否か判定するものである。
目的エリア変更部17は、エリア収音部10のマイクロホンアレイm1、m2から音響信号を受信し、各マイクロホンアレイm1、m2に含まれる音から、どのマイクロホンアレイm方向にビームを向けたらよいかを判断し、マイクロホンアレイm1、m2の制御を行うものである。また、目的エリア変更部17は、対目的エリア移動制御部18にマイクロホンアレイm1、m2のビームフォーマの指向性を決定するパラメータを送信する。
対目的エリア移動制御部18は、目的エリア変更部17から受信したマイクロホンアレイm1、m2のビームフォーマの指向性を決定するパラメータ等に基づき、対話装置5を移動制御する(例えば、移動機構15を制御する命令を移動機構15に送信する)ことによって、目的エリアを各マイクロホンアレイm1、m2から等距離にするものである。
パワー補正係数算出部11は、各マイクロホンアレイm(m1、m2)からの各ビームフォーマ出力信号に含まれるエリア音のパワーをそれぞれ同じにするためのパワー補正係数を算出するものである。ここで、パワー補正係数を求めるために、例えば、パワー補正係数算出部11は、各ビームフォーマ出力信号の間で周波数毎の振幅スペクトルの比率を算出する。次に、パワー補正係数算出部11は、求めた各周波数の振幅スペクトルの比率から最頻値若しくは中央値を算出し、その値をパワー補正係数とする。
パワー補正係数算出部11は、算出したパワー補正係数をパワー補正係数保持部12、移動方向決定部13、移動制御部14に送信する。
パワー補正係数保持部12は、パワー補正係数算出部11から受信したパワー補正係数を順次記憶するものである。なお、パワー補正係数保持部12が記憶するパワー補正係数の数及び保持する時間間隔は限定されないものであるが、例えば、対話装置5の移動速度や、エリア収音部10の収音範囲などの関係を考慮して決定しても良い。
パワー補正係数保持部12は、記憶したパワー補正係数(過去のパワー補正係数)を移動方向決定部13及び移動制御部14に送信する。
移動方向決定部13は、パワー補正係数算出部11から受信した最新のパワー補正係数と、パワー補正係数保持部12から受信した過去のパワー補正係数を基に、対話装置5の移動方向を決定するものである。なお、詳細は後述するが、この実施形態では、対話装置5の移動方向を決定する際に、一旦対話装置5を後進(又は前進)させるために、移動機構15を制御する命令を移動機構15に送信する。そして、移動方向決定部13は、一旦移動することにより生じたパワー補正係数を比較した結果に応じて、決定した移動方向の情報(例えば、移動方向を示すフラグ)を移動制御部14に送信する。
移動制御部14は、パワー補正係数算出部11から受信した最新のパワー補正係数と、パワー補正係数保持部12から受信した過去のパワー補正係数とを比較し、後述する所定の条件を満たす場合には、移動方向決定部13から受信した移動方向を示すフラグに従い移動機構15を制御する命令を送信する。
移動機構15は、移動方向決定部13、移動制御部14、又は対目的エリア移動制御部18からの制御命令に基づき、対話装置5を移動させる機構である。移動機構15は、例えば、360度動けるようなボール上の機構や、前後移動・左右への転回を行う車輪形状など、目的の方向に移動できばどのような機構でも良い。また、移動機構15は、ドローンのようなプロペラ旋回により空中移動する機構や、水上移動可能なモータ機構のようなものでも良い。いずれにしても移動機構15は、種々様々な機構を適用することができる。
(A−2)実施形態の動作
次に、実施形態に係る対話装置5の処理を説明する。図3は、実施形態に係る対話装置の処理を示すフローチャートである。
目的エリアがある空間に存在する音源からの音は、マイクロホンアレイm1、m2によって収音され、また、目的エリアを収音する過程で、パワー補正係数算出部11は、パワー補正係数αを算出する(S1)。なお、パワー補正係数算出部11が、パワー補正係数αを算出する手法は限定されないものであるが、例えば、特許文献1に記載の手法を適用することができる。算出されたパワー補正係数αは、パワー補正係数保持部12、移動方向決定部13、移動制御部14へ送信される。
エリア収音部10は、エリア収音した音響信号をエリア内有音判定部16に送信する。また、エリア収音部10は、各マイクロホンアレイm1、m2で収音した音響信号を目的エリア変更部17に送信する。
エリア内有音判定部16は、エリア収音部10から受信した音響信号のパワーの大きさによって目的エリアに音源が存在するか否かを判定する(S2)。対話装置5は、目的エリアに音源が存在しないと判断された場合にはステップS3の処理を実行し、目的エリアに音源が存在すると判定された場合にはステップS5を実行する。なお、音源の有無を判定する方法は、上述のパワーに限らず、例えば音声を対象として動作させる場合には、有声音を判定することで有音とする等、目的エリアに音が存在することが分かる方法であれば、種々様々な方法を適用することができる。
目的エリア変更部17は、エリア収音部10のマイクロホンアレイm1、m2から音響信号を受信し、各マイクロホンアレイm1、m2に含まれる音から、どのマイクロホンアレイm方向にビームを向けたらよいかを判断し、各マイクロホンアレイm1、m2の制御を行う(S3)。
例えば、図4(A)に示すようにマイクロホンアレイm2の収音範囲に音源Srが存在し、マイクロホンアレイm1の収音範囲に音源Srが存在しない場合、目的エリア変更部17は、マイクロホンアレイm2のビーム方向を固定し、マイクロホンアレイm1のビーム方向を変更する。そして、図4(B)に示すように、マイクロホンアレイm1のビーム方向を変更した後、目的エリア変更部17は、エリア収音の出力を確認し、音源が目的エリアに位置していると判定された場合には、次のステップS4に移行する。エリア収音の目的エリアに音源が存在しない場合、目的エリア変更部17は、目的エリアを変更して音源を探知する。
なお、マイクロホンアレイmのビーム方向を変更する方法は、各マイクロホンアレイmに到来する信号の遅延を補正するための遅延量を変更したり、マイクロホンアレイmの設置向きを物理的に変更したりする等、任意の方向に目的エリアを形成できれば良い。また、この際ビーム方向の変更方向や量は任意に決めて良い。本実施形態では、一方のマイクロホンアレイmの収音範囲に音源がある場合の動作を示したが、音源を探知する方法はこの限りではなく、例えばいずれのマイクロホンアレイmにも音源が含まれない場合、各マイクロホンアレイmのビームをランダムに向けたり、広範囲を俯瞰して収音するマイクロホン(広範囲を収音するセンサ)を使用することで目的エリアの近くに音源があることを探知したりすることで音源の探知を補助するなど、目的エリアの位置を変更して音源を探索することが出来れば良い。ただし一方のマイクロホンアレイの収音範囲に音源があるほうが望ましい。
対目的エリア移動制御部18は、目的エリア変更部17の処理によって、目的エリアがエリア収音部10の各マイクロホンアレイm1、m2から等距離ではないものを、対話装置5を移動制御することによって、目的エリアを各マイクロホンアレイm1、m2から等距離にする(S4)。例えば、対目的エリア移動制御部18は、目的エリア変更部17で変更したマイクロホンアレイmのビームの回転角と変更前の目的エリアの位置から、対話装置5の移動方向を決定し、移動機構15に移動機構の制御命令を、エリア収音部10にマイクロホンアレイのビーム方向を変更する情報(パラメータ)を送信する。例えば、図5(A)に示すようにマイクロホンアレイm1のビームを変更していた場合、対話装置5のマイクロホンアレイm1側は小さく前進し、マイクロホンアレイm2側を大きく前進し、マイクロホンアレイm1のビームは45°方向から0°方向に制御する。これらを同時に行うことで、図5(B)に示すように目的エリアに音源Srをとどめたまま、各マイクロホンアレイm1、m2の中央、すなわち対話装置5の正面に音源Srを位置させる。なお、対話装置5の移動方向は前進方向に限らず、前後左右上下等に移動して良く、音源を各マイクロホンアレイm1、m2から等距離に位置させることができればどのような方法でも良い。
以下では、マイクロホンアレイm1、m2は目的エリアから等間隔に位置していることを前提として説明する。
パワー補正係数保持部12は、エリア収音部10のパワー補正係数算出部11から取得したパワー補正係数αを保持(記憶)する(S5)。保持したパワー補正係数(例えば、現在より1つ前の過去のパワー補正係数αt-1)は、移動方向決定部13、及び移動制御部14に送信される。
移動方向決定部13はパワー補正係数算出部11で得たパワー補正係数αと上記パワー補正係数保持部12で保持した過去のパワー補正係数(例えば、パワー補正係数αt-1)とを比較し、エリア収音装置のマイクロホンアレイm1に対して垂直方向に対話装置5を移動させる方向(前方向又は後ろ方向)を決定する(S6)。以下、移動方向を決定させるステップS6の具体的手順について述べる。
まず、移動方向決定部13は、対話装置5をマイクロホンアレイm1のビームフォームと平行方向(以下、「マイクロホンアレイm1方向」とも呼ぶ)に後進させるように移動機構15に制御信号を送信し対話装置5を一旦移動させる。なお、対話装置5の移動方向を決定するためのマイクロホンアレイm1方向に対する動作の方向(一旦移動させる方向)は、後進方向に限らず、前進方向でも良い。また、一旦移動させる距離は、目的エリアの大きさや、周囲の空間の広さに応じて変更するなど自由に決定して良い。
次に、パワー補正係数算出部11で得たパワー補正係数α(対話装置5を一旦後進させたことにより生じた最新のパワー補正係数)を受信し、パワー補正係数保持部12から対話装置5を後進する前のパワー補正係数αt-1を受信する。なお、エリア内のパワー補正係数は、以下で示すような規則性が存在する。
図6は実施形態に係る目的エリアにおけるパワー補正係数の一例を示す図である。図6では、エリア収音に使用する各マイクロホンアレイm1、m2のマップで、指向性を持つため中央の収音レベルが高く、横に行くにつれ収音レベルが低くなり、その比によってパワー補正係数が決定される。図6の各セルに示す数値は、エリア収音を行った際のパワー補正係数の一例である。
図6に示すようにマイクロホンアレイm1方向の目的エリア内のパワー補正係数は、前後に対する中心線で最も小さくなり、中心線からマイクロホンアレイm1に近づくあるいは遠ざかるほど大きくなる。
そのため、移動方向決定部13は、パワー補正係数αとパワー補正係数αt-1とを比較し、α<αt-1であれば、マイクロホンアレイm1方向に後進する方向を移動方向と決定し、α>αt-1であれば前進する方向を移動方向と決定する。
なお、移動方向決定部13は、例えば、エリア収音出力の大きさを計測するなどして目的エリアに音源が存在しないことが分かる場合、この処理を実施せずに収音処理に戻っても良い。また、移動方向決定部13は、対話装置5を一旦後進させることで音源が目的エリアから外れてしまった場合、例えば動作を止めたり、又は前進させ対話装置5を元の位置に戻した上で上記移動方向を決定する動作を前進動作で行ったりするなどの処理を追加しても良い。
2つパワー補正係数の時刻の差(t−1)はこの実施形態で使用した例に過ぎず、処理の速度や使用用途に応じて変更するなど自由に決定しても良い。
移動制御部14は、移動方向決定部13で求めた移動方向(パワー補正係数が小さくなるマイクロホンアレイm1方向)に対話装置5を移動(前進又は後進)させる(S7)。
移動方向決定部13は、ステップS7の処理中(つまり、対話装置5が移動中)に、パワー補正係数αが極小値となったタイミング(又は極小値を超えたタイミング)で、対話装置5の移動方向をマイクロホンアレイm1方向から、マイクロホンアレイm2のビームフォームと平行方向(以下、「マイクロホンアレイm2方向」とも呼ぶ)に転換させる(S8)。なお、上記極小値は、対話装置5を移動させ続けて、パワー補正係数がα>αt-1となってはじめて理解できる。そのため、実際には極小値を僅かに超えたタイミングで、マイクロホンアレイm1方向からマイクロホンアレイm2方向に対話装置5の移動方向を転換させることになる。なお、パワー補正係数αが極小値となる位置が正確に分かる場合には、対話装置5を極小値の位置に移動させた後に、マイクロホンアレイm1方向からマイクロホンアレイm2方向に対話装置5の移動方向を転換させても良い。
移動方向決定部13は、マイクロホンアレイm2方向に対して、ステップS6と同様の処理を行う(S9)。なお、図6で示すように、マイクロホンアレイm2方向の目的エリア内のパワー補正係数は、マイクロホンアレイm1方向の目的エリア内のパワー補正係数とは異なり、前後に対する中心線で最も大きくなり、中心線からマイクロホンアレイm2に近づくあるいは遠ざかるほど小さくなる。そのため、移動方向決定部13は、先述のステップS6とは異なり、移動方向決定部13は、一旦対話装置5を後進させている場合には、パワー補正係数αとパワー補正係数αt-1とを比較し、α>αt-1であれば、マイクロホンアレイm2方向に後進する方向を移動方向と決定し、α<αt-1であれば前進する方向を移動方向と決定する。
移動制御部14は、移動方向決定部13で求めた移動方向(パワー補正係数が大きくなるマイクロホンアレイm2方向)に対話装置5を移動(前進又は後進)させる(S10)。なお、移動中の対話装置5は、パワー補正係数αが極大値となったタイミング(又は極大値を下回ったタイミング)で、対話装置5を停止する。上記極大値も先述の極小値と同様に、対話装置5を移動させ続けて、パワー補正係数がα<αt-1となってはじめて理解できる。
次に、上記ステップS7〜ステップS10の処理について、図7の具体例を交えて改めて説明を行う。図7は、実施形態に係る図6のパワー補正係数を基に、音源の位置が変化するイメージを示す図である。音源位置P1は、音源の初期位置を示している(図7では、パワー補正係数の値で音源位置を示している)。
ステップS7の処理により、移動方向決定部13で決定したマイクロホンアレイm1方向の移動方向が後進だった場合には、パワー補正係数がα<αt-1となる間、対話装置の移動を繰り返す。図7を参照すると、音源位置P1(初期位置)がα<αt-1となるように、対話装置5が移動することにより、相対的に音源の位置を更新する。そして、マイクロホンアレイm1方向に対する対話装置5の移動により、音源の位置がマイクロホンアレイm1の前後方向に対して中央の位置(音源位置P2)となる。この音源位置P2は、つまり、先に説明したパワー補正係数の極小値であり、マイクロホンアレイm1からマイクロホンアレイm2方向に転換する位置(値)である。
移動方向決定部13は、ステップS8の処理によりマイクロホンアレイm1からマイクロホンアレイm2方向へ転換した後、ステップS9の処理(マイクロホンアレイm2方向に対して対話装置5を移動させる方向を決定する処理)を行う。
ステップS10の処理により、パワー補正係数がα>αt-1となる間、対話装置の移動を繰り返す。図7を参照すると、音源位置P2がα>αt-1となるように、対話装置5が移動することにより、相対的に音源の位置を更新する。そうすると、音源の位置は音源位置P2から音源位置P3に変化する。この音源位置P3は、つまり、先に説明した極大値であり、対話装置5が停止する位置である。
なお、この後、対話装置5はステップS1の処理に戻ることで、音源が移動したとしても、継続的に音源を目的エリアの中央に位置するように対話装置を制御できる。
(A−3)実施形態の効果
以上のように、本発明の実施形態によれば、特定の範囲のみを収音し、かつ収音範囲に音源がないとき、収音範囲に音源が位置するように対話装置を制御し、そして、収音範囲の中央に音源が位置するように対話装置を自動で制御することで、精度良く収音することができる。
(B)他の実施形態
上記実施形態においても種々の変形実施形態を言及したが、本発明は、以下の変形実施形態にも適用できる。
(B−1)上記実施形態では、移動方向をマイクロホンアレイm1の方向から決定し制御したが、制御の順番は任意に決定しても良い(つまり、マイクロホンアレイm2の方向から決定しても良い)。
(B−2)上記実施形態では、対話装置5の移動制御は、移動機構15に直接制御信号を送信することにより実現する例を示した。変形例として、例えば、サーバ30(又は情報端末20)は、対話装置5の移動方向決定部13、移動制御部14、及び対目的エリア移動制御部18と同様の機能部を有し、サーバ30から対話装置5の移動に関する制御信号を送信し、それに従い対話装置5の移動機構15を制御する等の構成でも良い。
(B−3)上記実施形態では、対話装置5は必ずしも対話者を撮像するデバイス(例えば、カメラ等)を備える必要は無なかった。変形例としてカメラを備え、カメラからの映像(画像)を基に、一定の範囲内に音源が存在するか否かの大まかな判定を行い、かつ音源の存在する目的エリアに対話装置5の移動を行った後に、先述のステップS1〜S10の処理を行っても良い。
1…コミュニケーションシステム、5…対話装置、10…エリア収音部、11…パワー補正係数算出部、12…パワー補正係数保持部、13…移動方向決定部、14…移動制御部、15…移動機構、16…エリア内有音判定部、17…目的エリア変更部、18…対目的エリア移動制御部、20…情報端末、30…サーバ、m(m1、m2)…マイクロホンアレイ。

Claims (15)

  1. 複数のマイクロホンアレイを用いて目的エリアを収音する収音部を備える機器を制御する機器制御装置であって、
    上記目的エリア内に音源が存在するか否かを判定するエリア内有音判定部と、
    上記目的エリア内に音源が存在しない場合、上記目的エリアの位置を変更することで、上記目的エリア内に音源を位置させる目的エリア変更部とを有し、
    さらに、上記機器は、移動機構を備える移動機器であり、
    上記目的エリア変更部によって変更した上記目的エリアの世界座標を維持したまま、上記移動機器の位置を制御する対目的エリア移動制御部と、
    上記各マイクロホンアレイのビームフォーマ出力に含まれる目的エリア音のパワーを全て同じ大きさにするためのパワー補正係数を算出するパワー補正算出部と、
    上記パワー補正算出部で算出された上記パワー補正係数を保持するパワー補正係数保持部と、
    上記各マイクロホンアレイ中の1の対象マイクロホンアレイ方向に対して、上記パワー補正算出部で求められる上記パワー補正係数と、上記パワー補正係数保持部で保持していた過去の上記パワー補正係数の値とを比較する比較処理を行い、該比較処理の結果に応じて、上記移動機器の上記対象マイクロホンアレイ方向に対する移動方向を決定する移動方向決定部とを有する
    ことを特徴とする機器制御装置。
  2. 上記対目的エリア移動制御部は、上記各マイクロホンアレイから等距離に上記目的エリアが位置するように上記移動機器を制御することを特徴とする請求項に記載の機器制御装置。
  3. 上記収音部による収音処理と上記対目的エリア移動制御部による上記移動機器の制御とを繰り返し継続することを特徴とする請求項又はに記載の機器制御装置。
  4. 上記パワー補正算出部は、上記各マイクロホンアレイのビームフォーマ出力間の振幅スペクトルの比率の最頻値もしくは中央値を算出し、上記パワー補正係数とすることを特徴とする請求項1〜3のいずれかに記載の機器制御装置。
  5. 上記移動方向決定部は、上記対象マイクロホンアレイ方向に対して、上記移動機器を一旦移動させる制御を上記移動機構に対して行い、上記移動機器が一旦移動した後、上記比較処理を行い、上記対象マイクロホンアレイ方向に対する移動方向を決定することを特徴とする請求項1〜4のいずれかに記載の機器制御装置。
  6. 上記移動方向決定部は、上記目的エリアに音源が存在しなかった場合には、上記対象マイクロホンアレイ方向に対する移動方向を決定せず、上記収音部による収音処理を行うことを特徴とする請求項のいずれかに記載の機器制御装置。
  7. 上記移動方向決定部は、上記対象マイクロホンアレイ方向に上記移動機器を一旦移動後、上記目的エリアに音源が存在しなかった場合には、上記移動機器を一旦移動させる前の元の位置に移動させる制御を上記移動機構に対して行い、上記移動機器が元の位置に移動した後、上記対象マイクロホンアレイ方向に対して、最初に一旦前進移動をさせた場合には一旦後進移動を、又は最初に一旦後進移動させた場合には一旦前進移動をさせる制御を上記移動機構に対して行い、上記移動機器が再度一旦移動した後、上記比較処理を行い、上記対象マイクロホンアレイ方向に対する移動方向を決定することを特徴とする請求項又はに記載の機器制御装置。
  8. 上記移動方向決定部は、上記対象マイクロホンアレイ方向に上記移動機器を一旦移動後、上記目的エリアに音源が存在しなかった場合には、上記移動機器を一旦移動させる前の元の位置に移動させる制御を上記移動機構に対して行い、上記移動機器が元の位置に移動した後、上記対象マイクロホンアレイ方向に対して、上記移動機器を最初に一旦移動をさせた距離とは異なる距離で、再度一旦移動させる制御を上記移動機構に対して行い、上記移動機器が再度一旦移動した後、上記比較処理を行い、上記対象マイクロホンアレイ方向に対する移動方向を決定することを特徴とする請求項又はに記載の機器制御装置。
  9. さらに、上記移動方向決定部で決定された移動方向に対して、上記移動機器を移動させる制御を上記移動機構に対して行い、上記パワー補正算出部で求められる上記パワー補正係数と、上記パワー補正係数保持部で保持していた上記過去のパワー補正係数とを比較して、上記対象マイクロホンアレイ方向に対する上記パワー補正係数が極大値又は極小値となるまで上記移動機器を移動させ続ける制御を行う移動制御部を有することを特徴とする請求項のいずれかに記載の機器制御装置。
  10. 上記移動方向決定部は、上記移動制御部で上記対象マイクロホンアレイ方向に対する上記パワー補正係数が極大値又は極小値となるまで上記移動機器を移動させ続けた後、上記各マイクロホンアレイ中の他の1のマイクロホンアレイを対象マイクロホンアレイとして、同様に上記対象マイクロホンアレイ方向に対する移動方向を決定する処理を行うことを特徴とする請求項に記載の機器制御装置。
  11. 上記収音部による収音処理と上記移動機構に対する移動制御を繰り返しながら、音源を追尾することを特徴とする請求項10のいずれかに記載の機器制御装置。
  12. 複数のマイクロホンアレイを用いて目的エリアを収音する収音部を備える機器を制御する機器制御装置に搭載されるコンピュータを、
    上記目的エリア内に音源が存在するか否かを判定するエリア内有音判定部と、
    上記目的エリア内に音源が存在しない場合、上記目的エリアの位置を変更することで、上記目的エリア内に音源を位置させる目的エリア変更部として機能させ、
    さらに、上記機器は、移動機構を備える移動機器であり、
    上記目的エリア変更部によって変更した上記目的エリアの世界座標を維持したまま、上記移動機器の位置を制御する対目的エリア移動制御部と、
    上記各マイクロホンアレイのビームフォーマ出力に含まれる目的エリア音のパワーを全て同じ大きさにするためのパワー補正係数を算出するパワー補正算出部と、
    上記パワー補正算出部で算出された上記パワー補正係数を保持するパワー補正係数保持部と、
    上記各マイクロホンアレイ中の1の対象マイクロホンアレイ方向に対して、上記パワー補正算出部で求められる上記パワー補正係数と、上記パワー補正係数保持部で保持していた過去の上記パワー補正係数の値とを比較する比較処理を行い、該比較処理の結果に応じて、上記移動機器の上記対象マイクロホンアレイ方向に対する移動方向を決定する移動方向決定部として機能させる
    ことを特徴とする機器制御プログラム。
  13. 複数のマイクロホンアレイを用いて目的エリアを収音する収音部を備える機器を制御する機器制御装置に使用する機器制御方法であって、
    エリア内有音判定部及び目的エリア変更部を有し、
    上記エリア内有音判定部は、上記目的エリア内に音源が存在するか否かを判定し、
    上記目的エリア変更部は、上記目的エリア内に音源が存在しない場合、上記目的エリアの位置を変更することで、上記目的エリア内に音源を位置させ、
    さらに、上記機器は、移動機構を備える移動機器であり、対目的エリア移動制御部、パワー補正算出部、パワー補正係数保持部、及び移動方向決定部を有し、
    上記対目的エリア移動制御部は、上記目的エリア変更部によって変更した上記目的エリアの世界座標を維持したまま、上記移動機器の位置を制御し、
    上記パワー補正算出部は、上記各マイクロホンアレイのビームフォーマ出力に含まれる目的エリア音のパワーを全て同じ大きさにするためのパワー補正係数を算出し、
    上記パワー補正係数保持部は、上記パワー補正算出部で算出された上記パワー補正係数を保持し、
    上記移動方向決定部は、上記各マイクロホンアレイ中の1の対象マイクロホンアレイ方向に対して、上記パワー補正算出部で求められる上記パワー補正係数と、上記パワー補正係数保持部で保持していた過去の上記パワー補正係数の値とを比較する比較処理を行い、該比較処理の結果に応じて、上記移動機器の上記対象マイクロホンアレイ方向に対する移動方向を決定する
    ことを特徴とする機器制御方法。
  14. 複数のマイクロホンアレイを用いて目的エリアを収音する収音部と、移動機構とを備える対話装置であって、
    上記目的エリア内に音源が存在するか否かを判定するエリア内有音判定部と、
    上記目的エリア内に音源が存在しない場合、上記目的エリアの位置を変更することで、上記目的エリア内に音源を位置させる目的エリア変更部と、
    上記目的エリア変更部によって変更した上記目的エリアの世界座標を維持したまま、当該対話装置の位置を制御する対目的エリア移動制御部と、
    上記各マイクロホンアレイのビームフォーマ出力に含まれる目的エリア音のパワーを全て同じ大きさにするためのパワー補正係数を算出するパワー補正算出部と、
    上記パワー補正算出部で算出された上記パワー補正係数を保持するパワー補正係数保持部と、
    上記各マイクロホンアレイ中の1の対象マイクロホンアレイ方向に対して、上記パワー補正算出部で求められる上記パワー補正係数と、上記パワー補正係数保持部で保持していた過去の上記パワー補正係数の値とを比較する比較処理を行い、該比較処理の結果に応じて、当該対話装置の上記対象マイクロホンアレイ方向に対する移動方向を決定する移動方向決定部と
    を有することを特徴とする対話装置。
  15. 第1の対話装置および第2の対話装置を備え、少なくとも前記第1の対話装置および第2の対話装置それぞれの音声を他方の対話装置に出力するコミュニケーションシステムであって、
    前記第1の対話装置および第2の対話装置の少なくとも一方に請求項14に記載の対話装置を適用したことを特徴とするコミュニケーションシステム。
JP2017186313A 2017-09-27 2017-09-27 機器制御装置、機器制御プログラム、機器制御方法、対話装置、及びコミュニケーションシステム Active JP6977448B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017186313A JP6977448B2 (ja) 2017-09-27 2017-09-27 機器制御装置、機器制御プログラム、機器制御方法、対話装置、及びコミュニケーションシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017186313A JP6977448B2 (ja) 2017-09-27 2017-09-27 機器制御装置、機器制御プログラム、機器制御方法、対話装置、及びコミュニケーションシステム

Publications (2)

Publication Number Publication Date
JP2019062435A JP2019062435A (ja) 2019-04-18
JP6977448B2 true JP6977448B2 (ja) 2021-12-08

Family

ID=66178286

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017186313A Active JP6977448B2 (ja) 2017-09-27 2017-09-27 機器制御装置、機器制御プログラム、機器制御方法、対話装置、及びコミュニケーションシステム

Country Status (1)

Country Link
JP (1) JP6977448B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113453980B (zh) * 2019-05-15 2024-03-29 松下知识产权经营株式会社 信息处理方法、无人飞行体以及无人飞行体控制系统
CN112578338B (zh) * 2019-09-27 2024-05-14 阿里巴巴集团控股有限公司 声源定位方法、装置、设备及存储介质
CN112470215A (zh) * 2019-12-03 2021-03-09 深圳市大疆创新科技有限公司 控制方法、装置和可移动平台
JP7248048B2 (ja) * 2021-04-28 2023-03-29 沖電気工業株式会社 収音装置、収音プログラム及び収音方法、並びに、キーボード
CN117406174B (zh) * 2023-12-15 2024-03-15 深圳市声菲特科技技术有限公司 准确定位声源的方法、装置、设备与存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006251266A (ja) * 2005-03-10 2006-09-21 Hitachi Ltd 視聴覚連携認識方法および装置
EP1732352B1 (en) * 2005-04-29 2015-10-21 Nuance Communications, Inc. Detection and suppression of wind noise in microphone signals
JP6598064B2 (ja) * 2015-09-30 2019-10-30 パナソニックIpマネジメント株式会社 物体検出装置、物体検出システム、及び物体検出方法

Also Published As

Publication number Publication date
JP2019062435A (ja) 2019-04-18

Similar Documents

Publication Publication Date Title
JP6977448B2 (ja) 機器制御装置、機器制御プログラム、機器制御方法、対話装置、及びコミュニケーションシステム
US10979805B2 (en) Microphone array auto-directive adaptive wideband beamforming using orientation information from MEMS sensors
CN107534725B (zh) 一种语音信号处理方法及装置
CN104106267B (zh) 在增强现实环境中的信号增强波束成形
US8755536B2 (en) Stabilizing directional audio input from a moving microphone array
US8981994B2 (en) Processing signals
US9516241B2 (en) Beamforming method and apparatus for sound signal
KR100499124B1 (ko) 직교 원형 마이크 어레이 시스템 및 이를 이용한 음원의3차원 방향을 검출하는 방법
WO2021037129A1 (zh) 一种声音采集方法及装置
KR20120071452A (ko) 마이크 어레이를 이용한 방향성 음원 필터링 장치 및 그 제어방법
JP2014137226A (ja) 移動体、音響源マップ作成システムおよび音響源マップ作成方法
JP6467736B2 (ja) 音源位置推定装置、音源位置推定方法および音源位置推定プログラム
US20110058683A1 (en) Method & apparatus for selecting a microphone in a microphone array
WO2015106401A1 (zh) 语音处理方法和语音处理装置
JP2003251583A (ja) ロボット視聴覚システム
US11388343B2 (en) Photographing control method and controller with target localization based on sound detectors
EP2362238B1 (en) Estimating the distance from a sensor to a sound source
JP6879144B2 (ja) 機器制御装置、機器制御プログラム、機器制御方法、対話装置、及びコミュニケーションシステム
KR101884446B1 (ko) 다자간 회의에서의 화자 인식 및 화자 추적 방법
US10084965B2 (en) Omnidirectional high resolution tracking and recording apparatus and method
CN112859000B (zh) 一种声源定位方法以及装置
US20200275205A1 (en) Smart Speaker System with Microphone Room Calibration
CN112672251A (zh) 一种扬声器的控制方法和系统、存储介质及扬声器
Sasaki et al. Online spatial sound perception using microphone array on mobile robot
Martinson et al. Robotic discovery of the auditory scene

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200513

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210302

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210330

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210525

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211012

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211025

R150 Certificate of patent or registration of utility model

Ref document number: 6977448

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150