JP2020127103A

JP2020127103A - 音場制御装置、音場制御システム、音場制御装置の制御方法、プログラム、および記録媒体

Info

Publication number: JP2020127103A
Application number: JP2019017612A
Authority: JP
Inventors: 悟古平; Satoru Furuhira
Original assignee: Onkyo Corp
Current assignee: Onkyo Corp
Priority date: 2019-02-04
Filing date: 2019-02-04
Publication date: 2020-08-20

Abstract

【課題】第１スピーカーおよび第２スピーカーの左右位置を特定する。【解決手段】３個以上のマイクであるマイク群が設けられた第１スピーカーＳＰ１および第２スピーカーＳＰ２が配置された音場１００を制御するサーバー３であって、ユーザーＵから発音されたテスト音を、第１スピーカーＳＰ１および第２スピーカーのマイク群で収音した収音結果に基づいて、それぞれ第１スピーカーＳＰ１および第２スピーカーＳＰ２からのユーザーＵの方向を特定し、第１スピーカーＳＰ１および第２スピーカーＳＰ２のいずれか一方から発音されたテスト音を、他方のマイク群で収音した収音結果に基づいて、スピーカー同士の方向を特定し、特定したユーザーＵの方向と、スピーカー同士の方向と、に基づいて、ユーザーＵに対する第１スピーカーＳＰ１および第２スピーカーＳＰ２の左右位置を特定する。【選択図】図１

Description

本発明は、複数のスピーカーが配置された音場を制御する音場制御装置、音場制御システム、音場制御装置の制御方法、プログラム、および記録媒体に関するものである。

この種の技術として、特許文献１には、複数のスピーカー（発散デバイス）の相互の位置関係を特定する方法が開示されている。特許文献１では、スピーカーにマイク（検知デバイス）を搭載し、スピーカーから発音されたテスト音を他のスピーカーに設けられたマイクで収音する測定動作を、スピーカーの数だけ繰り返すことにより、複数のスピーカーの相互の位置関係を特定している。

特表２００５−５１３９３５号公報

特許文献１の技術では、任意のスピーカーに対する他のスピーカーの相対的な位置は特定できるものの、鏡像は同じ位置関係であるとみなされる（段落００１８，００２２参照）。例えば、他のスピーカーとして、第１スピーカーおよび第２スピーカーが配置されている場合、任意のスピーカーに対する、第１スピーカーおよび第２スピーカーの実際の配置である第１の配置と、任意のスピーカーに対し、第１スピーカーおよび第２スピーカーが実際の配置とは鏡像の位置関係となるように配置された第２の配置と、は同じ位置関係として特定される。このように、特許文献１の技術では、第１スピーカーおよび第２スピーカーのうち、基準位置に対して左に配置された左スピーカーおよび基準位置に対して右に配置された右スピーカーを特定することができない。

本発明は、上記の問題点に鑑み、第１スピーカーおよび第２スピーカーのうち、基準位置に対して左に配置された左スピーカーおよび基準位置に対して右に配置された右スピーカーを特定可能な音場制御装置、音場制御システム、音場制御装置の制御方法、プログラム、および記録媒体を提供することを目的とする。

本発明の音場制御装置は、３個以上のマイクである第１マイク群が設けられた第１スピーカーと、３個以上のマイクである第２マイク群が設けられた第２スピーカーと、が配置された音場を制御する音場制御装置であって、基準位置から発音されたテスト音を、第１マイク群で収音した収音結果に基づいて、第１スピーカーからの基準位置の方向を特定し、基準位置から発音されたテスト音を、第２マイク群で収音した収音結果に基づいて、第２スピーカーからの基準位置の方向を特定する基準位置方向特定部と、第１スピーカーから発音されたテスト音を、第２マイク群で収音した収音結果に基づいて、第２スピーカーからの第１スピーカーの方向を特定し、第２スピーカーから発音されたテスト音を、第１マイク群で収音した収音結果に基づいて、第１スピーカーからの第２スピーカーの方向を特定するスピーカー方向特定部と、基準位置方向特定部の特定結果と、スピーカー方向特定部の特定結果と、に基づいて、第１スピーカーおよび第２スピーカーのうち、基準位置に対して左に配置された左スピーカーおよび基準位置に対して右に配置された右スピーカーを特定するスピーカー位置特定部と、を備えることを特徴とする。

本発明の音場制御システムは、３個以上のマイクである第１マイク群が設けられた第１スピーカーと、３個以上のマイクである第２マイク群が設けられた第２スピーカーと、第１スピーカーおよび第２スピーカーが配置された音場を制御する音場制御システムであって、基準位置から発音されたテスト音を、第１マイク群で収音した収音結果に基づいて、第１スピーカーからの基準位置の方向を特定し、基準位置から発音されたテスト音を、第２マイク群で収音した収音結果に基づいて、第２スピーカーからの基準位置の方向を特定する基準位置方向特定部と、第１スピーカーから発音されたテスト音を、第２マイク群で収音した収音結果に基づいて、第２スピーカーからの第１スピーカーの方向を特定し、第２スピーカーから発音されたテスト音を、第１マイク群で収音した収音結果に基づいて、第１スピーカーからの第２スピーカーの方向を特定するスピーカー方向特定部と、基準位置方向特定部の特定結果と、スピーカー方向特定部の特定結果と、に基づいて、第１スピーカーおよび第２スピーカーのうち、基準位置に対して左に配置された左スピーカーおよび基準位置に対して右に配置された右スピーカーを特定するスピーカー位置特定部と、を備えることを特徴とする。

本発明の音場制御装置の制御方法は、３個以上のマイクである第１マイク群が設けられた第１スピーカーと、３個以上のマイクである第２マイク群が設けられた第２スピーカーと、が配置された音場を制御する音場制御装置の制御方法であって、基準位置から発音されたテスト音を、第１マイク群で収音した収音結果に基づいて、第１スピーカーからの基準位置の方向を特定し、基準位置から発音されたテスト音を、第２マイク群で収音した収音結果に基づいて、第２スピーカーからの基準位置の方向を特定するステップと、第１スピーカーから発音されたテスト音を、第２マイク群で収音した収音結果に基づいて、第２スピーカーからの第１スピーカーの方向を特定し、第２スピーカーから発音されたテスト音を、第１マイク群で収音した収音結果に基づいて、第１スピーカーからの第２スピーカーの方向を特定するステップと、特定された第１スピーカーからの基準位置の方向と、第２スピーカーからの基準位置の方向と、第２スピーカーからの第１スピーカーの方向と、第１スピーカーからの第２スピーカーの方向と、に基づいて、第１スピーカーおよび第２スピーカーのうち、基準位置に対して左に配置された左スピーカーおよび基準位置に対して右に配置された右スピーカーを特定するステップと、を実行することを特徴とする。

第１実施形態に係る音場制御システムのシステム構成図である。第１スピーカーの制御構成を示すブロック図である。サーバーの制御構成を示すブロック図である。第１スピーカーに設けられた３個のマイクと、ユーザーと、の位置関係を示す図である。指示音声の音声波形と、３個のマイクの収音音声の音声波形と、の一例を示す図である。第１スピーカーに設けられた第１マイクおよび第２マイクと、ユーザーと、の位置関係を示す図である。図６における、第１マイクおよび第２マイクと、ユーザーと、の位置関係を、ｘｙ座標上で示す図である。第１スピーカーと、第２スピーカーと、ユーザーと、の位置関係を示す図である。図８に示す∠Ａ１ＵＡ２と、第１スピーカーおよび第２スピーカーに割り当てるチャンネルと、の関係を示す表である。サーバーによるチャンネル設定処理の流れを示すフローチャートである。第２実施形態に係る音場制御システムのブロック図である。第２実施形態に係るチャンネル設定処理の流れの一部を示すフローチャートである。

［第１実施形態］
以下、本発明の一実施形態に係る音場制御装置、音場制御システム、音場制御装置の制御方法、プログラム、および記録媒体について、添付図面を参照しながら詳細に説明する。図１は、第１実施形態に係る音場制御システムＳＹ１のシステム構成図である。音場制御システムＳＹ１は、第１スピーカーＳＰ１と、第２スピーカーＳＰ２と、サーバー３と、を備えている。サーバー３は、「音場制御装置」の一例である。

本実施形態に係る第１スピーカーＳＰ１および第２スピーカーＳＰ２は、スマートスピーカーであり、サーバー３は、クラウドサーバーである。第１スピーカーＳＰ１および第２スピーカーＳＰ２は、インターネット通信網ＮＷを介して、それぞれサーバー３と接続される。また、第１スピーカーＳＰ１および第２スピーカーＳＰ２は、ユーザーＵが存在する音場１００において、ステレオ再生用のスピーカーとして用いられる。音場１００におけるユーザーＵの位置は、「基準位置」の一例である。

第１スピーカーＳＰ１には、第１マイクＭ１１、第２マイクＭ１２および第３マイクＭ１３が搭載されている。第１スピーカーＳＰ１に搭載されたこれらのマイクを、第１マイク群Ｍ１０と総称する。また、第２スピーカーＳＰ２には、第１マイクＭ２１、第２マイクＭ２２および第３マイクＭ２３が搭載されている。第２スピーカーＳＰ２に搭載されたこれらのマイクを、第２マイク群Ｍ２０と総称する。第１マイク群Ｍ１０および第２マイク群Ｍ２０に含めるマイクの種類は、特に限定しないが、例えばビームフォーミング用のマイクを用いることができる。

一方、サーバー３は、第１スピーカーＳＰ１および第２スピーカーＳＰ２と連携し、ＡＩアシスタントサービスを提供する。なお、「ＡＩアシスタントサービス」とは、ユーザーからの質問（例えば、音声「今日の天気は」を取得する）に回答（例えば、音声「今日の天気は晴れです」を出力する）したり、ユーザーからのリクエスト（例えば、音声「音楽再生して」を取得する）に応答（例えば、音楽を再生する）したりするサービスである。また、本実施形態に係るサーバー３は、ユーザーＵと、第１スピーカーＳＰ１と、第２スピーカーＳＰ２と、の位置関係を特定し、特定した位置関係に基づいて、第１スピーカーＳＰ１および第２スピーカーＳＰ２のうち、いずれか一方にＬチャンネルを割り当て、他方にＲチャンネルを割り当てるチャンネル自動設定機能を有している。以下、この点を中心に詳述する。

なお、ユーザーＵに対して左に配置されたスピーカー、すなわちＬチャンネルが割り当てられるべきスピーカーを、「左スピーカー」という。また、ユーザーＵに対して右に配置されたスピーカー、すなわちＲチャンネルが割り当てられるべきスピーカーを、「右スピーカー」という。

次に、図２および図３を参照し、第１スピーカーＳＰ１およびサーバー３の制御構成について説明する。図２は、第１スピーカーＳＰ１の制御構成を示すブロック図である。第２スピーカーＳＰ２については、第１スピーカーＳＰ１と同様の制御構成であるため、説明を省略する。

第１スピーカーＳＰ１は、スピーカー制御部１１と、スピーカー通信部１２と、音声出力部１３と、第１マイク群Ｍ１０と、を備えている。第１マイク群Ｍ１０には、第１マイクＭ１１と、第２マイクＭ１２と、第３マイクＭ１３と、が含まれる。

スピーカー制御部１１は、ＣＰＵ（Central Processing Unit）等のプロセッサーの他、ＲＯＭ（Read Only Memory）およびＲＡＭ（Random Access Memory）等を含み、第１スピーカーＳＰ１の各部を制御する。なお、プロセッサーは、複数のＣＰＵで構成されてもよいし、ＤＳＰ（digital signal processor）やＡＳＩＣ（Application Specific Integrated Circuit）等のハードウェア回路で構成されてもよい。また、プロセッサーは、１以上のＣＰＵと、ハードウェア回路が協働する構成でもよい。

スピーカー通信部１２は、インターネット通信網ＮＷを介して、サーバー３と通信する。なお、スピーカー通信部１２は、インターネット通信網ＮＷの他に、無線ＬＡＮ等を介してサーバー３と通信する構成でもよい。

音声出力部１３は、スピーカー制御部１１から出力されるデジタル信号をアナログ信号に変換するＤ／Ａコンバーターと、Ｄ／Ａコンバーターから出力されるアナログ信号を増幅するアンプと、スピーカーユニットと、を含み、アンプから出力されたアナログ信号に基づいて、スピーカーユニットから音声を出力する。以下、音声を出力することを、「発音する」という。

第１マイクＭ１１、第２マイクＭ１２および第３マイクＭ１３は、音声を入力し、入力した音声信号を増幅するアンプと、アンプから出力されるアナログ信号をデジタル信号に変換するＡ／Ｄコンバーターと、を含み、Ａ／Ｄコンバーターから出力されたデジタル信号を、スピーカー制御部１１に出力する。以下、音声を入力することを、「収音する」という。

図３は、サーバー３の制御構成を示すブロック図である。サーバー３は、サーバー制御部３１と、サーバー通信部３２と、サーバー記憶部３３と、を備えている。サーバー制御部３１は、ＣＰＵ等のプロセッサーの他、ＲＯＭおよびＲＡＭ等を含み、サーバー３の各部を制御する。なお、プロセッサーは、複数のＣＰＵで構成されてもよいし、ハードウェア回路で構成されてもよい。また、プロセッサーは、１以上のＣＰＵと、ハードウェア回路が協働する構成でもよい。

また、サーバー制御部３１は、後述する音場制御プログラム３３ａを実行することにより、音声認識部４１、基準位置方向特定部４２、スピーカー方向特定部４３、スピーカー位置特定部４４、チャンネル設定部４５および出力レベル設定部４６として機能する。

音声認識部４１は、第１スピーカーＳＰ１に設けられた第１マイク群Ｍ１０で収音された音声に基づくデジタル信号、または、第２スピーカーＳＰ２に設けられた第２マイク群Ｍ２０で収音された音声に基づくデジタル信号、を取得し、音声認識を行う。なお、「収音された音声に基づくデジタル信号」を、以下「収音音声」という。また、音声認識部４１は、第１マイク群Ｍ１０または第２マイク群Ｍ２０で収音された収音音声に基づいて、後述するチャンネル設定処理（図１０参照）の開始をユーザーＵが指示する指示音声を取得したか否かを判定する。指示音声としては、例えば、「チャンネルを設定して」や「ステレオで聞きたい」などが考えられる。

基準位置方向特定部４２は、ユーザーＵの位置から発音されたテスト音を、第１マイク群Ｍ１０で収音した収音結果に基づいて、第１スピーカーＳＰ１からのユーザーＵの方向を特定する。すなわち、基準位置方向特定部４２は、ユーザーＵの位置から発音されたテスト音を、第１マイク群Ｍ１０で収音した収音結果に基づいて、第１スピーカーＳＰ１の位置から見たユーザーＵの方向を特定する。本実施形態において、「第１マイク群Ｍ１０で収音した収音結果」とは、第１マイク群Ｍ１０に含まれる個々のマイクで収音した収音音声を指す。また、基準位置方向特定部４２は、ユーザーＵの位置から発音されたテスト音を、第２マイク群Ｍ２０で収音した収音結果に基づいて、第２スピーカーＳＰ２からのユーザーＵの方向を特定する。すなわち、基準位置方向特定部４２は、ユーザーＵの位置から発音されたテスト音を、第２マイク群Ｍ２０で収音した収音結果に基づいて、第２スピーカーＳＰ２の位置から見たユーザーＵの方向を特定する。本実施形態において、「第２マイク群Ｍ２０で収音した収音結果」とは、第２マイク群Ｍ２０に含まれる個々のマイクで収音した収音音声を指す。このとき、基準位置方向特定部４２は、音声認識部４１により、指示音声を取得したと判定された場合、その音声を、ユーザーＵの位置から発音されたテスト音として、ユーザーＵの方向を特定する。

より具体的には、基準位置方向特定部４２は、第１マイク群Ｍ１０で収音した収音結果から得られる、第１マイクＭ１１、第２マイクＭ１２および第３マイクＭ１３のマイクごとの収音時刻と、第１マイクＭ１１、第２マイクＭ１２および第３マイクＭ１３の第１スピーカーＳＰ１における配置と、に基づいて、第１スピーカーＳＰ１からのユーザーＵの方向を特定する。また、基準位置方向特定部４２は、第２マイク群Ｍ２０で収音した収音結果から得られる、第１マイクＭ２１、第２マイクＭ２２および第３マイクＭ２３のマイクごとの収音時刻と、第１マイクＭ２１、第２マイクＭ２２および第３マイクＭ２３の第２スピーカーＳＰ２における配置と、に基づいて、第２スピーカーＳＰ２からのユーザーＵの方向を特定する。なお、本実施形態において、第１マイクＭ１１、第２マイクＭ１２および第３マイクＭ１３の第１スピーカーＳＰ１における配置と、第１マイクＭ２１、第２マイクＭ２２および第３マイクＭ２３の第２スピーカーＳＰ２における配置と、は同じ配置とする。

スピーカー方向特定部４３は、第１スピーカーＳＰ１および第２スピーカーＳＰ２に対し、テスト音を発音させるための発音指示を行う。ここで用いるテスト音は、特に限定しないが、ユーザーＵの耳障りにならない程度の短い電子音、または、人間には認識できない可聴帯域外の信号を用いることが好ましい。

また、スピーカー方向特定部４３は、第１スピーカーＳＰ１から発音されたテスト音を、第２マイク群Ｍ２０で収音した収音結果に基づいて、第２スピーカーＳＰ２からの第１スピーカーＳＰ１の方向を特定する。すなわち、スピーカー方向特定部４３は、第１スピーカーＳＰ１から発音されたテスト音を、第２マイク群Ｍ２０で収音した収音結果に基づいて、第２スピーカーＳＰ２の位置から見た第１スピーカーＳＰ１の方向を特定する。また、スピーカー方向特定部４３は、第２スピーカーＳＰ２から発音されたテスト音を、第１マイク群Ｍ１０で収音した収音結果に基づいて、第１スピーカーＳＰ１からの第２スピーカーＳＰ２の方向を特定する。すなわち、スピーカー方向特定部４３は、第２スピーカーＳＰ２から発音されたテスト音を、第１マイク群Ｍ１０で収音した収音結果に基づいて、第１スピーカーＳＰ１の位置から見た第２スピーカーＳＰ２の方向を特定する。

より具体的には、スピーカー方向特定部４３は、第２マイク群Ｍ２０で収音した収音結果から得られる、第１マイクＭ２１、第２マイクＭ２２および第３マイクＭ２３のマイクごとの収音時刻と、第１マイクＭ２１、第２マイクＭ２２および第３マイクＭ２３の第２スピーカーＳＰ２における配置と、に基づいて、第２スピーカーＳＰ２からの第１スピーカーＳＰ１の方向を特定する。また、スピーカー方向特定部４３は、第１マイク群Ｍ１０で収音した収音結果から得られる第１マイクＭ１１、第２マイクＭ１２および第３マイクＭ１３のマイクごとの収音時刻と、第１マイクＭ１１、第２マイクＭ１２および第３マイクＭ１３の第１スピーカーＳＰ１における配置と、に基づいて、第１スピーカーＳＰ１からの第２スピーカーＳＰ２の方向を特定する。このように、スピーカー方向特定部４３による特定方法は、基準位置方向特定部４２による特定方法と同じアルゴリズムを採用可能である。

スピーカー位置特定部４４は、基準位置方向特定部４２の特定結果と、スピーカー方向特定部４３の特定結果と、に基づいて、第１スピーカーＳＰ１および第２スピーカーＳＰ２のうち、ユーザーＵに対して左に配置された左スピーカーおよびユーザーＵに対して右に配置された右スピーカーを特定する。すなわち、スピーカー位置特定部４４は、基準位置方向特定部４２の特定結果と、スピーカー方向特定部４３の特定結果と、に基づいて、第１スピーカーＳＰ１および第２スピーカーＳＰ２のうち、ユーザーＵから見て左に配置された左スピーカーおよびユーザーＵから見て右に配置された右スピーカーを特定する。

チャンネル設定部４５は、スピーカー位置特定部４４の特定結果に基づいて、第１スピーカーＳＰ１および第２スピーカーＳＰ２のチャンネルを設定する。例えば、チャンネル設定部４５は、スピーカー位置特定部４４により、第１スピーカーＳＰ１が左スピーカーとして特定され、第２スピーカーＳＰ２が右スピーカーとして特定された場合、第１スピーカーＳＰ１をＬチャンネルに設定し、第２スピーカーＳＰ２をＲチャンネルに設定する。

出力レベル設定部４６は、ユーザーＵの位置から発音されたテスト音、すなわち指示音声を、第１マイク群Ｍ１０で収音した収音結果と、同じ指示音声を、第２マイク群Ｍ２０で収音した収音結果と、に基づいて、第１スピーカーＳＰ１および第２スピーカーＳＰ２の出力レベルを設定する。より具体的には、出力レベル設定部４６は、第１スピーカーＳＰ１から発音された音と、第２スピーカーＳＰ２から発音された音と、がユーザーＵの位置で同じ音量となるように、第１スピーカーＳＰ１と第２スピーカーＳＰ２の出力レベルを設定する。例えば、第１マイク群Ｍ１０で収音した収音結果、すなわち第１マイク群Ｍ１０の収音レベルが、第２マイク群Ｍ２０で収音した収音結果、すなわち第２マイク群Ｍ２０の収音レベルよりも大きい場合、収音レベルの差に応じて、第２スピーカーＳＰ２の出力レベルが、第１スピーカーＳＰ１の出力レベルよりも大きくなるように、出力レベルを設定する。これにより、ユーザーＵは、第１スピーカーＳＰ１から発音された音と、第２スピーカーＳＰ２から発音された音と、を同じ音量で聞き取ることができる。ここで、収音レベルとは、第１マイク群Ｍ１０または第２マイク群Ｍ２０による収音音声の受信レベルを指す。なお、第１マイク群Ｍ１０で収音した収音結果としては、例えば、第１マイクＭ１１、第２マイクＭ１２および第３マイクＭ１３の平均収音レベルを採用可能である。第２マイク群Ｍ２０で収音した収音結果についても、同様である。

一方、サーバー通信部３２は、インターネット通信網ＮＷを介して、第１スピーカーＳＰ１および第２スピーカーＳＰ２と通信する。なお、サーバー通信部３２は、第１スピーカーＳＰ１および第２スピーカーＳＰ２から、第１マイク群Ｍ１０および第２マイク群Ｍ２０による収音音声を取得したり、第１スピーカーＳＰ１および第２スピーカーＳＰ２に対し、チャンネル設定部４５の設定に基づき、ＬチャンネルまたはＲチャンネルに対応した再生信号を出力したりするために用いられる。

サーバー記憶部３３は、例えば、ＨＤＤ（Hard Disk Drive）であり、ＯＳ（Operating System）等の基本ソフトウェアの他、音場制御プログラム３３ａを記憶している。サーバー制御部３１は、この音場制御プログラム３３ａに基づいて、後述するチャンネル設定処理を実行する。

上記の構成により、例えば、ユーザーＵが、図１に示したユーザーＵの位置で指示音声を発声すると、サーバー３は、第１スピーカーＳＰ１をＬチャンネルに設定し、第２スピーカーＳＰ２をＲチャンネルに設定する。また、ユーザーＵが、移動して、ユーザーＵ´の位置で指示音声を発声すると、第１スピーカーＳＰ１をＲチャンネルに設定し、第２スピーカーＳＰ２をＬチャンネルに設定する。このように、ユーザーＵは、自分が聴取したい位置で指示音声を発声するだけでよいため、チャンネル設定操作に不得手であっても、容易且つ適切にチャンネル設定操作を行うことができる。なお、ユーザーＵによる指示音声の発声は、「テスト音の発音」の一例である。

次に、図４ないし図９を参照し、基準位置方向特定部４２、スピーカー方向特定部４３、スピーカー位置特定部４４およびチャンネル設定部４５の詳細について説明する。まず、図４ないし図７に基づいて、基準位置方向特定部４２により、第１スピーカーＳＰ１からのユーザーＵの方向を特定する方法を説明する。なお、第２スピーカーＳＰ２からのユーザーＵの方向も、同じ方法で特定可能である。

図４は、第１スピーカーＳＰ１に設けられた第１マイクＭ１１、第２マイクＭ１２および第３マイクＭ１３と、ユーザーＵと、の位置関係を示す図である。第１スピーカーＳＰ１における第１マイクＭ１１、第２マイクＭ１２および第３マイクＭ１３の配置は、上から見た図、すなわち平面図として表している。なお、第１マイクＭ１１、第２マイクＭ１２および第３マイクＭ１３は、第１スピーカーＳＰ１の上面に配置されてもよいし、側面に配置されてもよいし、底面に配置されてもよい。

図４は、ユーザーＵが発声した指示音声が、第１マイクＭ１１、第２マイクＭ１２および第３マイクＭ１３に対し、それぞれＴｉｍｅ１１、Ｔｉｍｅ１２およびＴｉｍｅ１３の到達時間で到達することを示している。

一方、第１スピーカーＳＰ１には、上から見たときに、周方向における基準方向、すなわち０°の方向が定められており、本実施形態において、第１マイクＭ１１は、９０°の位置、第２マイクＭ１２は、３３０°の位置、第３マイクＭ１３は、２１０°の位置に配置されている。このように、第１マイク群Ｍ１０に含まれる３つのマイクは、第１スピーカーＳＰ１に対し、１２０°（３６０°／マイク数「３」）ずつ位置ずれして設けられている。また、第１マイクＭ１１、第２マイクＭ１２および第３マイクＭ１３は、第１スピーカーＳＰ１を上から見た状態において、正三角形の頂点に位置するように、等間隔で配置されている。

図５は、ユーザーＵが発声した指示音声の音声波形と、第１マイクＭ１１、第２マイクＭ１２および第３マイクＭ１３の収音音声の音声波形と、を時間軸上で示す図である。第１マイクＭ１１、第２マイクＭ１２および第３マイクＭ１３と、ユーザーＵと、の位置関係が、図４に示した位置関係の場合、指示音声が、第１マイクＭ１１、第２マイクＭ１２および第３マイクＭ１３に到達する到達時間は、Ｔｉｍｅ１２＞Ｔｉｍｅ１１＞Ｔｉｍｅ１３となる。なお、Ｔｉｍｅ１１、Ｔｉｍｅ１２およびＴｉｍｅ１３は、ユーザーＵによる指示音声の発音タイミングを特定できないため、正確な値ではないが、ここでは便宜上、第１マイクＭ１１、第２マイクＭ１２および第３マイクＭ１３のうち、最初に指示音声を収音したタイミングよりも前の任意の時点を、指示音声の発音タイミングとして、図示および説明する。

図４および図５に示すように、Ｔｉｍｅ１２＞Ｔｉｍｅ１１の場合、ユーザーＵは、第１スピーカーＳＰ１に対して、３０°ないし２１０°の方向に位置することになる。また、Ｔｉｍｅ１１＞Ｔｉｍｅ１３の場合、ユーザーＵは、第１スピーカーＳＰ１に対して、１５０°ないし３３０°の方向に位置することになる。したがって、Ｔｉｍｅ１２＞Ｔｉｍｅ１１＞Ｔｉｍｅ１３の場合、ユーザーＵは、第１スピーカーＳＰ１に対して、１５０°ないし２１０°の方向に位置することになる。

次に、第１マイクＭ１１、第２マイクＭ１２および第３マイクＭ１３のうち、いずれか２つのマイクへの到達時間の時間差Δｔ〔ｓ〕を用いて、第１スピーカーＳＰ１からのユーザーＵの方向を、より正確に特定していく。本実施形態では、Ｔｉｍｅ１２＞Ｔｉｍｅ１１＞Ｔｉｍｅ１３であるため、ユーザーＵから遠い位置にある第１マイクＭ１１への到達時間Ｔｉｍｅ１１と、第２マイクＭ１２への到達時間Ｔｉｍｅ１２と、の時間差Δｔ〔ｓ〕を用いて、第１スピーカーＳＰ１からのユーザーＵの方向を正確に特定する。ここで、指示音声の第１マイクＭ１１と第２マイクＭ１２への到達時間の時間差Δｔ〔ｓ〕は、第１マイクＭ１１と第２マイクＭ１２の収音時刻の時間差に相当する。なお、図５では、時間差Δｔ〔ｓ〕の計測基準を、音声波形の始点としているが、音声波形の終点とするなど、測定基準は任意である。

図６は、第１マイクＭ１１および第２マイクＭ１２と、ユーザーＵと、の位置関係を示す図である。上記のとおり、第１マイクＭ１１は、９０°の位置、第２マイクＭ１２は、３３０°の位置に配置され、第３マイクＭ１３は、２１０°の位置に配置され、且つ、第１マイクＭ１１、第２マイクＭ１２および第３マイクＭ１３は、等間隔となるように配置されているため、第１マイクＭ１１と第２マイクＭ１２を結ぶ直線は、第１スピーカーＳＰ１に対して、１２０°の角度となる。また、同図に示すように、第１マイクＭ１１からのユーザーＵの方向をθ１１、第２マイクＭ１２からのユーザーＵの方向をθ１２とする。

図７は、図６における、第１マイクＭ１１および第２マイクＭ１２と、ユーザーＵと、の位置関係をｘｙ座標上で示す図である。ここで、ユーザーＵが、第１マイクＭ１１と第２マイクＭ１２との間の距離に対して十分離れている場合、θ１１≒θ１２とみなすことができる。そのため、θ１２を求めることで、第１スピーカーＳＰ１からのユーザーＵの方向を特定することができる。なお、図７においてｘ軸は０°を示しているが、図６に示したとおり、実際は、第１スピーカーＳＰ１の基準方向に対して１２０°に相当するため、θ１２は、最終的に、１２０°を加味して算出される。つまり、サーバー３は、第１スピーカーＳＰ１における第１マイク群Ｍ１０の配置、および第２スピーカーＳＰ２における第２マイク群Ｍ２０の配置を、音場制御プログラム３３ａの一部として記憶している。

図７に示すように、第１マイクＭ１１と第２マイクＭ１２との間の距離をＭ〔ｍ〕とする。また、ユーザーＵと第１マイクＭ１１との間の距離と、ユーザーＵと第２マイクＭ１２との間の距離と、の差をΔｄ〔ｍ〕とする。このとき、式（１）の関係が成り立つ。

ここで、Δｄは、音速を、Ｃ〔ｍ／ｓ〕とし、第１マイクＭ１１と第２マイクＭ１２の収音時刻の時間差を、Δｔ〔ｓ〕とすると、式（２）の関係が成り立つ。

また、式（１）と、式（２）より、式（３）が成り立つ。

また、式（３）より、第１スピーカーＳＰ１からのユーザーＵの方向を示すθ１２は、式（４）により求められる。

ここで、音速Ｃ〔ｍ／ｓ〕と、マイク間距離Ｍ〔ｍ〕とは、サーバー３にとって既知の値であるため、Δｔ〔ｓ〕を求めることで、θ１２が求められる。

なお、スピーカー方向特定部４３による第１スピーカーＳＰ１と第２スピーカーＳＰ２との相互の方向についても、基準位置方向特定部４２と同様の方法で特定可能である。例えば、第２スピーカーＳＰ２からの第１スピーカーＳＰ１の方向を特定する場合は、第１スピーカーＳＰ１から発音したテスト音を、第２スピーカーＳＰ２に設けられた第２マイク群Ｍ２０に含まれる個々のマイクの収音時刻の時間差を用いればよい。また、第１スピーカーＳＰ１からの第２スピーカーＳＰ２の方向を特定する場合は、第２スピーカーＳＰ２から発音されたテスト音を、第１スピーカーＳＰ１に設けられた第１マイク群Ｍ１０に含まれる個々のマイクの収音時刻の時間差を用いればよい。

続いて、図８および図９に基づいて、スピーカー位置特定部４４により、左スピーカーおよび右スピーカーを特定し、チャンネル設定部４５により、第１スピーカーＳＰ１および第２スピーカーＳＰ２のチェンネルを設定する方法を説明する。

図８は、第１スピーカーＳＰ１と、第２スピーカーＳＰ２と、ユーザーＵと、の位置関係を示す図である。同図に示すように、第１スピーカーＳＰ１からのユーザーＵの方向を、∠Ａ１_Ｕ、第１スピーカーＳＰ１からの第２スピーカーＳＰ２の方向を、∠Ａ１_Ａ２とする。同様に、第２スピーカーＳＰ２からのユーザーＵの方向を、∠Ａ２_Ｕ、第２スピーカーＳＰ２からの第１スピーカーＳＰ１の方向を、∠Ａ２_Ａ１とする。

このとき、第１スピーカーＳＰ１からのユーザーＵの方向と、第１スピーカーＳＰ１からの第２スピーカーＳＰ２の方向と、の差である∠ＵＡ１Ａ２は、式（５）により求められる。

同様に、第２スピーカーＳＰ２からのユーザーＵの方向と、第２スピーカーＳＰ２からの第１スピーカーＳＰ１の方向と、の差である∠Ａ１Ａ２Ｕは、式（６）により求められる。

また、ユーザーＵからの第１スピーカーＳＰ１の方向と、ユーザーＵからの第２スピーカーＳＰ２の方向と、の差である∠Ａ１ＵＡ２は、三角形の内角の和が１８０°であることから、式（７）により求められる。

式（５）、式（６）および式（７）より、式（８）が成り立つ。

ここで、基準位置方向特定部４２により、∠Ａ１_Ｕおよび∠Ａ２_Ｕが特定され、スピーカー方向特定部４３により、∠Ａ１_Ａ２および∠Ａ２_Ａ１が特定されているため、∠Ａ１ＵＡ２が求められる。

スピーカー位置特定部４４は、以上の方法により求められた∠Ａ１ＵＡ２が、１８０°未満であるか否かに基づいて、左スピーカーと右スピーカーを特定する。より具体的には、図９に示すように、スピーカー位置特定部４４は、∠Ａ１ＵＡ２が１８０°未満の場合、第１スピーカーＳＰ１を左スピーカーに特定し、第２スピーカーＳＰ２を右スピーカーに特定する。また、スピーカー位置特定部４４は、∠Ａ１ＵＡ２が１８０°以上の場合、第１スピーカーＳＰ１を右スピーカーに特定し、第２スピーカーＳＰ２を左スピーカーに特定する。これに伴い、チャンネル設定部４５は、∠Ａ１ＵＡ２が１８０°未満の場合、第１スピーカーＳＰ１をＬチャンネルに設定し、第２スピーカーＳＰ２をＲチャンネルに設定する。また、チャンネル設定部４５は、∠Ａ１ＵＡ２が１８０°以上の場合、第１スピーカーＳＰ１をＲチャンネルに設定し、第２スピーカーＳＰ２をＬチャンネルに設定する。

次に、図１０のフローチャートを参照し、サーバー３によるチャンネル設定処理の流れを説明する。図１０のフローチャートは、音場制御プログラム３３ａが起動された状態において、繰り返し実行されるものとする。また、フローチャートにおいて、第１スピーカーＳＰ１を「ＳＰ１」、第２スピーカーＳＰ２を「ＳＰ２」と表記する。

サーバー３は、第１スピーカーＳＰ１または第２スピーカーＳＰ２により収音された収音音声に基づいて、チャンネル設定処理の開始を指示する指示音声を取得したか否かを判別する（Ｓ０１）。サーバー３は、指示音声を取得したと判定した場合（Ｓ０１：Ｙｅｓ）、Ｓ０２に進み、指示音声を取得していないと判定した場合（Ｓ０１：Ｎｏ）、Ｓ０１を繰り返す。Ｓ０１は、音声認識部４１による処理工程である。

サーバー３は、取得した指示音声に基づいて、第１スピーカーＳＰ１からのユーザーＵの方向と、第２スピーカーＳＰ２からのユーザーＵの方向と、を特定する（Ｓ０２）。すなわち、Ｓ０２では、∠Ａ１_Ｕおよび∠Ａ２_Ｕを特定する（図８参照）。Ｓ０２は、基準位置方向特定部４２による処理工程である。

サーバー３は、第１スピーカーＳＰ１および第２スピーカーＳＰ２に対し、テスト音の発音指示を行う（Ｓ０３）。なお、第１スピーカーＳＰ１と第２スピーカーＳＰ２に対するテスト音の発音指示は、同時ではなく、時間をずらして行うことが好ましい。サーバー３は、第１スピーカーＳＰ１から発音されたテスト音を第２マイク群Ｍ２０で収音した収音結果に基づいて、第２スピーカーＳＰ２からの第１スピーカーＳＰ１の方向を特定し、第２スピーカーＳＰ２から発音されたテスト音を第１マイク群Ｍ１０で収音した収音結果に基づいて、第１スピーカーＳＰ１からの第２スピーカーＳＰ２の方向を特定する（Ｓ０４）。すなわち、Ｓ０４では、∠Ａ２_Ａ１および∠Ａ１_Ａ２を特定する（図８参照）。Ｓ０３およびＳ０４は、スピーカー方向特定部４３による処理工程である。

サーバー３は、Ｓ０２で特定した∠Ａ１_Ｕおよび∠Ａ２_Ｕと、Ｓ０４で特定した∠Ａ２_Ａ１および∠Ａ１_Ａ２と、に基づいて、∠Ａ１ＵＡ２を求める（Ｓ０５，図８参照）。また、サーバー３は、求めた∠Ａ１ＵＡ２が、１８０°未満であるか否かを判別し（Ｓ０６）、１８０°未満であると判定した場合（Ｓ０６：Ｙｅｓ）、第１スピーカーＳＰ１を左スピーカー、第２スピーカーＳＰ２を右スピーカーとして特定する（Ｓ０７）。また、サーバー３は、第１スピーカーＳＰ１をＬチャンネル、第２スピーカーＳＰ２をＲチャンネルに設定する（Ｓ０８）。

一方、サーバー３は、求めた∠Ａ１ＵＡ２が、１８０°未満ではないと判定した場合（Ｓ０６：Ｎｏ）、第１スピーカーＳＰ１を右スピーカー、第２スピーカーＳＰ２を左スピーカーとして特定する（Ｓ０９）。また、サーバー３は、第１スピーカーＳＰ１をＲチャンネル、第２スピーカーＳＰ２をＬチャンネルに設定する（Ｓ１０）。Ｓ０５ないしＳ０７およびＳ０９は、スピーカー位置特定部４４による処理工程である。また、Ｓ０８およびＳ１０は、チャンネル設定部４５による処理工程である。

サーバー３は、指示音声の収音結果から、第１スピーカーＳＰ１と第２スピーカーＳＰ２の収音レベルが等しいか否か、すなわち、第１マイク群Ｍ１０と第２マイク群Ｍ２０の収音レベルが等しいか否かを判別する（Ｓ１１）。サーバー３は、第１スピーカーＳＰ１と第２スピーカーＳＰ２の収音レベルが等しいと判定した場合（Ｓ１１：Ｙｅｓ）、チャンネル設定処理を終了する。

また、サーバー３は、第１スピーカーＳＰ１と第２スピーカーＳＰ２の収音レベルが等しくないと判定した場合（Ｓ１１：Ｎｏ）、第１スピーカーＳＰ１から発音された音と、第２スピーカーＳＰ２から発音された音と、がユーザーＵの位置で同じ音量となるように、第１スピーカーＳＰ１と第２スピーカーＳＰ２の出力レベルを設定する（Ｓ１２）。例えば、第１スピーカーＳＰ１の収音レベルが第２スピーカーＳＰ２の収音レベルより大きい場合、第１スピーカーＳＰ１が第２スピーカーＳＰ２よりユーザーＵの位置に近いため、収音レベルの差に応じて、第２スピーカーＳＰ２の音量を、第１スピーカーＳＰ１の音量より大きくすることが考えられる。サーバー３は、第１スピーカーＳＰ１と第２スピーカーＳＰ２の出力レベルを設定した後（Ｓ１２）、チャンネル設定処理を終了する。Ｓ１１およびＳ１２は、出力レベル設定部４６による処理工程である。

以上説明したとおり、本実施形態に係るサーバー３は、ユーザーＵの位置から発音されたテスト音に基づいて、第１スピーカーＳＰ１からのユーザーＵの方向と、第２スピーカーＳＰ２からのユーザーＵの方向と、を特定し、第１スピーカーＳＰ１および第２スピーカーＳＰ２からそれぞれ発音されたテスト音に基づいて、第１スピーカーＳＰ１および第２スピーカーＳＰ２のスピーカー同士の方向を特定する。また、サーバー３は、これらの特定結果に基づいて、第１スピーカーＳＰ１および第２スピーカーＳＰ２のうち、ユーザーＵに対して左に配置された左スピーカーおよびユーザーＵに対して右に配置された右スピーカーを特定する。この構成によれば、左スピーカーおよび右スピーカーを正確に特定することができる。

また、サーバー３は、左スピーカーおよび右スピーカーの特定結果に基づいて、第１スピーカーＳＰ１および第２スピーカーＳＰ２のチャンネルを設定するため、ユーザーＵは、チャンネル設定の手間を省くことができる。

また、サーバー３は、第１マイク群Ｍ１０または第２マイク群Ｍ２０で収音した音声に基づいて、指示音声を取得したと判定した場合、取得した指示音声に基づいてユーザーＵの方向を特定するため、基準位置方向特定部４２によりユーザーＵの方向を特定するためのテスト音を、指示音声とは別に発音させる必要がない。

また、サーバー３は、基準位置方向特定部４２の処理において、例えば、第１スピーカーＳＰ１からのユーザーＵの方向を特定する際、第１マイク群Ｍ１０の収音結果から得られるマイクごとの収音時刻と、第１マイク群Ｍ１０に含まれる個々のマイクの第１スピーカーＳＰ１における配置と、を考慮するため、より正確にユーザーＵの方向を特定することができる。スピーカー方向特定部４３の処理においても同様である。

また、サーバー３は、ユーザーＵから発音されたテスト音を、第１マイク群Ｍ１０および第２マイク群Ｍ２０で収音した収音結果に基づいて、第１スピーカーＳＰ１および第２スピーカーＳＰ２の出力レベルを設定するため、ユーザーＵは、スピーカーの出力レベルを調整する手間を省くことができる。

なお、上記の実施形態によらず、以下の変形例を採用可能である。
［変形例１−１］
サーバー制御部３１から、チャンネル設定部４５の機能を省略してもよい。この場合、サーバー３は、第１スピーカーＳＰ１または第２スピーカーＳＰ２に対し、スピーカー位置特定部４４の特定結果を、音声出力させてもよい。また、ユーザーＵは、第１スピーカーＳＰ１または第２スピーカーＳＰ２から出力された音声にしたがって、チャンネル設定を手動で行えばよい。また、サーバー３は、第１スピーカーＳＰ１または第２スピーカーＳＰ２に音声出力させるのではなく、ユーザーＵのスマートフォンや、音場１００に配置されたディスプレー等に、スピーカー位置特定部４４の特定結果を表示させ、ユーザーＵにチャンネル設定を促してもよい。

［変形例１−２］
上記の第１実施形態では、第１スピーカーＳＰ１または第２スピーカーＳＰ２の２つのスピーカーを含む音場制御システムＳＹ１を例示したが、３つ以上のスピーカーを含む音場制御システムＳＹ１にも、上記の第１実施形態を適用可能である。例えば、スピーカーＡ、スピーカーＢおよびスピーカーＣの３つのスピーカーを、左スピーカー、右スピーカー、センタースピーカーとして特定する場合、基準位置方向特定部４２は、３つのスピーカーのそれぞれからのユーザーＵの方向を特定する。また、スピーカー方向特定部４３は、スピーカーＡから発音されたテスト音を、スピーカーＢおよびスピーカーＣで収音した収音結果に基づいて、スピーカーＢからのスピーカーＡの方向と、スピーカーＣからのスピーカーＡの方向と、を特定する。また、スピーカー方向特定部４３は、スピーカーＢから発音されたテスト音を、スピーカーＡおよびスピーカーＣで収音した収音結果に基づいて、スピーカーＡからのスピーカーＢの方向と、スピーカーＣからのスピーカーＢの方向と、を特定する。また、スピーカー方向特定部４３は、スピーカーＣから発音されたテスト音を、スピーカーＡおよびスピーカーＢで収音した収音結果に基づいて、スピーカーＡからのスピーカーＣの方向と、スピーカーＢからのスピーカーＣの方向と、を特定する。また、スピーカー位置特定部４４は、基準位置方向特定部４２の特定結果と、スピーカー方向特定部４３の特定結果と、に基づいて、スピーカーＡ、スピーカーＢおよびスピーカーＣのうち、左スピーカー、右スピーカー、センタースピーカーをそれぞれ特定する。より具体的には、スピーカー位置特定部４４は、スピーカーＡとスピーカーＢの左右位置を特定し、スピーカーＢとスピーカーＣの左右位置を特定し、さらに必要であれば、スピーカーＡとスピーカーＣの左右位置を特定し、最終的に、３つのスピーカーの位置を特定する。その他、５．１チャンネル対応の６つのスピーカーのスピーカー位置を特定する場合などにも、上記の第１実施形態を適用可能である。

［変形例１−３］
上記の第１実施形態において、第１マイク群Ｍ１０および第２マイク群Ｍ２０は、いずれも３個のマイクを含むものとしたが、４個以上のマイクを含む構成でもよい。この場合、例えば第１スピーカーＳＰ１の場合、４個以上のマイクのうち、いずれか３個のマイクを、第１マイクＭ１１、第２マイクＭ１２および第３マイクＭ１３として用いてもよい。若しくは、４個以上のマイクの全てのマイクでユーザーＵから発音されたテスト音を収音し、ユーザーＵから最も遠くに位置する３個のマイクを、第１マイクＭ１１、第２マイクＭ１２および第３マイクＭ１３として用いてもよい。

［変形例１−４］
第１スピーカーＳＰ１と第２スピーカーＳＰ２は、同じ構成でなくてもよい。例えば、第１スピーカーＳＰ１と第２スピーカーＳＰ２に搭載されるマイクの数、およびマイクの配置が異なっていてもよい。

［変形例１−５］
上記の実施形態では、第１スピーカーＳＰ１とサーバー３、および第２スピーカーＳＰ２とサーバー３が、インターネット通信網ＮＷを介して接続される例を示したが、インターネット通信網ＮＷ以外のネットワークを介して接続されてもよい。つまり、サーバー３は、クラウドサーバーでなくてもよい。また、サーバー３に代えて、パーソナルコンピューター、タブレット端末、スマートフォンなどの情報処理端末を用いてもよい。この場合、各スピーカーと、情報処理端末とは、ネットワークではなく、ケーブルやブルートゥース（登録商標）回線などの通信線を介して接続されてもよい。

［変形例１−６］
上記の第１実施形態において、基準位置方向特定部４２は、ユーザーＵが発音した指示音声を用いて、ユーザーＵの方向を特定したが、必ずしもユーザーＵの指示音声を用いなくてもよい。例えば、ユーザーＵが所持するスマートフォンからテスト音を発音してもよい。この場合、スマートフォンは、ユーザーＵの操作に基づいて、第１スピーカーＳＰ１および第２スピーカーＳＰ２に対し、チャンネル設定処理の開始を指示するコマンドを送信し、その後、テスト音を発音する。このように、テスト音の発音前に、第１スピーカーＳＰ１および第２スピーカーＳＰ２に対してコマンドを送信することにより、テスト音の誤認識を防止することができる。

［変形例１−７］
上記の第１実施形態では、基準位置方向特定部４２の処理の後に、スピーカー方向特定部４３の処理を行ったが、処理の順序は逆でもよい。

［変形例１−８］
上記の第１実施形態では、ユーザーＵが発音した指示音声の取得をトリガーとして、基準位置方向特定部４２、スピーカー方向特定部４３、スピーカー位置特定部４４、チャンネル設定部４５および出力レベル設定部４６の処理を順次行ったが、必ずしも各処理を連続して行わなくてもよい。例えば、以下のように各処理を行ってもよい。サーバー３は、定期的にスピーカー方向特定部４３の処理を行い、第１スピーカーＳＰ１および第２スピーカーＳＰ２の方向を特定した特定結果を記憶しておく。サーバー３は、第１スピーカーＳＰ１または第２スピーカーＳＰ２による指示音声の取得をトリガーとして、基準位置方向特定部４２の処理を行い、ユーザーＵ方向の特定結果と、記憶しておいたスピーカーの方向と、を用いて、スピーカー位置特定部４４の処理を行い、さらに続けて、チャンネル設定部４５および出力レベル設定部４６の処理を行う。

［変形例１−９］
上記の実施形態において、サーバー３は、第１マイク群Ｍ１０で収音した収音結果として、第１スピーカーＳＰ１から、第１マイク群Ｍ１０に含まれる個々のマイクの収音音声を取得したが、第１スピーカーＳＰ１および第２スピーカーＳＰ２において音声認識が可能である場合、第１スピーカーＳＰ１および第２スピーカーＳＰ２から、個々のマイクの収音時刻を取得してもよい。例えば、第１スピーカーＳＰ１において、チャンネル設定処理の開始を指示する指示音声を取得したと判定した場合、第１マイク群Ｍ１０に含まれる個々のマイクによる指示音声の収音時刻（例えば、第１マイクＭ１１、第２マイクＭ１２、第３マイクＭ１３の順に、「００時００分００秒００」、「００時００分００秒０１」、「００時００分００秒０２」など）をサーバー３に送信する。同様に、第２スピーカーＳＰ２において、チャンネル設定処理の開始を指示する指示音声を取得したと判定した場合、第２マイク群Ｍ２０に含まれる個々のマイクによる指示音声の収音時刻（例えば、第１マイクＭ２１、第２マイクＭ２２、第３マイクＭ２３の順に、「００時００分００秒０２」、「００時００分００秒０３」、「００時００分００秒０４」など）をサーバー３に送信する。サーバー３は、第１スピーカーＳＰ１および第２スピーカーＳＰ２から取得した個々のマイクの収音時刻に基づいて、チャンネル設定処理（図１０参照）のＳ０２以降の処理を行う。
なお、第１スピーカーＳＰ１および第２スピーカーＳＰ２は、サーバー３に対し、個々のマイクの収音時刻を送信するのではなく、個々のマイクの収音時刻の時間差を送信してもよい。例えば、第１スピーカーＳＰ１の場合、第１マイクＭ２１と第２マイクＭ２２の時間差、第２マイクＭ２２と第３マイクＭ２３の時間差、第３マイクＭ２３と第１マイクＭ２１の時間差の順に、「１／１００秒」、「１／１００秒」、「−２／１００秒」を、サーバー３に送信してもよい。

［第２実施形態］
次に、図１１を参照し、本発明の第２実施形態について説明する。上記の第１実施形態では、サーバー３においてチャンネル設定処理を行ったが、本実施形態では、第１スピーカーＳＰ１´または第２スピーカーＳＰ２´においてチャンネル設定処理を行う。したがって、本実施形態において、サーバー３は不要である。以下、第１実施形態と異なる点のみ説明する。なお、本実施形態において、第１実施形態と同様の構成部分については同様の符号を付し、詳細な説明を省略する。また、第１実施形態と同様の構成部分について適用される変形例は、本実施形態についても同様に適用される。

図１１は、第２実施形態に係る音場制御システムＳＹ２のブロック図である。音場制御システムＳＹ２は、第１スピーカーＳＰ１´と、第２スピーカーＳＰ２´と、を備えている。第２スピーカーＳＰ２´については、第１スピーカーＳＰ１´と同様の制御構成であるため、説明を省略する。

第１スピーカーＳＰ１´は、第１実施形態に係る第１スピーカーＳＰ１（図２参照）と、スピーカー制御部１１´およびスピーカー通信部１２´の構成が異なる。また、第１スピーカーＳＰ１´は、スピーカー記憶部１４を備えている。スピーカー記憶部１４は、音場制御プログラム３３ａを記憶している。第２実施形態に係るスピーカー制御部１１´は、第１実施形態に係るサーバー制御部３１（図３参照）と同様に、音場制御プログラム３３ａを実行することにより、音声認識部４１、基準位置方向特定部４２、スピーカー方向特定部４３、スピーカー位置特定部４４、チャンネル設定部４５および出力レベル設定部４６として機能する。また、第２実施形態に係る第１スピーカーＳＰ１´のスピーカー通信部１２´は、第２スピーカーＳＰ２´のスピーカー通信部１２´（図示省略）と、無線ＬＡＮ等の通信網ＮＷ´を介して通信する。

第２実施形態では、第１スピーカーＳＰ１´および第２スピーカーＳＰ２´のうち、いずれか一方のスピーカーが、図１０に示したチェンネル設定処理のＳ０５以降の処理を実行するマスタースピーカーとして動作し、他方のスピーカーがスレーブスピーカーとして動作する。本実施形態では、第１スピーカーＳＰ１´および第２スピーカーＳＰ２´のうち、後述するチャンネル設定処理（図１２参照）において、テスト音の発音指示（Ｓ２７）を先に行った方のスピーカーが、マスタースピーカーとして動作することになる。したがって、一般的には、第１スピーカーＳＰ１´および第２スピーカーＳＰ２´のうち、ユーザーＵから近い方のスピーカーがマスタースピーカーとなる。

マスタースピーカーは、音声認識部４１、基準位置方向特定部４２、スピーカー方向特定部４３、スピーカー位置特定部４４、チャンネル設定部４５および出力レベル設定部４６として機能する。これに対し、スレーブスピーカーは、音声認識部４１、基準位置方向特定部４２およびスピーカー方向特定部４３としてのみ機能する。

図１２は、第２実施形態に係るチャンネル設定処理の流れの一部を示すフローチャートである。図１２のフローチャートは、音場制御プログラム３３ａが起動された状態において、繰り返し実行されるものとする。ここでは、第１スピーカーＳＰ１´がマスタースピーカーとなり、第２スピーカーＳＰ２´がスレーブスピーカーとなる場合を説明する。まず、第２スピーカーＳＰ２´を主体として説明する。第２スピーカーＳＰ２´は、第２マイク群Ｍ２０により収音した収音音声に基づいて、チャンネル設定処理の開始を指示する指示音声を取得したか否かを判別する（Ｓ２１）。第２スピーカーＳＰ２´は、指示音声を取得したと判定した場合（Ｓ２１：Ｙｅｓ）、Ｓ２２に進み、指示音声を取得していないと判定した場合（Ｓ２１：Ｎｏ）、Ｓ２１を繰り返す。Ｓ２１は、音声認識部４１による処理工程である。

第２スピーカーＳＰ２´は、収音した指示音声に基づいて、第２スピーカーＳＰ２からのユーザーＵの方向を特定する（Ｓ２２）。すなわち、Ｓ２２では、∠Ａ２_Ｕを特定する（図８参照）。Ｓ２２は、基準位置方向特定部４２による処理工程である。

第２スピーカーＳＰ２´は、他のスピーカー、すなわち第１スピーカーＳＰ１´からテスト音の発音指示を受信したか否かを判別する（Ｓ２３）。第２スピーカーＳＰ２´は、テスト音の発音指示を受信したと判定した場合（Ｓ２３：Ｙｅｓ）、テスト音を発音する（Ｓ２４）。なお、第２スピーカーＳＰ２´は、テスト音の発音指示を受信したと判定した場合（Ｓ２３：Ｙｅｓ）、スレーブスピーカーとして動作する。

その後、第２スピーカーＳＰ２´は、マスタースピーカーすなわち第１スピーカーＳＰ１´から発音されたテスト音の収音に伴い、第２スピーカーＳＰ２´からのマスタースピーカーの方向を特定する（Ｓ２５）。すなわち、Ｓ２５では、∠Ａ２_Ａ１を特定する（図８参照）。Ｓ２３ないしＳ２５は、スピーカー方向特定部４３による処理工程である。その後、第２スピーカーＳＰ２´は、角度情報およびレベル情報をマスタースピーカーに送信する（Ｓ２６）。ここで、角度情報とは、Ｓ２２およびＳ２５で特定した∠Ａ２_Ｕおよび∠Ａ２_Ａ１を指す。また、レベル情報とは、Ｓ２１で収音した指示音声の収音レベルを指す。

次に、第１スピーカーＳＰ１´を主体として説明する。第１スピーカーＳＰ１´は、第１マイク群Ｍ１０により収音した収音音声に基づいて、チャンネル設定処理の開始を指示する指示音声を取得したか否かを判別する（Ｓ２１）。第１スピーカーＳＰ１´は、指示音声を取得したと判定した場合（Ｓ２１：Ｙｅｓ）、Ｓ２２に進み、指示音声を取得していないと判定した場合（Ｓ２１：Ｎｏ）、Ｓ２１を繰り返す。

第１スピーカーＳＰ１´は、収音した指示音声に基づいて、第１スピーカーＳＰ１からのユーザーＵの方向を特定する（Ｓ２２）。すなわち、Ｓ２２では、∠Ａ１_Ｕを特定する（図８参照）。

第１スピーカーＳＰ１´は、他のスピーカー、すなわち第２スピーカーＳＰ２´からテスト音の発音指示を受信したか否かを判別する（Ｓ２３）。第１スピーカーＳＰ１´は、テスト音の発音指示を受信していないと判定した場合（Ｓ２３：Ｎｏ）、スレーブスピーカーに対し、テスト音の発音指示を行う（Ｓ２７）。なお、第１スピーカーＳＰ１´は、テスト音の発音指示を受信していないと判定した場合（Ｓ２３：Ｎｏ）、マスタースピーカーとして動作する。

第１スピーカーＳＰ１´は、スレーブスピーカーすなわち第２スピーカーＳＰ２´から発音されたテスト音の収音に伴い、第１スピーカーＳＰ１´からのスレーブスピーカーの方向を特定する（Ｓ２８）。すなわち、Ｓ２８では、∠Ａ１_Ａ２を特定する（図８参照）。その後、第１スピーカーＳＰ１´は、テスト音を発音し（Ｓ２９）、スレーブスピーカーから角度情報およびレベル情報を受信する（Ｓ３０）。Ｓ２７ないしＳ２９は、スピーカー方向特定部４３による処理工程である。また、Ｓ３０は、スピーカー位置特定部４４による処理工程の一部である。第１スピーカーＳＰ１´は、Ｓ３０の後、図１０に示したフローチャートのＳ０５以降の処理を行う。

以上説明したとおり、第２実施形態係る音場制御システムＳＹ２は、第１スピーカーＳＰ１´および第２スピーカーＳＰ２´だけの簡易なシステム構成で、第１実施形態と同等の効果を奏することができる。

第２実施形態では、以下の変形例を採用可能である。
［変形例２−１］
上記の第２実施形態では、第１スピーカーＳＰ１´および第２スピーカーＳＰ２´のうち、テスト音の発音指示（図１２のＳ２７）を先に行った方のスピーカーが、マスタースピーカーとして動作するものとしたが、指示音声を取得したと判定した時点（Ｓ２１：Ｙｅｓ）で、他のスピーカーに対し、スレーブスピーカーとして動作するように指令を行ってもよい。この場合、指令を行った方がマスタースピーカーとして動作し、指令を受けた方がスレーブスピーカーとして動作することになる。また、スレーブスピーカーは、スレーブスピーカーとして動作する指令を受けた後、ユーザーＵの方向とマスタースピーカーの方向を特定し、角度情報およびレベル情報をマスタースピーカーに送信する。

［変形例２−２］
また、第１スピーカーＳＰ１´および第２スピーカーＳＰ２´のうち、マスタースピーカーとして動作するスピーカーと、スレーブスピーカーとして動作するスピーカーを予め決めておいてもよい。この場合、図１２のフローチャートにおいて、マスタースピーカーは、テスト音の発音指示を受信したか否かの判別工程（Ｓ２３）を省略できる。

以上、２つの実施形態および各種変形例を示したが、これらに示した音場制御システムＳＹ１，ＳＹ２における第１スピーカーＳＰ１、第２スピーカーＳＰ２およびサーバー３の各構成要素（音場制御プログラム３３ａを含む）をプログラムとして提供してもよい。また、そのプログラムを、ＣＤ−ＲＯＭやフラッシュメモリーなどの各種記録媒体に格納して提供してもよい。すなわち、コンピューターを、第１スピーカーＳＰ１、第２スピーカーＳＰ２およびサーバー３の各構成要素として機能させるためのプログラム、およびそれを記録したコンピューター読取可能な記録媒体も、本発明の権利範囲に含まれる。その他、本発明の要旨を逸脱しない範囲で、適宜変更が可能である。

３…サーバー、１００…音場、Ｍ１０…第１マイク群、Ｍ１１…第１マイク、Ｍ１２…第２マイク、Ｍ１３…第３マイク、Ｍ２０…第２マイク群、Ｍ２１…第１マイク、Ｍ２２…第２マイク、Ｍ２３…第３マイク、ＮＷ…インターネット通信網、ＳＰ１…第１スピーカー、ＳＰ２…第２スピーカー、ＳＹ１…音場制御システム、Ｕ…ユーザー

Claims

３個以上のマイクである第１マイク群が設けられた第１スピーカーと、３個以上のマイクである第２マイク群が設けられた第２スピーカーと、が配置された音場を制御する音場制御装置であって、
基準位置から発音されたテスト音を、前記第１マイク群で収音した収音結果に基づいて、前記第１スピーカーからの前記基準位置の方向を特定し、前記基準位置から発音されたテスト音を、前記第２マイク群で収音した収音結果に基づいて、前記第２スピーカーからの前記基準位置の方向を特定する基準位置方向特定部と、
前記第１スピーカーから発音されたテスト音を、前記第２マイク群で収音した収音結果に基づいて、前記第２スピーカーからの前記第１スピーカーの方向を特定し、前記第２スピーカーから発音されたテスト音を、前記第１マイク群で収音した収音結果に基づいて、前記第１スピーカーからの前記第２スピーカーの方向を特定するスピーカー方向特定部と、
前記基準位置方向特定部の特定結果と、前記スピーカー方向特定部の特定結果と、に基づいて、前記第１スピーカーおよび前記第２スピーカーのうち、前記基準位置に対して左に配置された左スピーカーおよび前記基準位置に対して右に配置された右スピーカーを特定するスピーカー位置特定部と、を備えることを特徴とする音場制御装置。
前記スピーカー位置特定部の特定結果に基づいて、前記第１スピーカーおよび前記第２スピーカーのチャンネルを設定するチャンネル設定部、を備えることを特徴とする請求項１に記載の音場制御装置。
前記第１マイク群または前記第２マイク群で収音した音声を認識することにより、処理の開始を指示する指示音声を取得したか否かを判定する音声認識部を備え、
前記基準位置方向特定部は、前記音声認識部により、前記指示音声を取得したと判定された場合、前記指示音声を、前記基準位置から発音されたテスト音として、前記基準位置の方向を特定することを特徴とする請求項１または２に記載の音場制御装置。
前記基準位置方向特定部は、前記第１マイク群で収音した収音結果から得られる、前記第１マイク群に含まれる個々の前記マイクの収音時刻の時間差と、前記第１マイク群に含まれる個々の前記マイクの前記第１スピーカーにおける配置と、に基づいて、前記第１スピーカーからの前記基準位置の方向を特定し、前記第２マイク群で収音した収音結果から得られる、前記第２マイク群に含まれる個々の前記マイクの収音時刻の時間差と、前記第２マイク群に含まれる個々の前記マイクの前記第２スピーカーにおける配置と、に基づいて、前記第２スピーカーからの前記基準位置の方向を特定し、
前記スピーカー方向特定部は、前記第２マイク群で収音した収音結果から得られる、前記第２マイク群に含まれる個々の前記マイクの収音時刻の時間差と、前記第２マイク群に含まれる個々の前記マイクの前記第２スピーカーにおける配置と、に基づいて、前記第２スピーカーからの前記第１スピーカーの方向を特定し、前記第１マイク群で収音した収音結果から得られる、前記第１マイク群に含まれる個々の前記マイクの収音時刻の時間差と、前記第１マイク群に含まれる個々の前記マイクの前記第１スピーカーにおける配置と、に基づいて、前記第１スピーカーからの前記第２スピーカーの方向を特定することを特徴とする請求項１ないし３のいずれか１項に記載の音場制御装置。
前記基準位置から発音されたテスト音を、前記第１マイク群で収音した収音結果と、前記基準位置から発音されたテスト音を、前記第２マイク群で収音した収音結果と、に基づいて、前記第１スピーカーおよび前記第２スピーカーの出力レベルを設定する出力レベル設定部、を備えることを特徴とする請求項１ないし４のいずれか１項に記載の音場制御装置。
３個以上のマイクである第１マイク群が設けられた第１スピーカーと、
３個以上のマイクである第２マイク群が設けられた第２スピーカーと、
前記第１スピーカーおよび前記第２スピーカーが配置された音場を制御する音場制御装置と、を含む音場制御システムであって、
基準位置から発音されたテスト音を、前記第１マイク群で収音した収音結果に基づいて、前記第１スピーカーからの前記基準位置の方向を特定し、前記基準位置から発音されたテスト音を、前記第２マイク群で収音した収音結果に基づいて、前記第２スピーカーからの前記基準位置の方向を特定する基準位置方向特定部と、
前記第１スピーカーから発音されたテスト音を、前記第２マイク群で収音した収音結果に基づいて、前記第２スピーカーからの前記第１スピーカーの方向を特定し、前記第２スピーカーから発音されたテスト音を、前記第１マイク群で収音した収音結果に基づいて、前記第１スピーカーからの前記第２スピーカーの方向を特定するスピーカー方向特定部と、
前記基準位置方向特定部の特定結果と、前記スピーカー方向特定部の特定結果と、に基づいて、前記第１スピーカーおよび前記第２スピーカーのうち、前記基準位置に対して左に配置された左スピーカーおよび前記基準位置に対して右に配置された右スピーカーを特定するスピーカー位置特定部と、を備えることを特徴とする音場制御システム。
前記音場制御装置は、前記第１スピーカーまたは前記第２スピーカーに設けられることを特徴とする請求項６に記載の音場制御システム。
３個以上のマイクである第１マイク群が設けられた第１スピーカーと、３個以上のマイクである第２マイク群が設けられた第２スピーカーと、が配置された音場を制御する音場制御装置の制御方法であって、
基準位置から発音されたテスト音を、前記第１マイク群で収音した収音結果に基づいて、前記第１スピーカーからの前記基準位置の方向を特定し、前記基準位置から発音されたテスト音を、前記第２マイク群で収音した収音結果に基づいて、前記第２スピーカーからの前記基準位置の方向を特定するステップと、
前記第１スピーカーから発音されたテスト音を、前記第２マイク群で収音した収音結果に基づいて、前記第２スピーカーからの前記第１スピーカーの方向を特定し、前記第２スピーカーから発音されたテスト音を、前記第１マイク群で収音した収音結果に基づいて、前記第１スピーカーからの前記第２スピーカーの方向を特定するステップと、
特定された前記第１スピーカーからの前記基準位置の方向と、前記第２スピーカーからの前記基準位置の方向と、前記第２スピーカーからの前記第１スピーカーの方向と、前記第１スピーカーからの前記第２スピーカーの方向と、に基づいて、前記第１スピーカーおよび前記第２スピーカーのうち、前記基準位置に対して左に配置された左スピーカーおよび前記基準位置に対して右に配置された右スピーカーを特定するステップと、を実行することを特徴とする音場制御装置の制御方法。
コンピューターに、請求項８に記載の音場制御装置の制御方法における各ステップを実行させるためのプログラム。
請求項９に記載のプログラムを記録したコンピューター読取可能な記録媒体。