JP2022122038A

JP2022122038A - 肩乗せ型スピーカ、音像定位方法及び音像定位プログラム

Info

Publication number: JP2022122038A
Application number: JP2021019091A
Authority: JP
Inventors: 裕介小長井; Yusuke Konagai
Original assignee: Yamaha Corp
Current assignee: Yamaha Corp
Priority date: 2021-02-09
Filing date: 2021-02-09
Publication date: 2022-08-22
Also published as: US11785385B2; US20220256287A1

Abstract

【課題】肩乗せ型スピーカのように頭部の姿勢を検出できない場合であっても、頭部の姿勢に応じて適切な位置に音像定位を行う肩乗せ型スピーカを提供する。【解決手段】肩乗せ型スピーカ（１）は、肩乗せ型スピーカ（１）が乗っている部位の姿勢を検出し、部位の姿勢をデータ化した部位姿勢データを取得する姿勢データ検出部（２５１）と、取得した姿勢データを、頭部姿勢データに補正する姿勢データ補正部（２５２）と、姿勢データ補正部（２５２）で補正した頭部姿勢データに応じた頭部伝達関数を用いて、音信号に音像定位処理を施す音像定位処理部（２５４）と、を備える。【選択図】図４

Description

この発明の一実施形態は、ユーザの肩に乗せて利用するスピーカに関する。

特許文献１のウェアラブルスピーカ装置は、ユーザの肩に乗せて使用されるスピーカである。特許文献１のウェアラブルスピーカ装置は、センサと、センサを用いて検出したユーザの頭部の一部（例えば、耳）、との距離に応じて、例えばスピーカとユーザの耳との間の伝達関数を修正し、頭部の動きによる音色の変化を抑制していた。また、従来、耳元で立体音響をシミュレートする手法として、頭部伝達関数（HRTF: Head-Related Transfer Function）を用いて音像を制御する音響処理装置（例えば、ヘッドフォン）があった（例えば、特許文献２）。特許文献２の音響処理装置は、ヘッドトラッキングを行い、全周囲のＨＲＴＦデータベースから必要とするＨＲＴＦを逐次読み込むことで、音像定位を行っていた。

特開２０１８－０２３１０４号公報国際公開第２０１７／１３５０６３号

特許文献１のウェアラブルスピーカ装置は、頭部の姿勢に関係なく音像がスピーカの位置になってしまう。また、特許文献２の音響処理装置は、頭部の姿勢を検出するセンサが必要である。特許文献２のように、頭部に装着するヘッドフォンでは頭部の姿勢をセンサで検出することが可能であるが、特許文献１の様な肩乗せ型スピーカは、頭部に装着するものではないので、センサを用いて頭部の姿勢を検出することができない。したがって、肩乗せ型スピーカでは特許文献２の様な音像定位を実現することが困難であった。

この発明の一実施形態は、肩乗せ型スピーカのように頭部の姿勢を検出できない場合であっても、頭部の姿勢に応じて適切な位置に音像定位することを目的とする。

本発明の一実施形態に係る肩乗せ型スピーカは、前記肩乗せ型スピーカが乗っている部位の姿勢を検出し、前記部位の姿勢をデータ化した部位姿勢データを取得する姿勢データ検出部と、取得した前記部位姿勢データを、頭部姿勢データに補正する姿勢データ補正部と、前記姿勢データ補正部で補正した前記頭部姿勢データに応じた頭部伝達関数を用いて、音信号に音像定位処理を施す音像定位処理部と、を備える。

本発明の一実施形態の肩乗せ型スピーカ、音像定位方法及び音像定位プログラムは、肩乗せ型スピーカのように頭部の姿勢を検出できない場合であっても、頭部の姿勢に応じて適切な位置に音像定位することができる。

肩乗せ型スピーカの外観を示す平面図及び側面図である。ユーザが肩乗せ型スピーカを装着したときの状態を示す説明図である。５チャンネルの音像の位置を示す平面図である肩乗せ型スピーカの構成の一例を示すブロック図である。鉛直方向から見た肩乗せ型スピーカであって、ユーザの状態の変化を示す平面図である。肩乗せ型スピーカに入力された信号の流れの一例を示す説明図である。肩の傾き角度と頭部の角度との関係を示すテーブルである。肩乗せ型スピーカの動作の一例を示すフローチャートである。変形例１の肩乗せ型スピーカの構成を示すブロック図である。肩の傾き角度と頭部の角度との関係を示す複数のテーブルである。変形例１の肩乗せ型スピーカに入力された信号の流れを示す説明図である。データ算出部の動作の一例を示すフローチャートである。変形例２の肩乗せ型スピーカの構成を示すブロック図である。３方向における肩の傾き角度と頭部の角度との関係を示すテーブルである。ユーザの正面から見た肩乗せ型スピーカであって、ユーザの状態の変化を示す正面図である。ユーザの左側から見た肩乗せ型スピーカであって、ユーザの状態の変化を示す側面図である。

本実施形態の肩乗せ型スピーカ１について図面を参照して説明する。図１は、肩乗せ型スピーカ１の外観を示す平面図及び側面図である。図２は、ユーザが肩乗せ型スピーカ１を装着したときの状態を示す説明図である。肩乗せ型スピーカ１は、図１に示すように、平面（鉛直方向の上側）から見た場合、円弧形状の円弧部分と円弧部分の両端から延びる長尺部分とで構成されたＵ字型に形成されている。肩乗せ型スピーカ１は、円弧部分が、図２に示すように、ユーザの首の後ろ側を沿うように装着される。また、肩乗せ型スピーカ１は、２つの長尺部分がユーザの肩５１から前方に向かうように、肩５１に掛かけられる。

肩乗せ型スピーカ１は、図１に示すように、長尺部分の筐体のそれぞれにスピーカ３Ｌ、３Ｒを備えている。ユーザは、肩乗せ型スピーカ１を、スピーカ３Ｌ、３Ｒの放音部分が上側に向くように、装着する。より詳細には、ユーザは、スピーカ３Ｌを、ユーザの左耳５２Ｌ側に配置されるように装着する。また、ユーザは、スピーカ３Ｒを、ユーザの右耳５２Ｒ側に配置されるように装着する（図２参照）。

肩乗せ型スピーカ１は、円弧部分の筐体の内部にセンサ４及びセンサ４以外の電気回路等を搭載している。なお、センサ４は、必ずしも肩乗せ型スピーカ１の筐体内に搭載されていなくてもよい。センサ４は、例えば肩乗せ型スピーカ１の筐体の外側に設けられていてもよい。

肩乗せ型スピーカ１は、例えば、携帯端末（スマートフォン、ＰＣなど）又はテレビから、オーディオ信号を受信する。肩乗せ型スピーカ１は、受信したオーディオ信号に信号処理を施す。肩乗せ型スピーカ１は、信号処理を施したオーディオ信号に基づく音を、スピーカ３Ｌ、３Ｒから放音する。

この例における肩乗せ型スピーカ１は、例えば、ステレオチャンネルのオーディオ信号を受信する。肩乗せ型スピーカ１は、例えば、受信したステレオチャンネルのオーディオ信号を５チャンネルのオーディオ信号にアップミックスする。この例でいう、５チャンネルとは、フロントレフトＦＬ、センタＣ、フロントライトＦＲ、サラウンドレフトＳＬ及びサラウンドライトＳＲである。

肩乗せ型スピーカ１は、ステレオチャンネルからアップミックスした５チャンネルのオーディオ信号に音像定位処理を行う。より詳細には、肩乗せ型スピーカ１は、各チャンネルに音像の位置から左耳５２Ｌに至る頭部伝達関数を畳み込んだオーディオ信号（Ｌチャンネル信号）と、右耳５２Ｒに至る頭部伝達関数を畳み込んだ（Ｒチャンネル信号）を生成する。

肩乗せ型スピーカ１は、頭部姿勢データに応じた音像定位処理を行うことで、ユーザの頭部５３の姿勢が変わっても、音像の位置が変わらない。

図３は、５チャンネルの音像の位置を示す平面図である。頭部伝達関数は、音源からユーザの頭部５３（具体的には、ユーザの左耳５２Ｌ、右耳５２Ｒ）までの伝達関数を示す。頭部伝達関数は、図３に示すように、ユーザから所定の距離、例えば１ｍで離間し、かつ５チャンネル（フロントレフトＦＬ、センタＣ、フロントライトＦＲ、サラウンドレフトＳＬ及びサラウンドライトＳＲ）のそれぞれに対してユーザの左耳５２Ｌ及び右耳５２Ｒに至る２つの伝達経路を表現した伝達関数である。この例では、ユーザを鉛直方向の上側から見て、ユーザを基準に、５チャンネルのうち、フロントレフトＦＬの音像をユーザの左前、センタＣをユーザの正面、フロントライトＦＲの音像をユーザの右前、サラウンドレフトＳＬの音像をユーザの左後ろ及びサラウンドライトＳＲの音像をユーザの右後ろに、それぞれ音像を定位させる。

ここで、肩乗せ型スピーカ１は、頭部伝達関数を使用して音像定位処理を行うために、頭部５３の姿勢を取得する。肩乗せ型スピーカ１は、肩５１の姿勢（傾き角度）を頭部５３の姿勢（角度）に補正する。言い換えると、肩乗せ型スピーカ１は、頭部５３の姿勢を直接検出せずに、肩５１が傾いた角度を検出し、検出した肩の傾き角度から頭部の角度を取得する。この例でいう、肩の傾き角度は、本発明の部位姿勢データの一例である。また、この例でいう、頭部の角度は、本発明の頭部姿勢データの一例である。

肩乗せ型スピーカ１の構成について、図４を参照して説明する。図４は、肩乗せ型スピーカ１の構成の一例を示すブロック図である。肩乗せ型スピーカ１は、通信部２１と、フラッシュメモリ２２と、ＲＡＭ２３と、信号処理部２４と、ＣＰＵ２５と、出力部２６と、スピーカ３Ｌ、３Ｒと、センサ４とを備えている。

通信部２１は、例えば、携帯端末又はテレビなどからオーディオ信号を受信する。

信号処理部２４は、例えば、ＤＳＰ（Digital Signal Processing）で構成されている。信号処理部２４は、受信したオーディオ信号に信号処理を施す。この例では、信号処理部２４は、受信したステレオオーディオ信号を５チャンネルにアップミックスする。

フラッシュメモリ２２は、肩の傾き角度と頭部の角度との関係を示すテーブルｔａ１（図７参照）を記憶している。なお、テーブルｔａ１に関する詳細な説明は後述する。また、フラッシュメモリ２２は、５チャンネルのそれぞれに対応する頭部伝達関数を記憶している。

ＣＰＵ２５は、フラッシュメモリ２２に記憶されている動作用プログラムをＲＡＭ２３に読み出し、肩乗せ型スピーカ１を統括的に制御する。また、ＣＰＵ２５は、姿勢データ検出部２５１と、姿勢データ補正部２５２と、頭部伝達関数取得部２５３と、音像定位処理部２５４とを備えている。ＣＰＵ２５は、アプリケーションプログラムを実行することで、フラッシュメモリ２２から姿勢データ検出処理、姿勢データ補正処理、頭部伝達関数取得処理及び音像定位処理に関するプログラムをＲＡＭ２３に読み出す。これにより、ＣＰＵ２５は、姿勢データ検出部２５１と、姿勢データ補正部２５２と、頭部伝達関数取得部２５３と、音像定位処理部２５４とを構成する。姿勢データ検出部２５１、姿勢データ補正部２５２、頭部伝達関数取得部２５３及び音像定位処理部２５４の詳細な説明は、後述する。

なお、ＣＰＵ２５が読み出すプログラムは、肩乗せ型スピーカ１のフラッシュメモリ２２に記憶されている必要はない。例えば、プログラムは、サーバ等の外部装置の記憶媒体に記憶されていてもよい。この場合、ＣＰＵ２５は、該サーバ（図示せず）から都度プログラムをＲＡＭ２３に読み出して実行すればよい。

出力部２６は、スピーカ３Ｌ、３Ｒに接続されている。出力部２６は、信号処理が施されたオーディオ信号をスピーカ３Ｌ、３Ｒに出力する。出力部２６は、ＤＡコンバータ（以下、ＤＡＣと称す）２６１と、増幅器（以下、ＡＭＰと称す）２６２とを有している。ＤＡＣ２６１は、信号処理が施されたデジタル信号をアナログ信号に変換する。ＡＭＰ２６２は、スピーカ３Ｌ、３Ｒを駆動するために該アナログ信号を増幅する。出力部２６は、増幅されたアナログ信号（オーディオ信号）をスピーカ３Ｌ、３Ｒに出力する。

スピーカ３Ｌ、３Ｒは、出力部２６から出力されたオーディオ信号に基づいて放音する。

センサ４は、例えば、角速度センサであって、筐体の円弧部分の中心に設けられている。センサ４は、例えば、鉛直方向（方向ｚ１）を軸とする水平方向ｃ１における角速度を検出する角速度センサである。この例では、肩５１を肩乗せ型スピーカ１が乗っている部位として説明する。

図５は、鉛直方向から見た肩乗せ型スピーカ１であって、ユーザが肩乗せ型スピーカ１を装着した状態の変化（状態６０から状態６１）を示した、平面図である。図５の一点鎖線で示される方向ｙ１は、前後方向を示し、紙面の上側がユーザの後ろ側、紙面の下側がユーザの前側を示す。また、図４の一点鎖線で示される方向ｘ１は、左右方向を示し、紙面の右側がユーザの左側を示し、紙面の左側がユーザの右側を示す。

状態６０（図５の紙面上における上側のユーザの状態）は、図５に示すように、ユーザが正面（前）を向いている状態を示す。また、状態６１（図５の紙面上における下側のユーザの状態）は、ユーザが左方向に傾いている状態を示す。状態６１の肩５１は、右方向を基準とした場合、状態６０の肩５１の位置から、肩の傾き角度ａ１で傾いている。

姿勢データ検出部２５１、姿勢データ補正部２５２、頭部伝達関数取得部２５３及び音像定位処理部２５４について、図６及び図７を参照して説明する。図６は、肩乗せ型スピーカ１に入力された信号の流れの一例を示す説明図である。図７は、肩の傾き角度と頭部の角度との関係を示すテーブルである。

姿勢データ検出部２５１は、図６に示すように、センサ４が出力した計測値から、肩５１の姿勢を検出する。姿勢データ検出部２５１は、センサ４で検出した角速度に基づいて肩の傾き角度ａ１（図５参照）を演算する。より詳細には、姿勢データ検出部２５１は、肩の向きが右方向から図５で示される二点鎖線ｄ１で示される方向に傾いた場合の肩の傾き角度ａ１を検出する。姿勢データ検出部２５１は、演算した肩の傾き角度ａ１を姿勢データ補正部２５２に出力する。

姿勢データ補正部２５２は、図７で示されるテーブルｔａ１に基づいて、肩の傾き角度ａ１（部位姿勢データ）を頭部の角度（頭部姿勢データ）に補正する。すなわち、姿勢データ補正部２５２は、フラッシュメモリ２２に予め記憶されているテーブルｔａ１を参照して、姿勢データ検出部２５１から出力された肩の傾き角度ａ１に対応する頭部の角度を取得する。姿勢データ補正部２５２は、例えば、図７に示すように、肩の傾き角度ａ１の場合、テーブルｔａ１から、肩の傾き角度ａ１に対応する頭部の角度ｂ１を取得する。

テーブルｔａ１は、例えば、大量に集められた測定データを平均化したものである。測定データとは、座った状態における人の肩の傾き角度と、該肩の傾き角度に対応する頭部の角度を測定したものである。なお、テーブルｔａ１は、機械学習済のアルゴリズム（例えばニューラルネットワーク）を用いて生成されたものでもよい。肩の傾き角度から頭部の角度を求めるアルゴリズムは、例えば、上記の大量に集められた測定データを用いてエンドツーエンドの学習により構築する。この場合、ユーザの肩の傾き角度は、入力データの要素となる。また、頭部の角度は、出力データの要素となる。当該アルゴリズムは、肩乗せ型スピーカ１のセンサ４から計算される肩の傾き角度に対する頭部の角度を出力することで、テーブルを生成する。この場合も、テーブルは予め作成される。

姿勢データ補正部２５２は、取得した頭部の角度ｂ１を頭部伝達関数取得部２５３に出力する。

頭部伝達関数取得部２５３は、頭部の角度ｂ１に対応する頭部伝達関数をフラッシュメモリ２２から読み出す。頭部伝達関数取得部２５３は、読み出した頭部伝達関数を音像定位処理部２５４に出力する。頭部伝達関数取得部２５３は、スピーカ３Ｌに対応するＬ用チャンネルの頭部伝達関数及びスピーカ３Ｒに対応するＲ用チャンネルの頭部伝達関数を音像定位処理部２５４に出力する。

頭部伝達関数取得部２５３は、音像の位置が移動しないように、頭部の角度に応じた頭部伝達関数をフラッシュメモリ２２から読み出す。より詳細には、頭部伝達関数取得部２５３は、頭部が状態６０から状態６１に角度ｂ１°（例えば、鉛直方向を軸として反時計回りに３０°）で傾いた場合、鉛直方向を軸として時計周りに角度ｂ１°（角度３０°）に傾いた場合の頭部伝達関数を読み出す。なお、頭部伝達関数取得部２５３は、頭部が状態６０から状態６１に角度ｂ１°（例えば、鉛直方向を軸として反時計回りに角度３０°）で傾いた場合、音像の位置を、鉛直方向を軸として時計周り角度ｂ１°（角度－３０°）に傾いた場合の頭部伝達関数を計算し、フラッシュメモリ２２に記憶されている頭部伝達関数を補正してもよい。

音像定位処理部２５４は、信号処理部２４によって５チャンネルにアップミックスされたオーディオ信号のそれぞれにＬチャンネル用の頭部伝達関数及びＲチャンネル用の頭部伝達関数をそれぞれ畳み込む。音像定位処理部２５４は、頭部伝達関数が畳み込まれた５チャンネルのオーディオ信号を２チャンネルのステレオオーディオ信号を生成する。

肩乗せ型スピーカ１の動作（音像定位に関する動作）について、図８を参照して説明する。図８は、肩乗せ型スピーカ１の動作の一例を示すフローチャートである。

肩乗せ型スピーカ１は、センサ４の計測値を取得する（Ｓ１）。肩乗せ型スピーカ１は、該計測値から肩の傾き角度ａ１を演算する（Ｓ２）。肩乗せ型スピーカ１は、テーブルｔａ１を用いて肩の傾き角度ａ１を頭部の角度ｂ１に補正する（Ｓ３）。言い換えると、肩乗せ型スピーカ１は、フラッシュメモリ２２に記憶されているテーブルｔａ１を参照して、肩の傾き角度ａ１に対応する頭部の角度ｂ１を取得する。肩乗せ型スピーカ１は、頭部の角度ｂ１に対応する頭部伝達関数を取得する（Ｓ４）。肩乗せ型スピーカ１は、アップミックスされた５チャンネルのオーディオ信号のそれぞれにＬチャンネル用の頭部伝達関数及びＲチャンネル用の頭部伝達関数を畳み込むことで、音像定位処理を行う（Ｓ５）。肩乗せ型スピーカ１は、頭部伝達関数が畳み込まれた各チャンネルのオーディオ信号をミキシングしてＬチャンネルとＲチャンネルのオーディオ信号として出力する（Ｓ６）。

本実施形態の肩乗せ型スピーカ１は、肩の傾き角度ａ１に対応する頭部の角度をテーブルｔａ１から取得する。さらに、本実施形態の肩乗せ型スピーカ１は、取得した頭部の角度に対応する頭部伝達関数を各チャンネルのオーディオ信号に適用することで、音像定位処理を行う。これにより、本実施形態の肩乗せ型スピーカ１は、頭部５３の姿勢を直接検出できない場合であっても、頭部５３の姿勢に応じて音像の位置に音像定位を行うことができる。したがって、ユーザの頭部５３の姿勢が変わっても、音像の位置は変わらない。

なお、信号処理部２４は、５チャンネルにアップミックスすることに限定されない。信号処理部２４は、３チャンネル、４チャンネル、７チャンネル又は９チャンネルなどにアップミックスしてもよい。

また、上述の実施形態では、肩乗せ型スピーカ１が２チャンネルのステレオオーディオ信号を５チャンネルにアップミックスし、５チャンネルにアップミックスされたオーディオ信号に対して頭部伝達関数を畳み込む処理を行っていたが、これに限定されない。肩乗せ型スピーカ１は、アップミックスは行わず、ステレオオーディオ信号に対して頭部伝達関数を畳み込む処理を行うようにしてもよい。

また、通信部２１は、５チャンネルのオーディオ信号を受信してもよい。この場合、信号処理部２４は、アップミックスせずに、音像定位処理部２５４にオーディオ信号を出力する。

［変形例１］
変形例１の肩乗せ型スピーカ１Ａについて図９、図１０、図１１及び図１２を参照して説明する。図９は、変形例１の肩乗せ型スピーカ１Ａの構成を示すブロック図である。図１０は、肩の傾き角度と頭部の角度との関係を示す複数のテーブルｐ１、ｐ２、ｐ３である。図１１は、変形例１の肩乗せ型スピーカ１Ａに入力された信号の流れを示す説明図である。図１２は、データ算出部２５５の動作の一例を示すフローチャートである。

ＣＰＵ２５は、図９に示すように、姿勢データ検出部２５１で取得した肩５１の角度からユーザの単位時間毎の肩の角度を算出するデータ算出部２５５を備えていることが、上述の実施形態の肩乗せ型スピーカ１の構成と異なる。また、肩乗せ型スピーカ１Ａは、単位時間毎の肩の角度に対応する複数（図１０では３つ）のテーブルｐ１、ｐ２、ｐ３をフラッシュメモリ２２に記憶していることが、上述の肩乗せ型スピーカ１と異なる。テーブルｐ１、ｐ２、ｐ３については、後述する。

変形例１Ａの肩乗せ型スピーカ１Ａも、上述の実施形態の肩乗せ型スピーカ１と同様に、頭部の角度を、肩の傾き角度から求める。ところで、肩５１の傾き角度に対する頭部の角度は、人それぞれ異なる。例えば、動きの小さい人は、動きの大きい人よりも、肩５１の傾き角度に対する頭部の角度が小さい。動きの大きさは、単位時間毎（例えば、１分間）における、肩の傾き角度の合計（移動量）によって求める。動きの小さい人は、例えば、単位時間毎における肩の傾き角度が小さい。また、動きの大きい人は、例えば、単位時間毎における肩の傾き角度が大きい。

そこで、肩乗せ型スピーカ１Ａは、単位時間毎、例えば、１分間の肩５１の傾き角度の合計を移動量として算出する。肩乗せ型スピーカ１Ａは、移動量に対応するパターンのテーブルを選択して、肩５１の傾き角度（例えば、図５で示される肩の傾き角度ａ１）を頭部の角度に補正する。この例でいう、移動量は本願発明のパラメータの一例である。

データ算出部２５５は、姿勢データ検出部２５１によって演算された肩の傾き角度を取得し、１分間に取得した肩５１の傾き角度の合計を移動量として算出する。データ算出部２５５は、例えば、正面を向いた状態から、ユーザが１分間に肩５１を右方向に２０°傾け、その後、左方向に肩５１を１０°を傾けた場合、ユーザの肩５１の傾き角度の合計を移動量＝３０°として算出する。データ算出部２５５は、図１１に示すように、姿勢データ補正部２５２に、算出した移動量を出力する。

データ算出部２５５の動作を、図１２を参照して説明する。なお、図１２で示されるデータ算出部２５５の動作は一例であって、これに限定されない。また、データ算出部２５５は、例えば、定期的、例えば３０分毎に、１分間に傾いた肩の角度を算出してもよい。

データ算出部２５５は、姿勢データ検出部２５１から肩の傾き角度を取得する（Ｓ１１）。データ算出部２５５は、１分間に傾いた肩５１の角度の算出を開始してから１分経過していなければ、（Ｓ１２：Ｎｏ）、取得した肩の傾き角度を加算する（Ｓ１３）。データ算出部２５５は、Ｓ１１の処理に戻る。データ算出部２５５は、１分間に傾いた肩５１の角度の算出を開始してから１分経過した場合（Ｓ１２：Ｙｅｓ）、算出した角度の合計を姿勢データ補正部２５２に出力する（Ｓ１４）。

なお、Ｓ１３はＳ１２の判定ステップの前でもよい。この場合、１分間に傾いた肩５１の算出を開始してから１分経過していなければ、動作をＳ１１に移行する。

姿勢データ補正部２５２は、データ算出部２５５から受信した移動量から、対応するパターンのテーブルを選択する。姿勢データ補正部２５２は、図１０に示す例では、３つのパターンのテーブルｐ１、ｐ２、ｐ３から、受信した移動量に応じたパターンのテーブルを選択する。

この例では、姿勢データ補正部２５２は、移動量が閾値ｔｈ１（例えば、３０°）未満の場合、パターン１のテーブルｐ１を選択する。また、姿勢データ補正部２５２は、移動量が閾値ｔｈ１以上かつ閾値ｔｈ２（例えば、１２０°）未満の場合、パターン２のテーブルｐ２を選択する。さらに、姿勢データ補正部２５２は、移動量が閾値ｔｈ２以上の場合、パターン３のテーブルｐ３を選択する。

例えば、姿勢データ補正部２５２は、移動量が２５°の場合、閾値ｔｈ１未満であるため、パターン１のテーブルｐ１を選択する。姿勢データ補正部２５２は、パターン１のテーブルｐ１に基づいて肩の傾き角度を頭部の角度に補正する。

このように、変形例１の肩乗せ型スピーカ１Ａは、移動量に応じたパターンのテーブルを選択し、選択されたテーブルから頭部の角度を取得する。これにより、変形例１の肩乗せ型スピーカ１Ａは、個人差に応じて、よりユーザ毎に適したテーブルを使用して、頭部の角度を取得する。したがって、変形例１の肩乗せ型スピーカ１Ａは、より正確な音像を定位することができる。

次に、肩乗せ型スピーカ１Ａが、単位時間毎の肩５１の移動回数（肩を傾かせる回数）に対応するパターンのテーブルから頭部の角度を取得する例を説明する。

例えば、単位時間毎の（例えば、１分間における）肩５１の移動回数は、人それぞれ異なる。１分間における肩５１の移動回数が少ない人と１分間における肩５１の移動回数が多い人とでは、肩の傾き角度が同じであっても、該肩の傾き角度に対応する頭部の角度が異なる。例えば、移動回数が多い人は、移動回数が少ない人よりも肩の傾き角度に対する頭部の角度が大きくなる。そこで、肩乗せ型スピーカ１Ａは、１分間に傾いた肩５１の移動回数の合計（以下、１分間の移動回数）を算出する。肩乗せ型スピーカ１Ａは、１分間の移動回数に応じたパターンのテーブルを使用して、肩５１の傾き角度を頭部の角度に補正する。

データ算出部２５５は、姿勢データ検出部２５１から受け取ったデータに基づいて、肩５１の１分間の移動回数を算出する。データ算出部２５５は、例えば、ユーザが１分間に右方向に５回及び左方向に６回、姿勢データ検出部２５１から肩の傾き角度を取得した場合、肩５１の１分間の移動回数を１１回とする。データ算出部２５５は、算出した１分間の移動回数を姿勢データ補正部２５２に出力する。

姿勢データ補正部２５２は、１分間の移動回数に対応するパターンのテーブルを選択する。また、姿勢データ補正部２５２は、１分間の移動回数に対応するパターンのテーブルに基づいて、姿勢データ検出部２５１によって演算された肩の傾き角度（例えば、図５で示される方の傾き角度ａ１）を頭部の角度を補正する。

ここで、各テーブルは、１分間の移動回数に応じて分類化されていると仮定する。すなわち、テーブルｐ１、ｐ２、ｐ３のそれぞれは、１分間の移動回数に応じて分類化されている。例えば、テーブルｐ１は、１分間の移動回数が５回未満で分類化されている。テーブルｐ２は、１分間の移動回数が５回以上かつ１０回未満で分類化されている。テーブルｐ３は、１分間の移動回数が１０回以上で分類化されている。

姿勢データ補正部２５２は、１分間の移動回数が閾値ｔｈ１（例えば、５回）未満の場合、パターン１のテーブルｐ１を選択する。また、姿勢データ補正部２５２は、１分間の移動回数が閾値ｔｈ１以上かつ閾値ｔｈ２（例えば、１０回）未満の場合、パターン２のテーブルｐ２を選択する。さらに、姿勢データ補正部２５２は、１分間の移動回数が閾値ｔｈ２以上の場合、パターン３のテーブルｐ３を選択する。

このように、変形例１の肩乗せ型スピーカ１Ａは、１分間の移動回数に応じたパターンのテーブルを選択し、選択されたテーブルから頭部の角度を取得してもよい。この場合も、変形例１の肩乗せ型スピーカ１Ａは、個人差に応じて、よりユーザに毎に適したテーブルを使用して、頭部の角度を取得する。したがって、変形例１の肩乗せ型スピーカ１Ａは、より正確な音像を定位することができる。

なお、変形例１では、単位時間を１分間で説明したが、単位時間は１分間より長くても短くてもよい。また、テーブルは、移動量及び移動回数の両方で分類化されてもよい。この場合、肩乗せ型スピーカ１Ａは、移動量及び移動回数の両方を算出し、対応するパターンのテーブルを選択する。

また、変形例１の肩乗せ型スピーカ１Ａは、コンテンツのジャンルに応じたパターンのテーブルを使用して頭部の角度を取得してもよい。同じユーザであっても、ゲーム、ＴＶ画像（ＤＶＤなどを含む）、又はミュージックなどにおける各コンテンツのジャンルに応じて、肩の傾き角度に対する頭部の角度が異なる。このように、同じ肩の傾き角度であっても、ユーザが視聴するコンテンツのジャンルに応じて、頭部の角度が異なる。例えば、ロック等の騒がしい曲はクラシック等の静かな曲に比べて、肩の傾き角度に対する頭部の角度が大きくなる。変形例１の肩乗せ型スピーカ１Ａは、このような場合、コンテンツのジャンルに応じて、適したテーブルを選択することで、より正確な音像定位処理を行うことができる。なお、コンテンツのジャンルを示す情報は、例えば、スマートフォンなどから取得する。この場合、変形例１の肩乗せ型スピーカ１Ａは、通信部２１を介してスマートフォンから情報を受信する。

［変形例２］
変形例２の肩乗せ型スピーカ１Ｂについて、図１３、図１４、図１５及び図１６を参照して説明する。図１３は、変形例２の肩乗せ型スピーカ１Ｂの構成を示すブロック図である。図１４は、３軸方向（鉛直軸（ヨー軸）、前後軸（ロール軸）、及び左右軸（ピッチ軸））における肩の傾き角度と頭部の角度との関係を示すテーブルｔａ１、ｔａ２、ｔａ３である。図１５は、ユーザの正面から見た肩乗せ型スピーカ１Ｂであって、ユーザの状態の変化を示す正面図である。図１６は、ユーザの左側から見た肩乗せ型スピーカ１Ｂであって、ユーザの状態の変化を示す側面図である。

変形例２の肩乗せ型スピーカ１Ｂは、３軸方向（鉛直軸、前後軸、及び左右軸）の動きに応じて、肩の傾き角度を頭部の角度に補正することが、上述の例と異なる。なお、上述の実施形態と同じ構成については同じ符号を付し、説明を省略する。

変形例２の肩乗せ型スピーカ１Ｂは、図１３に示すように、３軸角速度センサ４１を備えている。３軸角速度センサ４１は、鉛直方向を軸（鉛直軸）にした水平方向ｃ１における肩５１の傾きの角速度を検出する。姿勢データ検出部２５１は、３軸角速度センサ４１で検出した角速度に基づいて、図５の右方向から二点鎖線ｄ１で示される方向に傾いた場合の肩の傾き角度ａ１（図５参照）を演算する。３軸角速度センサ４１は、図１５に示すように、前後方向（方向ｙ１）を軸（前後軸）とする回転方向ｃ２における肩５１の傾きの角速度を検出する。姿勢データ検出部２５１は、３軸角速度センサ４１で検出した角速度に基づいて、図１５の右方向から二点鎖線ｄ２で示される方向に傾いた場合の肩の傾き角度ａｙ１を演算する。３軸角速度センサ４１は、図１６に示すように、左右方向（方向ｘ１）を軸（左右軸）とする回転方向ｃ３おける肩５１の傾きの角速度を検出する。姿勢データ検出部２５１は、３軸角速度センサ４１で検出した角速度に基づいて前方向から二点鎖線ｄ３で示される方向に傾いた肩の傾き角度ａｘ１を演算する。

なお、水平方向ｃ１における肩の傾き角度ａ１は、上述の実施形態で説明しているので、ここでの詳細な説明は省略する。

フラッシュメモリ２２には、鉛直軸（水平方向ｃ１）に傾く肩の傾き角度ａ１（図５参照）に対応するテーブルｔａ１と、前後軸に傾く肩５１の肩の傾き角度ａｙ１（図１５参照）に対応するテーブルｔａ２と、左右軸に傾く肩５１の肩の傾き角度ａｘ１（図１６参照）に対応するテーブルｔａ３とが記憶されている。

テーブルｔａ２及びテーブルｔａ３は、テーブルｔａ１と同様に、大量の測定データから平均化したものである。また、テーブルｔａ２及びテーブルｔａ３は、ニューラルネットワーク等の機械学習済のアルゴリズムを用いて生成されたものでもよい。

姿勢データ検出部２５１は、演算した演算結果を、姿勢データ補正部２５２に出力する。

姿勢データ補正部２５２は、肩の傾き角度ａ１を受け取ると、肩の傾き角度ａ１に対応するテーブルｔａ１から、頭部の角度を取得する。また、姿勢データ補正部２５２は、肩の傾き角度ａｙ１を受け取ると、肩の傾き角度ａｙ１に対応するテーブルｔａ２から、頭部の角度を取得する。さらに、姿勢データ補正部２５２は、肩の傾き角度ａｘ１を受け取ると、肩の傾き角度ａｘ１に対応するテーブルｔａ３から、頭部の角度を取得する。

頭部伝達関数取得部２５３は、鉛直軸、前後軸、及び左右軸の頭部の角度に対応する頭部伝達関数を読み出し、音像定位処理部２５４に出力する。あるいは、頭部伝達関数取得部２５３は、鉛直軸、前後軸、及び左右軸の頭部の角度に対応する頭部伝達関数を計算し、音像定位処理部２５４に出力する。

変形例２の肩乗せ型スピーカ１Ｂは、３軸方向において、肩５１の傾きを３軸角速度センサ４１から取得することで、より立体的でより正確な音像を定位することができる。

本実施形態の説明は、すべての点で例示であって、制限的なものではないと考えられるべきである。本発明の範囲は、上述の実施形態ではなく、特許請求の範囲によって示される。さらに、本発明の範囲には、特許請求の範囲と均等の意味及び範囲内でのすべての変更が含まれることが意図される。

なお、肩乗せ型スピーカは、センサ４又は３軸角速度センサ４１の代わりに３軸加速度センサを備えていてもよい。肩乗せ型スピーカは、３軸加速度センサで検出した加速度に基づいて、各軸の回転角度を求めることもできる。また、肩乗せ型スピーカは、上述した角速度センサと、３軸加速度センサとの両方を備えていてもよい。この場合、肩乗せ型スピーカは、角速度センサの検出値に基づいて計算した回転角度を３軸加速度センサの検出値で補正することで、より高精度に音像を定位することができる。

肩乗せ型スピーカは、テーブルを使用して、肩の傾き角度を頭部の角度に補正しなくてもよい。姿勢データ補正部２５２は、肩の傾き角度と頭部の角度との関係を示す関数に基づいて、肩の傾き角度を頭部の角度に補正してもよい。肩乗せ型スピーカは、頭部の角度を関数を用いて計算するので、頭部の角度の検出精度を上げることができる。

変形例１で説明した複数のパターンは、単位時間の移動量（速度）又は移動回数の少なくともいずれかのパラメータに対応付けされたものでなくてもよい。

変形例１の肩乗せ型スピーカ１Ａは、例えば、ユーザの操作を受け付けるユーザインタフェースを備え、ユーザから操作を受け付けるように構成されていてもよい。この場合、肩乗せ型スピーカ１Ａは、複数のパターンを表示した表示部を備える。表示部は、動きの大きい人用のパターンＡ及び動きの小さい人用のパターンＢを表示する。肩乗せ型スピーカ１Ａは、ユーザによって選択されたパターンのテーブルに基づいて、肩の傾き角度を頭部の角度に補正する。これにより、肩乗せ型スピーカ１Ａは、ユーザ好みの音像を定位することができる。

また、肩乗せ型スピーカ１Ａは、ユーザから入力された情報、例えば、性別及び年代に基づいて、パターンを選択するように構成されていてもよい。例えば、肩乗せ型スピーカ１Ａは、２０歳未満の人用のパターンＡ、２０歳以上４０歳未満の人用のパターンＢ及び４０歳以上の人用のパターンＣを用意する。この場合、肩乗せ型スピーカ１Ａは、入力された情報が２０歳未満の男性であれば、パターンＡのテーブルを選択する。また、肩乗せ型スピーカ１Ａは、入力された情報がパ２０歳以上４０歳未満の男性であれば、パターンＢのテーブルを選択する。

また、音像定位に関する処理は、オーディオ信号を送信する携帯端末などで行われてもよい。この場合、肩乗せ型スピーカは、センサの検出信号を通信部２１を介して携帯端末に送信し、携帯端末で音像定位処理が施されたステレオオーディオ信号を受信する。

１、１Ａ、１Ｂ…肩乗せ型スピーカ
４１…３軸角速度センサ
５１…肩（部位）
５３…頭部
２５１…姿勢データ検出部
２５２…姿勢データ補正部
２５４…音像定位処理部
ｃ１…水平方向
ｔａ１、ｔａ２、ｔａ３…テーブル
ｐ１、ｐ２、ｐ３…テーブル（パターンのテーブル）
ｚ１…鉛直方向

Claims

肩乗せ型スピーカが乗っている部位の姿勢を検出し、前記部位の姿勢をデータ化した部位姿勢データを取得する姿勢データ検出部と、
取得した前記部位姿勢データを、頭部姿勢データに補正する姿勢データ補正部と、
前記姿勢データ補正部で補正した前記頭部姿勢データに応じた頭部伝達関数を用いて、音信号に音像定位処理を施す音像定位処理部と、を備える、
肩乗せ型スピーカ。
前記姿勢データ補正部は、前記部位姿勢データと前記頭部姿勢データとの関係を示すテーブルに基づいて、前記部位姿勢データを前記頭部姿勢データに補正する、
請求項１に記載の肩乗せ型スピーカ。
前記テーブルは、複数のパターンに分類化され、
前記姿勢データ補正部は、前記複数のパターンのうちいずれか１つのパターンの選択を受け付け、受け付けたパターンのテーブルに基づいて前記部位姿勢データを前記頭部姿勢データに補正する、
請求項２に記載の肩乗せ型スピーカ。
前記姿勢データ検出部で取得した前記部位姿勢データからユーザの単位時間毎の移動量又は前記単位時間毎の移動回数の少なくともいずれかのパラメータを算出するデータ算出部をさらに備え、
前記複数のパターンは、それぞれ前記パラメータに対応付けられ、
前記姿勢データ補正部は、算出された前記パラメータに対応するパターンのテーブルに基づいて前記部位姿勢データを前記頭部姿勢データに補正する、
請求項３に記載の肩乗せ型スピーカ。
前記姿勢データ補正部は、前記部位姿勢データと前記頭部姿勢データとの関係を示す関数に基づいて、前記部位姿勢データを前記頭部姿勢データに補正する、
請求項１に記載の肩乗せ型スピーカ。
前記姿勢データ補正部は、鉛直方向を軸とする水平方向における前記部位の角度を頭部の角度に補正する、
請求項１乃至５のいずれかに記載の肩乗せ型スピーカ。
前記姿勢データ検出部は、３軸角速度センサ又は３軸加速度センサの少なくとも１つから前記部位の姿勢を検出する、
請求項１乃至６のいずれかに記載の肩乗せ型スピーカ。
肩乗せ型スピーカが乗っている部位の姿勢を検出し、
前記部位の姿勢をデータ化した部位姿勢データを取得し、
取得した前記部位姿勢データを、頭部姿勢データに補正し、
補正した前記頭部姿勢データに応じた頭部伝達関数を用いて、音信号に音像定位処理を施す、
音像定位方法。
前記部位姿勢データと前記頭部姿勢データとの関係を示すテーブルに基づいて、前記部位姿勢データを前記頭部姿勢データに補正する、
請求項８に記載の音像定位方法。
前記テーブルは、複数のパターンに分類化され、
前記複数のパターンのうちいずれか１つのパターンの選択を受け付け、
受け付けたパターンのテーブルに基づいて前記部位姿勢データを前記頭部姿勢データに補正する、
請求項９に記載の音像定位方法。
取得した前記部位姿勢データからユーザの単位時間毎の移動量又は前記単位時間毎の移動回数の少なくともいずれかのパラメータを算出し、
前記複数のパターンは、それぞれ前記パラメータに対応付けられ、
算出された前記パラメータに対応するパターンのテーブルに基づいて前記部位姿勢データを前記頭部姿勢データに補正する、
請求項１０に記載の音像定位方法。
前記部位姿勢データと前記頭部姿勢データとの関係を示す関数に基づいて、前記部位姿勢データを前記頭部姿勢データに補正する、
請求項８に記載の音像定位方法。
鉛直方向を軸とする水平方向における前記部位の角度を頭部の角度に補正する、
請求項８乃至１２のいずれかに記載の音像定位方法。
３軸加速度センサ及び３軸角速度センサから前記部位の姿勢を検出する、
請求項８乃至１３のいずれかに記載の音像定位方法。
コンピュータに実行される音像定位プログラムであって、
肩乗せ型スピーカが乗っている部位の姿勢を検出し、
前記部位の姿勢をデータ化した部位姿勢データを取得し、
取得した前記部位姿勢データを、頭部姿勢データに補正し、
補正した前記頭部姿勢データに応じた頭部伝達関数を用いて、音信号に音像定位処理を施す、
音像定位プログラム。