WO2023171280A1

WO2023171280A1 - 信号処理装置、音響出力装置、信号処理方法

Info

Publication number: WO2023171280A1
Application number: PCT/JP2023/005311
Authority: WO
Inventors: 康信村田; 慎平土谷; 宜紀田森; 徹徳板橋; 明文河野
Original assignee: ソニーグループ株式会社
Priority date: 2022-03-10
Filing date: 2023-02-15
Publication date: 2023-09-14

Abstract

信号処理装置は、音響出力装置に配置された複数の音響出力ドライバから出力する複数チャネルのコンテンツ音データと、音響出力装置に配置され周囲音を集音する複数のマイクロホンで得られた周囲音データと、周囲音の到来方向の情報とを用いて、コンテンツ音と周囲音のマスキング状態を判定するマスキング判定部を備える。またマスキング判定部によるマスキング状態の判定結果に応じて音響処理に関する制御を行う音響処理制御部を備える。

Description

信号処理装置、音響出力装置、信号処理方法

　本技術は信号処理装置、音響出力装置、信号処理方法に関し、特に音響出力ドライバを複数備えた立体音響再生の分野に好適な技術に関する。

　例えば３Ｄ（three dimensions）オーディオ、３６０度オーディオなどとして、立体音響再生の技術が開発されている。立体音響再生に用いるヘッドホンでは左耳側及び右耳側のユニットのそれぞれに複数チャネルの音響出力ドライバ（ドライバユニット）を配置し、ユーザに多様な方向性のコンテンツ音声を知覚させる。また、このようなヘッドホンではノイズキャンセル処理のためのマイクロホンを複数設け、多様な方向性で周囲音を集音するものもある。
　このような、いわゆるマルチマイクロホン・マルチドライバのヘッドホンによって、周囲音が生じている環境下において３Ｄオーディオ等のコンテンツを聴取するユースケースが想定される。
　下記特許文献１には立体（３Ｄ）オーディオの伝送に関する技術が開示されている。

特開２０２１－１５２６７７号公報

　ここでコンテンツ音と周囲音の２つを考えた場合において、一方の音で他方の音がマスキングされることを考える。すなわち周囲音がコンテンツ音によってマスキングされ、ユーザに認知されないケースや、周囲音によりコンテンツ音成分の一部がマスキングされるようなケースである。例えば周囲音をノイズとしてノイズキャンセル処理を行う場合は、その消し残り成分により、コンテンツ音成分の一部がマスキングされる場合もある。

　このようなマスキングの状態を判定することで、より効率的な処理や、ユーザにとって望ましい処理が実現できると考えられる。
　そこで本技術は、コンテンツ音と周囲音の状況に適した処理が行われるようにする技術を提案する。

　本技術に係る信号処理装置は、音響出力装置に配置された複数の音響出力ドライバから出力する複数チャネルのコンテンツ音データと、前記音響出力装置に配置され周囲音を集音する複数のマイクロホンで得られた周囲音データと、周囲音の到来方向の情報とを用いて、コンテンツ音と周囲音のマスキング状態を判定するマスキング判定部と、前記マスキング判定部によるマスキング状態の判定結果に応じて音響処理に関する制御を行う音響処理制御部と、を備える。
　ヘッドホン等の音響出力装置の筐体内で複数の音響出力ドライバが備えられて立体音響の再生を行うとともに、周囲音を集音する複数のマイクロホンが配置される場合を想定する。この場合に、コンテンツ音データと周囲音データについてマスキング状態を判定し、そのマスキング状態に応じた音響処理制御を行う。

本技術の第１の実施の形態のヘッドホンのブロック図である。実施の形態のヘッドホンにおけるマイクロホンと音響出力ドライバの模式的な説明図である。実施の形態のヘッドホンの装着者に聴取される音の説明図である。音響出力ドライバの位置とノイズキャンセル特性の説明図である。最小可聴限と同時刻マスキングの説明図である。ノイズが加わった状態のマスキングの説明図である。ノイズが加わった状態のマスキングの説明図である。消し残りノイズがあるときのマスキングの説明図である。消し残りノイズがあるときのマスキングの説明図である。空間マスキングの説明図である。ノイズとコンテンツ音の到来方向が一致する場合の説明図である。ノイズとコンテンツ音の到来方向が一致する場合のマスキングの説明図である。ノイズとコンテンツ音の到来方向が一致する場合にノイズキャンセル処理を加えた状態の説明図である。ノイズとコンテンツ音の到来方向が一致する場合にノイズキャンセル処理を加えた状態でのマスキングの説明図である。ノイズとコンテンツ音の到来方向が一致する場合のマスキングの説明図である。ノイズとコンテンツ音の到来方向が異なる場合の説明図である。ノイズとコンテンツ音の到来方向が異なる場合にノイズキャンセル処理を加えた状態の説明図である。ノイズとコンテンツ音の到来方向が異なる場合にノイズキャンセル処理を加えた状態でのマスキングの説明図である。ノイズの到来方向がコンテンツ音の到来方向に含まれる場合の説明図である。到来方向毎に異なるマスキング状態の説明図である。到来方向毎に異なるマスキング状態でノイズキャンセル処理を加えた場合の説明図である。ノイズキャンセル処理が行われた状態の説明図である。ノイズの到来方向がコンテンツ音の到来方向以外に存在する場合の説明図である。到来方向毎に異なるマスキング状態の説明図である。到来方向毎に異なるマスキング状態でノイズキャンセル処理を加えた場合の説明図である。ノイズキャンセル処理が行われた状態の説明図である。実施の形態の判定部の処理例のフローチャートである。実施の形態の判定部の処理例のフローチャートである。第２の実施の形態のヘッドホンのブロック図である。ホスト機器での周囲音通知のメッセージ表示例の説明図である。ホスト機器での周囲音及び到来方向通知の表示例の説明図である。ホスト機器での周囲音及び到来方向通知の表示例の説明図である。ホスト機器でのマスキング状態を含めた表示例の説明図である。ホスト機器でのマスキング状態を含めた表示例の説明図である。ホスト機器でのマスキング状態を含めた表示例の説明図である。実施の形態の判定部の処理例のフローチャートである。

　以下、実施の形態を次の順序で説明する。
＜１．第１の実施の形態＞
＜２．第２の実施の形態＞
＜３．まとめ及び変型例＞

＜１．第１の実施の形態＞
　本開示の実施の形態では、音響出力装置の例として、マルチマイクロホン・マルチドライバ搭載ヘッドホンを挙げ、このヘッドホンにおいて、３Ｄオーディオ等の立体音響データを含むコンテンツを聴取する場合を例にして説明する。なおヘッドホンに搭載される音響出力ドライバは、以下、単に「ドライバ」とも表記する。

　まず第１の実施の形態では、主に立体音響再生を行うためにコンテンツ音データの伝送量が増大することに対処する処理を説明する。

　立体音響再生の場合、旧来の２チャネルステレオ音声等を再生するコンテンツから比較すると、音源数が飛躍的に増加しており、コンテンツ音データの伝送ビットレートが肥大化するという実情がある。

　一方で、コンテンツ音以外に周囲から発せられ鼓膜に届く周囲音（ノイズ）が存在する。このとき、マスキング効果という現象を活用することで、コンテンツ音データの伝送ビットレートの低減、あるいはコンテンツ音データのＳ／Ｎ（Signal-to-Noise Ratio）向上、音の分離感の向上、ノイズキャンセル（以下、ノイズキャンセルを「ＮＣ」と表記する）効果の向上、さらには消費電力の削減によるヘッドホンの電池寿命の長時間化を実現する。

　ある音がほかの音によって妨害され、遮蔽されて聞こえなくなるマスキング効果という現象が存在する。なお音源がふたつ存在するとき、一方の信号が、もう一方の信号を遮蔽するマスキング効果が発生することがある。他方をマスクする側を「マスカー」、マスクされる側を「マスキー」と呼ぶ。

　本実施の形態では、このマスキング効果を利用し、ノイズ環境下における立体音響コンテンツ視聴時に、ノイズ、立体音響のコンテンツ音データ、ノイズの到来方向から、どちらの信号が支配的（マスカー）となり、もう一方の信号（マスキー）をどの程度劣化させるか、あるいはかき消してしまうか、を解析する。

　そして解析結果に応じて、ノイズがマスカーになる場合には、立体音響再生のコンテンツ音データの量子化ビットを削減することで、伝送ビットレート低減を実現する。

　またノイズ環境下でコンテンツ音を聴取するとき、ＮＣ機能をＯＮにする。このとき、ＮＣ効果、およびＮＣ処理後のコンテンツ音のＳ／Ｎ等の質は、ノイズの到来方向に依存する。そこで、ヘッドホンにおけるどのドライバを使用してノイズをキャンセルするべきか、あるいはどのドライバでのノイズキャンセリングが不要か、を割り出して、設定を変更することで、より快適な再生音のＳ／Ｎ、音の分離感、ＮＣ効果の向上を実現する。

　図１に第１の実施の形態のヘッドホン１の構成例を示す。
　ヘッドホン１は、ホスト機器１００から立体音響データとしてのコンテンツ音データＣＴが伝送され、そのコンテンツ音データＣＴによる再生音の出力を行う。
　なお、ホスト機器１００とは、ヘッドホン１と別体の機器を想定しているが、ヘッドホン１の内部に設けられる装置部でもよい。例えばヘッドホン１内の音声ストリーミング制御部などでもよい。すなわち実施の形態におけるホスト機器１００とは、ヘッドホン１で再生するコンテンツ音データＣＴのソースとなる機器や回路部であれば、どのような形態でもよく、またヘッドホン１との一体／別体を問わない。

　このヘッドホン１には、例えばＮチャネルの立体音響音声を出力するＮ個のドライバ２（２Ａ、２Ｂ・・・２（Ｎ））が設けられている。ドライバ２Ａ、２Ｂ・・・２（Ｎ）は、ヘッドホン１の左右の各ハウジング内において、各チャネルに対応した互いに異なる位置に配置される。
　例えば図２に模式的に示すように、ドライバ２Ａ、２Ｂ・・・２（Ｎ）はハウジング１０内において、ユーザの耳２００に向けて放音するように設けられている。これにより鼓膜２０１に到達するコンテンツ音の各チャネルは、到来方向が異なるものとなる。

　なお説明の簡略化のために、ユーザの左右の耳のうちの一方側のハウジング１０について図示及び説明を行うが、他方のハウジングも同様である。Ｎチャネル（Ｎ個）のドライバは、左右の各ハウジング１０に設けられる。図１も一方の耳２００に対応する構成として示しているが、他方側の構成も同様である。

　図１，図２に示すように、ハウジング１０の外側に向けて、互いに異なる位置にＭ個のマイクロホン３（３Ａ，３Ｂ・・・３（Ｍ））が設けられている。これによりＭチャネルの周囲音を集音する。マイクロホン３は例えばＦＦ（フィードフォワード）方式でＮＣ処理を行うための適切な位置に配置されている。

　なお図２はあくまでも模式図であり、ドライバ２及びマイクロホン３は、必ずしも図のようにハウジング１０の断面方向に並ぶわけではない。
　例えば複数のドライバ２はハウジング１０の内面側に、また複数のマイクロホン３はハウジング１０の外面側において、それぞれ各所に配置される。

　ヘッドホン１に対するホスト機器１００は、コンテンツ音データＣＴのソースとなる機器であり、例えばスマートフォン、ＨＭＤ（ヘッド・マウント・ディスプレイ）、ゲーム機器、タブレット、パーソナルコンピュータ、その他の各種の機器が想定される。

　ホスト機器１００は、例えば表示部を備えてコンテンツ映像の表示を行い、またコンテンツ音データＣＴをヘッドホン１に伝送する。これによりユーザは映像及び音声によるコンテンツを視聴することができる。この場合に、コンテンツ音データＣＴはヘッドホン１で再生するＮチャネルの立体音響データとされている。すなわちコンテンツ音データＣＴは、ホスト機器１００側で、ヘッドホン１のドライバ２のチャネル数及び位置に応じた信号処理が施されている想定である。

　コンテンツ音データＣＴを受信するヘッドホン１には、例えば１又は複数のマイクロプロセッサにより、判定部４、周囲音種別判定部５、ＮＣ信号生成部６、出力信号生成部７としての各機能が設けられる。

　マイクロホン３で集音された音声は、例えばマイクロホン３の出力段階でデジタルデータとしての周囲音データＳ１に変換されて判定部４、周囲音種別判定部５、ＮＣ信号生成部６に供給される。なお、デジタルデータへの変換は、これらの各部を構成するマイクロプロセッサの入力段で行われてもよい。例えばマイクロプロセッサにＡ／Ｄ変換端子が設けられていることで、判定部４、周囲音種別判定部５、ＮＣ信号生成部６はデジタルデータとしての周囲音データＳ１を取得する。

　判定部４は、マイクロホン３からの周囲音データＳ１と、コンテンツ音データＣＴを取得して判定及び制御を行う機能である。具体的にはマスキング判定部４ａ及び音響処理制御部４ｂとしての機能を備える。

　マスキング判定部４ａは、Ｎチャネルのドライバ２から出力するＮチャネルのコンテンツ音データＣＴと、マイクロホン３で得られたＭチャネルの周囲音データＳ１と、周囲音の到来方向の情報とを用いて、コンテンツ音と周囲音のマスキング状態を判定する処理を行う。
　このためマスキング判定部４ａは、Ｍチャネルの周囲音データＳ１から周囲音（ノイズ）の到来方向を判定する。
　またマスキング判定部４ａはＭチャネルの周囲音データＳ１の周波数特性を算出する。
　またマスキング判定部４ａはＮチャネルのコンテンツ音データＣＴの周波数特性を算出する。
　マスキング判定部４ａはこれらの情報に応じて周囲音とコンテンツ音に関するマスキング状態を判定する。詳細は後述する。
　なお本実施の形態のように立体音響コンテンツの場合、コンテンツ音データＣＴの各チャネルの音データは、それぞれ異なるドライバ２から出力する音データである。つまりチャネル番号が各ドライバ２の配置位置に対応している。このためコンテンツ音データＣＴのチャネル情報は、ユーザに対するコンテンツ音の到来方向の情報に相当する。従って複数チャネルのコンテンツ音データＣＴにおける各チャネルのレベルにより、コンテンツ音の到来方向毎のレベルが判定できる。
　換言すれば、コンテンツ音データＣＴ自体が、ユーザに対するコンテンツ音の到来方向の情報を含む。

　音響処理制御部４ｂは、マスキング判定部４ａによるマスキング状態の判定結果に応じて音響処理に関する制御を行う。
　例えば音響処理制御部４ｂは、マスキング状態に応じてＮＣ信号生成部６に制御信号を出力し、ＮＣ動作の制御を行う。ＮＣ動作の制御とは、ＮＣ処理のオン／オフや、ＮＣ信号を出力するドライバ２の選択制御などである。例えば到来するノイズに対して、どのドライバ２でＮＣ信号Ｓ２を出力するとＮＣ効果を最も大きくできるかを判定し、ＮＣ信号生成部６に指令を送る。

　また音響処理制御部４ｂは、例えばマスキング状態の判定結果に応じて、通知情報ＳＳを外部機器であるホスト機器１００に送信する処理を行う。
　第１の実施の形態の場合、通知情報ＳＳとして、コンテンツ音データＣＴに必要な量子化ビット情報がある。量子化ビット情報とは、例えばコンテンツ音データＣＴにおいて量子化ビット数の削減を行うチャネルと帯域の情報を含む。

　周囲音種別判定部５は、マイクロホン３で得られる周囲音データについて、音の種別を判定する処理を行う。なお、種別判定は、必ずしも具体的な音の判定を行わず、ノイズとして扱う音であるか否かの判定でもよい。
　なお周囲音種別判定部５は、主に第２の実施の形態の処理で必要になるため、第１の実施の形態の処理に関しては設けられなくてもよい。但し、第１の実施の形態において例えば周囲音データＳ１の音の種別に応じてＮＣ処理をオン／オフするような処理が行われるようにしてもよい。

　ＮＣ信号生成部６は、マイクロホン３で得られる周囲音データをノイズとして、それを打ち消すためのＮＣ信号Ｓ２を生成する機能である。例えばＦＦ－ＮＣアルゴリズムに従った処理でＮＣ信号Ｓ２を生成する。

　出力信号生成部７は、ドライバ２から出力する信号を生成する機能である。基本的にはコンテンツ音データＣＴの各チャネルのデータに基づいて、各チャネルのドライバ２を駆動する信号を生成する。なおコンテンツ音データＣＴに対するイコライザ処理等を含むこともある。
　また出力信号生成部７は入力されたＮＣ信号Ｓ２に基づいて、指定されたチャネルのドライバ２を駆動する信号を生成する。なおＮＣ信号を出力するドライバ２のチャネルは、上述のように音響処理制御部４ｂによって指定される場合がある。

　以下、判定部４によるマスキングの判定処理について説明する。
　マスキング効果には種類がある。同時刻の隣接周波数音を遮蔽する「同時刻マスキング（周波数マスキング）」、直前・直後の音を遮蔽する「時間マスキング」などである。
　本開示では、上記の「同時刻マスキング」と、音の到来方向の違いによって発生する「空間マスキング」を主に利用する。
　「空間マスキング」は、聴取者から見てマスカーとマスキーの到来方向が同じとき、最もマスキング効果が発揮され、到来方向が異なるときはマスキング効果が弱くなることである。なお図３には、周囲音であるノイズＡＮとコンテンツ音ＡＣの到来方向が異なる状態を模式的に示している。

　第１の実施の形態では周囲音をノイズＡＮと考える。
　そしてノイズＡＮと、ヘッドホン１がドライバ２から出力するコンテンツ音ＡＣを考えた場合、マスカー／マスキー関係と、それぞれの音の到来方向の観点で、以下のケースが考えられる。

・ノイズＡＮが同時刻マスキング効果で、コンテンツ音ＡＣ（量子化ビットすべて、あるいは量子化ビットの一部に相当する音）をマスクする
・コンテンツ音ＡＣがノイズＡＮをマスクする

・ノイズＡＮとコンテンツ音ＡＣの到来方向が同一（マスキング効果：大）
・ノイズＡＮとコンテンツ音ＡＣの到来方向が異なる（マスキング効果：小）

　これらのケースの組み合わせにおいて、立体音響コンテンツの視聴時のＳ／Ｎ改善、音の分離感の向上、ＮＣ効果の向上、ビットレート削減を実現する。

　ここで前提とする現象・効果について次の３つの点について説明する。
・ドライバの位置とＮＣ効果
・最小可聴限と同時刻マスキング
・空間マスキング

　まずドライバの位置とＮＣ効果について述べる。
　図４はマルチドライバヘッドホンにおけるドライバの選択とＮＣ性能を示すための実験結果である。実験ではNo.1からNo.4とした４つのドライバを搭載したマルチドライバヘッドホンを用いている。

　図４の横軸は周波数、縦軸は音圧レベルであり、縦軸では下方向が静か、つまりＮＣ効果が高いことを表す。
　測定結果Ｃ１は、ヘッドホンを装着しない状態での鼓膜位置の音圧である。
　測定結果Ｃ２は、ヘッドホンを装着しただけの状態（ＮＣ処理オフ）での鼓膜位置の音圧である。
　測定結果Ｃ３はNo.1としたドライバでＮＣ信号を出力した場合、測定結果Ｃ４はNo.2としたドライバでＮＣ信号を出力した場合、測定結果Ｃ５はNo.3としたドライバでＮＣ信号を出力した場合、測定結果Ｃ６はNo.4としたドライバでＮＣ信号を出力した場合を、それぞれ示している。

　測定結果Ｃ６では低域のＮＣ効果が高いが、４ｋＨｚ以上でＮＣ効果が低下している。
　一方で、測定結果Ｃ５は、低域が測定結果Ｃ６ほどではないが、１～６ｋＨｚで特にＮＣ効果が高いことがわかる。測定結果Ｃ３，Ｃ４もそれぞれ他の測定結果と異なる特性を持つ。

　このように、それぞれ異なるドライバでＮＣ処理を行った場合の測定結果Ｃ３，Ｃ４，Ｃ５，Ｃ６から、マルチドライバヘッドホンのノイズキャンセルに関しては、ＮＣ信号を出力するドライバによって、ＮＣ効果が高い帯域と低い帯域がある。これは、各ドライバの配置位置や鼓膜までの特性に起因する。
　このような特徴は、換言すれば、ＮＣ信号を出力するドライバの選択や組み合わせによって、どの帯域で重点的にノイズキャンセル処理をするかを選択できることになり、これがマルチドライバヘッドホンのノイズキャンセリングの利点であるといえる。

　次に最小可聴限と同時刻マスキング（周波数方向）について説明する。
　最小可聴限は、それぞれの帯域において、人が聞き取ることができる限界の音圧レベルを示し、最小可聴限より小さい音は聞くことができない。
　同時刻マスキングは、ある周波数成分（Ｆ１）が鼓膜に到達して聴取するとき、その近傍の周波数成分（Ｆ２）は、周波数成分（Ｆ１）と比較してある程度大きくないと、周波数成分（Ｆ１）にマスキングされてしまい聞き取ることができない現象である。

　これらを考えると、マスキングされる精度にあたる部分、および最小可聴限未満の部分は、量子化誤差を許容できることになり、伝送ビットレートを削減できることになる。

　図５で説明する。横軸は周波数、縦軸は振幅である。
　図では最小可聴限４０を一点鎖線で示している。
　また図では、同時刻に発生した音の周波数成分２０，２１，２２，２３を示している。また各周波数成分２０，２１，２２，２３によって同時刻マスキングされるマスキングレベル３０，３１，３２，３３を破線で示している。
　周波数成分２０の音によってはマスキングレベル３０より低い音はマスキングされる。マスキングレベル３０は、周波数成分２０の周波数と頂点として傘状に他の周波数に広がる。つまり周波数成分２０に近い周波数の音は、比較的大きい音でもマスキングされやすく、周波数が離れるほど、マスキングされにくくなる。
　周波数成分２１のマスキングレベル３１、周波数成分２２のマスキングレベル３２、周波数成分２３のマスキングレベル３３も、同様の傾向になる。

　この図５の例の場合、周波数成分２２のレベルは、最小可聴限未満である。
　周波数成分２１は、周波数成分２０によるマスキングレベル３０未満であり、つまり周波数成分２０によってマスキングされてしまう。
　周波数成分２３は、領域２３Ｍの部分が周波数成分２０によりマスキングされる。
　周波数成分２０は、領域２０Ｍが最小可聴限未満である。
　つまり、図中で黒塗りとした領域２０Ｍ、２３Ｍ、及び周波数成分２１，２２の全体は、マスキングされるか最小可聴限未満である音声成分であり、この部分には精度の高い情報は必要ないと考えることが可能である。

　これらのように、発生している音のマスキングの状態を判定すると、量子化精度が要求されない領域が判定できる。従って、判定部４が、マスキング状態の判定に基づいて、コンテンツ音データＣＴにおいて量子化ビット数の削減を行うチャネルと帯域の情報をホスト機器１００に送信すると、ホスト機器１００側でコンテンツ音データＣＴの量子化処理を制御し、伝送ビットレートを削減できる。

　以下、図５と同様に各種の場合を示していく。
　図６は、図５にノイズが加わったときの状態を示している。例えば図５のような周波数成分２０，２１，２２，２３を持つコンテンツ音を聴取している環境に、単一周波数のノイズ２４が加わった場合とする。
　この図６の場合、ノイズ２４は周波数成分２０で同時刻マスキングされるレベルを超えているため、コンテンツ音を劣化させる。
　このような場合は、ＮＣ処理を行い、同時刻マスキングされるレベル以下までノイズ２４をキャンセルすることを目指す。

　図７も、図６と同じく図５のような周波数成分２０，２１，２２，２３を持つコンテンツ音を聴取している環境に、単一周波数のノイズ２４が加わった場合である。但しこの図７の場合、ノイズ２４がそもそもコンテンツ音の周波数成分２０によるマスキングレベル３０以下である。このような場合は、ＮＣ処理を行う必要がない。

　図８の例は、ノイズ２４についてＮＣ処理による消し残りが、コンテンツ音の同時刻マスキングを受けるマスキングレベル３０を超えているときの例である。
　ノイズ２４、すなわちこの場合はＮＣ処理の消し残りノイズによって、コンテンツ音の下位ビットの精度が劣化してしまう。すなわち周波数成分２０，２１，２２，２３におけるノイズ２４によるマスキングレベル３４以下の領域で示す部分である。
　この領域の量子化誤差は、ＮＣ処理の消し残りノイズ２４に埋もれるので、伝送ビットレートの削減対象となる。

　図９の例は、ＮＣ処理の消し残りノイズ２４がコンテンツ音のレベルより大きい場合である。周波数成分２０，２１，２２，２３における、ノイズ２４によるマスキングレベル３４以下の領域で示す部分はノイズ２４に埋もれる。つまり図８の場合よりも、ビットレート削減の対象とする量子化誤差の許容範囲が広がることになる。

　次に空間マスキングについて説明する。
　図１０は空間マスキングの実験結果を示している。
　ユーザ（聴取者）から見て、正面方向を０度とする。マスカーが０度方向に位置して、マスキーを３０度ごと移動させた実験結果を示したものを図１０に示している。
　カーブ４１として示すように、マスキーが聞こえなくなる（マスキングされる）音量が、角度によって差が生じる傾向があることがわかる。
　９０度の位置では、０度（マスカーとマスキー方向が同一）と比較すると、マスカーが約６．４ｄＢ大きくないとマスキングできないことがわかり、角度差があるとマスキングされにくい結果が得られている。

　本実施の形態では、以上、ドライバの位置とＮＣ効果、最小可聴限と同時刻マスキング、空間マスキングという３つの現象・効果を利用する。
　第１ケースから第４ケースとして説明する。

　なお図１１から図２６の各図では、コンテンツ音ＡＣ、ノイズＡＮ、消し残りノイズＡＮ（ＮＣ）、ＮＣ音ＡＮＣを、それぞれ模式的に矢印で示している。
　各矢印は鼓膜２０１に到達する音の到来方向を示し、太さは音の大きさを示している。

　また図１１から図２６の各図では、図の見やすさを優先し、ドライバ２（２Ａ、２Ｂ・・・２（Ｎ））及びマイクロホン３（３Ａ，３Ｂ・・・３（Ｍ））については符号の記載を省略する。各ドライバ２及びマイクロホン３の構成は、図２，図３と同様と理解されたい。

　［第１ケース：ノイズとコンテンツ音の到来方向が一致する場合］
　図１１は、ノイズＡＮとコンテンツ音ＡＣの到来方向が一致する場合で、ノイズＡＮがマスカーとなっている例である。
　なお、実施の形態の基本的な考え方の説明のため、コンテンツ音は１チャネル、ノイズも単一方向とし、大小関係も全帯域で同じ関係とする。

　図１２は、ノイズＡＮがコンテンツ音ＡＣをマスクしてしまうことを示している。
　ノイズＡＮがコンテンツ音ＡＣをマスクしてしまうことに対して、ＮＣ処理を行うことで、コンテンツ音ＡＣを、よりはっきりと聴取できるようになる。基本的に、ノイズ到来方向と同じ方向に位置するドライバ２を使用してＮＣ処理をすることがＮＣ効果に有効である。そこでＮＣ音ＡＮＣはノイズ到来方向に応じたドライバを選択して出力させる。図１３は、ノイズ到来方向のドライバ２からＮＣ音ＡＮＣを出力していることを示している。

　ここでＮＣ音が鼓膜に到達するノイズＡＮを完全にキャンセルできるわけではない。図１４には消し残りノイズＡＮ（ＮＣ）があることを示している。なお図１４では、あたかもドライバ２の位置からノイズＡＮがキャンセルされているように表しているが、これは図示の都合であり、実際にキャンセルされるのは鼓膜２０１の位置である。他の図の消し残りノイズＡＮ（ＮＣ）の図示についても同様である。
　消し残りノイズＡＮ（ＮＣ）について次の（Ａ）（Ｂ）のような場合が想定される。

　（Ａ）消し残りノイズＡＮ（ＮＣ）が最小可聴限及びコンテンツ信号の量子化ノイズより大きい場合、消し残りノイズが同時刻マスキング効果でコンテンツ音ＡＣの量子化下位ビットの音を埋もれさせてしまう。そこでコンテンツ音データＣＴの量子化ビットを削減する。

　（Ｂ）消し残りノイズＡＮ（ＮＣ）が知覚できなくなるまで消える場合、あるいはコンテンツ音ＡＣにマスキングされる場合、コンテンツ音データＣＴの伝送では割り当てビットを最大にする。但しコンテンツ音データＣＴ自身の周波数特性によりマスキングを考慮したビット削減は行うようにする。

　次に、同じくノイズＡＮとコンテンツ音ＡＣの到来方向が一致する場合で、コンテンツ音ＡＣがマスカーとなる場合を述べる。
　図１５は、コンテンツ音ＡＣによってノイズＡＮがマスクされることを示している。このようにコンテンツ音ＡＣのレベルが大きく、ノイズＡＮをマスクする場合、ノイズＡＮは聴取者に知覚されなくなるため、ＮＣ処理を行わなくてもよい。
　コンテンツ音データＣＴの伝送では割り当てビットを最大にすることで、ユーザに認知できる精細さを実現する。

　［第２ケース：ノイズとコンテンツ音の到来方向が異なる場合］
　図１６は、ノイズＡＮとコンテンツ音ＡＣの到来方向が異なる場合を示している。
　なお、第１ケースと同様に、コンテンツ音は１チャネル、ノイズも単一方向とし、大小関係も全帯域で同じ関係とする。

　まずノイズＡＮのレベルが大きいときを考える。
　空間マスキング効果により、コンテンツ音ＡＣとノイズＡＮがそれぞれ聴取しやすく、ノイズＡＮが目立って聞こえる。あるいは、大小差が十分大きければノイズＡＮがコンテンツ音ＡＣを完全にマスキングしてしまう。

　そのため、ノイズＡＮの到来方向・特性に適したドライバ２を使用してＮＣ音ＡＮＣを出力することで、コンテンツ信号を聴取しやすくする。例えば図１７のように、ノイズＡＮの到来方向と同方向に位置するドライバ２を使用してＮＣ音ＡＮＣを出力することが通常想定される。

　但し到来方向が異なることで、図１８に示す消し残りノイズＡＮ（ＮＣ）が聞き取りやすくなる傾向にある。つまり空間マスキングの効果により、マスキング効果が小さい傾向にあるためである。するとコンテンツ音データＣＴのビット削減によるコンテンツ音ＡＣの劣化は認識されやすい。
　そこで図５から図９で説明した同時刻マスキングに、空間マスキングを加味して判定を行う。例えば到来方向の角度差に応じて、図５から図９に示したマスキングレベル（３０，３１，３２，３３，３４）が上下にシフトするように考えればよい。

　［第３ケース：ノイズ（複数）の到来方向がコンテンツ音（複数）の到来方向に含まれる場合］
　図１９に第３ケースの一例を示す。コンテンツ音ＡＣとして、コンテンツ音ＡＣ１，ＡＣ２，ＡＣ３が各ドライバ２から出力される。またノイズＡＮとして、ノイズＡＮ１，ＡＮ２が到来している。ノイズＡＮ１とコンテンツ音ＡＣ１の到来方向は一致し、ノイズＡＮ２とコンテンツ音ＡＣ２の到来方向は一致している。

　ノイズＡＮのレベルが大きいとき、第１ケースと同様にＮＣ処理を実行する。またＮＣ処理による消し残りノイズＡＮ（ＮＣ）に応じて、コンテンツ音データＣＴの伝送ビットを決定する。

　ここでノイズＡＮ、コンテンツ音ＡＣが複数存在する場合、図２０のように、方向ごとにマスカーとマスキーの関係が異なる場合がある。
　図２０の例では、ノイズＡＮ１がコンテンツ音ＡＣ１をマスクしている。一方、コンテンツ音ＡＣ２がノイズＡＮ２をマスクしている。
　このような場合が想定されるため、各到来方向において、ノイズＡＮとコンテンツ音ＡＣのどちらがマスカーとなるかをそれぞれ判定する。

　ノイズＡＮのレベルが、コンテンツ音ＡＣより大きい場合、ノイズＡＮについてＮＣ処理を行う。例えばノイズＡＮ１がコンテンツ音ＡＣ１をマスクしている場合に、同方向のドライバ２を用いてＮＣ音ＡＮＣを出力している状態を図２１に示している。
　またそのＮＣ処理による消し残りノイズＡＮ（ＮＣ）を図２２に示している。消し残りノイズＡＮ（ＮＣ）に関しては、第１ケースで（Ａ）又は（Ｂ）として述べた処理を行えば良い。

　一方、コンテンツ音ＡＣがノイズＡＮをマスクするほどにレベルが大きい場合、ノイズＡＮについてＮＣ処理を行う必要がない。
　例えばノイズＡＮ２がコンテンツ音ＡＣ２によってマスクされていることを図２１，図２２に示している。

　また図１９のような場合、或る到来方向のノイズＡＮによって、他の到来方向のコンテンツ音ＡＣがマスクされる場合もある。例えばノイズＡＮ１がコンテンツ音ＡＣ２をマスクするほどレベルが大きい場合である。
　ノイズＡＮ１についてＮＣ処理が行われる。図２１にＮＣ音ＡＮＣをノイズＡＮ１と同方向のドライバ２から出力している様子を示し、図２２には消し残りノイズＡＮ（ＮＣ）を示している。

　このときに、消し残りのノイズＡＮ（ＮＣ）がコンテンツ音ＡＣ１，ＡＣ２，ＡＣ３をどれだけ阻害するかによって、コンテンツ音ＡＣ１，ＡＣ２，ＡＣ３のそれぞれの伝送ビット割り当てを決定する。

　［第４ケース：ノイズ（複数）の到来方向が、コンテンツ音（複数）の到来方向以外にもある場合］
　図２３に第４ケースの一例を示す。コンテンツ音ＡＣとして、コンテンツ音ＡＣ１，ＡＣ２が各ドライバ２から出力される。またノイズＡＮとして、ノイズＡＮ１，ＡＮ２，ＡＮ３が到来している。ノイズＡＮ１とコンテンツ音ＡＣ１の到来方向は一致し、ノイズＡＮ２とコンテンツ音ＡＣ２の到来方向は一致している。ノイズＡＮ３は、コンテンツ音ＡＣの到来方向以外から到来するノイズである。

　この場合も第３ケースと同様に、必要に応じてＮＣ処理を行い、発生するマスキング効果にあわせてコンテンツ音データＣＴの伝送ビットを決定する。
　図２３の例では、図２４に示すようにノイズＡＮ１がコンテンツ音ＡＣ１をマスクしている。またコンテンツ音ＡＣ２がノイズＡＮ２をマスクしている。
　従ってノイズＡＮ１，ＡＮ３についてＮＣ処理を行う。図２５にＮＣ音ＡＮＣ１をノイズＡＮ１と同方向のドライバ２から出力し、ＮＣ音ＡＮＣ３をノイズＡＮ３と同方向のドライバ２から出力している様子を示している。図２６には消し残りノイズＡＮ１（ＮＣ），ＡＮ３（ＮＣ）を示している。

　このときに、消し残りのノイズＡＮ１（ＮＣ），ＡＮ３（ＮＣ）がコンテンツ音ＡＣ１，ＡＣ２，ＡＣ３をどれだけ阻害するかによって、コンテンツ音ＡＣ１，ＡＣ２，ＡＣ３のそれぞれの伝送ビット割り当てを決定する。

　図１の判定部４（マスキング判定部４ａ及び音響処理制御部４ｂ）は、以上の第１ケースから第４ケースのように、ノイズＡＮの特性と到来方向、コンテンツ音ＡＣの特性とドライバ２の位置の関係から、ＮＣ信号生成部６におけるＮＣ処理の制御を行う。すなわちノイズＡＮの特性毎に、ＮＣ処理を行うか否かの制御を行う。また判定部４は、最小可聴限及びマスキング効果によってコンテンツ音データＣＴの伝送にどれだけの量子化ビットを割り当てれば十分かを判定して、ホスト機器１００に要求を伝える処理を行う。

　この判定部４の処理例を図２７，図２８に示す。
　なお図２７，図２８において「ＣＮ１」「ＣＮ２」はフローチャートの接続を示す。

　ヘッドホン１がコンテンツ音データＣＴを受信してコンテンツ音ＡＣをドライバ２から出力している期間、判定部４は図２７、図２８の処理を繰り返す。ステップＳ１０１は、その繰り返しのループの終了判定である。例えば電源オフ、動作モード変更などにより、図２７，図２８の処理が終了される。

　ループ処理の実行中は、判定部４はステップＳ１０２で、マイクロホン３で得られる周囲音、すなわちノイズＡＮについて周波数特性や到来方向を解析する。
　また判定部４はステップＳ１０３で、コンテンツ音データＣＴの周波数特性を解析する。なお判定部４は、ユーザにとってのコンテンツ音ＡＣの到来方向、つまりどの成分の音がどのドライバ２から出力されるかは、コンテンツ音データＣＴのチャネル番号で判定できる。

　ステップＳ１１０では、ステップＳ１１１からステップＳ１１８までの処理のループが継続か終了かを判定する。
　ステップＳ１１１からステップＳ１１８までの処理は、到来方向毎について行う。例えばドライバ２のチャネル数に合わせて、第１の方向から第Ｎの方向までのそれぞれについてステップＳ１１１からステップＳ１１８までの処理を行う。全ての到来方向においてこれらの処理を終えたらループ終了となる。

　ステップＳ１１１で判定部４は、或る１つの方向からのノイズＡＮと最小可聴限とを比較する。ノイズＡＮのレベルはヘッドホン１の筐体によって遮蔽される分も加味する。
　（ノイズＡＮ）＜（最小可聴限）の場合、つまりノイズＡＮを構成する周波数成分の全てが最小可聴限未満であれば、判定部４はステップＳ１１５に進み、当該ノイズＡＮについてＮＣ処理の必要はないと設定する。
　そして判定部４はステップＳ１１６で、現在の処理対象の到来方向のノイズについて不可聴フラグをオンに設定する。

　（ノイズＡＮ）＜（最小可聴限）ではない場合、判定部４はステップＳ１１２に進み、当該到来方向からのコンテンツ音ＡＣが存在するか否かを判定する。
　コンテンツ音ＡＣが存在しなければ、判定部４はステップＳ１１７に進み、ＮＣ処理オンを設定する。またＮＣ音ＡＮＣを出力するドライバ２を設定する。
　そして判定部４はステップＳ１１８で、現在の処理対象の到来方向のノイズについて不可聴フラグをオフに設定する。

　ステップＳ１１２で当該到来方向からのコンテンツ音ＡＣが存在すると判定した場合は、判定部４はステップＳ１１３でノイズＡＮと、コンテンツ音データＣＴに基づいて出力されるコンテンツ音ＡＣのレベルを比較する。
　ノイズＡＮのレベルがコンテンツ音ＡＣより大きいと判定した場合、判定部４は上述のステップＳ１１７，Ｓ１１８の処理を行う。

　ノイズＡＮのレベルがコンテンツ音ＡＣ以下と判定した場合、判定部４はステップＳ１１４でコンテンツ音ＡＣが同時刻マスキングによりノイズをマスクするか否かを判定する。コンテンツ音ＡＣがノイズＡＮをマスクするのでなければ判定部４は上述のステップＳ１１７，Ｓ１１８の処理を行う。
　コンテンツ音ＡＣがノイズＡＮをマスクするのであれば判定部４は上述のステップＳ１１５，Ｓ１１６の処理を行う。

　以上の処理を各到来方向について実行されることで、到来方向毎にＮＣ処理の設定が決定される。つまりＮＣ処理が必要な方向について不可聴フラグがオフ、ＮＣ処理が不要な方向について不可聴フラグがオンと設定される。
　そして判定部４はステップＳ１１０でループ終了として図２８のステップＳ１２０に進む。

　ステップＳ１２０では、ステップＳ１２１からステップＳ１２５までの処理のループが継続か終了かを判定する。このステップＳ１２１からステップＳ１２５までの処理も到来方向毎について行う。

　ステップＳ１２１で判定部４は、処理対象とした１つの到来方向について、不可聴フラグを確認する。不可聴フラグがオン、すなわちＮＣ処理不要と設定されていれば、その到来方向についてはステップＳ１２０に戻り、次の到来方向の処理に移る。

　ステップＳ１２１で不可聴フラグがオフであれば、判定部４はステップＳ１２２に進み、ＮＣ処理の消し残りノイズＡＮ（ＮＣ）の周波数特性及びレベルを推定する。
　そしてステップＳ１２３で消し残りノイズＡＮ（ＮＣ）と最小可聴限とを比較する。

　（消し残りノイズＡＮ（ＮＣ））＜（最小可聴限）の場合、つまり消し残りノイズＡＮ（ＮＣ）を構成する周波数成分の全てが最小可聴限未満であれば、判定部４はステップＳ１２５に進み、当該消し残りノイズＡＮ（ＮＣ）について不可聴フラグをオンに設定する。

　（消し残りノイズＡＮ（ＮＣ））＜（最小可聴限）ではない場合は、判定部４はステップＳ１２４に進み、同時刻マスキングによりコンテンツ音ＡＣが当該消し残りノイズＡＮ（ＮＣ）をマスクするか否かを判定する。
　マスクする場合は、判定部４はステップＳ１２５に進み、当該消し残りノイズＡＮ（ＮＣ）について不可聴フラグをオンに設定する。
　当該消し残りノイズＡＮ（ＮＣ）がマスクされないと判定した場合は、そのまま不可聴フラグ＝オフを維持したまま、ステップＳ１２０に戻る。

　以上のステップＳ１２１からステップＳ１２５までの処理を到来方向毎に行うことで、各方向について消し残りノイズＡＮ（ＮＣ）を推定し、消し残りノイズＡＮ（ＮＣ）が最小可聴限未満か、或いはコンテンツ音ＡＣにマスクされるものである場合に、その到来方向について不可聴フラグがオンに変更される。

　以上のループ処理を終えたら、判定部４はステップＳ１２０からステップＳ１３０に進む。
　ステップＳ１３０で判定部は、全ての到来方向において不可聴フラグがオンであるか否かを確認する。

　全ての到来方向において不可聴フラグがオンであれば、判定部４はステップＳ１３７において、コンテンツ音データＣＴの全チャネルの必要量子化ビットを決定する。この場合は、精度の高いコンテンツ音データＣＴが要求されるため量子化ビット数として最大割当を要求することになる。

　ステップＳ１３０で不可聴フラグがオフの到来方向の存在を確認した場合、判定部４はステップＳ１３１に進み、不可聴フラグがオフの到来方向のそれぞれについて、ステップＳ１３２の処理を行う。ステップＳ１３２で判定部４は、当該方向が他の方向に与える空間マスキングの効果を算出する。これにより不可聴フラグがオフである１又は複数の到来方向について、他の方向に与える空間マスキングの効果が求められる。

　ステップＳ１３３で判定部４は到来方向毎のループの継続／終了を判定する。すなわちステップＳ１３４からステップＳ１３６の処理を到来方向毎に行う。
　判定部４はステップＳ１３４で、処理対象としている到来方向について、影響を受ける空間マスキングの有無を判定する。

　処理対象としている到来方向が空間マスキングの影響を受けない場合、判定部４はステップＳ１３５に進み、当該方向のコンテンツ音データＣＴの必要量子化ビットを決定する。この場合は、精度の高いコンテンツ音データＣＴが要求されるため量子化ビット数として最大割当を要求することになる。

　処理対象としている到来方向が空間マスキングの影響を受ける場合、判定部４はステップＳ１３６に進み、当該方向のコンテンツ音データＣＴの必要量子化ビットを決定する。この場合は、マスキングによって精度の高い情報が必要ない領域があるため、量子化ビット数の削減を要求することになる。

　以上のステップＳ１３３からのループで、各到来方向について、ステップＳ１３５又はステップＳ１３６のいずれかで量子化ビット数の設定が行われる。

　ステップＳ１３５，Ｓ１３６、又はステップＳ１３７で各方向について量子化ビット数の設定が行われる。ループ処理の対象とする各方向を各チャネルに対応させることで、各チャネルについての量子化ビット数の設定が行われたことになる。
　ステップＳ１４０で判定部４は、ホスト機器に通知情報ＳＳを送信する。この場合、通知情報ＳＳにはチャネル毎の必要量子化ビット数の情報を含むことになる。

　ステップＳ１４０で通知情報ＳＳの送信を行ったら、判定部４は図２７のステップＳ１０１に戻る。そして以上の処理を繰り返す。

　以上、第１の実施の形態では、判定部４が図２７，図２８の処理を行うことにより、状況に応じてコンテンツ音データの伝送ビットを削減し、伝送ビットレート低減を実現することができる。
　またヘッドホン１におけるどのドライバ２を使用してノイズＡＮをキャンセルするべきか、あるいはどのドライバ２でのＮＣ処理が不要か、を割り出して、逐次設定を変更することで、より快適なコンテンツ音ＡＣのＳ／Ｎ、音の分離感、ＮＣ効果の向上を実現することができる。

＜２．第２の実施の形態＞
　第２の実施の形態では、主に周囲音をユーザに認知させる処理を行うことを説明する。ここまでの第１の実施の形態では、周囲音をノイズＡＮとしてとらえて、必要な処理を行うものとしたが、第２の実施の形態では、ユーザに認知させたい周囲音を対象として必要な処理を行う。

　そのような周囲音の具体例としては、例えば次のようなものがある。
・後方や側方から近づく自動車などの音
・自分（ヘッドホン１を装着しているユーザ）の部屋に近づいてくる音（足音等）
・アナウンス（公共交通機関や各種公共施設のアナウンス等）
・アラート，サイレン（緊急車両の音、緊急地震速報等）
・自分(ヘッドホン１を装着しているユーザ）を呼ぶ声

　図２９にヘッドホン１の構成例を示す。但し図１と同一部分は同一符号を付し重複説明を避ける。図１と異なるのは、周囲音信号処理部８が設けられていることである。
　周囲音信号処理部８は、マイクロホン３で得られた周囲音データＳ１について、判定部４の音響処理制御部４ｂの制御に基づいた処理を行う。例えば周囲音データＳ１についてノイズリダクション処理や音声強調処理などを行って、処理後の音データＳ３を出力する。或いは周囲音信号処理部８は、ビープ音やアナウンス音声等の音データＳ３の生成処理を行う場合もある。

　周囲音信号処理部８で信号処理或いは生成された音データＳ３は出力信号生成部７に供給される。出力信号生成部７は、コンテンツ音データＣＴ、ＮＣ音データＳ２と共に、音データＳ３に基づいて、指定されたチャネルに応じてドライバ２への出力信号を生成する。

　周囲音種別判定部５は、マイクロホン３で得られる周囲音データについて、音の種別を判定する処理を行う。例えば接近してくる自動車の音、足音、電車等のアナウンス音など具体的な音の種別を判定する。なお、種別判定は、必ずしも具体的な音の判定が行わず、ノイズとして扱う音であるか否かの判定でもよい。

　判定部４は周囲音データＳ１及び周囲音データＳ１の種別情報を入力し、マスキング判定部４ａ、音響処理制御部４ｂの処理を行う。
　マスキング判定部４ａは第１の実施の形態と同様に、周囲音データＳ１とコンテンツ音データＣＴの関係におけるマスキング状態の判定を行う。
　この場合、種別情報により必要とされる周囲音がコンテンツ音ＡＣにマスクされてしまうか否かも判定される。

　音響処理制御部４ｂは、マスキング判定部４ａによるマスキング状態の判定結果に応じて音響処理に関する制御を行う。
　例えば音響処理制御部４ｂは、マスキング状態に応じてＮＣ信号生成部６に制御信号を出力し、ＮＣ動作の制御を行う。ＮＣ動作の制御とは、ＮＣ処理のオン／オフや、ＮＣ信号を出力するドライバ２の選択制御などである。

　また音響処理制御部４ｂは、周囲音データＳ１の音の種別と、マスキング状態の判定結果に応じて、周囲音を認知させる音がドライバ２から出力されるようにする制御を行う
　この場合、音響処理制御部４ｂは、周囲音の到来方向に応じて、周囲音を認知させる音を出力するドライバ２のチャネルを選択する。

　また音響処理制御部４ｂは、周囲音を認知させる音として、マイクロホン３で得られた周囲音に基づく音、すなわち周囲音データＳ１を信号処理した音がドライバ２から出力されるように周囲音信号処理部８を制御する。
　或いは音響処理制御部４ｂは、周囲音を認知させる生成音がドライバ２から出力されるように周囲音信号処理部８を制御する。

　また音響処理制御部４ｂは、例えばマスキング状態の判定結果に応じて、通知情報ＳＳを外部機器であるホスト機器１００に送信する処理を行う。
　この第２の実施の形態の場合、音響処理制御部４ｂは通知情報ＳＳとして、周囲音を認知させる表示に用いる情報を送信する。周囲音を認知させる表示に用いる情報としては、周囲音の到来方向の情報、周囲音の種別の情報、マスキング状態の判定結果の情報の一部或いは全部が含まれることがある。

　このような第２の実施の形態では、次のような処理が行われる。
　周囲音の中には、上述の例のようにユーザが認知すべき音がある。そこで周囲音種別判定部５が音の種別を判定する。

　判定部４（マスキング判定部４ａ）は周囲音データＳ１について、種別情報により、ユーザに認知させるべき音か否かを判定し、認知させるべき音であったら、その音がコンテンツ音ＡＣによってマスキングされる状態を判定する。ＮＣ処理によりキャンセルされてしまうか否かも判定する。

　必要な周囲音がマスキングされたりノイズとしてキャンセルされたりする場合は、そのままではユーザが認知できないため、判定部４（音響処理制御部４ｂ）は、その周囲音を認知させるための処理を行う。

　周囲音を認知させるための処理として、音出力を行う処理がある。
　例えば判定部４は周囲音信号処理部８に周囲音データＳ１についてノイズリダクション処理や音声強調処理など、聴取しやすいようにする処理を実行させ、その処理後の音データＳ３による音をドライバ２から出力させる。この場合、判定部４は周囲音の到来方向に基づいて出力するドライバ２を指示することが考えられる。
　これによりユーザは、コンテンツ音ＡＣの聴取時に、実際の当該周囲音の到来方向から、その周囲音自体を聴くことができる。

　音出力を行う手法としては、周囲音自体ではなく、ビープ音等のアラートを示す音や、メッセージ音を出力するようにしてもよい。
　例えば判定部４は周囲音信号処理部８に、音データ生成処理を実行させ、生成された音データＳ３による音、例えばビープ音やメッセージ音等をドライバ２から出力させる。

　これによりユーザは、コンテンツ音ＡＣの聴取時に、何らかの必要な周囲音が生じていることを認知できる。
　この場合も、判定部４は周囲音の到来方向に基づいて出力するドライバ２を指示することが考えられる。これによりユーザはビープ音等の到来方向から、必要な周囲音が到来していることを認識できる。
　ビープ音は、周囲音の存在のみを通知すればよいようなケースでは好適である。

　なお、例えば周囲音自体、ビープ音、メッセージ音を出力するドライバ２は、コンテンツ音ＡＣによる空間マスキングの影響のないチャネルのドライバを選択するという考え方もある。これにより、必要な周囲音の認知性を向上させることができる。

　また周囲音自体を出力することでユーザはどのような音かを認識できるが、ビープ音やメッセージ音では、音の種別を認識できないことがある。そこで、種別や緊急性に応じて、メッセージ内容を変更したり、ビープ音の音質、音量を変更したりしてもよい。これにより注意喚起性を高めたり、周囲音の種別を認知させたりすることができる。
　メッセージ音の例としては、「後方より、車が近づいています」「部屋に誰かが近づいています」等、具体的な内容を含むようにしてもよい。

　またＧＰＳ位置情報と組み合わせ、歩いている（あるいは走っている）道の大きさや車通りから、判定基準を変え、判定に応じて通知を行うようにしてもよい。

　周囲音の認知のためには、以上のようなヘッドホン１での音出力による通知に代えて、或いは音出力とともに、ホスト機器１００での表示を用いた通知を行うようにしてもよい。すなわち判定部４は、スマートフォンやＨＭＤなどのホスト機器１００に判定結果を伝えて、ホスト機器１００側でユーザに通知するようにする。

　ゲームコンテンツや動画コンテンツなどを視聴している場合、ユーザはホスト機器の画面を注視しているため、画面においてメッセージ表示等で周囲音を通知することは好適である。

　例えば図３０は、ホスト機器１００の画面６０上にメッセージ６１を表示させている例を示している。
　このようなメッセージ６１は周囲音の到来方向に応じて表示位置を変更してもよい。例えば「車が近づいています」というメッセージ６１は、後方から近づいているのであれば図３０のように画面下部、前方からであれば画面上部や中央、左方からであれば画面左側、右方からであれば画面右側などとして、表示位置を制御してもよい。

　図３１，図３２のように、画面６０にエフェクト画像６２を出現させる手法もある。この場合も周囲音の到来方向に応じて出現させることが考えられる。図３１は左方からの音の場合、図３２は前方からの音の場合である。
　エフェクト画像６２のサイズにより、周囲音の大きさを表現してもよい。

　これらの表示による通知によって、動画視聴やＶＲ（Virtual Reality）等のゲームのプレイ中などに、周囲音に対応できる。例えば自分の部屋に近づいてくる足音がマスキングされて聞き取ることができないようなときに、この処理が行われることで、ゲームをプレイしているユーザは、その通知をもとにゲームを中断するなど適切な対応をとることができる。

　なお、以上のように表示で通知することに加えて、ホスト機器１００側或いはヘッドホン１側で振動等により、通知をおこなってもよい。また表示による通知と、上述のようなヘッドホン１における音による通知とを併用してもよい。

　図３３，図３４，図３５は、画面表示により、より詳細な周囲音の状況を通知する例である。
　各図においては空間座標５０として、ユーザの頭部を中心とした空間のイメージが表示される。この空間座標５０を基準として音の到来方向に応じて位置に、コンテンツ音画像５１、周囲音種別画像５５，５７、エフェクト画像５６，５８が表示される。

　コンテンツ音画像５１は、コンテンツ音ＡＣについて種別や、マスキング範囲を示す画像とされる。図３３Ａの場合、ユーザの左側にバイオリン等の楽器の音が定位している状態であるとともに、その楽器の音によって他の音がマスクされる範囲が円状に示されている。

　周囲音種別画像５５，５７は周囲音の種別を示す画像で、例えば車の画像や、足音を示す足跡の画像などを例示している。エフェクト画像５６，５８は周囲音を示す。
　周囲音種別画像５５，５７やエフェクト画像５６，５８のサイズにより、周囲音においてマスクされる量が示される。また周囲音種別画像５５，５７やエフェクト画像５６，５８の表示位置により、周囲音の到来方向が示される。

　また画面６０には、設定部５３が表示される。設定部５３は、通知機能のオン／オフをユーザが任意に設定するための操作部となる。
　例えば設定部５３には、「周囲音抽出　ＯＮ／ＯＦＦ」「自動車　ＯＮ／ＯＦＦ」「足音　ＯＮ／ＯＦＦ」という設定フィールドが用意される。

　図３３Ａは周囲音抽出がオフとされている状態である。この場合、コンテンツ音画像５１が表示されている。
　図３３Ｂは、周囲音抽出がオンとされ、周囲音の種別として自動車がオンとされた状態である。自動車がオンとされると、スライドバー５４が表示される。ユーザはスライドバー５４により抽出レベルを設定することができる。

　そして自動車の音が検知されると、図３３Ｂのようにその到来方向や、マスクされる量に応じて周囲音種別画像５５やエフェクト画像５６が表示される。この場合、自動車の音がコンテンツ音と同方向であり、ある程度の量がマスキングされていることが示される。

　図３４Ａは、コンテンツ音が移動した場合を示している。例えばコンテンツ音データＣＴの元々の内容として定位が変化する場合、ユーザが操作により楽器の定位を変更させた場合が考えられる。
　或いは判定部４がホスト機器１００に要求して、自動的に楽器の定位を変更させることも考えられる。例えば判定部４は、自動車の音がマスキングされていることに応じて、コンテンツ音の定位変更をホスト機器１００に要求する。これによりホスト機器１００側でコンテンツ音データＣＴのチャネル変更が行われ、定位が変化される。
　図３４Ａのように定位が変化されると、空間マスキング効果によりマスクされる量が減少するため、ユーザは車の音を聞きやすくなる。マスクされる量が減少した分、図３４Ｂのように周囲音種別画像５５やエフェクト画像５６のサイズが小さくされる。

　図３５Ａは設定部５３で足音を抽出対象とした場合である。この場合も足音オンとすることでスライドバー５９が表示され、ユーザはスライドバー５９により足音の抽出レベルを設定することができる。
　図３５Ｂは右側から到来する足音が検知された場合である。これに応じて右側に足音の周囲音種別画像５７とエフェクト画像５８が表示される。この例では、コンテンツ音により足音がある程度マスキングされている状態が示されている。

　この図３３から図３５のような表示を行うことで、ユーザは、より詳細に周囲音や、そのマスキング状態を認識できるようになる。

　以上は立体音響コンテンツを想定しているが、例えばゲームなどでは音源の位置は自動的に移動する。これにリアルタイムに追従して、マスキング効果を解析し、ＮＣ処理とコンテンツ音データＣＴの伝送ビットレート設定を適切に行う。
　ホスト機器１００としてのＨＭＤとヘッドホン１の組み合わせであれば、ユーザの視覚と聴覚の方向が一致するため、親和性が高い。ユーザが頭部の向きを変えると、自然と同時にヘッドホン１（マイクロホン３）の位置も変わるため、ユーザから見た周囲音源の移動は、マイクロホン３からの信号の変化でリアルタイムに対応できる。

　図３３から図３５では立体音響コンテンツが存在する場合のイメージを示したが、立体音響ではないコンテンツ、あるいはコンテンツがない無音状態において、図３３から図３５のような表示を行ってもよい。

　ここまで第２の実施の形態として、音声や表示により、必要な周囲音を通知する例を述べてきた。このような動作を実現する判定部４の処理例を図３６に示す。

　ヘッドホン１がコンテンツ音データＣＴを受信してコンテンツ音ＡＣをドライバ２から出力している期間、判定部４は図３６の処理を繰り返す。ステップＳ２０１は、その繰り返しのループの終了判定である。例えば電源オフ、動作モード変更などにより、図３６の処理が終了される。

　ループ期間において、判定部４はステップＳ２０２で、マイクロホン３で得られる周囲音、すなわちノイズＡＮについて周波数特性や到来方向を解析する。また周囲音種別判定部５からの種別情報により、音の種別を判定する。

　判定部４はステップＳ２０３で、コンテンツ音データＣＴの周波数特性を解析する。なおコンテンツ音ＡＣの到来方向は、コンテンツ音データＣＴのチャネル番号で判定できる。

　判定部４はステップＳ２０４で、周囲音のうちでユーザが認知すべき音の有無を判定する。周囲音の種別判定結果として、自動車の音、足音、アナウンス、アラート等の音が存在した場合は、その認知すべき音が存在するとして、その周波数特性、到来方向を判定する。

　ステップＳ２０５で判定部４は、マスキング状態の判定及びＮＣ処理の実行有無の判定を行う。
　第１の実施の形態と同様に判定部４は、周囲音とコンテンツ音の関係で、マスキング状態を判定する。そしてそれに応じてＮＣ処理のオン／オフを判定する。

　また判定部４は、周囲音にユーザが認知すべき音が存在するか否かによってもＮＣ処理のオン／オフを判定する。
　例えば判定部４は、周囲音にユーザが認知すべき音が含まれていない場合は、周囲音に対して通常のＮＣ処理を実行すると判定する。
　周囲音にユーザが認知すべき音が含まれている場合は、少なくとも該当の音以外の周波数成分に対してＮＣ処理を実行し、認知すべき音についてはＮＣ処理が行われないと判定する。なお、この場合、通常のＮＣ処理を行うとする判定でもよい。例えばビープ音やメッセージ音を生成する場合は、周囲音に対するＮＣ処理は常に通常に実行してもよい。
　周囲音が、ユーザが認知すべき音のみである場合（或いは認知すべき音が支配的である場合）は、ＮＣ処理を実行しないと判定する。なおこの場合も上記のように通常のＮＣ処理を行うとする判定でもよい。

　ステップＳ２０６で判定部４は、ステップＳ２０５の判定結果によりＮＣ信号生成部６を制御する。例えばＮＣ処理のオン／オフを指示する。特定の周波数成分のみＮＣ処理を無効化するような制御を行う場合もある。判定部４は、ＮＣ音を出力するドライバ２のチャネルも指示する。

　ステップＳ２０７で判定部４は、ホスト機器１００の表示によりユーザに通知を行う場合であるか否かにより処理を分岐する。例えば周囲音に、ユーザが認知すべき音が含まれており、表示による通知がオンに設定されているような場合は、ステップＳ２２０に進み、ホスト機器１００へ通知情報ＳＳを送信する。この通知情報ＳＳには、周囲音の種別、到来方向、マスキングされるレベルの情報が含まれることで、ホスト機器１００において図３０から図３５で説明したような表示が可能となる。

　ステップＳ２０８で判定部４は、音声による通知を行う場合であるか否かにより処理を分岐する。例えば周囲音にユーザが認知すべき音が含まれていた場合、判定部４はステップＳ２１０に進み、どのような通知オンとするかで処理を分岐する。

　周囲音自体を出力する場合は、判定部４はステップＳ２１１に進み、周囲音信号処理部８に、周囲音データＳ１についてノイズリダクション処理や音声強調処理等を実行するように指示する。また到来方向に応じて出力するドライバ２のチャネルも指示する。

　通知音を生成する場合は、判定部４はステップＳ２１２に進み、周囲音信号処理部８に、ビープ音やメッセージ音の生成を指示する。また到来方向に応じて出力するドライバ２のチャネルも指示する。

　例えば以上の図３６の処理が繰り返されることで、上述した音声や表示で周囲音の通知を行う動作が実現される。

＜３．まとめ及び変型例＞
　以上の第１，第２の実施の形態によれば次のような効果が得られる。

　実施の形態の信号処理装置は、マスキング判定部４ａと音響処理制御部４ｂを備える判定部４の機能を有するプロセッサ等として実現される。また実施の形態の音響出力装置は、このような判定部４を備えるヘッドホン１として実現される。
　これらにおいてマスキング判定部４ａは、ヘッドホン１に配置された複数のドライバ２から出力する複数チャネルのコンテンツ音データＣＴと、ヘッドホン１に配置され周囲音を集音する複数のマイクロホン３で得られた周囲音データＳ１と、周囲音の到来方向の情報とを用いて、コンテンツ音と周囲音のマスキング状態を判定する。
　音響処理制御部４ｂは、マスキング判定部４ａによるマスキング状態の判定結果に応じて音響処理に関する制御を行う。
　これにより、例えばコンテンツ音ＡＣが周囲音（ノイズＡＮ）にマスキングされる場合や、必要な周囲音がコンテンツ音にマスキングされる場合などに、それぞれ適した音響処理に関する制御を実行できる。特に周囲音のレベルと到来方向、及びコンテンツ音のチャネル（どの出力位置から出力するかの情報）と各チャネルのレベルも加味してマスキング状態を判定することで、いわゆるマルチマイク・マルチドライバのヘッドホンにおけるマスキングの状況をより適切に判定できる。
　従って３Ｄオーディオなどの立体音響コンテンツの再生時に、精度の高いマスキング状況判定に応じた適切な音響処理の制御が可能になる。例えばユーザが必要な周囲音を認知できるようにすることや、適切なＮＣ処理により快適なコンテンツ音の聴取ができるようにすることや、システム処理の負荷を軽減することなどが可能になる。

　第２の実施の形態では、周囲音データＳ１の音の種別と、マスキング状態の判定結果に応じて、周囲音を認知させる音がドライバ２から出力されるようにする制御を行う例を述べた（図３６参照）。
　例えば立体音響コンテンツを楽しんでいるユーザにとって、周囲音は全てノイズというわけではない。例えば安全上或いは生活上で必要な音も存在する。そこで、周囲音の種別に応じて、必要であると判定した場合は、その周囲音がドライバ２から出力されるようにし、ユーザに認知させる。これにより周囲音も適切に聞こえる状態で立体音響を楽しむことができるようになる。

　第２の実施の形態では、周囲音の到来方向に応じて、周囲音を認知させる音を出力するドライバ２を決定する例を挙げた。
　このようにドライバ２を決定（つまりチャネルを決定）することで、ユーザには決定されたチャネルに応じた方向から音の到来が認知される。従って、周囲音自体や、周囲音に代わる通知音やメッセージ音声を聞くと共に、実際の周囲音の到来方向も認知できるようになる。
　周囲音の到来方向については、ヘッドホン１のマイクロホン３で集音される周囲音データＳ１を常時解析することで、ユーザ自身の動作、移動にリアルタイムに追従できる。

　第２の実施の形態では、周囲音を認知させる音として、マイクロホン３で得られた周囲音データＳ１を信号処理した音がドライバ２から出力されるようにする制御を行う例を挙げた（図３６のステップＳ２１１）。
　これにより必要な周囲音がマスキングによって聞こえなくなるということがなくなり、ユーザはヘッドホン１により立体音響を聴いていても実際の周囲音を認知できる。

　第２の実施の形態では、周囲音を認知させる生成音がドライバ２から出力されるようにする制御を行う例も述べた（図３６のステップＳ２１２）。
　例えばビープ音、メッセージ音声等、何らかの注意、警告、告知を意味する音を生成して出力する。これにより必要な周囲音がコンテンツ音によるマスキングやノイズキャンセル処理により聞こえなくなっても、ユーザは周囲の状況（必要な周囲音が発生している状況）を認知できるようになる。

　第２の実施の形態では、判定部４（音響処理制御部４ｂ）は、周囲音データＳ１の音の種別とマスキング状態の判定結果に応じて、周囲音を認知させる表示に用いる通知情報ＳＳをホスト機器１００に送信する処理を行う例を挙げた（図３６のステップＳ２２０）。
　例えばユーザにとって必要と判定される周囲音が検知された場合は、ホスト機器１００に対して、周囲音を認知させる表示に用いる情報を送信する。これにより図３０から図３５で説明したような、周囲音を認知させる表示をホスト機器１００において実行させる。画像を伴う立体音響コンテンツを視聴している場合、ユーザは画面も注視しているため、表示による必要な周囲音の通知も有効である。

　第２の実施の形態では、周囲音を認知させる表示に用いる通知情報ＳＳに、周囲音の到来方向の情報を含む例を挙げた。
　これによりホスト機器１００等の外部機器では、周囲音の到来方向に応じた表示を行うことができるようになる（図３０から図３５参照）。

　第２の実施の形態では、周囲音を認知させる表示に用いる通知情報ＳＳに、周囲音の種別の情報を含む例を挙げた。
　これによりホスト機器１００等の外部機器では、周囲音の種別、例えば自動車の音や足音などの別に応じた表示を行うことができるようになる（図３１から図３５参照）。

　第２の実施の形態では、周囲音を認知させる表示に用いる通知情報ＳＳに、マスキング状態の判定結果の情報を含む例を挙げた。
　これによりホスト機器１００等の外部機器では、周囲音がコンテンツ音にマスキングされている状況などを示す表示を行うことができるようになる（図３３から図３５参照）。

　第１，第２の実施の形態では、音響処理制御部４ｂは、マスキング状態の判定結果に応じて、周囲音に対するノイズキャンセル処理の制御を行う例を述べた。
　周囲音についてＮＣ処理を行うことで、立体音響コンテンツを楽しんでいるユーザにとって、周囲音を低減又は解消できる。但し、元々マスキングされている周囲音については、ＮＣ処理を行わなくてもよい。従ってマスキング判定結果に応じてＮＣ処理の制御を行うことで、ＮＣ処理を効率化できる。つまり周波数成分や到来方向によりコンテンツ音でマスキングされない周囲音についてＮＣ処理を実行させ、マスキングされている周囲音についてはＮＣ処理をオフとしてもよい。
　またさらに、音響処理制御部４ｂは、マイクロホン３で得られた周囲音データの音の種別も用いてＮＣ処理の制御を行っても良い。
　例えば周囲音が、ユーザにとって必要な音と判定した場合は、ＮＣ処理をオフとして、ユーザに聴取させるようにすることができる。

　第１，第２の実施の形態では、音響処理制御部４ｂは、マスキング状態の判定結果と、周囲音の到来方向の情報に応じて、周囲音に対するＮＣ音を出力するドライバ２（つまりチャネル）を決定する制御を行う例を述べた。
　周囲音についてＮＣ処理を行う場合に、その周囲音の到来方向に合わせてＮＣ音ＡＮＣを出力するドライバ２を決定することで、ＮＣ効果をより有効化できる。

　第１の実施の形態では、音響処理制御部４ｂは、マスキング状態の判定結果に応じて、コンテンツ音データＣＴに必要な量子化ビット情報をホスト機器１００に送信する処理を行う例を述べた。
　立体音響再生に関しては、多視点、自由視点化で、伝送ビットレートの大幅な増加に直面しており、コンテンツ音データの伝送ビットレートの低減が重要な課題の１つとなっている。ここでマスキングされる音成分の情報はそもそも伝送する必要がなくなるので、量子化ビット数を削減できる。そこでマスキング状態の判定結果に応じて、コンテンツ音データに必要な量子化ビット情報をホスト機器１００に送信する。これによりホスト機器１００側でコンテンツ音データのデータ量を削減でき、結果としてコンテンツ音データの伝送ビットレートの低減、あるいはコンテンツ信号のＳ／Ｎ向上、音の分離感の向上、ＮＣ効果の向上、さらには消費電力の削減による　ヘッドホン１の電池寿命の長時間化を実現することができる。

　第１の実施の形態でホスト機器１００に送信する量子化ビット情報は、コンテンツ音データにおいて量子化ビット数の削減を行うチャネルと帯域の情報を含むものとした。
　これによりホスト機器１００では、指定されたチャネルにおける指定された帯域の量子化ビット数削減を行うことができる。

　なお、判定部４（音響処理制御部４ｂ）は、選択的にドライバ２の電源オフ制御を行うようにすることもできる。例えばＮＣ音を出力せず、かつコンテンツ音の出力も行わないチャネルのドライバ２は、電源供給をオフにする制御である。
　常時、このように一時的に使用されないドライバ２を監視して、電源供給をオフとすることで、消費電力を削減し、ヘッドホン１の電池寿命の長時間化に貢献する。

　また実施の形態では音響出力装置の例としてヘッドホン１で説明したが、本開示の技術はインナーイヤー型、カナル型等の各種のイヤホンとしての音響出力装置においても適用できる。

　なお、本明細書に記載された効果はあくまでも例示であって限定されるものではなく、また他の効果があってもよい。

　なお本技術は以下のような構成も採ることができる。
　（１）
　音響出力装置に配置された複数の音響出力ドライバから出力する複数チャネルのコンテンツ音データと、前記音響出力装置に配置され周囲音を集音する複数のマイクロホンで得られた周囲音データと、周囲音の到来方向の情報とを用いて、コンテンツ音と周囲音のマスキング状態を判定するマスキング判定部と、
　前記マスキング判定部によるマスキング状態の判定結果に応じて音響処理に関する制御を行う音響処理制御部と、を備えた
　信号処理装置。
　（２）
　前記音響処理制御部は、前記マイクロホンで得られた周囲音データの音の種別と、マスキング状態の判定結果に応じて、周囲音を認知させる音を前記音響出力ドライバから出力させる制御を行う
　上記（１）に記載の信号処理装置。
　（３）
　前記音響処理制御部は、複数の前記音響出力ドライバのうちで、周囲音の到来方向に応じて、周囲音を認知させる音を出力する音響出力ドライバを決定する
　上記（２）に記載の信号処理装置。
　（４）
　前記音響処理制御部は、周囲音を認知させる音として、前記マイクロホンで得られた周囲音を信号処理した音が前記音響出力ドライバから出力されるようにする制御を行う
　上記（２）又は（３）に記載の信号処理装置。
　（５）
　前記音響処理制御部は、周囲音を認知させる生成音が前記音響出力ドライバから出力されるようにする制御を行う
　上記（２）又は（３）に記載の信号処理装置。
　（６）
　前記音響処理制御部は、前記マイクロホンで得られた周囲音データの音の種別と、マスキング状態の判定結果に応じて、周囲音を認知させる表示に用いる情報を外部機器に送信する処理を行う
　上記（１）から（５）のいずれかに記載の信号処理装置。
　（７）
　前記音響処理制御部は、周囲音を認知させる表示に用いる情報に、周囲音の到来方向の情報を含めて前記外部機器に送信する処理を行う
　上記（６）に記載の信号処理装置。
　（８）
　前記音響処理制御部は、周囲音を認知させる表示に用いる情報に、周囲音の種別の情報を含めて前記外部機器に送信する処理を行う
　上記（６）又は（７）に記載の信号処理装置。
　（９）
　前記音響処理制御部は、周囲音を認知させる表示に用いる情報に、マスキング状態の判定結果の情報を含めて前記外部機器に送信する処理を行う
　上記（６）から（８）のいずれかに記載の信号処理装置。
　（１０）
　前記音響処理制御部は、マスキング状態の判定結果に応じて、周囲音に対するノイズキャンセル処理の制御を行う
　上記（１）から（９）のいずれかに記載の信号処理装置。
　（１１）
　前記音響処理制御部は、複数の前記音響出力ドライバのうちで、マスキング状態の判定結果と周囲音の到来方向の情報に応じて、周囲音に対するノイズキャンセル信号を出力する音響出力ドライバを決定する制御を行う
　上記（１）から（１０）のいずれかに記載の信号処理装置。
　（１２）
　前記音響処理制御部は、マスキング状態の判定結果に応じて、コンテンツ音データに必要な量子化ビット情報を外部機器に送信する処理を行う
　上記（１）から（１１）のいずれかに記載の信号処理装置。
　（１３）
　前記外部機器に送信する量子化ビット情報は、コンテンツ音データにおいて量子化ビット数の削減を行うチャネルと帯域の情報を含む
　上記（１２）に記載の信号処理装置。
　（１４）
　複数の音響出力ドライバと、
　周囲音を集音する複数のマイクロホンと、
　前記音響出力ドライバから出力する複数チャネルのコンテンツ音データと、前記マイクロホンで得られた周囲音データと、周囲音の到来方向の情報とを用いて、コンテンツ音と周囲音のマスキング状態を判定するマスキング判定部と、
　前記マスキング判定部によるマスキング状態の判定結果に応じて音響処理に関する制御を行う音響処理制御部と、を備えた
　音響出力装置。
　（１５）
　音響出力装置に配置された複数の音響出力ドライバから出力する複数チャネルのコンテンツ音データと、前記音響出力装置に配置され周囲音を集音する複数のマイクロホンで得られた周囲音データと、周囲音の到来方向の情報とを用いて、コンテンツ音と周囲音のマスキング状態を判定するマスキング判定処理と、
　前記マスキング判定処理によるマスキング状態の判定結果に応じて音響処理に関する制御を行う音響処理制御処理と、
　を信号処理装置が実行する信号処理方法。

１　ヘッドホン
２，２Ａ・・・２（Ｎ）　音響出力ドライバ（ドライバ）
３，３Ａ・・・３（Ｍ）　マイクロホン
４　判定部
４ａ　マスキング判定部
４ｂ　音響処理制御部
５　周囲音種別判定部
６　ＮＣ信号生成部
７　出力信号生成部
８　周囲音信号処理部
１００　ホスト機器
２００　耳
２０１　鼓膜
ＡＣ　コンテンツ音
ＡＮ　ノイズ
ＡＮ（ＮＣ）　消し残りノイズ
ＡＮＣ　ＮＣ音
Ｓ１　周囲音データ
Ｓ２　ＮＣ音データ
Ｓ３　音データ
ＳＳ　通知情報
ＣＴ　コンテンツ音データ

Claims

　音響出力装置に配置された複数の音響出力ドライバから出力する複数チャネルのコンテンツ音データと、前記音響出力装置に配置され周囲音を集音する複数のマイクロホンで得られた周囲音データと、周囲音の到来方向の情報とを用いて、コンテンツ音と周囲音のマスキング状態を判定するマスキング判定部と、
　前記マスキング判定部によるマスキング状態の判定結果に応じて音響処理に関する制御を行う音響処理制御部と、を備えた
　信号処理装置。
　前記音響処理制御部は、前記マイクロホンで得られた周囲音データの音の種別と、マスキング状態の判定結果に応じて、周囲音を認知させる音を前記音響出力ドライバから出力させる制御を行う
　請求項１に記載の信号処理装置。
　前記音響処理制御部は、複数の前記音響出力ドライバのうちで、周囲音の到来方向に応じて、周囲音を認知させる音を出力する音響出力ドライバを決定する
　請求項２に記載の信号処理装置。
　前記音響処理制御部は、周囲音を認知させる音として、前記マイクロホンで得られた周囲音を信号処理した音が前記音響出力ドライバから出力されるようにする制御を行う
　請求項２に記載の信号処理装置。
　前記音響処理制御部は、周囲音を認知させる生成音が前記音響出力ドライバから出力されるようにする制御を行う
　請求項２に記載の信号処理装置。
　前記音響処理制御部は、前記マイクロホンで得られた周囲音データの音の種別と、マスキング状態の判定結果に応じて、周囲音を認知させる表示に用いる情報を外部機器に送信する処理を行う
　請求項１に記載の信号処理装置。
　前記音響処理制御部は、周囲音を認知させる表示に用いる情報に、周囲音の到来方向の情報を含めて前記外部機器に送信する処理を行う
　請求項６に記載の信号処理装置。
　前記音響処理制御部は、周囲音を認知させる表示に用いる情報に、周囲音の種別の情報を含めて前記外部機器に送信する処理を行う
　請求項６に記載の信号処理装置。
　前記音響処理制御部は、周囲音を認知させる表示に用いる情報に、マスキング状態の判定結果の情報を含めて前記外部機器に送信する処理を行う
　請求項６に記載の信号処理装置。
　前記音響処理制御部は、マスキング状態の判定結果に応じて、周囲音に対するノイズキャンセル処理の制御を行う
　請求項１に記載の信号処理装置。
　前記音響処理制御部は、複数の前記音響出力ドライバのうちで、マスキング状態の判定結果と周囲音の到来方向の情報に応じて、周囲音に対するノイズキャンセル信号を出力する音響出力ドライバを決定する制御を行う
　請求項１に記載の信号処理装置。
　前記音響処理制御部は、マスキング状態の判定結果に応じて、コンテンツ音データに必要な量子化ビット情報を外部機器に送信する処理を行う
　請求項１に記載の信号処理装置。
　前記外部機器に送信する量子化ビット情報は、コンテンツ音データにおいて量子化ビット数の削減を行うチャネルと帯域の情報を含む
　請求項１２に記載の信号処理装置。
　複数の音響出力ドライバと、
　周囲音を集音する複数のマイクロホンと、
　前記音響出力ドライバから出力する複数チャネルのコンテンツ音データと、前記マイクロホンで得られた周囲音データと、周囲音の到来方向の情報とを用いて、コンテンツ音と周囲音のマスキング状態を判定するマスキング判定部と、
　前記マスキング判定部によるマスキング状態の判定結果に応じて音響処理に関する制御を行う音響処理制御部と、を備えた
　音響出力装置。
　音響出力装置に配置された複数の音響出力ドライバから出力する複数チャネルのコンテンツ音データと、前記音響出力装置に配置され周囲音を集音する複数のマイクロホンで得られた周囲音データと、周囲音の到来方向の情報とを用いて、コンテンツ音と周囲音のマスキング状態を判定するマスキング判定処理と、
　前記マスキング判定処理によるマスキング状態の判定結果に応じて音響処理に関する制御を行う音響処理制御処理と、
　を信号処理装置が実行する信号処理方法。