WO2021161722A1

WO2021161722A1 - 情報処理装置、情報処理方法、情報処理プログラム及び情報処理システム

Info

Publication number: WO2021161722A1
Application number: PCT/JP2021/001406
Authority: WO
Inventors: 長坂　英夫
Original assignee: ソニーグループ株式会社
Priority date: 2020-02-10
Filing date: 2021-01-18
Publication date: 2021-08-19
Also published as: US20230118803A1; DE112021000974T5; CN115039419A

Abstract

情報処理装置は、取得部と、判定部と、信号処理部とを有する。取得部は、一又は複数の他の音要素を取得する。判定部は、取得部にて取得された音要素の重要度を判定する。信号処理部は、判定部にて判定された音要素の重要度に応じて、再生中のコンテンツの音要素及び他の音要素の少なくとも一つの音源位置を変更する。その結果、再生コンテンツの音要素及び他の音要素が同時に発生した場合でも、再生コンテンツの音要素と他の音要素との間の音干渉を抑制できる。

Description

情報処理装置、情報処理方法、情報処理プログラム及び情報処理システム

　本開示は、音要素の音源位置を変更可能にする機能を備えた情報処理装置等に関する。

　近年、個人のタスク又はサービスを実行するソフトウェアエージェントとしてバーチャルアシスタント等の情報処理装置が知られている。情報処理装置には、例えば、コンテンツを再生する機能、アラームを通知する機能、ＡＩ（Artificial　Intelligence）が利用者と対話するダイアログ機能等がある。情報処理装置は、利用者が装着するヘッドホン等と接続し、例えば、音楽や動画等の再生コンテンツ、アラームやダイアログ等の音信号をヘッドホンから出力する。その結果、利用者は、ヘッドホンからの音声を聞きながら各種サービスを受けることができる。

　情報処理装置は、例えば、ダイアログと、再生コンテンツとが同時に発生した場合、ヘッドホンでダイアログの音源位置と再生コンテンツの音源位置とが同じ頭内に定位させている。この場合、利用者は、ダイアログと再生コンテンツとが重なり、ダイアログと再生コンテンツとの間で音干渉が生じるため、ダイアログや再生コンテンツが聞きづらくなる。従って、情報処理装置では、ダイアログ発生中はコンテンツ再生を停止することで対処している。また、情報処理装置では、ヘッドホンを用いて音要素の音源位置を変更可能にする技術も広く知られている。

特開平１１－３３１９９２号公報特開２００２－４４７９７号公報

　しかしながら、情報処理装置では、例えば、コンテンツ再生中にダイアログ等の他の音要素が発生した場合にコンテンツ再生を停止すると、再生コンテンツの音が途切れるため、利用者に不快感を与えるおそれがある。

　そこで、このような事態に対処すべく、例えば、コンテンツ再生中に他の音要素が同時に発生した場合でも、他の音要素が聞こえてくる音源位置や再生コンテンツが聞こえてくる音源位置を変えることで、再生コンテンツと他の音要素との間の音干渉を抑制する技術が求められている。また、ヘッドホン装置として、音源位置を変えるべく、各入力音声信号による音像を頭外に定位させる技術はあるが、利用者に応じて通知すべき入力音声信号の音像定位位置を制御する技術もなく、当該技術が求められている。

　そこで、本開示では、再生コンテンツの音要素及び他の音要素が同時に発生した場合でも、再生コンテンツの音要素と他の音要素との間の音干渉を抑制できる情報処理装置等を提案する。

　上記の課題を解決するために、本開示に係る一形態の情報処理装置は、再生中のコンテンツの音要素及び、一又は複数の他の音要素を取得する取得部と、前記取得部にて取得された前記音要素の重要度を判定する判定部と、前記判定部にて判定された前記音要素の重要度に応じて、前記再生中のコンテンツの音要素又は前記他の音要素の何れか一方の音源位置を変更する信号処理部と、を有する。

本開示の実施形態１に係る情報処理システムの一例を示す図である。情報処理装置内の重要度テーブルの一例を示す図である。音源位置特定時及び音源位置設定時の再生コンテンツの音要素及びアラームの音要素の音源位置の一例を示す図である。第１の３Ｄ信号生成処理に係る情報処理装置の処理動作の一例を示すフローチャートである。実施形態２に係る情報処理システムの一例を示す図である。情報処理装置内の重要度テーブルの一例を示す図である。音源位置特定時及び音源位置設定時の再生コンテンツの音要素及び外部音（車の音）の音要素の音源位置の一例を示す図である。第２の３Ｄ信号生成処理に係る情報処理装置の処理動作の一例を示すフローチャートである。実施形態３に係る情報処理システムの一例を示す図である。情報処理装置内の重要度テーブルの一例を示す図である。音源位置特定時及び音源位置設定時の再生コンテンツの音要素及び外部音（車の音）の音要素の音源位置の一例を示す図である。音源位置特定時及び音源位置設定時の再生コンテンツの音要素、Ａさんの音要素及びＢさんの音要素の音源位置の一例を示す図である。第３の３Ｄ信号生成処理に係る情報処理装置の処理動作の一例を示すフローチャートである。情報処理装置の動作の一例を示す図である。

　以下に、本開示の実施形態について図面に基づいて詳細に説明する。なお、以下の各実施形態において、同一の部位には同一の符号を付することにより重複する説明を省略する。

　また、以下に示す項目順序に従って本開示を説明する。
　　１．はじめに
　　　１－１．情報処理システムの概要
　　２．実施形態１の情報処理システムの構成及び動作
　　　２－１．情報処理装置の構成
　　　２－２．判定部の構成
　　　２－３．信号処理部の構成
　　　２－４．重要度テーブルの構成
　　　２－５．音源位置の一例
　　　２－６．第１の３Ｄ信号生成処理
　　３．実施形態２の情報処理システムの構成及び動作
　　　３－１．情報処理装置の構成
　　　３－２．重要度テーブルの構成
　　　３－３．音源位置の一例
　　　３－４．第２の３Ｄ信号生成処理
　　４．実施形態３の情報処理システムの構成及び動作
　　　４－１．情報処理装置の構成
　　　４－２．重要度テーブルの構成
　　　４－３．音源位置の一例
　　　４－４．第３の３Ｄ信号生成処理
　　　４－５．情報処理装置の動作の一例
　　５．変形例
　　６．むすび

＜＜１．はじめに＞＞
＜１－１．情報処理システムの概要＞
　情報処理装置には、例えば、コンテンツを再生する機能、アラームを通知する機能、ＡＩが利用者と対話するダイアログ機能等がある。情報処理装置は、利用者が装着するヘッドホン等と接続し、例えば、音楽や動画等の再生コンテンツ、アラームやダイアログ等の音信号をヘッドホンから出力する。その結果、利用者は、ヘッドホンからの音声を聞きながら各種サービスを受けることができる。

　しかしながら、情報処理装置は、例えば、ヘッドホンで再生コンテンツを出力中にダイアログが発生した場合、コンテンツの再生を停止し、ダイアログのＡＩ音声を出力するため、再生コンテンツの中断によって利用者に不快感を与える場合がある。そこで、例えば、コンテンツ再生中に他の音要素が同時に発生した場合でも、他の音要素が聞こえてくる音源位置や再生コンテンツが聞こえてくる音源位置を変えることで、再生コンテンツと他の音要素との間の音干渉を抑制する技術が求められている。

　そこで、本実施形態では以下の手段によりこの問題を解決する。

　例えば、情報処理装置は、再生中のコンテンツの音要素及び、一又は複数の他の音要素を取得する取得部と、前記取得部にて取得された前記音要素の重要度を判定する判定部と、前記判定部にて判定された前記音要素の重要度に応じて、前記再生中のコンテンツの音要素又は前記他の音要素の何れか一方の音源位置を変更する信号処理部と、を有する。

　情報処理装置は、再生中のコンテンツの音要素及び、一又は複数の他の音要素の重要度に応じて、再生中のコンテンツの音要素又は他の音要素の何れか一方の音源位置を変更する。その結果、再生中のコンテンツを中断することなく、音要素の重要度に応じて各音要素の音源位置を変えることで音要素間の音干渉を抑制できる。そして、情報伝達の効率化を図ることができる。

＜＜２．実施形態１の情報処理システムの構成及び動作＞＞
　以上、本実施形態の概要を説明したが、以下、本実施形態１の情報処理システム１を詳細に説明する。

＜２－１．情報処理装置の構成＞
　図１は、本開示の実施形態１に係る情報処理システム１の一例を示す図である。図１に示す情報処理システム１は、情報処理装置２と、情報処理装置２と接続し、利用者が装着する音響出力デバイス３とを有する。音響出力デバイス３は、例えばヘッドホン、ワイヤレスヘッドホン、ワイヤレスイヤホン、ネックバンド型イヤホン、スピーカ、車載スピーカ等である。情報処理装置２は、例えば、音要素毎の音源位置を変更した３Ｄ音信号を生成し、生成した３Ｄ音信号を利用者の音響出力デバイス３に出力する。利用者は、音響出力デバイス３の３Ｄ音信号の音響出力で各音要素の音を受聴できる。情報処理装置２は、システム音取得部１１と、外部音取得部１１Ａと、判定部１２と、信号処理部１３とを有する。システム音取得部１１は、再生中のコンテンツの音要素及び、一又は複数の他の音要素を取得する。音要素は、例えば、情報処理装置２が発するシステム音の音要素である。尚、システム音の音要素は、例えば、音楽や動画等の再生コンテンツ等の音要素、アラーム等の音要素、電話の音の音要素、利用者と対話するＡＩ音声等のダイアログの音要素等である。外部音取得部１１Ａは、図示せぬマイクを使用して車の音等の外部音の音要素を取得する。

＜２－２．判定部の構成＞
　判定部１２は、システム音取得部１１にて取得された音要素の重要度を判定する。音要素の重要度は、音要素の重要度合を順位付けた情報である。信号処理部１３は、音要素の重要度に応じて、再生中のコンテンツの音要素又は他の音要素の何れか一方の音像の音響出力デバイス３内での音源位置を変更する。また、信号処理部１３は音源の位置ではなく、音源の方向を制御するようにしても良いし、方向推定のみを行っても良い。さらに、オブジェクトオーディオに代表される、３次元空間上に配置された音源に対して、その位置を特定かつ/または変更するような制御を行っても良いし、前述したいずれかを組み合わせた制御を行ってもよい。

　判定部１２は、Ａ／Ｄ変換部２１と、Ａ／Ｄ変換部２１Ａと、分離部２２と、音要素特定部２３と、音位置推定部２４と、重要度特定部２５と、重要度テーブル２６と、比較部２７とを有する。Ａ／Ｄ変換部２１は、システム音取得部１１にて取得されたシステム音の音信号をデジタル変換する。Ａ／Ｄ変換部２１Ａは、外部音取得部１１Ａにて取得された外部音の音信号をデジタル変換する。分離部２２は、Ａ／Ｄ変換部２１及びＡ／Ｄ変換部２１Ａでデジタル変換後の音信号を周波数解析等で音要素毎に分離する。分離部２２は、システム音や外部音の音信号を音要素毎に分離する。音要素特定部２３は、図示せぬ音要素の種別を管理するテーブルを参照して、音要素毎の音要素種別を特定する。音要素特定部２３は、例えば、再生コンテンツの音要素、アラームの音要素、電話の音の音要素、ダイアログの音要素等の音要素種別を特定する。

　音位置推定部２４は、分離部２２にて分離された音要素を解析することで、音要素毎の実際の音源位置を推定する。音位置推定部２４は、音要素毎の実際の音源位置、すなわち音要素の音が実際に聞こえて来る音源位置を推定する。音位置推定部２４は、例えば、再生コンテンツの音要素等のシステム音の音要素の場合、音響出力デバイス３を装着しているため、システム音の音要素の音像の音源位置として頭内と推定する。重要度特定部２５は、重要度テーブル２６を参照し、音要素毎の重要度を特定する。比較部２７は、音要素同士の重要度、特に再生コンテンツの音要素の重要度と他の音要素の重要度とを比較する。

＜２－３．信号処理部の構成＞
　信号処理部１３は、音量設定部３１と、音位置設定部３２と、ノイズキャンセリング部３３と、３Ｄ信号処理部３４と、Ｄ／Ａ変換部３５と、アンプ部３６とを有する。音量設定部３１は、音要素毎の重要度に応じて３Ｄ信号処理後の各音要素の音量を設定する。３Ｄ信号処理後の各音要素の音量は、３Ｄ信号処理部３４で生成した各音要素の音量である。尚、音量設定部３１は、音要素の重要度に応じた音量を管理する図示せぬテーブルを参照し、音要素毎の重要度に対応する、３Ｄ信号処理後の各音要素の音量を設定する。

　音位置設定部３２は、音要素毎の重要度に応じて３Ｄ信号処理後の各音要素の音源位置を設定する。３Ｄ信号処理後の各音要素の音源位置は、３Ｄ信号処理部３４で生成した各音要素の音源位置である。尚、音位置設定部３２は、音要素の重要度に応じた音源位置を管理する図示せぬテーブルを参照し、音要素毎の重要度に対応する、３Ｄ信号処理後の各音要素の音像の音位置を設定する。ノイズキャンセリング部３３は、Ａ／Ｄ変換部２１Ａでデジタル変換後の外部音の音信号にノイズキャンセル処理を施したノイズキャンセル信号をＤ／Ａ変換部３５に出力する。

　３Ｄ信号処理部３４は、音要素毎の音源位置及び音量に基づき、音要素のデジタル信号に頭部インパルス応答（ＨＲＩＲ：Head-Related　Impulse　Response）を畳み込んで当該音要素の音像を所望の音源位置に定位させる３Ｄ音信号を生成する３Ｄ信号処理を実行する。頭部インパルス応答は、音源から出た音が利用者の耳に届くまでの特性を表した頭部伝達関数（ＨＲＴＦ：Head-Related　Transfer　Function）を時間軸で表現したものである。３Ｄ信号処理部３４は、音要素毎の３Ｄ音信号を合成し、合成した全ての音要素の３Ｄ音信号を出力する。３Ｄ信号処理部３４は、音要素の音像を音源位置、例えば、頭内や頭外に定位させる３Ｄ音信号を生成する。尚、頭外には、例えば、音響出力デバイス３を装着した利用者の頭内から一定距離だけ離間した音源位置の他に、頭内から任意の距離だけ離間した音源位置も含まれる。また、３Ｄ信号処理部３４は、利用者の顔の向きの角度変化に応じて音源位置を相対的に移動するヘッドトラッキング機能も有する。

　Ｄ／Ａ変換部３５は、３Ｄ信号処理部３４の３Ｄ音信号及びノイズキャンセリング部３３でノイズキャンセル処理を施したノイズキャンセル信号をアナログ変換する。アンプ部３６は、アナログ変換後の３Ｄ音信号及びノイズキャンセル信号を増幅して音響出力デバイス３に出力する。情報処理装置２は、ノイズキャンセル処理が施された状態で３Ｄ音信号に応じて各音要素の音像を各音源位置に定位できる。その結果、音響出力デバイス３を装着した利用者は、頭内定位は勿論のこと、まるで周囲から音が鳴っているように聞こえる頭外定位の状態で各音要素を受聴できる。

＜２－４．重要度テーブルの構成＞
　図２は、情報処理装置２内の重要度テーブル２６の一例を示す図である。図２に示す重要度テーブル２６は、重要度２６１毎に、システム音の音要素の種別を識別する音要素種別２６２を対応付けて管理する。重要度“１”は、重要の度合が一番高く、重要度“２”→重要度“３”→重要度“４”→…の順に段々と重要の度合が低くなる。重要度“１”の音要素としては、例えば、アラームや電話の音の音要素、重要度“２”の音要素としては、例えば、ダイアログの音要素、重要度“３”の音要素としては、例えば、再生コンテンツの音要素である。

　音要素の音源位置には、例えば、頭内や頭外の位置がある。また、頭外には、例えば、正面、背面、左右側面、頭上等がある。頭外には、利用者の頭の周辺の位置であれば、何処でも良く、適宜変更可能である。例えば、再生コンテンツ及びアラームの音要素の場合、これらのシステム音の音要素が音響出力デバイス３から出力するため、例えば、頭内を実際の音源位置とする。尚、説明の便宜上、音要素の音源位置は、例えば、頭内が利用者に一番聞き取り易く、頭内→正面の頭外→左右側面の頭外→背面の頭外→頭上の頭外の順に序列化し、この序列順に聞き取りやすい度合が低下するものとする。従って、重要度が高い音要素の音源位置は頭内→正面の頭外→…に設定し、重要度の低い音要素の音源位置は、例えば、頭上の頭外に設定するものとする。これら音源位置の序列は、重要度に応じて音源位置を管理する図示せぬテーブルで管理している。尚、これら音源位置の序列は、単なる一例に過ぎず、適宜変更可能である。

＜２－５．音源位置の一例＞
　図３は、音源位置推定時及び音源位置設定時の再生コンテンツの音要素及びアラームの音要素の音源位置の一例を示す図である。尚、説明の便宜上、再生コンテンツの音要素及びアラームの音要素の実際の音源位置は、例えば、頭内とする。

　音位置推定部２４は、アラームの音要素及び再生コンテンツの音要素の実際の音源位置として頭内を推定する。これに対して、音位置設定部３２は、アラームの音要素の重要度“１”と再生コンテンツの音要素の重要度“３”とを比較する。そして、音位置設定部３２は、アラームの音要素の重要度の方が高いため、３Ｄ信号処理後の音源位置として、アラームを頭内、再生コンテンツを頭上の頭外に設定する。アラームの音源位置が頭内、再生コンテンツの音源位置が頭上の頭外に定位するため、アラーム音及び再生コンテンツの音源位置が重ならない。従って、再生コンテンツとアラームとの間の音干渉を抑制することで、利用者は、再生コンテンツ及びアラーム音の両方が聞き取りやすくなる。

＜２－６．第１の３Ｄ信号生成処理＞
　図４は、実施形態１の第１の３Ｄ信号生成処理に係る情報処理装置２の処理動作の一例を示すフローチャートである。図４において情報処理装置２内のシステム音取得部１１は、音信号を取得したか否かを判定する（ステップＳ１１）。尚、音信号は、情報処理装置２で発するシステム音を含む音信号である。

　情報処理装置２内のＡ／Ｄ変換部２１は、音信号を取得した場合（ステップＳ１１：Ｙｅｓ）、音信号をデジタル変換する（ステップＳ１２）。尚、Ａ／Ｄ変換部２１Ａは、外部音取得部１１Ａにて取得された外部音の音信号をデジタル変換する。そして、ノイズキャンセリング部３３は、外部音の音信号にノイズキャンセル処理を施したノイズキャンセル信号を３Ｄ信号処理部３４から出力された信号に加算し、その後Ｄ／Ａ変換部３５に出力する。情報処理装置２内の分離部２２は、デジタル変換後の音信号からシステム音の音要素を周波数解析や音源分離技術等で分離する（ステップＳ１３）。情報処理装置２内の音要素特定部２３は、音要素の分離結果に基づき、音要素毎の音要素種別を特定する（ステップＳ１４）。情報処理装置２内の重要度特定部２５は、重要度テーブル２６を参照し、音要素毎の重要度を特定する（ステップＳ１５）。

　情報処理装置２内の音位置推定部２４は、音要素毎の分析結果から音要素毎の実際の音源位置を推定する（ステップＳ１６）。情報処理装置２内の比較部２７は、音要素内に再生中コンテンツの音要素があるか否かを判定する（ステップＳ１７）。比較部２７は、音要素内に再生中コンテンツの音要素がある場合（ステップＳ１７：Ｙｅｓ）、音要素内に再生中のコンテンツの音要素以外の他の音要素があるか否かを判定する（ステップＳ１８）。尚、他の音要素は、システム音の内、再生中のコンテンツ以外の音要素である。

　比較部２７は、他の音要素がある場合（ステップＳ１８：Ｙｅｓ）、再生中のコンテンツの音要素の重要度と他の音要素の重要度とを比較する（ステップＳ１９）。情報処理装置２内の音位置設定部３２は、音要素毎の重要度に応じて、３Ｄ信号処理後の音要素毎の音源位置を設定する（ステップＳ２０）。例えば、音要素としてアラーム及び再生中コンテンツが発生した場合、アラームの重要度が“１”、再生中コンテンツの重要度が“３”となる。従って、音位置設定部３２は、３Ｄ信号処理後の音源位置として、アラームの音源位置を頭内、再生中コンテンツの音源位置を頭上の頭外に設定する。

　更に、情報処理装置２内の音量設定部３１は、音要素種別毎の重要度に応じて、３Ｄ信号処理後の音要素毎の音量を設定する（ステップＳ２１）。音量設定部３１は、３Ｄ信号処理後の音量として、例えば、アラームの音量を１倍、再生中コンテンツの音量を１倍に設定する。尚、音量設定部３１は、３Ｄ信号処理後の音量として、例えば、アラームの音量を１倍、再生中コンテンツの音量を０．７５倍、また、アラームの音量を２倍、再生中コンテンツの音量を１倍にしても良く、適宜変更可能である。情報処理装置２内の３Ｄ信号処理部３４は、設定された３Ｄ信号処理後の音要素毎の音源位置及び音量に基づき、音要素毎の３Ｄ音信号を生成し、全ての音要素の３Ｄ音信号を合成出力する（ステップＳ２２）。３Ｄ信号処理部３４は、音要素毎の音源位置及び音量に基づき、音要素毎の音信号に頭部インパクト応答を畳み込んで音要素毎の３Ｄ音信号を生成する。そして、３Ｄ信号処理部３４は、全ての音要素毎の３Ｄ音信号を合成して出力する。

　情報処理装置２内のＤ／Ａ変換部３５は、合成後の３Ｄ音信号及びノイズキャンセル信号をアナログ変換する（ステップＳ２３）。情報処理装置２内のアンプ部３６は、アナログ変換後の３Ｄ音信号及びノイズキャンセル信号を増幅し、増幅後の３Ｄ音信号及びノイズキャンセル信号を音響出力デバイス３に出力し（ステップＳ２４）、図４に示す処理動作を終了する。

　システム音取得部１１は、音信号を取得したのでない場合（ステップＳ１１：Ｎｏ）、図４に示す処理動作を終了する。また、音位置設定部３２は、音要素内に再生中のコンテンツの音要素がない場合（ステップＳ１７：Ｎｏ）、音要素毎の音源位置を設定すべく、ステップＳ２０に移行する。音位置設定部３２は、音要素内に再生中のコンテンツの音要素以外の他の音要素がない場合（ステップＳ１８：Ｎｏ）、音要素毎の音源位置を設定すべく、ステップＳ２０に移行する。

　情報処理装置２は、再生中コンテンツの音要素の重要度と他の音要素の重要度とを比較し、重要度に応じて、３Ｄ信号処理後の音要素毎の音源位置及び音量を設定し、音要素毎の音源位置及び音量に基づき３Ｄ音信号を生成する。更に、情報処理装置２は、重要度に応じた音源位置及び音量の３Ｄ音信号及びノイズキャンセル信号を音響出力デバイス３に提供する。情報処理装置２は、重要度に応じて音要素毎の音源位置及び音量を変更、例えば、再生コンテンツの音要素とシステム内の他の音要素との音源位置を変えることで再生コンテンツの音要素とシステム音内の他の音要素との間の音干渉を抑制できる。更に、システム音内の音要素間の音干渉を抑制できる。そして、システム音の情報伝達の効率化を図ることができる。

　実施形態１では、再生中のコンテンツの音要素及び、一又は複数の他の音要素の重要度に応じて、再生中のコンテンツの音要素又は他の音要素の何れか一方の音像の音響出力デバイス３での音源位置を変更する。その結果、再生中のコンテンツを中断することなく、音要素の重要度に応じて各音要素の音源位置を変えることで、システム音内の音要素間の音干渉を抑制することで情報伝達の効率化を図る。

　また、システム音の重要度に応じて、例えば、再生コンテンツと他の音要素の音源位置を頭外に変更し、聞きたい他の音要素と再生コンテンツとを分離して音源位置をレイアウトする。その結果、利用者の意思を反映した音要素毎の重要度を用いて聞きたい音を聞き易くできる。

　尚、説明の便宜上、音位置設定部３２は、図３に示すように、３Ｄ信号処理後の音源位置として、再生コンテンツを頭上の頭外、アラームを頭内に設定した。しかしながら、３Ｄ信号処理後の音源位置として、アラームを頭上の頭外、再生コンテンツを頭内に設定しても良い。また、音位置設定部３２は、３Ｄ信号処理後の音源位置として、再生コンテンツ及びアラーム両方の音源位置を頭外の異なる位置に設定すれば良い。また、音位置設定部３２は、３Ｄ信号処理後の音源位置として、重要度の高いアラームを正面の頭外、再生コンテンツを頭上の頭外に設定しても良い。

　また、アラーム音が緊急性を有して重要度が再生コンテンツの音要素の重要度に比較してはるかに高い場合、音量設定部３１は、アラームの音要素の３Ｄ信号処理後の音量を高くし、再生コンテンツの音要素の３Ｄ信号処理後の音量を小さくしても良い。尚、はるかに高い場合とは、例えば、重要度が２段以上離れている場合である。また、アラームが緊急性を有して重要度が再生コンテンツの音要素の重要度に比較してはるかに高い場合、音量を調整するのではなく、再生コンテンツの再生を停止しても良い。また、ノイズキャンセリング部３３を用いて再生コンテンツをキャンセルしても良い。

　尚、実施形態１の情報処理装置２では、システム音内の音要素の重要度に応じてシステム音内の音要素毎の音源位置及び音量を調整する場合を例示したが、システム音の音要素に限定されるものではなく、例えば、車の音等の外部音にも適用可能である。従って、その実施の形態につき、以下に説明する。

＜＜３．実施形態２の情報処理システムの構成及び動作＞＞
＜３－１．情報処理装置の構成＞
　図５は、実施形態２に係る情報処理システム１Ａの一例を示す図である。尚、実施形態１の情報処理システム１と同一の構成には同一符号を付すことで、その重複する構成及び動作の説明については省略する。図５に示す情報処理装置２Ａの外部音取得部１１Ａは、図示せぬマイクを通じて外部音の音信号を取得する。マイクは、例えば、複数のマイクを有するマイクアレイである。マイクは、例えば、音響出力デバイス３に内蔵しているものとする。尚、マイクは、音響出力デバイス３に内蔵する場合を例示したが、別個に設けても良く、適宜変更可能である。

　更に、情報処理装置２Ａは、音響出力デバイス３の種別を特定するデバイス特定部１４を有する。音響出力デバイス３の種別には、利用者の耳穴を開口した状態で利用者が装着する耳孔開放型のヘッドホンや、耳栓のように装着する耳孔非開放型のヘッドホン等がある。耳孔開放型ヘッドホンは、例えばオープン型ヘッドホンであり、耳孔非開放型ヘッドホンは、例えばカナル型ヘッドホンである。デバイス特定部１４は、例えば、音響出力デバイス３を情報処理装置２Ａに接続する際に利用者が設定操作で入力したデバイス種別で音響出力デバイス３を特定しても良い。また、デバイス特定部１４は、例えば、音響出力デバイス３を情報処理装置２Ａに接続する際の情報処理装置２Ａとのネゴシエーションでデバイス種別を特定するようにしても良く、適宜変更可能である。

　判定部１２内の分離部２２は、Ａ／Ｄ変換部２１及びＡ／Ｄ変換部２１Ａでデジタル変換後の音信号から外部音やシステム音等の音要素を分離する。音要素特定部２３は、外部音やシステム音等の音要素の音要素種別を特定する。音位置推定部２４は、外部音やシステム音等の音要素から実際の音要素の音源位置を推定する。音位置推定部２４は、例えば、車の音が聞こえて来る実際の音源位置を推定する。重要度特定部２５は、後述する重要度テーブル２６Ａを参照し、外部音やシステム音の音要素毎に重要度を特定する。

　信号処理部１３は、利用者が装着する音響出力デバイス３が耳孔開放型のヘッドホンの場合、外部音の音要素以外のシステム音内の音要素の音源位置及び音量を調整する。信号処理部１３は、利用者が装着する音響出力デバイス３が耳孔非開放型のヘッドホンの場合、システム音の音要素の他に、外部音の音要素の音源位置及び音量を調整する。

＜３－２．重要度テーブルの構成＞
　図６は、情報処理装置２Ａ内の重要度テーブル２６Ａの一例を示す図である。図６に示す重要度テーブル２６Ａは、システム音の音要素及び外部音の音要素毎の重要度を対応付けて管理するテーブルである。重要度１の音要素としては、例えば、赤ちゃんの泣き声、Ａさんの音声、固定電話の音等の外部音の音要素と、例えば、アラーム音や電話の音等のシステム音の音要素とを有する。重要度２の音要素としては、例えば、再生中のコンテンツのシステム音の音要素を有する。重要度３の音要素としては、例えば、Ａさん以外の人の音声や車の音等の外部音の音要素を有する。

＜３－３．音源位置の一例＞
　例えば、利用者が装着する音響出力デバイス３が耳孔非開放型のヘッドホンであって、外部音及び再生コンテンツが発生した場合を想定する。外部音の重要度が再生コンテンツよりも高い場合、音位置設定部３２は、３Ｄ信号処理後の音源位置として、外部音を実際の音源位置、再生コンテンツを頭上の頭外に設定する。また、再生コンテンツの重要度が外部音又はシステム音よりも高い場合、音位置設定部３２は、３Ｄ信号処理後の音源位置として、再生コンテンツを頭内又は正面の頭外、外部音を再生コンテンツの音源位置と異なる音源位置に設定する。

　利用者が装着する音響出力デバイス３が耳孔開放型のヘッドホンであって、外部音及び再生コンテンツが発生した場合を想定する。外部音の重要度が再生コンテンツよりも高い場合、音位置設定部３２は、３Ｄ信号処理後の音源位置として、再生コンテンツを頭上の頭外に設定する。また、再生コンテンツの重要度が外部音よりも高い場合、音位置設定部３２は、３Ｄ信号処理後の音源位置として、再生コンテンツを頭内又は正面の頭外に設定する。また、再生コンテンツの重要度が他のシステム音よりも高い場合、音位置設定部３２は、３Ｄ信号処理後の音源位置として、再生コンテンツを頭内又は正面の頭外、他のシステム音を再生コンテンツと異なる音源位置に設定する。

　図７は、音源位置推定時及び音源位置設定時の再生コンテンツの音要素及び外部音の音要素の音源位置の一例を示す図である。例えば、耳孔開放型のヘッドホンを装着する利用者がコンテンツを再生しながらＡさんと居る場合を想定する。

　音位置推定部２４は、利用者とＡさんとの会話がない場合、再生コンテンツの実際の音源位置として頭内を推定する。音位置設定部３２は、利用者とＡさんとの会話がなく、再生コンテンツの音要素の重要度が一番高いため、３Ｄ信号処理後の音源位置として、再生コンテンツを正面の頭外に設定する。これに対して、音位置推定部２４は、利用者とＡさんとの会話がある場合、Ａさんの音声の実際の音源位置を推定する。音位置設定部３２は、Ａさんの音声の音要素の重要度が一番高いため、３Ｄ信号処理後の音源位置として、再生コンテンツを頭上の頭外に設定する。その結果、利用者は、耳孔開放型のヘッドホンであるため、頭上から再生コンテンツをＢＧＭ的に聞きながら、Ａさんの音声を実際の音源位置から直接聞くことができる。つまり、情報処理装置２Ａは、Ａさんの音声を優先させるため、再生コンテンツの聞こえる音源位置を調整するので、Ａさんの音声と再生コンテンツとの間の音干渉を抑制できる。

　また、例えば、耳孔非開放型のヘッドホンを装着した利用者が、コンテンツを再生しながらＡさんと居る場合を想定する。音位置推定部２４は、利用者とＡさんとの会話がない場合、再生コンテンツの実際の音源位置として頭内を推定する。音位置設定部３２は、利用者とＡさんとの会話がなく、再生コンテンツの音要素の重要度が一番高いため、３Ｄ信号処理後の音源位置として、再生コンテンツを正面の頭外に設定する。これに対して、音位置推定部２４は、利用者とＡさんとの会話がある場合、Ａさんの音声の音源位置として実際の音源位置を推定する。音位置設定部３２は、Ａさんの音声の音要素の重要度が一番高いため、３Ｄ信号処理後の音源位置として、再生コンテンツを頭上の頭外、Ａさんの音声を実際の音源位置（頭外）に設定する。その結果、利用者は、耳孔非開放型のヘッドホンであるため、頭上から再生コンテンツをＢＧＭ的に聞きながら、Ａさんの音声を実際の音源位置から聞くことができる。つまり、情報処理装置２Ａは、Ａさんの音声を優先させるため、音源や音量を調整するので、Ａさんの音声と再生コンテンツとの間の音干渉を抑制できる。

＜３－４．第２の３Ｄ信号生成処理＞
　図８は、実施形態２の第２の３Ｄ信号生成処理に係る情報処理装置２Ａの処理動作の一例を示すフローチャートである。図８において情報処理装置２Ａ内のシステム音取得部１１及び外部音取得部１１Ａは、音信号を取得したか否かを判定する（ステップＳ１１Ａ）。尚、音信号は、情報処理装置２Ａで発するシステム音の音信号の他に、外部音取得部１１Ａで取得した外部音の音信号を含む。

　情報処理装置２Ａ内のデバイス特定部１４は、音信号を取得した場合（ステップＳ１１Ａ：Ｙｅｓ）、情報処理装置２に接続する音響出力デバイス３が耳孔非開放型のヘッドホンであるか否かを判定する（ステップＳ３１）。情報処理装置２に接続する音響出力デバイス３は、利用者が装着する耳孔非開放型のヘッドホン又は耳孔開放型のヘッドホンである。Ａ／Ｄ変換部２１は、音響出力デバイス３が耳孔非開放型のヘッドホンの場合（ステップＳ３１：Ｙｅｓ）、音信号をデジタル変換する（ステップＳ１２Ａ）。情報処理装置２Ａ内の分離部２２は、デジタル変換後の音信号から外部音を含む音要素を周波数解析や音源分離技術等で分離する（ステップＳ１３Ａ）。情報処理装置２Ａ内の音要素特定部２３は、音要素の分離結果に基づき、外部音を含む音要素毎の音要素種別を特定する（ステップＳ１４Ａ）。尚、音要素種別は、システム音の音要素種別の他に、外部音の音要素種別を有する。

　情報処理装置２Ａ内の重要度特定部２５は、重要度テーブル２６Ａを参照し、外部音を含む音要素毎に重要度を特定する（ステップＳ１５Ａ）。情報処理装置２Ａ内の音位置推定部２４は、音要素毎の分析結果から外部音を含む音要素の音像毎の実際の音源位置を推定する（ステップＳ１６Ａ）。

　情報処理装置２Ａ内の比較部２７は、音要素内に再生中コンテンツの音要素があるか否かを判定する（ステップＳ１７Ａ）。比較部２７は、音要素内に再生中コンテンツの音要素がある場合（ステップＳ１７Ａ：Ｙｅｓ）、音要素内に再生中のコンテンツの音要素以外の他の音要素があるか否かを判定する（ステップＳ１８Ａ）。

　比較部２７は、他の音要素がある場合（ステップＳ１８Ａ：Ｙｅｓ）、再生中のコンテンツの音要素の重要度と他の音要素の重要度とを比較する（ステップＳ１９Ａ）。情報処理装置２Ａ内の音位置設定部３２は、利用者の音響出力デバイス３が耳孔非開放型のヘッドホンであるか否かを判定する（ステップＳ３３）。音位置設定部３２は、利用者の音響出力デバイス３が耳孔非開放型のヘッドホンの場合（ステップＳ３３：Ｙｅｓ）、外部音及びシステム音を含む音要素毎の重要度に応じて音要素毎の３Ｄ信号処理後の音源位置を設定する（ステップＳ２０Ａ）。尚、音位置設定部３２は、音響出力デバイス３が耳孔非開放型のヘッドホンであって、音要素がＡさんの音声及び再生中コンテンツの場合、Ａさんの音声の重要度が一番高いと判定する。音位置設定部３２は、３Ｄ信号処理後の音源位置として、Ａさんの音声を実際の音源位置（頭外）、再生中コンテンツを頭上の頭外に設定する。

　更に、情報処理装置２Ａ内の音量設定部３１は、システム音及び外部音を含む音要素毎の重要度に応じて音要素毎の３Ｄ信号処理後の音量を設定する（ステップＳ２１Ａ）。尚、音量設定部３１は、３Ｄ信号処理後の音量として、Ａさんの音声の音量を１倍、再生中コンテンツの音量を１倍に設定する。情報処理装置２Ａ内の３Ｄ信号処理部３４は、音要素毎の３Ｄ信号処理後の音源位置及び音量に基づき、音要素毎の３Ｄ音信号を生成し、全ての音要素の３Ｄ音信号を合成出力する（ステップＳ２２Ａ）。３Ｄ信号処理部３４は、音要素毎の音源位置及び音量に基づき、音要素毎の頭部インパクト応答を畳み込んで音要素毎の３Ｄ音信号を生成する。そして、３Ｄ信号処理部３４は、システム音及び外部音を含む音要素毎の３Ｄ音信号を全て合成して出力する。

　情報処理装置２Ａ内のＤ／Ａ変換部３５は、ノイズキャンセリング部３３からのノイズキャンセル信号及び全ての３Ｄ音信号をアナログ変換する（ステップＳ２３Ａ）。情報処理装置２Ａ内のアンプ部３６は、アナログ変換後の３Ｄ音信号及びノイズキャンセル信号を音響出力デバイス３に増幅出力し（ステップＳ２４Ａ）、図８に示す処理動作を終了する。

　デバイス特定部１４は、情報処理装置２に接続する音響出力デバイス３が耳孔非開放型のヘッドホンでない場合（ステップＳ３１：Ｎｏ）、デバイス種別が耳孔開放型のヘッドホンと判断し（ステップＳ３２）、音信号をデジタル信号に変換すべく、ステップＳ１２Ａに移行する。また、音位置設定部３２は、ステップＳ１９Ａにて重要度を比較した後、利用者の音響出力デバイス３が耳孔非開放型のヘッドホンでない場合（ステップＳ３３：Ｎｏ）、利用者の音響出力デバイス３が耳孔開放型のヘッドホンと判断する。音位置設定部３２は、外部音以外のシステム音を含む音要素毎の重要度に応じて音要素毎の３Ｄ信号処理後の音源位置を設定する（ステップＳ２０Ｂ）。尚、音位置設定部３２は、例えば、音要素がＡさんの音声及び再生中コンテンツの場合、Ａさんの音声の重要度が一番高いと判定する。その結果、音位置設定部３２は、３Ｄ信号処理後の音源位置として、再生中コンテンツを頭上の頭外に設定することで、再生中のコンテンツとＡさんの音声との干渉を抑制することができる。

　更に、音量設定部３１は、外部音以外のシステム音を含む音要素毎の重要度に応じて音要素毎の３Ｄ信号処理後の音量を設定し（ステップＳ２１Ｂ）、音要素毎の音量及び音源位置に基づき３Ｄ音信号を生成すべく、ステップＳ２２Ａに移行する。尚、音量設定部３１は、Ａさんの音声の音量を調整することなく、再生中コンテンツの音要素の音量を１倍に設定する。

　システム音取得部１１及び外部音取得部１１Ａは、音信号を取得したのでない場合（ステップＳ１１Ａ：Ｎｏ）、図８に示す処理動作を終了する。また、音位置設定部３２は、音要素内に再生中のコンテンツの音要素がない場合（ステップＳ１７Ａ：Ｎｏ）、音響出力デバイス３が耳孔非開放型のヘッドホンであるか否かを判定すべく、ステップＳ３３に移行する。音位置設定部３２は、音要素内に再生中のコンテンツの音要素以外の他の音要素がない場合（ステップＳ１８Ａ：Ｎｏ）、音響出力デバイス３が耳孔非開放型のヘッドホンであるか否かを判定すべく、ステップＳ３３に移行する。

　実施形態２の情報処理装置２Ａでは、利用者の音響出力デバイス３が耳孔開放型のヘッドホンの場合、システム音及び外部音の音要素の重要度に応じて、外部音以外のシステム音の音要素の音源位置を調整する。その結果、外部音を妨げないようにシステム音の音源位置を調整できる。つまり、システム音内の音要素と外部音内の他の音要素との間の音干渉を抑制できる。

　情報処理装置２Ａでは、利用者の音響出力デバイス３が耳孔非開放型のヘッドホンの場合、システム音及び外部音の音要素の重要度に応じて、システム音及び外部音の音要素の音源位置を調整する。その結果、外部音を妨げないようにシステム音及び外部音の音源位置を調整できる。つまり、システム音内の音要素と外部音内の他の音要素との間の音干渉を抑制できる。

　上記実施形態２の情報処理システム１Ａでは、利用者が装着する音響出力デバイス３の種別に応じて音要素の制御対象の音源位置を変更する場合を例示した。しかしながら、音響出力デバイス３を装着する利用者の現在位置に応じて音要素毎の重要度を変更しても良く、その実施形態につき、以下に説明する。

＜＜４．実施形態３の情報処理システムの構成及び動作＞＞
＜４－１．情報処理装置の構成＞
　図９は、実施形態３に係る情報処理システム１Ｂの一例を示す図である。尚、実施形態２の情報処理システム１Ｂと同一の構成には同一符号を付すことで、その重複する構成及び動作の説明については省略する。図９に示す情報処理装置２Ｂは、音響出力デバイス３を装着する利用者の現在位置を検出する検出部１５を有する。検出部１５は、例えば、ＧＰＳ（Global　Positioning　System）等を用いて利用者の現在位置を検出する機能である。尚、説明の便宜上、検出部１５は、現在位置として、例えば、自宅又は自宅外を検出するものである。

　判定部１２は、利用者の現在位置が自宅の場合、自宅に応じた音要素毎の重要度を設定する。判定部１２は、利用者の現在位置が自宅外の場合、自宅外に応じた音要素毎の重要度を設定する。信号処理部１３は、現在位置が自宅の場合、自宅に応じた音要素毎の重要度に基づき、音要素の音源位置及び音量を調整する。信号処理部１３は、現在位置が自宅外の場合、自宅外に応じた音要素毎の重要度に基づき、音要素の音源位置及び音量を調整する。また、信号処理部１３は、自宅外での外部音の内、例えば、車の音は実際の音源位置を変えると意味がないため、音源位置を変更しないものとする。

＜４－２．重要度テーブルの構成＞
　図１０は、情報処理装置２Ｂ内の重要度テーブル２６Ｂの一例を示す図である。図１０に示す重要度テーブル２６Ｂは、自宅での重要度毎の音要素種別と、自宅外での重要度毎の音要素種別とを対応付けて管理するテーブルである。

　自宅での重要度１の音要素としては、例えば、赤ちゃんの泣き声、Ａさんの音声、電話の音の外部音の音要素と、例えば、アラームや固定電話の音のシステム音の音要素とを有する。自宅での重要度２の音要素としては、例えば、再生中のコンテンツのシステム音の音要素を有する。自宅での重要度３の音要素としては、例えば、Ａさん以外の人の音声や車の音の外部音の音要素を有する。

　これに対して、自宅外での重要度１の音要素としては、例えば、赤ちゃんの泣き声、Ａさんの音声、電話の音、車の音の外部音の音要素と、例えば、アラームのシステム音の音要素とを有する。自宅外での重要度２の音要素としては、例えば、再生中のコンテンツのシステム音の音要素を有する。自宅外での重要度３の音要素としては、例えば、Ａさん以外の人の音声、固定電話の音の外部音の音要素を有する。

　自宅での重要度と自宅外での重要度とを比較した場合、自宅での重要度では、例えば、固定電話の音の重要度が高く、車の音の重要度が低く設定してある。これに対して、自宅外での重要度では、例えば、車の音の重要度が高く、固定電話の音の重要度が低く設定してある。また、各音要素の重要度は利用者によって適宜設定、変更されるようにしても良い。

＜４－３．音源位置の一例＞
　図１１は、音源位置推定時及び音源位置設定時の再生コンテンツの音要素及び外部音の音要素の音源位置の一例を示す図である。例えば、耳孔非開放型のヘッドホンを装着する利用者の自宅外で再生コンテンツ及び車の音の音要素が発生した場合を想定する。

　音位置設定部３２は、自宅外のため、車の音要素の重要度が一番高く、３Ｄ信号処理後の音源位置として、再生コンテンツを頭上の頭外、車の音を実際の音源位置（頭外）に設定する。この際、音量設定部３１は、３Ｄ信号処理後の音量として、車の音の音量を１．５倍、再生コンテンツの音量を０．５倍に設定する。その結果、利用者は、自宅外であるため、車に対する危険度が高く、車の実際の位置から車の音量を大きくし、車の存在を強く認識できる。近年、自動車の音が小さくなっているため、その自動車の音の音量を大きくなるように調整することで、自動車の存在を利用者に強く認識させることができる。

　これに対して、例えば、耳孔非開放型のヘッドホンを装着する利用者の自宅で再生コンテンツ及び車の音の音要素が発生した場合を想定する。音位置推定部２４は、再生コンテンツの音源位置として実際の音源位置（頭内）、車の音の音源位置として実際の音源位置を推定する。音位置設定部３２は、自宅のため、再生コンテンツの音要素の重要度が一番高く、３Ｄ信号処理毎の音源位置として、再生コンテンツを正面の頭外、車の音を実際の音源位置（頭外）に設定する。この際、音量設定部３１は、３Ｄ信号処理後の音量として、再生コンテンツの音量を１倍、車の音の音量を０倍に設定する。利用者は、自宅での車に対する危険度が低く、車の音を消去することで正面の頭外から再生コンテンツを聞くことができる。また、不要な外部音を消去することで、利用者の脳への負担も減り、疲れにくくなるなどの効果もある。

　例えば、耳孔開放型のヘッドホンを装着する利用者の自宅で再生コンテンツ及び車の音の音要素が発生した場合を想定する。音位置推定部２４は、再生コンテンツの音源位置として実際の音源位置（頭内）、車の音の音源位置として実際の音源位置を推定する。音位置設定部３２は、自宅のため、再生コンテンツの音要素の重要度が一番高く、３Ｄ信号処理後の音源位置として、再生コンテンツを正面の頭外に設定する。この際、音量設定部３１は、３Ｄ信号処理後の音量として、再生コンテンツの音量を１倍に設定する。利用者は、自宅での車に対する危険度が低いため、実際の車の音を聞きながら、正面の頭外から再生コンテンツを聞くことができる。

　これに対して、例えば、耳孔開放型のヘッドホンを装着する利用者の自宅外で再生コンテンツ及び車の音の音要素が発生した場合を想定する。音位置設定部３２は、自宅外のため、車の音要素の重要度が一番高く、３Ｄ信号処理後の音源位置として、再生コンテンツを頭上の頭外に設定する。この際、音量設定部３１は、３Ｄ信号処理後の音量として、再生コンテンツの音量を０．５倍に設定する。その結果、利用者は、自宅外での車に対する危険度が高く、再生コンテンツを頭上からＢＧＭ的に聞きながら、実際の車の位置から車の音を直接聞くことで、車の存在を認識できる。また、車以外の音要素の重要度が一番高くなるように適宜設定してもよい。

　また、例えば、耳孔非開放型のヘッドホンを装着する利用者の自宅で再生コンテンツの音要素及びＡさんの音声の音要素が発生した場合を想定する。音位置推定部２４は、実際の音源位置として、再生コンテンツの音源位置（頭内）、Ａさんの音声の実際の音源位置（頭外）を推定する。これに対して、音位置設定部３２は、３Ｄ信号処理後の音源位置として、再生コンテンツを頭上の頭外、Ａさんの音声を実際の音源位置（頭外）に設定する。音量設定部３２は、３Ｄ信号処理後の音量として、再生コンテンツの音量及びＡさんの音声の音量を１倍に設定する。その結果、利用者は、再生コンテンツを頭上からＢＧＭ的に聞きながら、Ａさんの音声を聞くことができる。

　例えば、耳孔開放型のヘッドホンを装着する利用者の自宅で再生コンテンツの音要素及びＡさんの音声の音要素が発生した場合を想定する。音位置推定部２４は、実際の音源位置として、再生コンテンツの音源位置（頭内）、Ａさんの音声の実際の音源位置（頭外）を推定する。これに対して、音位置設定部３２は、３Ｄ信号処理後の音源位置として、再生コンテンツを頭上の頭外に設定する。音量設定部３２は、３Ｄ信号処理後の音量として、再生コンテンツの音量を１倍に設定する。その結果、利用者は、再生コンテンツを頭上からＢＧＭ的に聞きながら、Ａさんの音声を直接聞くことができる。

　また、例えば、耳孔非開放型のヘッドホンを装着する利用者の自宅外で再生コンテンツの音要素及び車の音の音要素が発生した場合を想定する。音位置推定部２４は、実際の音源位置として、再生コンテンツの音源位置（頭内）、車の音の実際の音源位置を推定する。これに対して、音位置設定部３２は、３Ｄ信号処理後の音源位置として、再生コンテンツを頭上の頭外、車の音を実際の音源位置（頭外）に設定する。音量設定部３１は、３Ｄ信号処理後の音量として、再生コンテンツの音量を０．５倍、車の音の音量を１倍に設定する。その結果、利用者は、再生コンテンツを頭上の頭外からＢＧＭ的に聞きながら、車の音を聞くことができる。

　例えば、耳孔開放型のヘッドホンを装着する利用者の自宅外で再生コンテンツの音要素及び車の音の音要素が発生した場合を想定する。音位置推定部２４は、実際の音源位置として、再生コンテンツの音源位置（頭内）、車の音の実際の音源位置を推定する。これに対して、音位置設定部３２は、３Ｄ信号処理後の音源位置として、再生コンテンツを頭上の頭外に設定する。音量設定部３１は、３Ｄ信号処理後の音量として、再生コンテンツの音量を０．５倍に設定する。その結果、利用者は、再生コンテンツを頭上からＢＧＭ的に聞きながら、車の音を直接聞くことができる。

　また、例えば、耳孔非開放型のヘッドホンを装着する利用者の自宅外で再生コンテンツの音要素及び外部音のアナウンス音の音要素が発生した場合を想定する。音位置推定部２４は、実際の音源位置として、再生コンテンツの実際の音源位置（頭内）、アナウンス音の実際の音源位置（頭外）を推定する。これに対して、音位置設定部３２は、３Ｄ信号処理後の音源位置として、再生コンテンツを正面の頭外、アナウンス音の音源位置を頭上の頭外に設定する。その結果、利用者は、再生コンテンツを頭上からＢＧＭ的に聞きながら、アナウンス音を聞くことができる。

　図１２は、音源位置推定時及び音源位置設定時の再生コンテンツの音要素、Ａさんの音要素及びＢさんの音要素の音源位置の一例を示す図である。例えば、耳孔非開放型のヘッドホンを装着する利用者の自宅で再生コンテンツの音要素、Ａさんの音声の音要素及びＢさんの音声の音要素が発生した場合を想定する。音位置推定部２４は、実際の音源位置として、再生コンテンツの音源位置（頭内）、Ａさんの音声の実際の音源位置（頭外）、Ｂさんの音声の実際の音源位置（頭外）を推定する。これに対して、音位置設定部３２は、Ａさんの音声の重要度１、再生コンテンツの重要度２、Ｂさんの音声の重要度３と判定する。音位置設定部３２は、３Ｄ信号処理後の音源位置として、再生コンテンツを頭上の頭外に、Ａさんの音声を実際の音源位置（頭外）に設定する。尚、Ｂさんの音声の音要素は、重要度３であるため、ノイズキャンセリング部３３を通じてキャンセルすることになる。その結果、利用者は、再生コンテンツを頭上からＢＧＭ的に聞きながら、Ａさんの音声を聞くことができる。

　例えば、耳孔開放型のヘッドホンを装着する利用者の自宅で再生コンテンツの音要素、Ａさんの音声の音要素及びＢさんの音声の音要素が発生した場合を想定する。音位置推定部２４は、実際の音源位置として、再生コンテンツの音源位置（頭内）、Ａさんの音声の実際の音源位置（頭外）、Ｂさんの音声の実際の音源位置（頭外）を推定する。これに対して、音位置設定部３２は、Ａさんの音声が重要度１、再生コンテンツが重要度２、Ｂさんの音声が重要度３のため、３Ｄ信号処理後の音源位置として、再生コンテンツを頭上の頭外に設定する。その結果、利用者は、再生コンテンツを頭上からＢＧＭ的に聞きながら、Ａさんの音声を直接聞くことができる。

＜４－４．第３の３Ｄ信号生成処理＞
　図１３は、実施形態３の第３の３Ｄ信号生成処理に係る情報処理装置２Ｂの処理動作の一例を示すフローチャートである。図１３において情報処理装置２Ｂ内の検出部１５は、音響出力デバイス３を装着した利用者の現在位置を特定する（ステップＳ３２）。尚、説明の便宜上、現在位置は、音響出力デバイス３を装着した利用者の自宅又は自宅外とする場合を例示したが、これに限定されるものではなく、適宜変更可能である。システム音取得部１１及び外部音取得部１１Ａは、音響出力デバイス３の利用者の現在位置を特定した後、システム音及び外部音を含む音信号を取得したか否かを判定すべく、ステップＳ１１Ａに移行する。

　情報処理装置２Ｂ内の重要度特定部２５は、ステップＳ１４Ａにて外部音を含む音要素毎の音要素種別を特定した後、重要度テーブル２６Ｂを参照し、外部音及びシステム音を含む音要素毎に現在位置に対応した重要度を特定する（ステップＳ１５Ｃ）。情報処理装置２Ｂ内の音位置推定部２４は、現在位置に対応した重要度を特定した後、システム音及び外部音を含む音要素毎の音源位置を推定すべく、ステップＳ１６Ａに移行する。

　情報処理装置２Ｂでは、自宅にいる利用者の音響出力デバイス３が耳孔開放型のヘッドホンの場合、自宅に対応したシステム音及び外部音の音要素の重要度に応じて、外部音以外のシステム音の音要素の音源位置を調整する。その結果、耳孔開放型ヘッドホンを装着して自宅にいる場合でも、外部音を妨げないようにシステム音の音源位置を調整できる。つまり、システム音内の音要素と外部音内の他の音要素との間の音干渉を抑制できる。

　情報処理装置２Ｂでは、自宅にいる利用者の音響出力デバイス３が耳孔非開放型のヘッドホンの場合、自宅に対応したシステム音及び外部音の音要素の重要度に応じて、システム音及び外部音の音要素の音源位置を調整する。その結果、耳孔非開放型ヘッドホンを装着して自宅にいる場合でも、外部音を妨げないようにシステム音及び外部音の音源位置を調整できる。つまり、システム音内の音要素と外部音内の他の音要素との間の音干渉を抑制できる。

　情報処理装置２Ｂでは、自宅外にいる利用者の音響出力デバイス３が耳孔開放型のヘッドホンの場合、自宅外に対応したシステム音及び外部音の音要素の重要度に応じて、外部音以外のシステム音の音要素の音源位置を調整する。その結果、耳孔開放型ヘッドホンを装着して自宅外にいる場合でも、外部音を妨げないようにシステム音の音源位置を調整できる。つまり、システム音内の音要素と外部音内の他の音要素との間の音干渉を抑制できる。

　情報処理装置２Ｂでは、自宅外にいる利用者の音響出力デバイス３が耳孔非開放型のヘッドホンの場合、自宅外に対応したシステム音及び外部音の音要素の重要度に応じて、システム音及び外部音の音要素の音源位置を調整する。その結果、耳孔非開放型ヘッドホンを装着して自宅外にいる場合でも、外部音を妨げないようにシステム音及び外部音の音源位置を調整できる。つまり、システム音内の音要素と外部音内の他の音要素との間の音干渉を抑制できる。

＜４－５．情報処理装置の動作の一例＞
　図１４は、情報処理装置２Ｂの動作の一例を示す図である。自宅外で利用者が耳孔非開放型のヘッドホンを装着して、例えば、Ａさんの音声、車の音、Ｂさんの音声、再生コンテンツが発生した場合を想定する。更に、利用者が装着する音響出力デバイス３は、耳孔非開放型ヘッドホンとする。システム音取得部１１及び外部音取得部１１Ａは、Ａさんの音声、車の音、Ｂさんの音声、再生コンテンツ等を含む音信号を取得する。尚、外部音取得部１１Ａは、例えば、Ａさんの音声、車の音、Ｂさんの音声等の外部音を図示せぬマイクで取得する。

　Ａ／Ｄ変換部２１は、システム音取得部１１にて取得された音信号をデジタル変換し、デジタル変換後の音信号を分離部２２に出力する。Ａ／Ｄ変換部２１Ａは、外部音取得部１１Ａにて取得された外部音の音信号をデジタル変換し、デジタル変換後の音信号を分離部２２に出力する。分離部２２は、音信号から、例えば、Ａさんの音声の音要素、車の音の音要素、Ｂさんの音声の音要素、再生コンテンツの音要素を周波数解析等や音源分離技術等で分離する。音要素特定部２３は、分離された音要素毎の音要素種別を特定する。更に、検出部１５は、音響出力デバイス３を装着した利用者の現在位置が自宅外と判断する。重要度特定部２５は、重要度テーブル２６Ｂを参照し、自宅外の音要素毎の重要度を特定する。重要度特定部２５は、Ａさんの音声及び車の音の重要度を重要度１、Ｂさんの音声の重要度を重要度３、再生コンテンツの重要度を重要度２と判定する。

　また、音位置推定部２４は、分離された音要素毎の音源位置を推定する。音位置推定部２４は、実際の音源位置として、例えば、Ａさんの音声の実際の音源位置（例えば、正面）、車の音の実際の音源位置（例えば、右側面）を推定する。更に、音位置推定部２４は、実際の音源位置として、Ｂさんの音声の実際の音源位置（例えば、左側面）、再生コンテンツの実際の音源位置（頭内）を推定する。

　音位置設定部３２は、音要素毎の重要度に応じて音要素毎の３Ｄ信号処理後の音源位置を設定する。音位置設定部３２は、３Ｄ信号処理後の音源位置として、例えば、Ａさんの音声を実際の音源位置（正面の頭外）、車の音を実際の音源位置（例えば、右側面の頭外）に設定する。更に、音位置設定部３２は、３Ｄ信号処理後の音源位置として、Ｂさんの音声を実際の音源位置（例えば、左側面の頭外）、再生コンテンツを頭上の頭外に設定する。

　音量設定部３１は、音要素毎の重要度に応じて音要素毎の３Ｄ信号処理後の音量を設定する。音量設定部３１は、３Ｄ信号処理後の音量として、例えば、Ａさんの音声の音量を１倍、車の音の音量を１倍、Ｂさんの音声の音量を０倍、再生コンテンツの音量を１倍に設定する。３Ｄ信号処理部３４は、３Ｄ信号処理後の音要素毎の音量及び音源位置に基づき、音要素毎の３Ｄ音信号を生成する。３Ｄ信号処理部３４は、音要素毎の３Ｄ音信号を合成し、合成後の３Ｄ音信号をＤ／Ａ変換部３５に出力する。そして、Ｄ／Ａ変換部３５は、３Ｄ音信号及びノイズキャンセリング部３３で処理されるノイズキャンセル信号をアナログ変換し、アナログ変換後の３Ｄ音信号及びノイズキャンセル信号を音響出力デバイス３に音響出力する。その結果、音響出力デバイス３を装着した利用者は、頭上から流れる再生コンテンツをＢＧＭ的に聞きながら、Ｂさんの音声を聞くことなく、Ａさんの音声及び車の音を実際の音源位置から聞くことができる。

＜＜５．変形例＞＞
　情報処理装置２は、音響出力デバイス３と接続するバーチャルアシスタント等の情報処理装置を例示した。しかしながら、バーチャルアシスタントに限定されるものではなく、再生コンテンツを再生する機能や他の音要素を取得する機能を備えた、例えば、コンテンツ再生装置やスマートホンにも適用可能であり、適宜変更可能である。

　また、情報処理装置２は、例えば、クラウド上のサーバ装置でも良く、クラウド上で判定部１２や信号処理部１３の処理を実行し、信号処理部１３で生成した３Ｄ音信号を音響出力デバイス３に伝送しても良い。また、判定部１２及び信号処理部１３を音響出力デバイス３内に内蔵しても良い。

　音響出力デバイス３は、例えば、ＶＲ（Virtual　Reality）やＡＲ(Augmented　Reality)等のヘッドマウントディプレイ等のヘッドホンでも良く、適宜変更可能である。

　情報処理装置２では、音要素の重要度に応じて音要素の音源位置を変更する場合を例示したが、音要素の音源位置の変更に加えて、音要素の音響特性を調整しても良い。

　情報処理装置２では、重要度に応じて音要素の音源位置を変更し、変更後の音源位置での音量を調整する場合を例示した。しかしながら、音量を調整するのではなく、重要度の高い音要素が聞き取り易いように音要素の周波数特性を調整しても良い。

　情報処理装置２では、音響出力デバイス３を装着した利用者の現在位置が自宅又は自宅外の場合、現在位置に対応した音要素毎の重要度を定義する場合を例示した。しかしながら、自宅又は自宅外に限定されるものではなく、例えば、会社や電車内等の場所に対応した音要素毎の重要度を定義しても良い。

　また、情報処理装置２では、音響出力デバイス３を装着した利用者の現在位置等に限定されるものではなく、利用者の時間帯や利用者の状態、例えば、利用者が勉強中や睡眠中等の状態に対応付けて音要素毎の重要度を定義しても良い。例えば、利用者が勉強中の場合、再生コンテンツを頭内から頭上の頭外に変更しても良い。また、利用者が歯の治療中の場合、再生中のコンテンツを頭内から頭上の頭外に変更し、治療機器の鳴音の音要素を取得して、その逆相の音で治療機器の鳴音をキャンセルしても良い。

　また、情報処理装置２では、音要素の重要度に応じて再生コンテンツの音要素の音源位置を頭内から頭上の頭外に変更し、音源位置での音像の音量を調整する場合を例示した。しかしながら、再生コンテンツの内、歌詞部分の音声を除去し、伴奏部分の音のみを出力しても良い。

　また、情報処理装置２では、再生コンテンツの音要素が第１の通知音の音要素の重要度よりも高く、再生コンテンツの音要素が第２の通知音の音要素の重要度よりも低い場合を想定としたとする。この場合、情報処理装置２は、第１の通知音を頭上の頭外、第２の通知音を正面又は背面の頭外に変更しても良い。

　また、情報処理装置２では、Ａさんの音声の音要素の重要度を重要度テーブル２６Ａ内に事前に定義する場合を例示した。しかしながら、例えば、ＳＮＳのソーシャルグラフに応じて利用者との関連性の高い人を特定し、特定された人の音要素の重要度が高くなるように重要度テーブル２６Ａ内の定義を更新しても良い。

　また、情報処理装置２は、音要素が発生した場合に利用者の音の方向を向く等の反応動作を検出する機能を備え、利用者の反応動作に応じて当該音要素及び当該利用者の状態の組合せに応じて重要度テーブル２６内の音要素毎の重要度を変更しても良い。

　また、情報処理装置２では、自宅外の場合、例えば、車の音の音要素の重要度を重要度１とする場合を例示した。しかしなら、自宅外の場合でも、例えば、歩道橋のように、車の通らない場所では車に対する危険度は低くいため、場所に応じて重要度を変更しても良い。また、自宅外の場合でも、事故多発エリアの場合は、車の音要素の音量を大きくして車の存在を利用者に喚起しても良い。

　情報処理装置２では、車の音の音量と同時に、車の音の周波数を調整して車の音を聞き易くしても良く、また、特定の音を付け加えて車の存在を利用者に認識させ易くしても良い。

　情報処理装置２では、横断歩道等の青信号や赤信号等を知らせる報知音は地域によって異なる場合がある。しかしながら、情報処理装置２は、横断歩道の報知音を検出した場合に、その報知音の代わりに、利用者が知る地域の別の報知音に置き換えても良い。

　情報処理装置２は、音要素毎の重要度に応じて各音要素の音源位置を適宜変更した３Ｄ音信号を音響出力デバイス３に出力する場合を例示した。しかしながら、音響出力装置として音響出力デバイス３に限定されるものではなく、複数のスピーカを使用して音源位置を変更しても良い。

　本実施形態の情報処理装置２は、専用のコンピュータシステム、又は汎用のコンピュータシステムによって実現してもよい。

　例えば、上述の動作（例えば、第１の３Ｄ信号生成処理、第２の３Ｄ信号生成処理及び第３の３Ｄ信号生成処理）を実行するためのプログラムを、光ディスク、半導体メモリ、磁気テープ、フレキシブルディスク等のコンピュータ読み取り可能な記録媒体に格納して配布する。そして、例えば、該プログラムをコンピュータにインストールし、上述の処理を実行することによって情報処理装置２（２Ａ，２Ｂ）を構成する。

　また、上記プログラムをインターネット等のネットワーク上の他の情報処理装置が備える記憶装置に格納しておき、コンピュータにダウンロード等できるようにしてもよい。また、上述の機能を、ＯＳ（Operating　System）とアプリケーションソフトとの協働により実現してもよい。この場合には、ＯＳ以外の部分を媒体に格納して配布してもよいし、ＯＳ以外の部分をサーバ装置に格納しておき、コンピュータにダウンロード等できるようにしてもよい。

　また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部又は一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部又は一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。また、上記実施の形態では、具体的な値を示して説明をしている箇所があるが、値はその例に寄らず、別の値を使用してもよい。

　また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部又は一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的又は物理的に分散・統合して構成することができる。

　また、上述の実施形態は、処理内容を矛盾させない領域で適宜組み合わせることが可能である。また、上述の実施形態のフローチャート及びシーケンス図に示された各ステップは、適宜順序を変更することが可能である。

　また、例えば、本実施形態は、装置またはシステムを構成するあらゆる構成、例えば、システムＬＳＩ（Large　Scale　Integration）等としてのプロセッサ、複数のプロセッサ等を用いるモジュール、複数のモジュール等を用いるユニット、ユニットにさらにその他の機能を付加したセット等（すなわち、装置の一部の構成）として実施することもできる。

　なお、本実施形態において、システムとは、複数の構成要素（装置、モジュール（部品）等）の集合を意味し、全ての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、１つの筐体の中に複数のモジュールが収納されている１つの装置は、いずれも、システムである。

　また、本実施形態は、例えば、少なくとも１つの機能（例えば、判定部１２や信号処理部１３）を、ネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。

＜＜６．むすび＞＞
　以上説明したように、本開示の一実施形態の情報処理装置は、再生中のコンテンツの音要素及び、一又は複数の他の音要素を取得する取得部と、取得部にて取得された音要素の重要度を判定する判定部と、音要素の重要度に応じて、再生中のコンテンツの音要素又は他の音要素の何れか一方の音源位置を変更する信号処理部と、を有する。その結果、再生中のコンテンツを中断することなく、音要素の重要度に応じて各音要素の音源位置を変えることで音要素間の音干渉を抑制できる。そして、利用者は、再生コンテンツを聞きながら、他の音要素を聞き取り易くできる。

　情報処理装置は、他の音要素の重要度が再生中のコンテンツの音要素の重要度よりも高い場合に、再生中のコンテンツの音要素の音源位置を変更する。その結果、再生中のコンテンツの音要素と他の音要素との間の音干渉を抑制できる。そして、利用者は、再生コンテンツを聞きながら、他の音要素を聞き取り易くできる。

　情報処理装置は、他の音要素の重要度が再生中のコンテンツの音要素の重要度よりも高い場合に、再生中のコンテンツの音要素の音源位置を他の音要素の音源位置と異なる音源位置に変更する。その結果、再生中のコンテンツの音要素と他の音要素との間の音干渉を抑制できる。そして、利用者は、再生コンテンツを聞きながら、他の音要素を聞き取り易くできる。

　情報処理装置は、他の音要素の重要度が再生中のコンテンツの音要素の重要度よりも高い場合に、再生中のコンテンツの音要素の音源の音源位置を音響出力装置での頭外定位に変更する。その結果、再生中のコンテンツの音要素と他の音要素との間の音干渉を抑制できる。そして、利用者は、再生コンテンツを聞きながら、他の音要素を聞き取り易くできる。

　情報処理装置は、再生中のコンテンツの音要素の重要度が他の音要素の重要度よりも高い場合に、再生中のコンテンツの音要素の音源位置と他の音要素の音源位置とが異なる音響出力装置での頭外定位に変更する。その結果、再生中のコンテンツの音要素と他の音要素との間の音干渉を抑制できる。そして、利用者は、再生コンテンツを聞きながら、他の音要素を聞き取り易くできる。

　情報処理装置は、音響出力装置を使用する利用者の所定空間への移動を検出した場合に、所定空間に対応した各空間の音要素毎の重要度を管理する重要度テーブルを参照し、取得された音要素の重要度を判定する。所定空間とは、例えば利用者の自宅や自宅外の様々な環境ということができる。また、所定空間への移動とは、例えば利用者が自宅内から自宅外へ移動するときや、自宅外から自宅内に移動するとき、自宅外のある空間から別の空間に移動することという事ができる。その結果、音響出力装置を使用する利用者が移動する所定空間毎に音要素の重要度を変更することで、所定空間毎の重要度に応じた音要素間の音干渉を抑制できる。

　情報処理装置は、重要度テーブルを参照し、分離された音要素毎の重要度を判定する。その結果、音要素毎の重要度を変更することで、音要素間の音干渉を抑制できる。

　情報処理装置は、特定人物の音要素を含む音要素毎の重要度を管理する重要度テーブルと、重要度テーブルを参照し、分離された他の音要素から特定された特定人物の音要素の重要度が再生中のコンテンツの音要素よりも高い場合に、当該特定人物の他の音要素を強調すると共に、特定された特定人物の他の音要素の重要度が再生中のコンテンツの音要素よりも高くない場合に、当該特定人物の他の音要素をキャンセルする。その結果、再生コンテンツの重要度よりも高い特定人物の音声がある場合に特定人物の音要素を優先し、再生コンテンツの重要度よりも高くない特定人物以外の人物の音声がある場合、その音声をキャンセルすることで、特定人物の音声への音干渉を抑制できる。

　情報処理装置は、音響出力装置の利用者と特定人物との関連性に応じて当該特定人物の音要素の重要度が高くなるように特定人物の音要素を含む音要素毎の重要度を更新する。その結果、利用者と特定人物との関連性に応じて特定人物の音要素毎の重要度を更新できる。

　重要度テーブルは、一つの重要度テーブルにおいて適宜重要度が更新されても良いし、予め複数の重要度テーブルをクラウドやデータベース等に格納しておき、重要度が変更されるタイミングで複数の中から所定の重要度テーブルが適宜参照されるようにしても良いし、その両方のパターンが適宜組み合わされるようにしても良い。

　情報処理装置は、情報処理装置が発する音要素と、情報処理装置の外部から取り込む外部音の音要素を含む当該情報処理装置外の他の音要素とを取得し、音要素を音源位置に出力する音響出力装置が耳孔開放型ヘッドホンの場合に、情報処理装置が発する音要素の重要度に応じて音要素の音源位置を変更可能にする。また、情報処理装置は、音響出力装置が耳孔非開放型ヘッドホンの場合に、情報処理装置が発する音要素の重要度及び外部音の音要素の重要度に応じて音要素の音源位置を変更可能にする。その結果、利用者が耳孔開放型ヘッドホンを装着する場合、音要素の重要度に応じて、情報処理装置が発する音要素の音源位置を変更できると共に、利用者が耳孔非開放型ヘッドホンを装着する場合に、音要素の重要度に応じて、情報処理装置が発する音要素及び外部音の音要素の音源位置を変更できる。

　以上、本開示の各実施形態について説明したが、本開示の技術的範囲は、上述の各実施形態そのままに限定されるものではなく、本開示の要旨を逸脱しない範囲において種々の変更が可能である。また、異なる実施形態及び変形例にわたる構成要素を適宜組み合わせてもよい。

　また、本明細書に記載された各実施形態における効果はあくまで例示であって限定されるものでは無く、他の効果があってもよい。

　なお、本技術は以下のような構成も取ることができる。
（１）
　一又は複数の音要素を取得する取得部と、
　前記取得部にて取得された前記音要素の重要度を判定する判定部と、
　前記判定部にて判定された前記音要素の重要度に応じて、再生中のコンテンツの音要素及び他の音要素の少なくとも一つの音源位置を変更する信号処理部と、
　を有する情報処理装置。
（２）
　前記一又は複数の音要素は、少なくとも再生中のコンテンツを含むことを特徴とする、
前記（１）に記載の情報処理装置。
（３）
　前記信号処理部は、
　前記他の音要素の重要度が前記再生中のコンテンツの音要素の重要度よりも高い場合に、前記再生中のコンテンツの音要素の前記音源位置を変更する前記（１）又は（２）に記載の情報処理装置。
（４）
　前記信号処理部は、
　前記他の音要素の重要度が前記再生中のコンテンツの音要素の重要度よりも高い場合に、前記再生中のコンテンツの音要素の音源位置を前記他の音要素の音源位置と異なる音源位置に変更する前記（１）～（３）の何れか一つに記載の情報処理装置。
（５）
　前記信号処理部は、
　前記他の音要素の重要度が前記再生中のコンテンツの音要素の重要度よりも高い場合に、頭部伝達関数用いて前記再生中のコンテンツの音要素の音源位置を頭外に変更する前記（１）～（４）の何れか一つに記載の情報処理装置。
（６）
　前記信号処理部は、
　前記再生中のコンテンツの前記音要素の重要度が前記他の音要素の重要度よりも高い場合に、頭部伝達関数を用いて前記再生中のコンテンツの音要素の音源位置と前記他の音要素の音源位置とが異なるように変更する前記（１）～（４）の何れか一つに記載の情報処理装置。
（７）
　前記音要素を音源位置に定位出力する音響出力装置と、
　を有し、
　前記判定部は、音要素の種別ごとに重要度付けされた重要度テーブルを参照し、各音要素の重要度を判定することを特徴とする前記（１）～（６）の何れか一つに記載の情報処理装置。
（８）
　前記重要度テーブルは、前記音響出力装置を装着した利用者がいる所定空間に応じて前記音要素の重要度を更新することを特徴とする前記（１）～（７）の何れか一つに記載の情報処理装置。
（９）
　前記重要度テーブルは、前記音響出力装置を装着した利用者の第１の所定空間から第２の所定空間への移動を検知した場合に、前記音要素の重要度定義を更新することを特徴とする前記（１）～（８）の何れか一つに記載の情報処理装置。
（１０）
　前記重要度テーブルは、前記音響出力装置を装着した利用者と特定人物との関連性に応じて前記音要素の重要度を更新することを特徴とする前記（１）～（９）の何れか一つに記載の情報処理装置。
（１１）
　前記他の音要素から特定された特定人物の音要素の重要度が前記再生中のコンテンツの音要素よりも高い場合に、当該特定人物の他の音要素を強調すると共に、前記特定された前記特定人物の他の音要素の重要度が前記再生中のコンテンツの音要素よりも高くない場合に、当該特定人物の他の音要素をキャンセルするキャンセリング部と、
　を有する前記（１）に記載の情報処理装置。
（１２）
　前記取得部は、
　前記再生中のコンテンツの音要素を含む当該情報処理装置が発する音要素と、
　前記情報処理装置外部から取り込む外部音の音要素を含む当該情報処理装置外部の他の音要素とを取得し、
　前記信号処理部は、
　前記音要素を音源位置に出力する音響出力装置が耳孔開放型ヘッドホンの場合に、前記音要素の重要度に応じて、前記情報処理装置が発する前記音要素の音源位置を変更可能にすると共に、
　前記音響出力装置が耳孔非開放型ヘッドホンの場合に、前記音要素の重要度に応じて、前記情報処理装置が発する音要素及び前記外部音の音要素の音源位置を変更可能にする前記（１）～（１１）の何れか一つに記載の情報処理装置。
（１３）
　前記取得部にて取得された前記音要素を分離する分離部と、をさらに有する
前記（１）～（１２）の何れか一つに記載の情報処理装置。
（１４）
　一又は複数の他の音要素を取得し、
　取得された前記音要素の重要度を判定し、
　判定された前記音要素の重要度に応じて、再生中のコンテンツの音要素及び前記他の音要素の少なくとも一つの音源位置を変更する
　処理を実行する情報処理方法。
（１５）
　一又は複数の他の音要素を取得し、
　取得された前記音要素の重要度を判定し、
　判定された前記音要素の重要度に応じて、再生中のコンテンツの音要素及び前記他の音要素の少なくとも一つの音源位置を変更する
　を処理をコンピュータに実行させる情報処理プログラム。
（１６）
　一又は複数の他の音要素を取得する情報処理装置と、前記情報処理装置にて取得された前記音要素を音源位置に出力する音響出力装置とを有する情報処理システムであって、
　前記情報処理装置は、
　前記音要素の重要度を判定する判定部と、
　前記判定部にて判定された前記音要素の重要度に応じて、再生中のコンテンツの音要素及び前記他の音要素の少なくとも一つの前記音響出力装置での音源位置を変更する信号処理部と、
　を有する情報処理システム。

　１　情報処理システム
　２、２Ａ、２Ｂ　情報処理装置
　３　ヘッドホン
　１１　取得部
　１２　判定部
　１３　信号処理部
　１４　デバイス特定部
　１５　検出部
　２５　重要度特定部
　２６，２６Ａ、２６Ｂ　重要度テーブル
　３１　音量設定部
　３２　音位置設定部
　３４　３Ｄ信号処理部

Claims

　一又は複数の音要素を取得する取得部と、
　前記取得部にて取得された前記音要素の重要度を判定する判定部と、
　前記判定部にて判定された前記音要素の重要度に応じて、再生中のコンテンツの音要素及び他の音要素の少なくとも一つの音源位置を変更する信号処理部と、
　を有する情報処理装置。
　前記一又は複数の音要素は、少なくとも再生中のコンテンツを含むことを特徴とする、
請求項１に記載の情報処理装置。
　前記信号処理部は、
　前記他の音要素の重要度が前記再生中のコンテンツの音要素の重要度よりも高い場合に、前記再生中のコンテンツの音要素の前記音源位置を変更する請求項１に記載の情報処理装置。
　前記信号処理部は、
　前記他の音要素の重要度が前記再生中のコンテンツの音要素の重要度よりも高い場合に、前記再生中のコンテンツの音要素の音源位置を前記他の音要素の音源位置と異なる音源位置に変更する請求項１に記載の情報処理装置。
　前記信号処理部は、
　前記他の音要素の重要度が前記再生中のコンテンツの音要素の重要度よりも高い場合に、頭部伝達関数用いて前記再生中のコンテンツの音要素の音源位置を頭外に変更する請求項１に記載の情報処理装置。
　前記信号処理部は、
　前記再生中のコンテンツの前記音要素の重要度が前記他の音要素の重要度よりも高い場合に、頭部伝達関数を用いて前記再生中のコンテンツの音要素の音源位置と前記他の音要素の音源位置とが異なるように変更する請求項１に記載の情報処理装置。
　前記音要素を音源位置に定位出力する音響出力装置と、
　を有し、
　前記判定部は、音要素の種別ごとに重要度付けされた重要度テーブルを参照し、各音要素の重要度を判定することを特徴とする請求項１に記載の情報処理装置。
　前記重要度テーブルは、前記音響出力装置を装着した利用者がいる所定空間に応じて前記音要素の重要度を更新することを特徴とする請求項１に記載の情報処理装置。
　前記重要度テーブルは、前記音響出力装置を装着した利用者の第１の所定空間から第２の所定空間への移動を検知した場合に、前記音要素の重要度定義を更新することを特徴とする請求項１に記載の情報処理装置。
　前記重要度テーブルは、前記音響出力装置を装着した利用者と特定人物との関連性に応じて前記音要素の重要度を更新することを特徴とする請求項１に記載の情報処理装置。
　前記他の音要素から特定された特定人物の音要素の重要度が前記再生中のコンテンツの音要素よりも高い場合に、当該特定人物の他の音要素を強調すると共に、前記特定された前記特定人物の他の音要素の重要度が前記再生中のコンテンツの音要素よりも高くない場合に、当該特定人物の他の音要素をキャンセルするキャンセリング部と、
　を有する請求項１に記載の情報処理装置。
　前記取得部は、
　前記再生中のコンテンツの音要素を含む当該情報処理装置が発する音要素と、
　前記情報処理装置外部から取り込む外部音の音要素を含む当該情報処理装置外部の他の音要素とを取得し、
　前記信号処理部は、
　前記音要素を音源位置に出力する音響出力装置が耳孔開放型ヘッドホンの場合に、前記音要素の重要度に応じて、前記情報処理装置が発する前記音要素の音源位置を変更可能にすると共に、
　前記音響出力装置が耳孔非開放型ヘッドホンの場合に、前記音要素の重要度に応じて、前記情報処理装置が発する音要素及び前記外部音の音要素の音源位置を変更可能にする請求項１に記載の情報処理装置。
　前記取得部にて取得された前記音要素を分離する分離部と、をさらに有する
請求項１に記載の情報処理装置。
　一又は複数の他の音要素を取得し、
　取得された前記音要素の重要度を判定し、
　判定された前記音要素の重要度に応じて、再生中のコンテンツの音要素及び前記他の音要素の少なくとも一つの音源位置を変更する
　処理を実行する情報処理方法。
　一又は複数の他の音要素を取得し、
　取得された前記音要素の重要度を判定し、
　判定された前記音要素の重要度に応じて、再生中のコンテンツの音要素及び前記他の音要素の少なくとも一つの音源位置を変更する
　を処理をコンピュータに実行させる情報処理プログラム。
　一又は複数の他の音要素を取得する情報処理装置と、前記情報処理装置にて取得された前記音要素を音源位置に出力する音響出力装置とを有する情報処理システムであって、
　前記情報処理装置は、
　前記音要素の重要度を判定する判定部と、
　前記判定部にて判定された前記音要素の重要度に応じて、再生中のコンテンツの音要素及び前記他の音要素の少なくとも一つの前記音響出力装置での音源位置を変更する信号処理部と、
　を有する情報処理システム。