WO2024075527A1

WO2024075527A1 - 情報処理装置、情報処理方法、およびプログラム

Info

Publication number: WO2024075527A1
Application number: PCT/JP2023/034201
Authority: WO
Inventors: 祐司土田
Original assignee: ソニーグループ株式会社
Priority date: 2022-10-07
Filing date: 2023-09-21
Publication date: 2024-04-11

Abstract

本開示は、インパルス応答の調整作業の効率化を図ることができるようにする情報処理装置、情報処理方法、およびプログラムに関する。レベル制御部は、インパルス応答に含まれる第１の音成分および第２の音成分と相関があるパラメータの調整に応じて、第１の音成分のレベルと第２の音成分のレベルを変化させる。本開示に係る技術は、例えば、リモート合奏システムに適用することができる。

Description

情報処理装置、情報処理方法、およびプログラム

　本開示は、情報処理装置、情報処理方法、およびプログラムに関し、特に、インパルス応答の調整作業の効率化を図ることができるようにする情報処理装置、情報処理方法、およびプログラムに関する。

　従来、複数の演奏者がそれぞれ離れた場所にいるような状態で合奏を行うことができるリモート合奏システムが知られている。

　例えば特許文献１には、共演する複数のユーザの音響信号に対して、仮想空間におけるユーザ間の位置関係に応じた頭部伝達関数を畳み込むことで、遠隔にいる複数の演奏者による高度な合奏を実現できるようにしたリモート合奏システムが開示されている。

　このようなリモート合奏システムにおいては、演奏者（ユーザ）が、マイク（マイクロフォン）入力に対して音場再現のインパルス応答を畳み込んだ音響信号を、ヘッドホンを介して聞くケースがある。

国際公開第２０２２／１９６０７３号

　音源からユーザの両耳までの伝達特性をユーザ自身が調整する場合、例えば絶対音量は、インパルス応答の調整に伴い変化する特性があることから、これらの調整項目が最適値に収束するまでに微調整を繰り返す必要があった。

　本開示は、このような状況に鑑みてなされたものであり、インパルス応答の調整作業の効率化を図ることができるようにするものである。

　本開示の情報処理装置は、インパルス応答に含まれる第１の音成分および第２の音成分と相関があるパラメータの調整に応じて、前記第１の音成分のレベルと前記第２の音成分のレベルを変化させるレベル制御部を備える情報処理装置である。

　本開示の情報処理方法は、情報処理装置が、インパルス応答に含まれる第１の音成分および第２の音成分と相関があるパラメータの調整に応じて、前記第１の音成分のレベルと前記第２の音成分のレベルを変化させる情報処理方法である。

　本開示のプログラムは、コンピュータに、インパルス応答に含まれる第１の音成分および第２の音成分と相関があるパラメータの調整に応じて、前記第１の音成分のレベルと前記第２の音成分のレベルを変化させる処理を実行させるためのプログラムである。

　本開示においては、インパルス応答に含まれる第１の音成分および第２の音成分と相関があるパラメータの調整に応じて、前記第１の音成分のレベルと前記第２の音成分のレベルが変化させられる。

本開示の一実施形態に係るリモート合奏システムの構成例を示す図である。ブースに設けられる機器の例を示す図である。インパルス応答の音成分の例を示す図である。従来想定され得るインパルス応答の調整のためのＵＩの例を示す図である。本開示のインパルス応答の調整のためのＵＩの例を示す図である。本開示のインパルス応答の調整のためのＵＩの例を示す図である。本開示のインパルス応答の調整のためのＵＩの例を示す図である。情報処理装置の機能構成例を示すブロック図である。インパルス応答の調整処理の流れを説明するフローチャートである。調整項目に応じたレベル制御の流れを説明するフローチャートである。調整項目に応じたレベル制御の流れを説明するフローチャートである。コンピュータのハードウェアの構成例を示すブロック図である。

　以下、本開示を実施するための形態（以下、実施形態とする）について説明する。なお、説明は以下の順序で行う。

　１．リモート合奏システムの構成とその課題
　２．インパルス応答の調整のためのＵＩの例
　３．情報処理装置の構成とインパルス応答の調整処理
　４．適用例
　５．コンピュータの構成例

＜１．リモート合奏システムの構成とその課題＞
　図１は、本開示の一実施形態に係るリモート合奏システムの構成例を示す図である。

　図１に示されるリモート合奏システム１は、それぞれ離れた場所にいる演奏者が行ういわゆるリモート合奏に用いられるシステムである。

　図１の例においては、オーケストラの演奏者である演奏者Ｐ１乃至Ｐ４が示されている。演奏者Ｐ１と演奏者Ｐ２が担当する楽器はヴァイオリンであり、演奏者Ｐ３が担当する楽器はチェロである。演奏者Ｐ４が担当する楽器はトランペットである。

　なお、演奏者の数は４人に限定されるものではなく、実際には、さらに多くの演奏者によって、さらに多くの種類の楽器を用いたリモート合奏が行われる。楽団の編成などによって、演奏者の数は異なる数になる。

　図１のリモート合奏システム１は、伝送制御装置１０に対して、演奏者Ｐ１乃至Ｐ４が使用する複数の情報処理装置が接続されることにより構成される。伝送制御装置１０とそれぞれの情報処理装置の間が有線の通信によって接続されるようにしてもよいし、無線の通信によって接続されるようにしてもよい。伝送制御装置１０と演奏者Ｐ１乃至Ｐ４が使用する複数の情報処理装置とが有線の通信によって接続される場合、例えばＵＳＢ（Universal Serial Bus）ケーブルなどの所定の規格が用いられてよい。また、伝送制御装置１０と演奏者Ｐ１乃至Ｐ４が使用する複数の情報処理装置とが無線の通信によって接続される場合、Ｗｉ－Ｆｉ（登録商標）やＢｌｕｅｔｏｏｔｈ（登録商標）などの任意の通信プロトコルが用いられてよい。

　演奏者Ｐ１乃至Ｐ４は、遠隔の空間において演奏を行う。例えば、スタジオ内に用意されたそれぞれ異なるブースが演奏を行う空間として用いられる。図１において、演奏者Ｐ１乃至Ｐ４のそれぞれを囲む破線の矩形は、演奏者Ｐ１乃至Ｐ４がそれぞれ異なるブースで演奏を行っていることを表す。

　図２は、ブースに設けられる機器の例を示す図である。

　図２に示されるように、演奏者Ｐ１のブース内には、ヘッドホン１１０、マイク（マイクロフォン）１２０、および情報処理装置１３０が設けられる。ヘッドホン１１０とマイク１２０は、ＰＣ（Personal Computer）やスマートフォン、タブレット端末などにより構成される情報処理装置１３０に接続される。マイク１２０は、適宜、伝送制御装置１０に直接接続されてもよい。ヘッドホン１１０、マイク１２０、および情報処理装置１３０は、それぞれ有線または無線で接続されていてもよい。

　ヘッドホン１１０は、演奏者Ｐ１の頭部に装着される出力機器である。ヘッドホン１１０は、情報処理装置１３０による制御に従って、演奏者Ｐ１自身の演奏音や共演者の演奏音を出力する。ヘッドホンに代えて、イヤホン（インナーイヤーヘッドホン）が出力機器として用いられるようにしてもよい。

　マイク１２０は、演奏者Ｐ１の演奏音（演奏者Ｐ１が演奏する楽器からの音）を収音する。

　演奏者Ｐ２乃至Ｐ４のそれぞれのブース内にも、演奏者Ｐ１のブース内と同様に、ヘッドホン１１０、マイク１２０、および情報処理装置１３０の３つの機器が設けられる。

　このように、リモート合奏システム１において、それぞれの演奏者は、ヘッドホン１１０を装着し、ヘッドホン１１０から出力される演奏音を聴きながら、マイク１２０に向かって演奏を行うことになる。

　このようなリモート合奏システム１では、実際の演奏環境を仮想的に再現することで、演奏者は、自身の演奏に没入することができる。そのためには、従来の映画や音楽などのコンテンツ鑑賞のための音場再現とは異なり、音場のインパルス応答だけではなく絶対音量も正確に再現される必要がある。

　また、音場再現中の演奏においては、楽器からの音を収音するマイク１２０と、演奏者の頭部に装着されるヘッドホン１１０との間の距離が近くなる。ここで、ヘッドホン１１０として開放型のヘッドホンを使用した場合、マイク１２０との間の音響的なフィードバックによりハウリングなどが発生するおそれがある。この問題を回避するために、密閉型のヘッドホンやイヤホンを使用した場合、演奏者は、自身の楽器からの直接音を聴くことができなくなるため、マイク入力に対して直接音を含む音場再現のインパルス応答を畳み込んだ音響信号を、ヘッドホンを介して聞くことになる。

　しかしながら、音源となる楽器から演奏者の両耳までの伝達関数（伝達特性）については、
・伝搬距離が極端に短い上に、楽器自体が複雑な放射パターンを有していること
・骨伝導などで伝わる成分も聴感に影響すること
などがわかっている。これらのことから、事前に測定や計算により求めた伝達関数では、演奏者が主観的に違和感を覚えることが多かった。

　さらに、絶対音量の再現についても、個々の再生環境での感度校正が必要となるため、現実的には難しいことが多かった。

　以上のことから、演奏者は、演奏を実施する前に、
・「絶対音量」
・「自身の楽器からの直接音のレベル」（以下、単に「直接音のレベル」という）
・「自身の楽器からの間接音のレベル」（以下、単に「間接音のレベル」という）
の微調整を行う必要があった。

　図３は、演奏者が演奏する楽器からマイク１２０で収音されて、演奏者の頭部に装着されるヘッドホン１１０で再生される再生音についての、インパルス応答の音成分の例を示す図である。

　図３に示されるように、インパルス応答の音成分は、大きく「直接音」と「間接音」に分類することができる。さらに「間接音」は、「初期反射音」と「後部残響音」に分類することができる。演奏者がインパルス応答の微調整を行う場合、これらの調整項目（パラメータ）毎にそのレベルを調整することになる。

　一方で、「絶対音量」は、「直接音のエネルギー」と「間接音のエネルギー」の和で決定されるため、調整項目としての「直接音のレベル」は、「絶対音量」とは完全に独立していない。そのため、「直接音のレベル」を調整すると「絶対音量」の再調整が必要となってしまい、その逆に「絶対音量」を調整すると「直接音のレベル」の再調整が必要となってしまっていた。

　このような調整項目（パラメータ）間の相関によって、演奏者はこれら全ての調整項目が最適値に収束するまで微調整を繰り返す必要があった。

　ここで、「直接音のレベル」は、例えば直接音の振幅の値とされ、「直接音のエネルギー」は、例えば信号処理に用いるインパルス応答のサンプル値の二乗を直接音の時間区間に渡って累積加算した値とされる。「間接音のレベル」と「間接音のエネルギー」についても、それぞれ直接音と同様に定義され得る。また、後述する「直接音と間接音の比率」は、例えば直接音のエネルギーと間接音のエネルギーの比とされる。これに限らず、直接音と間接音それぞれの「レベル」や「エネルギー」は、それぞれの音に関わる他の物理量に基づいて定義されてもよい。

＜２．インパルス応答の調整のためのＵＩの例＞
　ここで、上述したインパルス応答の調整のためのＵＩ（User Interface）の例について説明する。

　図４は、従来想定され得るインパルス応答の調整のためのＵＩの例を示す図である。

　図４には、インパルス応答の調整のためのＵＩとして提示される調整画面Ａｄ１が示されている。

　調整画面Ａｄ１には、調整項目（パラメータ）である「絶対音量」、「直接音のレベル」、および「間接音のレベル」それぞれの値を示すとともにこれらパラメータの調整を受け付けるスライダが設けられている。

　図４の例では、調整画面Ａｄ１において直接音のレベルを調整する場合の調整作業の過程が示されている。具体的には、ユーザ（演奏者）による操作により「直接音のレベル」が調整されたとする。このとき、直接音のレベルと相関のある「絶対音量」が変化してしまうため、ユーザによる操作により「絶対音量」が調整される。すると、「直接音のレベル」が変化してしまうため、ユーザによる操作により「直接音のレベル」が再び調整される。このとき、「絶対音量」がまた変化してしまうため、ユーザによる操作により「絶対音量」が再び調整される。

　このように、「絶対音量」と「直接音のレベル」は互いに独立していないため、それぞれが最適値に収束するまで、ユーザは「絶対音量」と「直接音のレベル」を交互に微調整する必要があった。

　これに対して、本開示に係る技術においては、インパルス応答の調整作業の効率化を図るべく、以下の２つの観点に基づいて調整項目（パラメータ）の変換と集約を行う。

（１）演奏者にとって主観的な調整の行いやすさ
　「直接音のレベル」や「間接音のレベル」といった調整項目は、インパルス応答を合成する際の便宜上の分類であり、最終的に演奏者（ユーザ）が聴取する音には直接的な関連はない。つまり、演奏者は最終的にヘッドホンから出力される音の中から「直接音」だけを分離して聴取することはできないし、「間接音」だけを分離して聴取することもできない。

　このことは、演奏者が「直接音」や「間接音」といった分類に基づいて調整操作を行ったとしても、それが調整結果にどのように反映されたかを主観的に理解しにくい要因となっている。

　これに対して、調整項目（パラメータ）を「調整操作が調整結果にどのように反映されたかを、演奏者が主観的に把握しやすいもの」に変換することで、インパルス応答の調整作業の効率化を図る。

（２）調整項目の余剰次元の削減
　調整項目である「絶対音量」、「直接音のレベル」、「間接音のレベル」は相互に独立していないため、パラメータとしての次元数は過剰となってしまう。調整項目が多くなればそれだけ調整作業は煩雑になる。

　そこで、調整項目の余剰次元を削減し調整項目の数を減らすことで、インパルス応答の調整作業の効率化を図る。

　図５および図６は、本開示のインパルス応答の調整のためのＵＩの例を示す図である。

　図５および図６には、インパルス応答の調整のためのＵＩとして提示される調整画面Ａｄ１１が示されている。

　調整画面Ａｄ１１には、図４の調整画面Ａｄ１と同様の構成に加え、調整項目（パラメータ）として「直接音と間接音の比率」の値を示すとともに当該パラメータの調整を受け付けるスライダが設けられている。なお、当該パラメータの調整に用いられるＵＩとして、スライダ以外のもの（例えばラジオボタンや音声入力など）が用いられてもよい。

　図５の例では、調整画面Ａｄ１１において絶対音量を調整する場合の調整作業の過程が示されている。具体的には、ユーザ（演奏者）による操作により「絶対音量」が調整されると、「絶対音量」を用いて「直接音のレベル」と「間接音のレベル」それぞれを表す関係式に基づいて、「直接音のレベル」と「間接音のレベル」が自動的に変化する。このとき、「直接音と間接音の比率」は変化せず、一定のままとされる。

　また図６の例では、調整画面Ａｄ１１において直接音と間接音の比率を調整する場合の調整作業の過程が示されている。具体的には、ユーザ（演奏者）による操作により「直接音と間接音の比率」が調整されると、「直接音と間接音の比率」を用いて「直接音のレベル」と「間接音のレベル」それぞれを表す関係式に基づいて、「直接音のレベル」と「間接音のレベル」が自動的に変化する。このとき、「絶対音量」は変化せず、一定のままとされる。

　このように、ユーザが、調整画面Ａｄ１１において、調整操作が調整結果にどのように反映されたかを主観的に把握しやすい「絶対音量」や「直接音と間接音の比率」を調整することで、「直接音のレベル」と「間接音のレベル」が自動的に調整されるようになる。

　なお、調整画面Ａｄ１１においては、「直接音のレベル」と「間接音のレベル」それぞれのスライダではなく、「絶対音量」や「直接音と間接音の比率」の調整に応じて「直接音のレベル」と「間接音のレベル」それぞれの値を示すのみのインジケータが設けられてもよい。この場合、これらのインジケータは、「直接音のレベル」と「間接音のレベル」の調整を受け付けないようになされる。

　ここで、「直接音のレベル」または「間接音のレベル」の調整を行う場合に、「絶対音量」と「直接音と間接音の比率」のうち、ユーザにより指定された値を固定することでその調整を受け付けないようにし、固定されていない値を自動的に変化させるようにしてもよい。例えば、「絶対音量」を固定した状態で「直接音のレベル」を変化させた場合、絶対音量（すなわち、直接音のレベルと間接音のレベルの和）を変化させることなく、「間接音のレベル」と「直接音と間接音の比率」が自動的に調整される。なお、固定するパラメータは、前述のようにユーザにより任意に指定されてもよいし、インパルス応答を測定した際の環境情報（例えば演奏環境の広さや材質）などにより決定されたり、前述以外の方法で決定されたりしてもよい。

　また、図７に示される調整画面Ａｄ１２のように、「直接音のレベル」と「間接音のレベル」のスライダやインジケータが提示されずに、「絶対音量」と「直接音と間接音の比率」それぞれを調整するためのスライダのみが提示されるようにしてもよい。なお、調整画面に提示される項目である「絶対音量」、「直接音のレベル」、「間接音のレベル」、「直接音と間接音の比率」のうち、どの項目を調整画面上に提示させるかを、ユーザが適宜設定できるようにしてもよい。また、調整画面に提示される項目として、前述した４つのパラメータを例として挙げたが、これら以外のパラメータを別途追加して提示できるようにしてもよい。

＜３．情報処理装置の構成とインパルス応答の調整処理＞
　以下においては、本開示に係る技術を適用した情報処理装置の構成と、情報処理装置によるインパルス応答の調整処理について説明する。

（情報処理装置の構成）
　図８は、本開示に係る技術を適用した情報処理装置１３０の機能構成例を示すブロック図である。図８に示される機能ブロックのうちの少なくとも一部は、情報処理装置１３０を構成するＰＣなどに搭載されたＣＰＵ（Central Processing Unit）によりプログラムが実行されることによって実現される。

　図８に示される情報処理装置１３０は、音響信号取得部１５１、インパルス応答保持部１５２、畳み込み処理部１５３、出力制御部１５４、ＵＩ制御部１５５、ＵＩ提示部１５６、およびレベル制御部１５７を含むように構成される。

　音響信号取得部１５１は、マイク１２０により収音された演奏音の音響信号を取得する。音響信号取得部１５１により取得された音響信号は、畳み込み処理部１５３に供給される。

　インパルス応答保持部１５２には、ユーザ（演奏者）が楽器を演奏する演奏環境においてあらかじめ測定されたか、または計算された、音場再現のインパルス応答が保持される。インパルス応答保持部１５２に保持されているインパルス応答は、必要に応じて、畳み込み処理部１５３、ＵＩ制御部１５５、およびレベル制御部１５７に取得される。インパルス応答保持部１５２には、測定されたインパルス応答に加えて、インパルス応答を測定した際の環境情報（例えばコンサートホールやスタジアムといったような演奏環境の種別、その広さ（容積など）や形状、演奏環境の壁面や床面に使用される材質）などが保持（格納）されていてもよい。

　畳み込み処理部１５３は、音響信号取得部１５１から供給された音響信号に対して、インパルス応答保持部１５２から取得したインパルス応答を畳み込む畳み込み処理を実行する。畳み込み処理が施された音響信号は、出力制御部１５４に供給される。

　出力制御部１５４は、畳み込み処理部１５３から供給された音響信号に基づいた再生音をヘッドホン１１０から出力させる。

　ＵＩ制御部１５５は、ＵＩ提示部１５６を制御することで、図５や図６を参照して説明したようなインパルス応答の調整のためのＵＩ（調整画面）の提示を制御する。具体的には、インパルス応答保持部１５２に保持されているインパルス応答に含まれる音成分と相関のあるパラメータ（調整項目）の値を示すとともに、当該パラメータの調整を受け付けるＧＵＩパーツ（例えばスライダやボタン）を有するＵＩの提示が制御される。また、ＵＩとしては、先述したスライダなどに限定されず、つまみやボタン、音声によるものなどが用いられてもよい。

　また、ＵＩ制御部１５５は、ＵＩ提示部１５６に提示されたＵＩにおいて設定されている各調整項目の設定値や、当該ＵＩに対するユーザの操作を表す操作情報をレベル制御部１５７に供給する。

　ＵＩ提示部１５６は、液晶ディスプレイやＬＥＤ（Light Emitting Diode）ディスプレイ、有機ＥＬ（Electro-Luminescence）ディスプレイなどの、ＵＩを表示可能な表示部と、キーボードやマウスなどの、ユーザの操作を受付可能な操作部を含むように構成される。ＵＩ提示部１５６は、表示部と操作部それぞれの機能を備えるタッチパネルモニタにより構成されてもよい。ＵＩ提示部１５６は、ＰＣなどにより構成される情報処理装置１３０と一体に構成されてもよいし、情報処理装置１３０とは別個に構成されてもよい。

　レベル制御部１５７は、ＵＩ制御部１５５からの操作情報で表されるユーザの操作に応じて、インパルス応答保持部１５２に保持されているインパルス応答に含まれる第１の音成分と第２の音成分のレベルを変化させる。ＵＩ制御部１５５からの操作情報で表されるユーザの操作は、例えば、インパルス応答に含まれる第１の音成分と第２の音成分と相関があるパラメータの調整のための操作とされる。

　より詳細には、レベル制御部１５７は、ユーザの操作に応じて調整されるパラメータを用いて第１の音成分のレベルと第２の音成分のレベルそれぞれを表す関係式に基づいて、第１の音成分のレベルと第２の音成分のレベルを変化させる。なお、以下においては、インパルス応答に含まれる第１の音成分を「直接音」とし、第２の音成分を「間接音」として説明する。

（インパルス応答の調整処理）
　図９のフローチャートを参照して、図８の情報処理装置１３０のレベル制御部１５７により実行されるインパルス応答の調整処理の流れについて説明する。

　ステップＳ１１において、レベル制御部１５７は、ＵＩ提示部１５６に提示されたＵＩにおいて設定されている、調整前の絶対音量Ｇａ、直接音のレベルＬ１ａ、および間接音のレベルＬ２ａの設定値を、ＵＩ制御部１５５を介して取得する。

　ステップＳ１２において、レベル制御部１５７は、畳み込み処理部１５３に供給されている調整前のインパルス応答に基づいて、調整前の直接音のエネルギーＥ１ａ、間接音のエネルギーＥ２ａ、および全体のエネルギーＥａを算出する。

　直接音のエネルギーＥ１ａと間接音のエネルギーＥ２ａそれぞれは、直接音のレベルＬ１ａと間接音のレベルＬ２ａそれぞれのサンプル値の二乗を累積加算することで求められる。また、全体のエネルギーＥａは、直接音のエネルギーＥ１ａと間接音のエネルギーＥ２ａの和として求められる。

　ステップＳ１３において、レベル制御部１５７は、ＵＩ提示部１５６に提示されているＵＩにおける調整項目の調整に応じて、インパルス応答保持部１５２に保持されているインパルス応答の直接音のレベルと間接音のレベルを変化させる。

　ここでは、ＵＩにおける調整項目として、「絶対音量」と「直接音と間接音の比率」のいずれかが調整される。

（ａ）絶対音量が調整される場合の直接音と間接音のレベル制御
　まず、図１０のフローチャートを参照して、図９のステップＳ１３において、調整項目として「絶対音量」が調整される場合の直接音と間接音のレベル制御の流れについて説明する。

　ステップＳ１１１において、レベル制御部１５７は、ＵＩ提示部１５６に提示されているＵＩにおける調整後の絶対音量Ｇｂの設定値を、ＵＩ制御部１５５を介して取得する。

　ステップＳ１１２において、レベル制御部１５７は、調整後の絶対音量Ｇｂを用いて表される、調整後の直接音のレベルＬ１ｂを算出する。調整後の直接音のレベルＬ１ｂは、調整後の絶対音量Ｇｂ、調整前の絶対音量Ｇａ、調整前の直接音のレベルＬ１ａを用いて、以下の関係式で表される。

［数１］
　　　Ｌ１ｂ＝Ｌ１ａ×Ｇｂ÷Ｇａ　　　　　　・・・（１）

　ステップＳ１１３において、レベル制御部１５７は、調整後の絶対音量Ｇｂを用いて表される、調整後の間接音のレベルＬ２ｂを算出する。調整後の間接音のレベルＬ２ｂは、調整後の絶対音量Ｇｂ、調整前の絶対音量Ｇａ、調整前の間接音のレベルＬ２ａを用いて、以下の関係式で表される。

［数２］
　　　Ｌ２ｂ＝Ｌ２ａ×Ｇｂ÷Ｇａ　　　　　　・・・（２）

　このように、絶対音量が調整された場合、レベル制御部１５７は、「直接音のレベル」と「間接音のレベル」それぞれを絶対音量の変化率（Ｇｂ／Ｇａ）に従って変化させる。すなわち、調整前の絶対音量Ｇａと調整後の絶対音量Ｇｂの比に従って、調整後の直接音のレベルＬ１ｂと、調整後の間接音のレベルＬ２ｂが更新されればよい。

（ｂ）直接音と間接音の比率が調整される場合の直接音と間接音のレベル制御
　次に、図１１のフローチャートを参照して、図９のステップＳ１３において、調整項目として「直接音と間接音の比率」が調整される場合の直接音と間接音のレベル制御の流れについて説明する。

　ステップＳ１２１において、レベル制御部１５７は、ＵＩ提示部１５６に提示されているＵＩにおける調整後の直接音と間接音の比率Ｒｂの設定値を、ＵＩ制御部１５５を介して取得する。

　ステップＳ１２２において、レベル制御部１５７は、調整後の直接音と間接音の比率Ｒｂを用いて表される、調整後の直接音のレベルＬ１ｂを算出する。

　ステップＳ１２３において、レベル制御部１５７は、調整後の直接音と間接音の比率Ｒｂを用いて表される、調整後の間接音のレベルＬ２ｂを算出する。

　以下では、調整後の直接音と間接音の比率Ｒｂを用いて、調整後の直接音のレベルＬ１ｂと、調整後の間接音のレベルＬ２ｂそれぞれを表す関係式の導出について説明する。

　まず、調整前の直接音のエネルギーＥ１ａ、間接音のエネルギーＥ２ａ、および全体のエネルギーＥａは、以下の関係式で表される。

［数３］
　　　Ｅａ＝Ｅ１ａ＋Ｅ２ａ　　　　　　・・・（３）

　一方、調整後の直接音のエネルギーＥ１ｂと間接音のエネルギーＥ２ｂの比率は、調整対象となる調整後の直接音と間接音の比率Ｒｂと同一になることから、以下の式が成立する。

［数４］
　　　Ｒｂ＝Ｅ１ｂ÷Ｅ２ｂ　　　　　　・・・（４）

　さらに、直接音と間接音の比率の調整前後で、全体のエネルギー（絶対音量）を変化させないための制約条件として、以下の式が成立する。

［数５］
　　　Ｅａ＝Ｅ１ｂ＋Ｅ２ｂ　　　　　　・・・（５）

　式（５）を式（４）に代入することで、以下の式が得られる。

［数６］
　　　Ｒｂ＝Ｅ１ｂ÷（Ｅａ－Ｅ１ｂ）　　　　　　・・・（６）

　さらに、調整後の直接音のエネルギーＥ１ｂについて、式（６）を以下のように変形する。

［数７］
　　　Ｅ１ｂ＝Ｒｂ×（Ｅａ－Ｅ１ｂ）＝Ｒｂ×Ｅａ－Ｒｂ×Ｅ１ｂ
　　　Ｅ１ｂ＋Ｒｂ×Ｅ１ｂ＝Ｒｂ×Ｅａ
　　　Ｅ１ｂ（１＋Ｒｂ）＝Ｒｂ×Ｅａ
　　　Ｅ１ｂ＝Ｒｂ×Ｅａ÷（１＋Ｒｂ）　　　　　　・・・（７）

　式（７）を式（４）に代入することで、調整後の間接音のエネルギーＥ２ｂについて、以下の式が得られる。

［数８］
　　　Ｅ２ｂ＝Ｅ１ｂ÷Ｒｂ
　　　　　　＝｛Ｒｂ×Ｅａ÷（１＋Ｒｂ）｝÷Ｒｂ
　　　　　　＝Ｅａ÷（１＋Ｒｂ）　　　　　　・・・（８）

　上述した式（７）と式（８）を用いて、調整後の直接音と間接音の比率Ｒｂから、直接音と間接音それぞれのエネルギーの比率の制御目標値を、以下のようにして得ることができる。

　すなわち、調整前後での直接音のレベルの変化量と、調整前後での直接音のエネルギーの変化量とは比例関係にあることから、以下の関係式が成立する。

［数９］
　　　Ｅ１ｂ＝Ｅ１ａ×Ｌ１ｂ÷Ｌ１ａ　　　　　　・・・（９）

　式（９）を式（７）に代入することで、調整後の直接音のレベルＬ１ｂについて、以下の式が得られる。

［数１０］
　　　Ｅ１ａ×Ｌ１ｂ÷Ｌ１ａ＝
　　　Ｌ１ｂ＝Ｌ１ａ×Ｒｂ×Ｅａ÷（１＋Ｒｂ）÷Ｅ１ａ　　　　　　・・・（１０）　

　同様に、調整前後での間接音のレベルの変化量と、調整前後での間接音のエネルギーの変化量とは比例関係にあることから、以下の関係式が成立する。

［数１１］
　　　Ｅ２ｂ＝Ｅ２ａ×Ｌ２ｂ÷Ｌ２ａ　　　　　　・・・（１１）

　式（１１）を式（８）に代入することで、調整後の間接音のレベルＬ２ｂについて、以下の式が得られる。

［数１２］
　　　Ｅ２ａ×Ｌ２ｂ÷Ｌ２ａ＝Ｅａ÷（１＋Ｒｂ）
　　　Ｌ２ｂ＝Ｌ２ａ×Ｅａ÷（１＋Ｒｂ）÷Ｅ２ａ　　　　　　・・・（１２）

　このように、直接音と間接音の比率が調整された場合、レベル制御部１５７は、「直接音のレベル」と「間接音のレベル」それぞれを調整後の直接音と間接音の比率Ｒｂに従って変化させる。すなわち、上述した式（１０）と式（１２）に基づいて、調整後の直接音のレベルＬ１ｂと、調整後の間接音のレベルＬ２ｂが更新されればよい。

　以上の処理によれば、インパルス応答の調整項目を「絶対音量」と「直接音と間接音の比率」のいずれかとすることで、演奏者が、調整操作が調整結果にどのように反映されたかを主観的に把握しやすくすることができる。また、演奏者にとって主観的に理解しにくい「直接音のレベル」や「間接音のレベル」といった調整項目の数を減らすことで、調整作業の煩雑化を抑制することができる。結果として、インパルス応答の調整作業の効率化を図ることが可能となる。

＜４．適用例＞
　以下においては、本開示に係るインパルス応答の調整の他の適用例について説明する。

（インパルス応答の音成分の他の分類への適用）
　以上においては、インパルス応答を「直接音」と「間接音」に分類して調整する例について説明した。これに限らず、本開示に係る技術においては、任意の「第１の音成分」と「第２の音成分」に分類されたインパルス応答の微調整を行うことが可能である。

　例えば、インパルス応答を「直接音＋初期反射音」と「後部残響音」に分類して、インパルス応答の微調整を行うようにしてもよい。また、インパルス応答を、特定方向からの反射音と特定方向以外の方向からの反射音として、例えば「前方からの反射音」と「前方以外の方向からの反射音」に分類して、インパルス応答の微調整を行うようにしてもよい。これらの分類は、ユーザにより任意に設定されてもよいし、例えば、インパルス応答保持部１５２に格納されている、インパルス応答を測定した演奏環境などを示す環境情報などに紐づけられた形で自動的に設定されてもよい。

（他の用途への適用）
　本開示に係る技術は、リモート合奏システムに限らず、音源からユーザの両耳までの伝達特性を表すインパルス応答全般の調整の効率化を目的とする用途に適用することができる。本開示に係る技術は、例えば、以下に例示する用途への適用が可能である。

（１）立体音響のミキシング・マスタリング作業
　立体音響のミキシング・マスタリング作業において、音場効果を最適化する目的でインパルス応答を調整するケースが考えられる。この場合、全体の音量（絶対音量）は、音の広がり感や、等しい音色と感じる音圧レベルを結んだ「等ラウドネス曲線」に影響するため、作業中においては一定に保ちたい。

　従来、インパルス応答の直接音、初期反射音、後部残響音などのレベルを調整した場合、全体の音量も変化してしまうため、調整の後には絶対音量を再調整する必要があった。

　これに対して、本開示に係る技術を適用することで、例えば「直接音＋初期反射音」と「後部残響音」の比率を調整した場合であっても、絶対音量の再調整を不要とすることができ、立体音響のミキシング・マスタリング作業の効率化を図ることが可能となる。

（２）ユーザによるゲーム音響の調整作業
　ゲーム音響において、ユーザが好みに応じて直接音や間接音、反射音の方向など音場の微調整を行うケースが考えられる。この場合、これら音場の調整を行うことにより全体の音量も変化してしまうため、調整の後には絶対音量を再調整する必要があった。

　これに対して、本開示に係る技術を適用することで、例えば「直接音」と「間接音」の比率を調整した場合であっても、絶対音量の再調整を不要とすることができ、ゲーム音響の調整作業の効率化とともにＵＩの簡略化を図ることが可能となる。

　なお、本開示に係る技術は、上記の他にも、仮想空間内のライブ、授業、会議などの用途への適用が可能であり、また、適用可能な用途はこれらに限定されるものではない。

＜５．コンピュータの構成例＞
　上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または汎用のパーソナルコンピュータなどに、プログラム記録媒体からインストールされる。

　図１２は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。情報処理装置１３０は、例えば、図１２に示される構成と同様の構成を有するＰＣにより構成される。

　ＣＰＵ３０１，ＲＯＭ（Read Only Memory）３０２，ＲＡＭ（Random Access Memory）３０３は、バス３０４により相互に接続されている。

　バス３０４には、さらに、入出力インタフェース３０５が接続される。入出力インタフェース３０５には、キーボード、マウスなどよりなる入力部３０６、ディスプレイ、スピーカなどよりなる出力部３０７が接続される。また、入出力インタフェース３０５には、ハードディスクや不揮発性のメモリなどよりなる記憶部３０８、ネットワークインタフェースなどよりなる通信部３０９、リムーバブルメディア３１１を駆動するドライブ３１０が接続される。

　以上のように構成されるコンピュータでは、ＣＰＵ３０１が、例えば、記憶部３０８に記憶されているプログラムを入出力インタフェース３０５とバス３０４とを介してＲＡＭ３０３にロードして実行することにより、上述した一連の処理が行われる。

　ＣＰＵ３０１が実行するプログラムは、例えばリムーバブルメディア３１１に記録して、あるいは、ローカルエリアネットワーク、インターネット、デジタル放送といった、有線または無線の伝送媒体を介して提供され、記憶部３０８にインストールされる。

　コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。

　なお、本明細書において、システムとは、複数の構成要素（装置、モジュール（部品）等）の集合を意味し、すべての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、１つの筐体の中に複数のモジュールが収納されている１つの装置は、いずれも、システムである。

　本明細書に記載された効果はあくまで例示であって限定されるものでは無く、また他の効果があってもよい。

　本開示の実施形態は、上述した実施形態に限定されるものではなく、本開示の要旨を逸脱しない範囲において種々の変更が可能である。

　例えば、本開示の実施形態は、１つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。

　また、上述のフローチャートで説明した各ステップは、１つの装置で実行する他、複数の装置で分担して実行することができる。

　さらに、１つのステップに複数の処理が含まれる場合には、その１つのステップに含まれる複数の処理は、１つの装置で実行する他、複数の装置で分担して実行することができる。

　本明細書に記載された効果はあくまで例示であって限定されるものではなく、他の効果があってもよい。

　さらに、本開示に係る技術は以下のような構成をとることができる。
（１）
　インパルス応答に含まれる第１の音成分および第２の音成分と相関があるパラメータの調整に応じて、前記第１の音成分のレベルと前記第２の音成分のレベルを変化させるレベル制御部
　を備える情報処理装置。
（２）
　前記インパルス応答は、あらかじめ測定または計算されたものである
　（１）に記載の情報処理装置。
（３）
　前記レベル制御部は、前記パラメータを用いて前記第１の音成分のレベルと前記第２の音成分のレベルそれぞれを表す関係式に基づいて、前記第１の音成分のレベルと前記第２の音成分のレベルを変化させる
　（１）に記載の情報処理装置。
（４）
　前記パラメータは、絶対音量である
　（１）乃至（３）のいずれかに記載の情報処理装置。
（５）
　前記レベル制御部は、調整された前記絶対音量の変化率に従って、前記第１の音成分のレベルと前記第２の音成分のレベルを変化させる
　（４）に記載の情報処理装置。
（６）
　前記パラメータは、前記第１の音成分と前記第２の音成分の比率である
　（１）乃至（３）のいずれかに記載の情報処理装置。
（７）
　前記レベル制御部は、前記比率の調整前後で、前記第１の音成分のエネルギーと前記第２の音成分のエネルギーの和を変化させることなく、前記第１の音成分のレベルと前記第２の音成分のレベルを変化させる
　（６）に記載の情報処理装置。
（８）
　前記第１の音成分は、直接音を含み、
　前記第２の音成分は、間接音を含む
　（１）乃至（７）のいずれかに記載の情報処理装置。
（９）
　前記間接音は、初期反射音または後部残響音を含む
　（８）に記載の情報処理装置。
（１０）
　前記第１の音成分は、直接音と初期反射音とを含み、
　前記第２の音成分は、後部残響音を含む
　（１）乃至（７）のいずれかに記載の情報処理装置。
（１１）
　前記第１の音成分は、特定方向からの反射音を含み、
　前記第２の音成分は、前記特定方向以外の方向からの反射音を含む
　（１）乃至（７）のいずれかに記載の情報処理装置。
（１２）
　前記パラメータの値を示すとともに前記パラメータの調整を受け付けるＵＩ（User Interface）の提示を制御するＵＩ制御部をさらに備える
　（１）乃至（１１）のいずれかに記載の情報処理装置。
（１３）
　前記ＵＩは、前記パラメータの調整に応じて変化する前記第１の音成分のレベルと前記第２の音成分のレベルの値を示すインジケータをさらに有し、
　前記インジケータは、前記第１の音成分のレベルと前記第２の音成分のレベルの調整を受け付けない
　（１２）に記載の情報処理装置。
（１４）
　前記レベル制御部は、前記ＵＩ制御部を介して、前記ＵＩにおいて調整された前記パラメータ、前記第１の音成分のレベル、および前記第２の音成分のレベルの少なくとも１つを取得する
　（１２）に記載の情報処理装置。
（１５）
　前記インパルス応答は、音源からユーザの両耳までの伝達特性を表す
　（１）乃至（１４）のいずれかに記載の情報処理装置。
（１６）
　前記音源からの音響信号に対する、前記第１の音成分のレベルと前記第２の音成分のレベルが調整された前記インパルス応答の畳み込み処理に基づいた再生音を、前記ユーザが使用する出力機器から出力させる出力制御部を備える
　（１５）に記載の情報処理装置。
（１７）
　情報処理装置が、
　インパルス応答に含まれる第１の音成分および第２の音成分と相関があるパラメータの調整に応じて、前記第１の音成分のレベルと前記第２の音成分のレベルを変化させる
　情報処理方法。
（１８）
　コンピュータに、
　インパルス応答に含まれる第１の音成分および第２の音成分と相関があるパラメータの調整に応じて、前記第１の音成分のレベルと前記第２の音成分のレベルを変化させる
　処理を実行させるためのプログラム。

　１　リモート合奏システム，　１０　伝送制御装置，　１１０　ヘッドホン，　１２０　マイクロフォン，　１３０　情報処理装置，　１５１　音響信号取得部，　１５２　インパルス応答保持部，　１５３　畳み込み処理部，　１５４　出力制御部，　１５５　ＵＩ制御部，　１５６　ＵＩ提示部，　１５７　レベル制御部

Claims

　インパルス応答に含まれる第１の音成分および第２の音成分と相関があるパラメータの調整に応じて、前記第１の音成分のレベルと前記第２の音成分のレベルを変化させるレベル制御部
　を備える情報処理装置。
　前記インパルス応答は、あらかじめ測定または計算されたものである
　請求項１に記載の情報処理装置。
　前記レベル制御部は、前記パラメータを用いて前記第１の音成分のレベルと前記第２の音成分のレベルそれぞれを表す関係式に基づいて、前記第１の音成分のレベルと前記第２の音成分のレベルを変化させる
　請求項１に記載の情報処理装置。
　前記パラメータは、絶対音量である
　請求項１に記載の情報処理装置。
　前記レベル制御部は、調整された前記絶対音量の変化率に従って、前記第１の音成分のレベルと前記第２の音成分のレベルを変化させる
　請求項４に記載の情報処理装置。
　前記パラメータは、前記第１の音成分と前記第２の音成分の比率である
　請求項１に記載の情報処理装置。
　前記レベル制御部は、前記比率の調整前後で、前記第１の音成分のエネルギーと前記第２の音成分のエネルギーの和を変化させることなく、前記第１の音成分のレベルと前記第２の音成分のレベルを変化させる
　請求項６に記載の情報処理装置。
　前記第１の音成分は、直接音を含み、
　前記第２の音成分は、間接音を含む
　請求項１に記載の情報処理装置。
　前記間接音は、初期反射音または後部残響音を含む
　請求項８に記載の情報処理装置。
　前記第１の音成分は、直接音と初期反射音とを含み、
　前記第２の音成分は、後部残響音を含む
　請求項１に記載の情報処理装置。
　前記第１の音成分は、特定方向からの反射音を含み、
　前記第２の音成分は、前記特定方向以外の方向からの反射音を含む
　請求項１に記載の情報処理装置。
　前記パラメータの値を示すとともに前記パラメータの調整を受け付けるＵＩ（User Interface）の提示を制御するＵＩ制御部をさらに備える
　請求項１に記載の情報処理装置。
　前記ＵＩは、前記パラメータの調整に応じて変化する前記第１の音成分のレベルと前記第２の音成分のレベルの値を示すインジケータをさらに有し、
　前記インジケータは、前記第１の音成分のレベルと前記第２の音成分のレベルの調整を受け付けない
　請求項１２に記載の情報処理装置。
　前記レベル制御部は、前記ＵＩ制御部を介して、前記ＵＩにおいて調整された前記パラメータ、前記第１の音成分のレベル、および前記第２の音成分のレベルの少なくとも１つを取得する
　請求項１２に記載の情報処理装置。
　前記インパルス応答は、音源からユーザの両耳までの伝達特性を表す
　請求項１に記載の情報処理装置。
　前記音源からの音響信号に対する、前記第１の音成分のレベルと前記第２の音成分のレベルが調整された前記インパルス応答の畳み込み処理に基づいた再生音を、前記ユーザが使用する出力機器から出力させる出力制御部を備える
　請求項１５に記載の情報処理装置。
　情報処理装置が、
　インパルス応答に含まれる第１の音成分および第２の音成分と相関があるパラメータの調整に応じて、前記第１の音成分のレベルと前記第２の音成分のレベルを変化させる
　情報処理方法。
　コンピュータに、
　インパルス応答に含まれる第１の音成分および第２の音成分と相関があるパラメータの調整に応じて、前記第１の音成分のレベルと前記第２の音成分のレベルを変化させる
　処理を実行させるためのプログラム。