WO2020008889A1

WO2020008889A1 - オーディオ信号処理装置および方法、インパルス応答生成装置および方法、並びにプログラム

Info

Publication number: WO2020008889A1
Application number: PCT/JP2019/024440
Authority: WO
Inventors: 福井　隆郎
Original assignee: ソニー株式会社
Priority date: 2018-07-04
Filing date: 2019-06-20
Publication date: 2020-01-09
Also published as: EP3820161A1; JPWO2020008889A1; JP7359146B2; EP3820161A4

Abstract

本技術は、所望の位相特性を得ることができるようにするオーディオ信号処理装置および方法、インパルス応答生成装置および方法、並びにプログラムに関する。オーディオ信号処理装置は、振幅特性がフラットまたは略フラットであり、かつ所定の位相特性を有するインパルス応答を取得する取得部と、入力オーディオ信号にインパルス応答を畳み込む位相特性畳み込み部とを備える。本技術はオーディオ信号処理装置およびインパルス応答生成装置に適用することができる。

Description

オーディオ信号処理装置および方法、インパルス応答生成装置および方法、並びにプログラム

　本技術は、オーディオ信号処理装置および方法、インパルス応答生成装置および方法、並びにプログラムに関し、特に、所望の位相特性を得ることができるようにしたオーディオ信号処理装置および方法、インパルス応答生成装置および方法、並びにプログラムに関する。

　例えば音楽などのオーディオ再生を行う場合に、オーディオ信号に対してフィルタ処理を行うことで、再生する音楽等に対してエフェクトなどの効果を施す技術が知られている。

　そのような技術として、例えば複数のフィルタを組み合わせることで、低音強調効果をもたらすようにオーディオ信号の振幅特性を変化させるものが提案されている（例えば、特許文献１参照）。

特開２００２－１７１５８９号公報

　ところで、近年では音楽をスピーカではなくヘッドフォンで再生し、受聴するユーザが増えてきており、ヘッドフォンでのオーディオ再生が主流になりつつある。

　一方で、商用コンテンツは基本的にはスピーカでマスタリングされていることが殆どである。そのため、スピーカで再生を行いながらマスタリングした音楽等のコンテンツをヘッドフォンで再生してもスピーカで再生したときのような量感のある低音を聞くことができないという不満もあがっている。すなわち、コンテンツをヘッドフォンで再生すると、スピーカ再生のときとは低域の聞こえ方が異なり、本来作り手が伝えたい音質での再生を実現することができないことがあった。

　そこで出願人が調査したところ、低域の聞こえ方は位相の特性に大きく左右されることが分かった。すなわち、スピーカの低域の位相特性とヘッドフォンの低域の位相特性が大きく異なることに原因の一端があることが分かった。

　しかしながら上述した技術では、オーディオ信号の振幅特性を調整することはできるが、オーディオ信号の位相特性が所望の特性となるようにすることはできなかった。

　本技術は、このような状況に鑑みてなされたものであり、所望の位相特性を得ることができるようにするものである。

　本技術の第１の側面のオーディオ信号処理装置は、振幅特性がフラットまたは略フラットであり、かつ所定の位相特性を有するインパルス応答を取得する取得部と、入力オーディオ信号に前記インパルス応答を畳み込む位相特性畳み込み部とを備える。

　本技術の第１の側面のオーディオ信号処理方法またはプログラムは、振幅特性がフラットまたは略フラットであり、かつ所定の位相特性を有するインパルス応答を取得し、入力オーディオ信号に前記インパルス応答を畳み込むステップを含む。

　本技術の第１の側面においては、振幅特性がフラットまたは略フラットであり、かつ所定の位相特性を有するインパルス応答が取得され、入力オーディオ信号に前記インパルス応答が畳み込まれる。

　本技術の第２の側面のインパルス応答生成装置は、振幅特性がフラットまたは略フラットであり、かつ所定の位相特性を有する目標特性インパルス応答を生成する。

　本技術の第２の側面のインパルス応答生成方法またはプログラムは、振幅特性がフラットまたは略フラットであり、かつ所定の位相特性を有する目標特性インパルス応答を生成するステップを含む。

　本技術の第２の側面においては、振幅特性がフラットまたは略フラットであり、かつ所定の位相特性を有する目標特性インパルス応答が生成される。

　本技術の第１の側面および第２の側面によれば、所望の位相特性を得ることができる。

　なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載された何れかの効果であってもよい。

周波数特性とインパルス応答の関係について説明する図である。インパルス応答の再構築について説明する図である。再構築されたインパルス応答の周波数特性を示す図である。インパルス応答の再構築について説明する図である。再構築されたインパルス応答の周波数特性を示す図である。インパルス応答の再構築について説明する図である。再構築されたインパルス応答の周波数特性を示す図である。インパルス応答生成装置の構成例を示す図である。インパルス応答生成処理を説明するフローチャートである。インパルス応答生成装置の構成例を示す図である。インパルス応答生成処理を説明するフローチャートである。コンテンツのマスタリングについて説明する図である。再生装置の構成例を示す図である。再生処理を説明するフローチャートである。再生装置の構成例を示す図である。再生処理を説明するフローチャートである。再生装置の構成例を示す図である。再生処理を説明するフローチャートである。再生装置の構成例を示す図である。コンピュータの構成例を示す図である。

　以下、図面を参照して、本技術を適用した実施の形態について説明する。

〈第１の実施の形態〉
〈本技術について〉
　本技術は、オーディオ信号の振幅特性（ゲイン特性）を変えずに位相特性だけを調整することができるようにするものである。

　すなわち、本技術は振幅特性がフラットまたは略フラットで、かつ所望の位相特性をもつインパルス応答を生成することで、オーディオ信号の振幅特性を維持したまま位相特性のみを調整し、所望の位相特性を得ることができるようにするものである。

　本技術では、目標とする位相特性を有するインパルス応答（インパルスレスポンス）に対してFFT（Fast Fourier Transform）およびIFFT（Inverse Fast Fourier Transform）を行うことで、振幅特性がフラットまたは略フラットで、かつ所望の位相特性をもつインパルス応答を得ることができる。ここで、振幅特性がフラットまたは略フラットとは、例えば振幅特性の各周波数における振幅（ゲイン）の値が１または略１であることである。

　具体的には、本技術では以下の手法Ａ１または手法Ａ２によって目標とするインパルス応答が生成される。

　すなわち、手法Ａ１では、まず位相をシミュレートしたいインパルス応答の前に適当な長さの０データ（ゼロデータ）が挿入されてFFT（高速フーリエ変換）が行われる。

　このようなFFTによって振幅特性と位相特性が得られるが、この振幅特性がフラットとなるように振幅特性の各周波数における振幅（ゲイン）の値が１とされ、フラットとされた振幅特性と、FFTで得られた位相特性とに基づいてIFFT（高速フーリエ逆変換）が行われる。そして、IFFTで得られたインパルス応答の後段が適当な時定数でフェード処理され、目的とするインパルス応答とされる。

　このようにして得られたインパルス応答は、振幅特性を維持したまま位相特性のみを変化させるIIR（Infinite Impulse Response）フィルタとして機能する。したがって、このようなインパルス応答をオーディオ信号に畳み込むことで位相特性のみを調整することができる。

　また、手法Ａ２では、位相をシミュレートしたいインパルス応答に対して０データの挿入を行わずにFFTが行われるとともに、単純インパルスに対して０データが挿入されてFFTが行われる。

　そして、インパルス応答に対するFFTで得られた位相特性と、０データが挿入された単純インパルスに対するFFTで得られた位相特性とが加算され、その結果得られた位相特性と、各周波数における振幅の値が１であるフラットな振幅特性とに基づいてIFFTが行われる。さらに、IFFTで得られたインパルス応答の後段が適当な時定数でフェードされ、目的とするインパルス応答とされる。

　手法Ａ２においても手法Ａ１における場合と同様の特性のインパルス応答を得ることができる。換言すれば、振幅特性を維持したまま位相特性のみを変化させるIIRフィルタを得ることができる。

　加えて手法Ａ２ではインパルス応答に対するFFTで得られた位相特性と、０データが挿入された単純インパルスに対するFFTで得られた位相特性とを加算するのではなく減算すれば、もとのインパルス応答の位相特性と逆特性のインパルス応答を得ることができる。

　以上の手法Ａ１や手法Ａ２で得られたインパルス応答を用いれば、再生機器が異なる場合でも同じ音質の音を再生することが可能となる。

　具体例として、例えばスピーカで音を再生しながらマスタリングされたコンテンツがあり、そのコンテンツをヘッドフォンで再生するとする。

　そのような場合、コンテンツのオーディオ信号に対して、ヘッドフォンの位相特性とは逆特性のインパルス応答を畳み込むとともに、スピーカと同じ位相特性のインパルス応答を畳み込むことで、ヘッドフォンの位相特性をキャンセルし、スピーカの位相特性をシミュレートすることができる。すなわち、ヘッドフォンでコンテンツを再生する場合であっても、マスタリング時と同じ音質の音を再生することができる。

　それでは以下、本技術についてより詳細に説明する。

　例えばスピーカで音を再生しながらマスタリングされたコンテンツがあり、そのコンテンツをヘッドフォンで再生する場合について考える。

　この場合、ヘッドフォンでの再生時にコンテンツの音源、つまりコンテンツのオーディオ信号に対して、マスタリングに用いられたスピーカの低域の位相特性だけを付加することができれば、マスタリングスタジオで作り手が制作している音と略同じ音を体感できると想定される。

　一般的に、任意のコンテンツからマスタリングスタジオで用いられたスピーカを特定することは困難である。また、将来的にはコンテンツのメタデータ等から、マスタリングスタジオで用いられたスピーカを特定することも考えられるが、現状ではそのようなことは困難である。

　そこで、カットオフ周波数Fc=50HzであるIIR型のHPF（High Pass Filter）の特性がスピーカの特性に近いことから、そのようなHPFの特性を擬似スピーカ特性として考えることとする。

　例えばカットオフ周波数Fcが50HzであるIIR型のHPFの周波数特性、すなわち振幅特性（ゲイン特性）および位相特性と、そのHPFのインパルス応答との関係は図１に示すようになる。

　図１では、矢印Ｑ１１に示す部分はHPFの周波数特性のうちの振幅特性を示しており、矢印Ｑ１２に示す部分はHPFの周波数特性のうちの位相特性を示している。

　特に振幅特性における縦軸はゲイン（振幅）を示しており、横軸は周波数を示している。また位相特性における縦軸は位相を示しており、横軸は周波数を示している。この周波数特性から、HPFの低域側ではゲインが小さく位相が正の値となっていることが分かる。

　これに対して、矢印Ｑ１３に示す部分にはHPFのインパルス応答が示されている。インパルス応答の縦軸は振幅を示しており、横軸は時間、すなわち時間サンプル（サンプル）を示している。なお、ここではHPFのインパルス応答は、０サンプル目付近を拡大したものとなっている。

　このようなインパルス応答はIIR型フィルタとして用いることができ、矢印Ｑ１３に示すインパルス応答をオーディオ信号に畳み込むことで、オーディオ信号に対してHPFのフィルタ処理を施すことができる。

　さらに、HPFの周波数特性、すなわち振幅特性および位相特性と、HPFのインパルス応答とは変換誤差はあるものの可逆の関係となっている。

　具体的には、矢印Ｑ１１に示す振幅特性および矢印Ｑ１２に示す位相特性からなる周波数特性に対してIFFTを行うと、理想的には矢印Ｑ１３に示すインパルス応答が得られる。これに対し、矢印Ｑ１３に示すインパルス応答に対してFFTを行うと、理想的には矢印Ｑ１１に示す振幅特性および矢印Ｑ１２に示す位相特性からなる周波数特性が得られる。

　このようなHPFのインパルス応答を、上述のスピーカで音を再生しながらマスタリングされたコンテンツのオーディオ信号に畳み込めば、コンテンツの音にスピーカと同様の位相特性を付加することはできるが、低域のゲイン（振幅）が低下してしまう。

　そこで、矢印Ｑ１３に示すインパルス応答に対して実際にFFTを行い、その結果得られた周波数特性について、振幅特性の全周波数の振幅（ゲイン）を１としてフラットな振幅特性とし、さらにIFFTを行ってインパルス応答を再構築することを考える。

　このとき、再構築により得ようとするインパルス応答は、振幅特性を変化させずに図１に示した位相特性のみをオーディオ信号に対して付加するインパルス応答、つまり振幅特性を変化させずに所望の位相特性のみを付加するインパルス応答とされる。

　そうすれば、再構築により得られたインパルス応答を、上述のスピーカで音を再生しながらマスタリングされたコンテンツのオーディオ信号に畳み込むことで、振幅特性を変化させずに目標とするスピーカの位相特性をコンテンツの音に付加することができる。これにより、マスタリングスタジオで作り手が制作している音と略同じ音を受聴者（ユーザ）に体感させることができるようになる。

　なお、以下では、振幅特性を変化させずに所望の位相特性を付加するフィルタとして機能するインパルス応答を、特に目標位相特性インパルス応答とも称することとする。

　インパルス応答の再構築により目標位相特性インパルス応答を得ようとする場合、例えば図２に示すように再構築を行うことが考えられる。

　図２では、矢印Ｑ２１に示す部分には、図１の矢印Ｑ１３に示したインパルス応答が示されている。

　このインパルス応答は略1024サンプルで収束している。しかし、ここでは変換後の語調を考えて、矢印Ｑ２２に示すようにインパルス応答における時間方向の後ろ側、すなわち未来側に０詰め処理を行って4096処理を行うようにする。

　すなわち、インパルス応答の時間方向の後ろ側（末尾）に対して、サンプル値が０であるサンプルである０データを付加する０詰め処理を行って、インパルス応答全体の長さ（サンプル数）が4096サンプルとなるようにする。

　このようにして０詰め処理されたインパルス応答に対して矢印Ｑ２３に示すようにFFTを行うと、図１に示したものと同様の振幅特性および位相特性が得られる。

　ここで、目標とする目標位相特性インパルス応答は、振幅特性がフラットまたは略フラットなものであり、位相特性は矢印Ｑ１２に示した位相特性である。

　そのため、FFTで得られた振幅特性における各周波数の振幅（ゲイン）の値が「１」に調整される。換言すればフラットな振幅特性となるように、FFTで得られた振幅特性の振幅が調整される。

　また、FFTで得られた位相特性は、目標とする矢印Ｑ１２に示した位相特性となっているはずであるので、FFTで得られた位相特性に対しては特に位相調整は行われない。

　次に、矢印Ｑ２４に示すように、振幅調整により得られたフラットな振幅特性と、FFTで得られた位相特性とからなる周波数特性に対してIFFTが行われる。

　さらに、IFFTにより得られたインパルス応答は０に収束しないので、IFFTにより得られたインパルス応答に対して、そのインパルス応答の時間方向の後ろ側（末尾側）をフェードアウトさせて０に収束させるフェード処理が行われる。

　このようなフェード処理によりインパルス応答が再構築され、その結果、矢印Ｑ２５に示す目標位相特性インパルス応答が得られる。ここでは、長さが4096サンプルであるインパルス応答が目標位相特性インパルス応答として得られている。

　矢印Ｑ２５に示す目標位相特性インパルス応答は、理想的にはフラットまたは略フラットな振幅特性を有し、かつもとのHPFと同じ位相特性を有しているはずである。

　ところが、実際にはFFTやIFFTといった変換において変換ひずみが生じるため、矢印Ｑ２５に示した目標位相特性インパルス応答の周波数特性は、図３に示すようになる。

　図３では、矢印Ｑ３１に示す部分は振幅特性を示しており、矢印Ｑ３２に示す部分は位相特性を示している。なお、振幅特性における縦軸はゲイン（振幅）を示しており、横軸は周波数を示している。また位相特性における縦軸は位相を示しており、横軸は周波数を示している。

　矢印Ｑ３１に示す部分では、曲線Ｌ１１は図２の矢印Ｑ２５に示した目標位相特性インパルス応答の振幅特性を示しており、曲線Ｌ１２は図２の矢印Ｑ２１に示したもとのHPFの振幅特性を示している。曲線Ｌ１１から、目標位相特性インパルス応答の振幅特性では、もとのHPFほどではないが低域部分、すなわち矢印Ｗ１１に示す部分のゲインが低下しており、フラットな振幅特性とはなっていないことが分かる。

　また、矢印Ｑ３２に示す部分では、曲線Ｌ１３は図２の矢印Ｑ２５に示した目標位相特性インパルス応答の位相特性を示しており、曲線Ｌ１４は図２の矢印Ｑ２１に示したもとのHPFの位相特性、つまり目標とする位相特性を示している。

　この例では、曲線Ｌ１３は曲線Ｌ１４と略同じとなっており、目標位相特性インパルス応答では位相特性に関しては目標とする特性が得られていることが分かる。

　ところで、一般的に目標位相特性インパルス応答とは逆の場合、すなわち位相特性がフラット（直線）で、振幅（ゲイン）が変化する場合には、基本的にインパルス応答は左右対称の形状となることが知られている。

　そこで、本出願人はパルスが立ち上がっている部分を中心としてインパルス応答が略左右対称となるように０詰め処理を行い、パルスが立ち上がっている部分の前後が同じ長さの区間となるようにすれば、フラットな振幅特性のインパルス応答を得ることができるのではないかと考えた。

　ここで、もとのHPFのインパルス応答に対して、少なくとも時間方向の前側（過去側）に０詰め処理を行い、インパルス応答が略左右対称の形状となるようにしてからFFTおよびIFFTを行って目標位相特性インパルス応答を生成することを考える。

　そのような場合、例えば図４に示すようにインパルス応答の再構築が行われ、目標位相特性インパルス応答が生成される。

　図４では、矢印Ｑ４１に示す部分には、図１の矢印Ｑ１３に示したHPFのインパルス応答が示されており、このインパルス応答は略1024サンプルで収束している。

　この例では、矢印Ｑ４１に示すHPFのインパルス応答に対して矢印Ｑ４２に示すように０詰め処理が行われる。

　すなわち、インパルス応答の長さに合わせて、インパルス応答における時間方向の後ろ側（末尾側）だけでなく、前側（先頭側）にも０データが付加されている。

　特に、ここではインパルス応答における時間方向の前側に8192サンプル分だけ０データが付加されるとともに、インパルス長自体も長さが8192サンプルとなるようにインパルス応答における時間方向の後ろ側にも０データが付加されている。このような０詰め処理により、矢印Ｑ４２に示すインパルス応答は略左右対称の形状となっており、全体の長さが16384サンプルとなっている。

　次に、矢印Ｑ４３に示すように、０詰め処理されたインパルス応答に対してFFTを行うと、図２の矢印Ｑ２３における場合と同様に振幅特性および位相特性が得られる。

　この例においても目標とする目標位相特性インパルス応答の振幅特性はフラットなものであるので、FFTで得られた振幅特性における各周波数の振幅（ゲイン）の値が「１」に調整され、フラットな振幅特性とされる。

　また、FFTで得られた位相特性は、目標とする位相特性となっているはずであるので、FFTで得られた位相特性に対しては特に位相調整は行われない。

　続いて矢印Ｑ４４に示すように振幅調整により得られたフラットな振幅特性と、FFTで得られた位相特性とからなる周波数特性に対してIFFTが行われ、その結果得られたインパルス応答に対して図２の矢印Ｑ２４における場合と同様にフェード処理が行われる。

　そして、フェード処理により得られたインパルス応答が目標位相特性インパルス応答とされる。ここでは、矢印Ｑ４５に示す目標位相特性インパルス応答が得られており、この目標位相特性インパルス応答は左右対称に近い形状となっている。また、目標位相特性インパルス応答の長さは16384サンプルとなっている。

　このようにして得られた矢印Ｑ４５に示す目標位相特性インパルス応答の周波数特性は、図５に示すようになる。

　図５では、矢印Ｑ５１に示す部分は振幅特性を示しており、矢印Ｑ５２に示す部分は位相特性を示している。なお、振幅特性における縦軸はゲイン（振幅）を示しており、横軸は周波数を示している。また位相特性における縦軸は位相を示しており、横軸は周波数を示している。

　矢印Ｑ５１に示す部分では、曲線Ｌ３１は図４の矢印Ｑ４５に示した目標位相特性インパルス応答の振幅特性を示しており、曲線Ｌ３２は図４の矢印Ｑ４１に示したもとのHPFの振幅特性を示している。

　曲線Ｌ３１に示される目標位相特性インパルス応答の振幅特性は、各周波数における振幅（ゲイン）の値が±0.2dB以内の範囲におさまっており、略フラットな特性が得られていることが分かる。すなわち、目標とする振幅特性が得られていることが分かる。

　また、矢印Ｑ５２に示す部分では、曲線Ｌ３３は図４の矢印Ｑ４５に示した目標位相特性インパルス応答の位相特性を示しており、曲線Ｌ３４は図４の矢印Ｑ４１に示したもとのHPFの位相特性、つまり目標とする位相特性を示している。さらに曲線Ｌ３５は8192サンプルだけディレイ（遅延）させた単純インパルスの位相特性、つまり直線位相を示している。

　ここでは、曲線Ｌ３３と曲線Ｌ３４とは殆ど重なっており、目標位相特性インパルス応答の位相特性として目標とする特性と略同等な特性が得られていることが分かる。

　また、曲線Ｌ３５は比較のために示されているものである。曲線Ｌ３５は直線位相である単純インパルスの位相特性を示しているので、各周波数における曲線Ｌ３３と曲線Ｌ３５との差が図１の矢印Ｑ１２に示した位相特性の各周波数における位相の値となっていれば、目標位相特性インパルス応答の位相特性として目標とする特性が得られていることになる。なお、図４の矢印Ｑ４１に示したもとのHPFの位相特性は、図１の矢印Ｑ１２に示した位相特性と同じである。

　この例では、曲線Ｌ３３と曲線Ｌ３５とを比較すると、それらの位相の差分は周波数が高くなるにつれて小さくなっている。そのため、曲線Ｌ３３と曲線Ｌ３５からも、目標位相特性インパルス応答の位相特性として図１の矢印Ｑ１２に示した位相特性と略同じ特性が得られていることが分かる。

　以上のことから、目標とする位相特性を有するインパルス応答に対して少なくとも時間方向の前側に０詰め処理を行い、０詰め処理されたインパルス応答に対してFFT、IFFT、およびフェード処理を行うことで、振幅特性がフラットまたは略フラットであり、かつ目標とする位相特性を有する目標位相特性インパルス応答を得ることができることが分かる。

　以上のような図４を参照して説明した目標位相特性インパルス応答の生成手法が上述した手法Ａ１である。

　なお、目標位相特性インパルス応答の生成にあたっては、０詰め処理されたインパルス応答の長さを長くするほど、つまりサンプル数を多くするほど目標位相特性インパルス応答の周波数特性は目標とする特性に近くなる。すなわち、よりよい特性が得られるようになる。特に０詰め処理されたインパルス応答の長さが無限サンプルとなると、目標位相特性インパルス応答の周波数特性と、目標とする特性との誤差は限りなく０に近くなる。

　また、目標位相特性インパルス応答を生成する場合、目標とする特性との誤差をある程度許容してでも処理量を削減したいこともある。例えば目標位相特性インパルス応答の長さを短くすれば、生成時においても生成後の畳み込み時においても処理量は少なくなる。

　そのような場合、例えば図６に示すように０詰め処理においてインパルス応答に付加する０データの数を少なくすることで処理量を削減しつつ十分な特性の目標位相特性インパルス応答が得られるようにしてもよい。

　図６では、矢印Ｑ６１に示す部分には、図１の矢印Ｑ１３に示したHPFのインパルス応答が示されており、このインパルス応答は略1024サンプルで収束している。

　この例では、矢印Ｑ６１に示すHPFのインパルス応答に対して矢印Ｑ６２に示すように０詰め処理が行われる。

　ここでは、インパルス応答における時間方向の前側に384サンプル分だけ０データが付加されるとともに、インパルス応答全体の長さが4096サンプルとなるようにインパルス応答における時間方向の後ろ側にも０データが付加されている。

　この０詰め処理では、インパルス応答における時間方向の前側に付加する０データの数が少ないため、矢印Ｑ６２に示す０詰め処理後のインパルス応答は、左右対称の形状とはなっていない。

　次に、矢印Ｑ６３に示すように、０詰め処理されたインパルス応答に対してFFTを行うと、図２の矢印Ｑ２３における場合と同様に振幅特性および位相特性が得られる。

　この例においても図４における場合と同様にFFTで得られた振幅特性における各周波数の振幅（ゲイン）の値が「１」に調整されてフラットな振幅特性とされ、FFTで得られた位相特性に対しては特に位相調整は行われない。

　続いて矢印Ｑ６４に示すように振幅調整により得られたフラットな振幅特性と、FFTで得られた位相特性とからなる周波数特性に対してIFFTが行われ、その結果得られたインパルス応答に対して図２の矢印Ｑ２４における場合と同様にフェード処理が行われる。

　そして、フェード処理により得られたインパルス応答が目標位相特性インパルス応答とされる。ここでは、矢印Ｑ６５に示す目標位相特性インパルス応答が得られており、目標位相特性インパルス応答の長さは4096サンプルとなっている。

　なお、この例ではインパルス応答における時間方向の前側に付加する０データの数が少ないため、矢印Ｑ６５に示す目標位相特性インパルス応答は、左右対称な形状とはなっていない。

　このようにして得られた矢印Ｑ６５に示す目標位相特性インパルス応答の周波数特性は、図７に示すようになる。

　図７では、矢印Ｑ７１に示す部分は振幅特性を示しており、矢印Ｑ７２に示す部分は位相特性を示している。なお、振幅特性における縦軸はゲイン（振幅）を示しており、横軸は周波数を示している。また位相特性における縦軸は位相を示しており、横軸は周波数を示している。

　矢印Ｑ７１に示す部分では、曲線Ｌ５１は図６の矢印Ｑ６５に示した目標位相特性インパルス応答の振幅特性を示しており、曲線Ｌ５２は図６の矢印Ｑ６１に示したもとのHPFの振幅特性を示している。

　曲線Ｌ５１に示される目標位相特性インパルス応答の振幅特性は、各周波数における振幅（ゲイン）の値が±1dB以内の範囲におさまっており、略フラットな特性が得られていることが分かる。すなわち、十分な振幅特性が得られていることが分かる。

　特に、ここでは曲線Ｌ５１に示される振幅特性は、図５の曲線Ｌ３１に示した振幅特性と比較すると目標とする特性からの誤差が大きくなっているが、その誤差は十分に小さい範囲におさまっていることが分かる。

　また、矢印Ｑ７２に示す部分では、曲線Ｌ５３は図６の矢印Ｑ６５に示した目標位相特性インパルス応答の位相特性を示しており、曲線Ｌ５４は図６の矢印Ｑ６１に示したもとのHPFの位相特性、つまり目標とする位相特性を示している。さらに曲線Ｌ５５は図５の曲線Ｌ３５と同様に、ディレイ（遅延）させた単純インパルスの位相特性を示している。

　ここでは、曲線Ｌ５３と曲線Ｌ５４とは、図５における場合よりは誤差が大きいものの殆ど重なっており、目標位相特性インパルス応答の位相特性として目標とする特性と略同等な特性が得られていることが分かる。

　また、曲線Ｌ５３と曲線Ｌ５５とを比較すると、それらの位相の差分は周波数が高くなるにつれて小さくなっており、図５における場合と同様に、目標位相特性インパルス応答の位相特性として図１の矢印Ｑ１２に示した位相特性と略同じ特性が得られていることが分かる。

　以上のように目標とする位相特性を有するインパルス応答の時間方向の前側に付加する０データの数をある程度少なくしても、振幅特性がフラットまたは略フラットであり、かつ目標とする位相特性を有する目標位相特性インパルス応答を得ることができる。

　なお、インパルス応答の時間方向の前側にどれだけ０データを付加するかは、目標とする特性との許容誤差と、処理量とのトレードオフとなるので、付加する０データの数は必要に応じて調整すればよい。

　また、目標とする位相特性を有するインパルス応答に０詰め処理を行うのではなく、例えば図５の曲線Ｌ３５に示したような単純インパルスに対して０詰め処理を行って目標位相特性インパルス応答を生成してもよい。このような目標位相特性インパルス応答の生成手法が上述した手法Ａ２である。

　手法Ａ２では、単純インパルスの時間方向の前側に対して０データを付加する０詰め処理が行われ、０詰め処理後の単純インパルスに対してFFTが行われる。

　なお、以下では、０詰め処理後の単純インパルスに対するFFTにより得られた周波数特性の位相特性を、特に単純インパルスの位相特性とも称することとする。

　また、手法Ａ２では目標とする位相特性を有するインパルス応答に対しては０詰め処理は行われず、インパルス応答に対してそのままFFTが行われる。以下では、目標とする位相特性を有するインパルス応答に対するFFTにより得られた周波数特性の位相特性を、特に目標位相特性とも称することとする。

　このようにしてFFTにより単純インパルスの位相特性と、目標位相特性とが得られると、それらの単純インパルスの位相特性と目標位相特性とが加算され、加算により得られた位相特性と、フラットな振幅特性とからなる周波数特性に対してIFFTが行われる。

　そして、IFFTにより得られたインパルス応答に対してフェード処理が行われ、その結果得られたインパルス応答が目標位相特性インパルス応答とされる。

　このようにして得られた目標位相特性インパルス応答は、振幅特性がフラットまたは略フラットであり、かつ目標とする位相特性を有するインパルス応答である。

　なお、手法Ａ２では、単純インパルスの位相特性と目標位相特性とを加算するのではなく、単純インパルスの位相特性から目標位相特性を減算すれば、目標位相特性の逆特性を有するインパルス応答を目標位相特性インパルス応答として得ることができる。

　具体的には、例えば所定のHPFのインパルス応答に対して０詰め処理を行わずにFFTを行って得られた位相特性を、単純インパルスの位相特性から減算し、その結果得られた位相特性と、フラットな振幅特性とからなる周波数特性に対してIFFTが行われる。そして、IFFTにより得られたインパルス応答に対してフェード処理が行われ、その結果得られたインパルス応答が目標位相特性インパルス応答とされる。

　この場合、得られた目標位相特性インパルス応答の位相特性は、もとのHPFの位相特性の逆特性となる。

　上述したように手法Ａ１では目標とする位相特性を有するインパルス応答に０詰め処理を行って、その後FFT、IFFT、およびフェード処理を行って目標位相特性インパルス応答を生成している。これに対して、手法Ａ２では単純インパルスに０詰め処理を行って、その後FFT、IFFT、およびフェード処理を行い、目標位相特性インパルス応答を生成している。

　手法Ａ１で用いるインパルス応答と、手法Ａ２で用いる単純インパルスとは、ともにインパルス情報、すなわちインパルスに関する情報である。したがって、手法Ａ１と手法Ａ２を一般化すると、インパルス情報に対して０詰め処理が行われ、その結果得られた位相特性に対してFFT、IFFT、およびフェード処理が行われて、目標位相特性インパルス応答が生成されているということができる。

　以上のようにして得られる目標位相特性インパルス応答を用いれば、オーディオ信号に対して振幅特性は変化させずに所望の位相特性を付加することができる。

　具体例として、例えばマスタリング用のスピーカで音を再生しながらマスタリングされたコンテンツがあり、そのコンテンツを再生側のヘッドフォンまたはスピーカで再生する場合について考える。

　この場合、再生側のヘッドフォンまたはスピーカの位相特性と逆特性を有する目標位相特性インパルス応答をコンテンツのオーディオ信号に畳み込むことで、コンテンツのオーディオ信号について再生側のヘッドフォンまたはスピーカの位相特性をキャンセルすることができる。ここでは再生側のヘッドフォンまたはスピーカの位相特性がキャンセルされたオーディオ信号を補正オーディオ信号と称することとする。

　なお、再生側のヘッドフォンまたはスピーカの位相特性と逆特性を有する目標位相特性インパルス応答は、上述した手法Ａ２により生成してもよいし手法Ａ１により生成してもよい。例えばそのような目標位相特性インパルス応答を手法Ａ１により生成する場合には、再生側のヘッドフォンまたはスピーカの位相特性と逆特性を有するインパルス応答に０詰め処理を行ってFFT、IFFT、およびフェード処理を行えばよい。

　さらに、マスタリング用のスピーカの位相特性と同じ特性を有する目標位相特性インパルス応答を補正オーディオ信号に畳み込むことで、補正オーディオ信号に対して、すなわちコンテンツの音に対してマスタリング用のスピーカの位相特性を付加することができる。

　したがって、このようにしてマスタリング用のスピーカの位相特性が付加された補正オーディオ信号に基づいてコンテンツの音を再生すれば、マスタリングスタジオで作り手が制作している音と略同じ音を受聴者（ユーザ）に体感させることができる。

　加えて、例えば再生側において受聴者がヘッドフォンでコンテンツの音を再生する場合には、頭部伝達特性、すなわち頭部伝達関数（HRTF（Head Related Transfer Function））を用いれば、マスタリングスタジオで作り手が制作している音により近い音を提示することが可能となる。

　ここで、HRTFは音源から受聴者の耳まで、より詳細には受聴者の鼓膜近傍または外耳道入口までの音の伝達特性を示す関数である。

　この例では、マスタリング用のスピーカの位相特性が付加された補正オーディオ信号に、さらにHRTFを畳み込むことで、マスタリングスタジオで作り手が制作しているときに受聴した音により近い音を受聴者に体感させることができる。

〈インパルス応答生成装置の構成例〉
　続いて、以上において説明した目標位相特性インパルス応答を生成するインパルス応答生成装置の具体的な構成と動作について説明する。

　図８は、上述した手法Ａ１により目標位相特性インパルス応答、すなわち振幅特性がフラットまたは略フラットであり、かつ所望の位相特性を有するインパルス応答を生成するインパルス応答生成装置の構成例を示す図である。

　図８に示すインパルス応答生成装置１１は０詰め処理部２１、FFT処理部２２、IFFT処理部２３、およびフェード処理部２４を有している。

　０詰め処理部２１には、目標位相特性インパルス応答の生成に用いられる、目標とする位相特性を有するインパルス応答が供給される。以下では、このような目標とする位相特性を有するインパルス応答を入力インパルス応答と称することとする。

　０詰め処理部２１は、供給された入力インパルス応答に対して０詰め処理を行い、FFT処理部２２に供給する。

　FFT処理部２２は、０詰め処理部２１から供給された０詰め処理後の入力インパルス応答に対してFFTを行い、その結果得られた周波数特性のうちの位相特性をIFFT処理部２３に供給する。

　IFFT処理部２３には、外部から各周波数のゲイン（振幅）が「１」であるフラットな振幅特性（ゲイン特性）が供給される。

　IFFT処理部２３は、外部から供給されたフラットな振幅特性と、FFT処理部２２から供給された位相特性とからなる周波数特性に対してIFFTを行い、その結果得られたインパルス応答をフェード処理部２４に供給する。換言すれば、フラットな振幅特性と、FFT処理部２２から供給された位相特性とに基づいてIFFTが行われ、インパルス応答が生成される。

　なお、IFFT処理部２３では外部から供給されたフラットな振幅特性を用いるのではなく、FFT処理部２２でのFFTで得られた周波数特性の振幅特性に対してゲイン調整を行うことでフラットな振幅特性を生成し、その振幅特性をIFFTに用いるようにしてもよい。

　フェード処理部２４は、IFFT処理部２３から供給されたインパルス応答に対してフェード処理を行い、その結果得られたインパルス応答を目標位相特性インパルス応答として出力する。

〈インパルス応答生成処理の説明〉
　次に、インパルス応答生成装置１１の動作について説明する。

　すなわち、以下、図９のフローチャートを参照して、インパルス応答生成装置１１により行われるインパルス応答生成処理について説明する。

　ステップＳ１１において０詰め処理部２１は、供給された入力インパルス応答に対して０詰め処理を行い、FFT処理部２２に供給する。

　例えばステップＳ１１では、図４や図６を参照して説明したように、入力インパルス応答における時間方向の後ろ側や前側に０データを付加する０詰め処理が行われる。０詰め処理では、少なくとも入力インパルス応答における時間方向の前側に０データが付加されるようにされる。

　ステップＳ１２においてFFT処理部２２は、０詰め処理部２１から供給された０詰め処理後の入力インパルス応答に対してFFTを行い、その結果得られた周波数特性のうちの位相特性をIFFT処理部２３に供給する。

　ステップＳ１３においてIFFT処理部２３は、外部から供給されたフラットな振幅特性と、FFT処理部２２から供給された位相特性とからなる周波数特性に対してIFFTを行い、その結果得られたインパルス応答をフェード処理部２４に供給する。

　ステップＳ１４においてフェード処理部２４は、IFFT処理部２３から供給されたインパルス応答に対してフェード処理を行い、その結果得られたインパルス応答を目標位相特性インパルス応答として出力する。

　例えばフェード処理では、IFFT処理部２３から供給されたインパルス応答の時間方向の後ろ側（末尾側）をフェードアウトさせて０に収束させることで、目標位相特性インパルス応答が生成される。なお、IFFTにより得られたインパルス応答が０に収束していれば、特にフェード処理は不要である。

　また、入力インパルス応答として、例えばヘッドフォンの位相特性の逆特性を有するインパルス応答を用いれば、目標位相特性インパルス応答としてヘッドフォンの位相特性をキャンセルする、つまりヘッドフォンの位相特性の逆特性のインパルス応答を得ることができる。

　このようにして目標位相特性インパルス応答が生成されると、インパルス応答生成処理は終了する。

　以上のようにしてインパルス応答生成装置１１は、少なくとも入力インパルス応答における時間方向の前側に０データを付加する０詰め処理を行い、０詰め処理された入力インパルス応答に対してFFT、IFFT、およびフェード処理を行うことで目標位相特性インパルス応答を生成する。

　このようにすることで、振幅特性を変化させずに目標とする位相特性を付加することが可能なフィルタとして機能する目標位相特性インパルス応答を得ることができる。これにより、目標位相特性インパルス応答を用いて、振幅特性を変化させずに所望の位相特性を得ることができるようになる。

〈第２の実施の形態〉
〈インパルス応答生成装置の構成例〉
　また、上述した手法Ａ２により目標位相特性インパルス応答を生成する場合、インパルス応答生成装置は例えば図１０に示すように構成される。なお、図１０において図８における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。

　図１０に示すインパルス応答生成装置５１はFFT処理部６１、０詰め処理部６２、FFT処理部６３、演算処理部６４、IFFT処理部２３、およびフェード処理部２４を有している。このインパルス応答生成装置５１の構成は、インパルス応答生成装置１１における０詰め処理部２１およびFFT処理部２２に代えてFFT処理部６１乃至演算処理部６４を設けた構成となっている。

　FFT処理部６１には、目標位相特性インパルス応答の生成に用いられる、目標とする位相特性を有するインパルス応答、すなわち入力インパルス応答が供給される。

　FFT処理部６１は、供給された入力インパルス応答に対してFFTを行い、その結果得られた周波数特性のうちの位相特性を演算処理部６４に供給する。なお、目標とする位相特性自体を得ることができ、その目標とする位相特性を演算処理部６４に供給することができれば、特にFFT処理部６１は設けられる必要はない。

　０詰め処理部６２には、目標位相特性インパルス応答の生成に用いられる単純インパルスが供給される。０詰め処理部６２は、供給された単純インパルスに対して０詰め処理を行い、FFT処理部６３に供給する。

　FFT処理部６３は、０詰め処理部６２から供給された０詰め処理後の単純インパルスに対してFFTを行い、その結果得られた周波数特性のうちの位相特性を演算処理部６４に供給する。

　演算処理部６４は、FFT処理部６１から供給された位相特性と、FFT処理部６３から供給された位相特性とに基づく演算処理を行い、その結果得られた位相特性をIFFT処理部２３に供給する。ここでは演算処理として、加算処理または減算処理が行われる。

〈インパルス応答生成処理の説明〉
　次に、インパルス応答生成装置５１の動作について説明する。

　すなわち、以下、図１１のフローチャートを参照して、インパルス応答生成装置５１により行われるインパルス応答生成処理について説明する。

　ステップＳ４１においてFFT処理部６１は、供給された入力インパルス応答に対してFFTを行い、その結果得られた周波数特性のうちの位相特性を演算処理部６４に供給する。

　ステップＳ４２において０詰め処理部６２は、供給された単純インパルスに対して０詰め処理を行い、FFT処理部６３に供給する。０詰め処理では、単純インパルスにおける時間方向の前側に０データが付加され、適切に単純インパルスがディレイされる。

　ステップＳ４３においてFFT処理部６３は、０詰め処理部６２から供給された０詰め処理後の単純インパルスに対してFFTを行い、その結果得られた周波数特性のうちの位相特性を演算処理部６４に供給する。

　ステップＳ４４において演算処理部６４は、FFT処理部６１から供給された位相特性と、FFT処理部６３から供給された位相特性とに基づく演算処理を行い、その結果得られた位相特性をIFFT処理部２３に供給する。

　例えば演算処理部６４は、目標位相特性インパルス応答の位相特性として、入力インパルス応答が有する位相特性と同じ特性を得ようとする場合には、FFT処理部６１から供給された入力インパルス応答の位相特性と、FFT処理部６３から供給された、０詰め処理後の単純インパルスの位相特性とを加算し、その結果得られた位相特性をIFFT処理部２３に供給する。

　これに対して演算処理部６４は、目標位相特性インパルス応答の位相特性として、入力インパルス応答が有する位相特性の逆特性を得ようとする場合には、FFT処理部６１から供給された入力インパルス応答の位相特性を、FFT処理部６３から供給された、０詰め処理後の単純インパルスの位相特性から減算し、その結果得られた位相特性をIFFT処理部２３に供給する。

　このように位相特性に対する演算処理として加算または減算が行われると、その後、ステップＳ４５およびステップＳ４６の処理が行われてインパルス応答生成処理は終了するが、これらの処理は図９のステップＳ１３およびステップＳ１４の処理と同様であるので、その説明は省略する。

　以上のようにしてインパルス応答生成装置５１は、単純インパルスにおける時間方向の前側に０データを付加する０詰め処理を行い、０詰め処理された単純インパルス応答と、入力インパルス応答とに基づいて目標位相特性インパルス応答を生成する。

〈第３の実施の形態〉
〈再生装置の構成例〉
　ここで、以上において説明したインパルス応答生成装置１１やインパルス応答生成装置５１で生成された目標位相特性インパルス応答を用いて、コンテンツの再生を行う再生装置について説明する。

　以下では、説明を具体的にするため、再生対象となるコンテンツは、図１２に示すように所定のスタジオでマスタリングされたものとする。

　図１２に示す例では、スタジオ内にはマスタリングを行う制作者Ｍ１１がおり、制作者Ｍ１１は、スタジオ内に配置されたスピーカ９１でコンテンツの音を再生しながら、コンテンツの各帯域の振幅調整等をマスタリングの作業として行う。

　また、マスタリングにより得られたコンテンツのオーディオ信号が、受聴者が所持する再生装置等からなる再生システムで再生される。なお、コンテンツの音の再生には、ヘッドフォンやスピーカ、イヤフォンなど、どのようなものが用いられてもよいが、以下では具体的な例としてヘッドフォンが用いられるものとして説明を続ける。

　コンテンツの再生に用いる再生装置は、例えば図１３に示すように構成される。

　図１３に示す例では、再生装置１２１は少なくとも音声コンテンツの再生制御が可能なポータブルプレーヤやスマートフォン、パーソナルコンピュータなどからなり、再生装置１２１にはヘッドフォン１２２が接続されている。

　再生装置１２１は、取得部１３１、スピーカ位相特性畳み込み部１３２、および再生制御部１３３を有している。

　再生装置１２１では、制作者Ｍ１１によるマスタリングによって得られたコンテンツのオーディオ信号がスピーカ位相特性畳み込み部１３２に供給される。

　取得部１３１は、任意のタイミングで目標位相特性インパルス応答をインパルス応答生成装置１１やインパルス応答生成装置５１などの外部の装置から取得し、保持している。また、取得部１３１は保持している目標位相特性インパルス応答をスピーカ位相特性畳み込み部１３２に供給する。

　取得部１３１により取得される目標位相特性インパルス応答は、マスタリングに用いられたスピーカ９１の位相特性を有する入力インパルス応答が用いられて、インパルス応答生成装置１１またはインパルス応答生成装置５１により生成されたものである。すなわち、目標位相特性インパルス応答は、スピーカ９１の位相特性と同じ位相特性を有するインパルス応答である。

　なお、目標位相特性インパルス応答は取得部１３１により任意のタイミングで取得されるのではなく、予め取得部１３１に保持されているようにしてもよい。

　また、以下では、スピーカ９１の位相特性と同じ位相特性を有する目標位相特性インパルス応答を、特にスピーカ特性インパルス応答とも称することとする。

　スピーカ位相特性畳み込み部１３２は、供給されたオーディオ信号に対して、取得部１３１から供給されたスピーカ特性インパルス応答を畳み込み、その結果得られたオーディオ信号を再生制御部１３３に供給する。

　再生制御部１３３は、スピーカ位相特性畳み込み部１３２から供給されたオーディオ信号をヘッドフォン１２２に供給し、コンテンツの音を再生させる。換言すれば、再生制御部１３３はヘッドフォン１２２でのコンテンツの音の再生を制御する。

　ヘッドフォン１２２は、再生制御部１３３から供給されたオーディオ信号に基づいてコンテンツの音を再生する。

　なお、ここでは再生装置１２１にヘッドフォン１２２が設けられていない構成とされているが、ヘッドフォン１２２が再生装置１２１に設けられているようにしてもよいし、ヘッドフォン１２２内部に取得部１３１乃至再生制御部１３３が設けられているようにしてもよい。

〈再生処理の説明〉
　続いて、再生装置１２１の動作について説明する。すなわち、以下、図１４のフローチャートを参照して再生装置１２１による再生処理について説明する。なお、この再生処理が開始されるタイミングでは、スピーカ特性インパルス応答が既に取得部１３１により取得されている。

　ステップＳ７１においてスピーカ位相特性畳み込み部１３２は、供給されたオーディオ信号に対して、取得部１３１から供給されたスピーカ特性インパルス応答を畳み込み、その結果得られたオーディオ信号を再生制御部１３３に供給する。

　これにより、オーディオ信号に基づくコンテンツの音に対して、スピーカ特性インパルス応答の位相特性、つまりスピーカ９１の位相特性を付加することができる。

　ステップＳ７２において再生制御部１３３は、スピーカ位相特性畳み込み部１３２から供給されたオーディオ信号をヘッドフォン１２２に供給してコンテンツの音を再生させ、再生処理は終了する。

　ヘッドフォン１２２により再生されたコンテンツの音にはスピーカ９１の位相特性と同じ特性が付加されているので、そのコンテンツの音を受聴している受聴者には、制作者Ｍ１１がスタジオで聞いていたコンテンツの音と略同じ音質の音が聞こえている。しかもスピーカ特性インパルス応答は、振幅特性を変化させずに所望の位相特性のみをコンテンツの音に付加することができるので、コンテンツの音のゲインが変化してしまうようなこともない。

　以上のようにして再生装置１２１は、スピーカ特性インパルス応答をコンテンツのオーディオ信号に畳み込んでからコンテンツの音の再生を行う。このようにすることで、コンテンツの音をヘッドフォン１２２で再生する場合であっても、マスタリングに用いたスピーカ９１の位相特性をコンテンツの音に付加することができる。すなわち、所望の位相特性を得ることができる。

〈第４の実施の形態〉
〈再生装置の構成例〉
　なお、再生装置１２１では、コンテンツの音にスピーカ９１の位相特性と同じ特性を付加すると説明した。しかし、コンテンツの音をヘッドフォン１２２で再生すると、その音にはヘッドフォン１２２が有する位相特性も付加されることになる。

　そこで、コンテンツの音にスピーカ９１の位相特性と同じ特性を付加するだけでなく、ヘッドフォン１２２が有する位相特性をキャンセル（除去）することで、制作者Ｍ１１がスタジオで聞いていたコンテンツの音により近い音を受聴者に対して聞かせることができるようにしてもよい。

　そのような場合、再生装置は例えば図１５に示すように構成される。なお、図１５において図１３における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。

　図１５に示す再生装置１６１には、ヘッドフォン１２２が接続されている。また、再生装置１６１は、取得部１３１、ヘッドフォン逆特性畳み込み部１７１、スピーカ位相特性畳み込み部１３２、および再生制御部１３３を有している。

　特に再生装置１６１の構成は、再生装置１２１におけるスピーカ位相特性畳み込み部１３２の前段にヘッドフォン逆特性畳み込み部１７１が設けられた構成とされている。

　再生装置１６１では、上述したスピーカ特性インパルス応答だけでなく、ヘッドフォン１２２が有する位相特性とは逆特性を有する目標位相特性インパルス応答も取得部１３１によってインパルス応答生成装置１１やインパルス応答生成装置５１などの外部の装置から取得され、保持されている。以下、ヘッドフォン１２２が有する位相特性とは逆特性を有する目標位相特性インパルス応答を特にヘッドフォン逆特性インパルス応答とも称することとする。

　このヘッドフォン逆特性インパルス応答は、例えばヘッドフォン１２２の位相特性を有する入力インパルス応答を用い、演算処理部６４での演算処理として減算を行うことでインパルス応答生成装置５１により生成された目標位相特性インパルス応答である。

　なお、ヘッドフォン逆特性インパルス応答も取得部１３１により取得されるのではなく、予め取得部１３１に保持されているようにしてもよい。

　取得部１３１は、保持しているヘッドフォン逆特性インパルス応答をヘッドフォン逆特性畳み込み部１７１に供給する。

　ヘッドフォン逆特性畳み込み部１７１は、供給されたコンテンツのオーディオ信号に対して、取得部１３１から供給されたヘッドフォン逆特性インパルス応答を畳み込み、その結果得られたオーディオ信号をスピーカ位相特性畳み込み部１３２に供給する。

〈再生処理の説明〉
　次に、再生装置１６１の動作について説明する。すなわち、以下、図１６のフローチャートを参照して再生装置１６１による再生処理について説明する。なお、この再生処理が開始されるタイミングでは、スピーカ特性インパルス応答およびヘッドフォン逆特性インパルス応答が既に取得部１３１により取得されている。

　ステップＳ１０１においてヘッドフォン逆特性畳み込み部１７１は、供給されたコンテンツのオーディオ信号に対して、取得部１３１から供給されたヘッドフォン逆特性インパルス応答を畳み込み、その結果得られたオーディオ信号をスピーカ位相特性畳み込み部１３２に供給する。

　これにより、コンテンツの音に対して、ヘッドフォン１２２の位相特性の逆特性を付加することができる。換言すれば、ヘッドフォン１２２でコンテンツの音を再生するときに付加される、ヘッドフォン１２２の位相特性がキャンセルされるようになる。しかも、ヘッドフォン逆特性インパルス応答の畳み込みでは、コンテンツの音の振幅（ゲイン）は変化させずに位相特性のみを調整することができる。

　オーディオ信号に対してヘッドフォン逆特性インパルス応答が畳み込まれると、その後、ステップＳ１０２およびステップＳ１０３の処理が行われて再生処理は終了するが、これらの処理は図１４のステップＳ７１およびステップＳ７２の処理と同様であるので、その説明は省略する。

　再生装置１６１でのコンテンツの音の再生では、まずコンテンツの音に対してヘッドフォン１２２の位相特性のキャンセルが行われ、その後、付加したい特性であるスピーカ９１の位相特性が付加される。

　なお、ヘッドフォン１２２の位相特性の逆特性を付加し、同時にスピーカ９１の位相特性を付加することができる目標位相特性インパルス応答を生成し、その目標位相特性インパルス応答をコンテンツのオーディオ信号に畳み込むようにしてもよい。

　しかし、再生装置１６１のように、スピーカ特性インパルス応答およびヘッドフォン逆特性インパルス応答を別々に畳み込むことで、コンテンツの音に対して付加する位相特性を自由に変えることができる。すなわち、例えば再生装置１６１ではメーカー等が異なる複数のスピーカ９１のなかから任意のスピーカ９１を選択し、選択したスピーカ９１の位相特性を有するスピーカ特性インパルス応答を畳み込むようにすることなどが可能である。

　以上のようにして再生装置１６１は、ヘッドフォン逆特性インパルス応答をコンテンツのオーディオ信号に畳み込み、さらにスピーカ特性インパルス応答をオーディオ信号に畳み込んでからコンテンツの音の再生を行う。

　このようにすることで、コンテンツの音をヘッドフォン１２２で再生する場合であっても、ヘッドフォン１２２により付加される位相特性をキャンセルし、かつマスタリングに用いたスピーカ９１の位相特性をコンテンツの音に付加することができる。すなわち、所望の位相特性を得ることができる。特に、図１６を参照して説明した再生処理では、図１４を参照して説明した再生処理における場合よりも、制作者Ｍ１１がスタジオで聞いていたコンテンツの音により近い音を聞かせることができる。

〈第５の実施の形態〉
〈再生装置の構成例〉
　なお、コンテンツの音をヘッドフォン１２２で再生する場合、音源、例えばスピーカ９１から制作者Ｍ１１までの音の伝達特性を示すHRTFを畳み込めば、制作者Ｍ１１がスタジオで聞いていたコンテンツの音により近い音を聞かせることができる。すなわち、マスタリング時のスタジオの受聴環境を再現することができる。

　コンテンツのオーディオ信号にHRTFを畳み込む場合、再生装置は例えば図１７に示すように構成される。なお、図１７において図１５における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。

　図１７に示す再生装置２０１には、ヘッドフォン１２２が接続されている。また、再生装置２０１は、取得部１３１、ヘッドフォン逆特性畳み込み部１７１、スピーカ位相特性畳み込み部１３２、HRTF畳み込み部２１１、および再生制御部１３３を有している。

　特に再生装置２０１の構成は、再生装置１６１におけるスピーカ位相特性畳み込み部１３２の後段にHRTF畳み込み部２１１が設けられた構成とされている。

　再生装置２０１では、上述したスピーカ特性インパルス応答およびヘッドフォン逆特性インパルス応答だけでなく、HRTFも取得部１３１によって外部の装置から取得され、保持されている。なお、HRTFも取得部１３１により取得されるのではなく、予め取得部１３１に保持されているようにしてもよい。

　取得部１３１は、保持しているHRTFをHRTF畳み込み部２１１に供給する。

　HRTF畳み込み部２１１は、スピーカ位相特性畳み込み部１３２から供給されたオーディオ信号に対して、取得部１３１から供給されたHRTFを畳み込み、その結果得られたオーディオ信号を再生制御部１３３に供給する。

　なお、図１３に示した再生装置１２１にHRTF畳み込み部２１１が設けられるようにしてもよい。

〈再生処理の説明〉
　次に、再生装置２０１の動作について説明する。すなわち、以下、図１８のフローチャートを参照して再生装置２０１による再生処理について説明する。なお、この再生処理が開始されるタイミングでは、スピーカ特性インパルス応答、ヘッドフォン逆特性インパルス応答、およびHRTFが既に取得部１３１により取得されている。

　再生処理が開始されるとステップＳ１３１およびステップＳ１３２の処理が行われるが、これらの処理は図１６のステップＳ１０１およびステップＳ１０２の処理と同様であるので、その説明は省略する。

　ステップＳ１３３においてHRTF畳み込み部２１１は、スピーカ位相特性畳み込み部１３２から供給されたオーディオ信号に対して取得部１３１から供給されたHRTFを畳み込み、その結果得られたオーディオ信号を再生制御部１３３に供給する。

　ステップＳ１３４において再生制御部１３３は、HRTF畳み込み部２１１から供給されたオーディオ信号をヘッドフォン１２２に供給してコンテンツの音を再生させ、再生処理は終了する。これにより、コンテンツの音の再生時には、ヘッドフォン１２２の位相特性がキャンセルされ、スピーカ９１の位相特性とスタジオにおける音の伝達特性が付加されることになる。

　以上のようにして再生装置２０１は、ヘッドフォン逆特性インパルス応答、スピーカ特性インパルス応答、およびHRTFをオーディオ信号に畳み込んでからコンテンツの音の再生を行う。

　このようにすることで、コンテンツの音をヘッドフォン１２２で再生する場合であっても所望の位相特性とスタジオ等の所望の受聴環境における伝達特性とを付加し、制作者Ｍ１１がスタジオで聞いていたコンテンツの音と略同じ音を受聴者に聞かせることができる。

〈変形例〉
〈再生装置の構成例〉
　なお、再生装置１２１や再生装置１６１、再生装置２０１内部に目標位相特性インパルス応答を生成する生成部が設けられるようにしてもよい。

　例えば再生装置１６１内部にそのような生成部が設けられる場合、再生装置１６１は図１９に示すように構成される。なお、図１９において図１５における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。

　図１９に示す再生装置１６１は、生成部２４１、取得部１３１、ヘッドフォン逆特性畳み込み部１７１、スピーカ位相特性畳み込み部１３２、および再生制御部１３３を有している。

　図１９に示す再生装置１６１の構成は、図１５に示した再生装置１６１に、さらに生成部２４１が設けられた構成となっている。

　生成部２４１は、インパルス応答生成装置１１やインパルス応答生成装置５１に対応する。すなわち、生成部２４１は、図９や図１１を参照して説明したインパルス応答生成処理と同様の処理を行ってヘッドフォン逆特性インパルス応答やスピーカ特性インパルス応答を生成し、取得部１３１に供給する。

　以上の各実施の形態や変形例において説明した本技術によれば、振幅特性は変化させずに位相特性のみを調整し、所望の位相特性を得ることができる。

　例えば音楽制作でマスタリングに用いられる任意のスピーカの位相特性、特に低域の位相特性を、振幅特性はフラット（平坦）なままで音源に付加することができる。これにより、ヘッドフォンを用いて音を再生するときでも、低域の音質効果としてマスタリングスタジオで得られるものと同等の効果を得ることができる。

　しかも、対象とするスピーカが未知である場合でも、そのスピーカの位相特性を模した任意の一般的なIIRフィルタのインパルス応答を上述した入力インパルス応答として用いれば、得られたスピーカ特性インパルス応答を用いることで、振幅特性は変化させずにスピーカと同等の低域の位相特性を付加することができる。

　また、ヘッドフォン逆特性インパルス応答によりヘッドフォンの位相特性、特に低域の位相特性の逆特性を付加すれば、ヘッドフォンの位相特性、特に低域の位相特性をキャンセルすることができる。そしてヘッドフォンの位相特性のキャンセル後に、さらにスピーカ特性インパルス応答によりスピーカの位相特性、特に低域の特性を付加すれば、マスタリングスタジオでの低域の音質効果により近い効果を得ることができる。

　なお、将来的にメタデータ等によりマスタリングスタジオで用いられているスピーカを特定できる場合には、そのスピーカの位相特性を有するインパルス応答を入力インパルス応答として用いればよい。また、マスタリングスタジオで用いられているスピーカを特定できない場合には、そのスピーカの位相特性を模したIIR型のHPF等のインパルス応答を入力インパルス応答として用いればよい。

　さらに、ヘッドフォンでコンテンツの音を再生するときには、ヘッドフォンの位相特性のキャンセルと、スピーカの位相特性の付加に加えて、コンテンツのオーディオ信号に対してHRTFを畳み込むことで、マスタリングスタジオでの受聴環境の低域の位相特性をヘッドフォンでシミュレートすることができる。

〈コンピュータの構成例〉
　ところで、上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウェアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。

　図２０は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。

　コンピュータにおいて、CPU（Central Processing Unit）５０１，ROM（Read Only Memory）５０２，RAM（Random Access Memory）５０３は、バス５０４により相互に接続されている。

　バス５０４には、さらに、入出力インターフェース５０５が接続されている。入出力インターフェース５０５には、入力部５０６、出力部５０７、記録部５０８、通信部５０９、及びドライブ５１０が接続されている。

　入力部５０６は、キーボード、マウス、マイクロホン、撮像素子などよりなる。出力部５０７は、ディスプレイ、スピーカなどよりなる。記録部５０８は、ハードディスクや不揮発性のメモリなどよりなる。通信部５０９は、ネットワークインターフェースなどよりなる。ドライブ５１０は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブル記録媒体５１１を駆動する。

　以上のように構成されるコンピュータでは、CPU５０１が、例えば、記録部５０８に記録されているプログラムを、入出力インターフェース５０５及びバス５０４を介して、RAM５０３にロードして実行することにより、上述した一連の処理が行われる。

　コンピュータ（CPU５０１）が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブル記録媒体５１１に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。

　コンピュータでは、プログラムは、リムーバブル記録媒体５１１をドライブ５１０に装着することにより、入出力インターフェース５０５を介して、記録部５０８にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部５０９で受信し、記録部５０８にインストールすることができる。その他、プログラムは、ROM５０２や記録部５０８に、あらかじめインストールしておくことができる。

　なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。

　また、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。

　例えば、本技術は、１つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。

　また、上述のフローチャートで説明した各ステップは、１つの装置で実行する他、複数の装置で分担して実行することができる。

　さらに、１つのステップに複数の処理が含まれる場合には、その１つのステップに含まれる複数の処理は、１つの装置で実行する他、複数の装置で分担して実行することができる。

　さらに、本技術は、以下の構成とすることも可能である。

（１）
　振幅特性がフラットまたは略フラットであり、かつ所定の位相特性を有するインパルス応答を取得する取得部と、
　入力オーディオ信号に前記インパルス応答を畳み込む位相特性畳み込み部と
　を備えるオーディオ信号処理装置。
（２）
　前記所定の位相特性は、所定のスピーカが有する位相特性である
　（１）に記載のオーディオ信号処理装置。
（３）
　前記インパルス応答の畳み込みにより得られたオーディオ信号に基づく音のヘッドフォンでの再生を制御する再生制御部をさらに備える
　（１）または（２）に記載のオーディオ信号処理装置。
（４）
　前記ヘッドフォンの位相特性の逆特性を有するインパルス応答を前記入力オーディオ信号に畳み込む逆特性畳み込み部をさらに備える
　（３）に記載のオーディオ信号処理装置。
（５）
　前記位相特性畳み込み部による畳み込みにより得られたオーディオ信号にHRTFを畳み込むHRTF畳み込み部をさらに備える
　（１）乃至（４）の何れか一項に記載のオーディオ信号処理装置。
（６）
　前記インパルス応答を生成するインパルス応答生成部をさらに備える
　（１）乃至（５）の何れか一項に記載のオーディオ信号処理装置。
（７）
　オーディオ信号処理装置が、
　振幅特性がフラットまたは略フラットであり、かつ所定の位相特性を有するインパルス応答を取得し、
　入力オーディオ信号に前記インパルス応答を畳み込む
　オーディオ信号処理方法。
（８）
　振幅特性がフラットまたは略フラットであり、かつ所定の位相特性を有するインパルス応答を取得し、
　入力オーディオ信号に前記インパルス応答を畳み込む
　ステップを含む処理をコンピュータに実行させるプログラム。
（９）
　振幅特性がフラットまたは略フラットであり、かつ所定の位相特性を有する目標特性インパルス応答を生成する
　インパルス応答生成装置。
（１０）
　所定のインパルス情報に対して０データを付加する０詰め処理を行う０詰め処理部と、
　前記０データが付加された前記インパルス情報に対してFFTを行うインパルス情報FFT処理部と、
　前記FFTにより得られた位相特性と、フラットな振幅特性とに基づいてIFFTを行うことで前記目標特性インパルス応答を生成するIFFT処理部と
　をさらに備える（９）に記載のインパルス応答生成装置。
（１１）
　前記０詰め処理部は、少なくとも前記インパルス情報の時間方向における前側に前記０データを付加する
　（１０）に記載のインパルス応答生成装置。
（１２）
　前記IFFTにより得られたインパルス応答に対してフェード処理を行い、前記目標特性インパルス応答とするフェード処理部をさらに備える
　（１０）または（１１）に記載のインパルス応答生成装置。
（１３）
　前記インパルス情報は前記所定の位相特性を有するインパルス応答である
　（１０）乃至（１２）の何れか一項に記載のインパルス応答生成装置。
（１４）
　前記インパルス情報は単純インパルスであり、
　前記所定の位相特性を有するインパルス応答に対してFFTを行うインパルス応答FFT処理部と、
　前記インパルス情報FFT処理部による前記FFTにより得られた位相特性と、前記インパルス応答FFT処理部による前記FFTにより得られた位相特性とに基づく演算を行う演算処理部と
　をさらに備え、
　前記IFFT処理部は、前記演算により得られた位相特性と、前記フラットな振幅特性とに基づいて前記IFFTを行う
　（１０）乃至（１２）の何れか一項に記載のインパルス応答生成装置。
（１５）
　前記演算処理部は、前記演算として、前記インパルス情報FFT処理部による前記FFTにより得られた位相特性と、前記インパルス応答FFT処理部による前記FFTにより得られた位相特性との加算を行う
　（１４）に記載のインパルス応答生成装置。
（１６）
　前記演算処理部は、前記演算として、前記インパルス情報FFT処理部による前記FFTにより得られた位相特性からの、前記インパルス応答FFT処理部による前記FFTにより得られた位相特性の減算を行う
　（１４）に記載のインパルス応答生成装置。
（１７）
　インパルス応答生成装置が、
　振幅特性がフラットまたは略フラットであり、かつ所定の位相特性を有する目標特性インパルス応答を生成する
　インパルス応答生成方法。
（１８）
　振幅特性がフラットまたは略フラットであり、かつ所定の位相特性を有する目標特性インパルス応答を生成する
　ステップを含む処理をコンピュータに実行させるプログラム。

　１１　インパルス応答生成装置，　２１　０詰め処理部，　２２　FFT処理部，　２３　IFFT処理部，　２４　フェード処理部，　６１　FFT処理部，　６２　０詰め処理部，　６３　FFT処理部，　６４　演算処理部，　１２１　再生装置，　１３１　取得部，　１３２　スピーカ位相特性畳み込み部，　１３３　再生制御部，　１７１　ヘッドフォン逆特性畳み込み部，　２１１　HRTF畳み込み部，　２４１　生成部

Claims

　振幅特性がフラットまたは略フラットであり、かつ所定の位相特性を有するインパルス応答を取得する取得部と、
　入力オーディオ信号に前記インパルス応答を畳み込む位相特性畳み込み部と
　を備えるオーディオ信号処理装置。
　前記所定の位相特性は、所定のスピーカが有する位相特性である
　請求項１に記載のオーディオ信号処理装置。
　前記インパルス応答の畳み込みにより得られたオーディオ信号に基づく音のヘッドフォンでの再生を制御する再生制御部をさらに備える
　請求項１に記載のオーディオ信号処理装置。
　前記ヘッドフォンの位相特性の逆特性を有するインパルス応答を前記入力オーディオ信号に畳み込む逆特性畳み込み部をさらに備える
　請求項３に記載のオーディオ信号処理装置。
　前記位相特性畳み込み部による畳み込みにより得られたオーディオ信号にHRTFを畳み込むHRTF畳み込み部をさらに備える
　請求項１に記載のオーディオ信号処理装置。
　前記インパルス応答を生成するインパルス応答生成部をさらに備える
　請求項１に記載のオーディオ信号処理装置。
　オーディオ信号処理装置が、
　振幅特性がフラットまたは略フラットであり、かつ所定の位相特性を有するインパルス応答を取得し、
　入力オーディオ信号に前記インパルス応答を畳み込む
　オーディオ信号処理方法。
　振幅特性がフラットまたは略フラットであり、かつ所定の位相特性を有するインパルス応答を取得し、
　入力オーディオ信号に前記インパルス応答を畳み込む
　ステップを含む処理をコンピュータに実行させるプログラム。
　振幅特性がフラットまたは略フラットであり、かつ所定の位相特性を有する目標特性インパルス応答を生成する
　インパルス応答生成装置。
　所定のインパルス情報に対して０データを付加する０詰め処理を行う０詰め処理部と、
　前記０データが付加された前記インパルス情報に対してFFTを行うインパルス情報FFT処理部と、
　前記FFTにより得られた位相特性と、フラットな振幅特性とに基づいてIFFTを行うことで前記目標特性インパルス応答を生成するIFFT処理部と
　をさらに備える請求項９に記載のインパルス応答生成装置。
　前記０詰め処理部は、少なくとも前記インパルス情報の時間方向における前側に前記０データを付加する
　請求項１０に記載のインパルス応答生成装置。
　前記IFFTにより得られたインパルス応答に対してフェード処理を行い、前記目標特性インパルス応答とするフェード処理部をさらに備える
　請求項１０に記載のインパルス応答生成装置。
　前記インパルス情報は前記所定の位相特性を有するインパルス応答である
　請求項１０に記載のインパルス応答生成装置。
　前記インパルス情報は単純インパルスであり、
　前記所定の位相特性を有するインパルス応答に対してFFTを行うインパルス応答FFT処理部と、
　前記インパルス情報FFT処理部による前記FFTにより得られた位相特性と、前記インパルス応答FFT処理部による前記FFTにより得られた位相特性とに基づく演算を行う演算処理部と
　をさらに備え、
　前記IFFT処理部は、前記演算により得られた位相特性と、前記フラットな振幅特性とに基づいて前記IFFTを行う
　請求項１０に記載のインパルス応答生成装置。
　前記演算処理部は、前記演算として、前記インパルス情報FFT処理部による前記FFTにより得られた位相特性と、前記インパルス応答FFT処理部による前記FFTにより得られた位相特性との加算を行う
　請求項１４に記載のインパルス応答生成装置。
　前記演算処理部は、前記演算として、前記インパルス情報FFT処理部による前記FFTにより得られた位相特性からの、前記インパルス応答FFT処理部による前記FFTにより得られた位相特性の減算を行う
　請求項１４に記載のインパルス応答生成装置。
　インパルス応答生成装置が、
　振幅特性がフラットまたは略フラットであり、かつ所定の位相特性を有する目標特性インパルス応答を生成する
　インパルス応答生成方法。
　振幅特性がフラットまたは略フラットであり、かつ所定の位相特性を有する目標特性インパルス応答を生成する
　ステップを含む処理をコンピュータに実行させるプログラム。