JP7359146B2 - Impulse response generation device, method, and program - Google Patents

Impulse response generation device, method, and program Download PDF

Info

Publication number
JP7359146B2
JP7359146B2 JP2020528786A JP2020528786A JP7359146B2 JP 7359146 B2 JP7359146 B2 JP 7359146B2 JP 2020528786 A JP2020528786 A JP 2020528786A JP 2020528786 A JP2020528786 A JP 2020528786A JP 7359146 B2 JP7359146 B2 JP 7359146B2
Authority
JP
Japan
Prior art keywords
impulse response
characteristic
fft
phase
impulse
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020528786A
Other languages
Japanese (ja)
Other versions
JPWO2020008889A1 (en
Inventor
隆郎 福井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Sony Group Corp
Original Assignee
Sony Corp
Sony Group Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp, Sony Group Corp filed Critical Sony Corp
Publication of JPWO2020008889A1 publication Critical patent/JPWO2020008889A1/en
Application granted granted Critical
Publication of JP7359146B2 publication Critical patent/JP7359146B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/033Headphones for stereophonic communication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • H04S1/005For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

本技術は、インパルス応答生成装置および方法、並びにプログラムに関し、特に、所望の位相特性を得ることができるようにしたインパルス応答生成装置および方法、並びにプログラムに関する。 The present technology relates to an impulse response generation device, method, and program, and particularly relates to an impulse response generation device, method, and program that can obtain desired phase characteristics.

例えば音楽などのオーディオ再生を行う場合に、オーディオ信号に対してフィルタ処理を行うことで、再生する音楽等に対してエフェクトなどの効果を施す技術が知られている。 For example, when reproducing audio such as music, a technique is known in which an effect such as an effect is applied to the reproduced music by performing filter processing on the audio signal.

そのような技術として、例えば複数のフィルタを組み合わせることで、低音強調効果をもたらすようにオーディオ信号の振幅特性を変化させるものが提案されている(例えば、特許文献1参照)。 As such a technique, for example, a technique has been proposed in which a plurality of filters are combined to change the amplitude characteristics of an audio signal so as to bring about a bass emphasis effect (see, for example, Patent Document 1).

特開2002-171589号公報Japanese Patent Application Publication No. 2002-171589

ところで、近年では音楽をスピーカではなくヘッドフォンで再生し、受聴するユーザが増えてきており、ヘッドフォンでのオーディオ再生が主流になりつつある。 Incidentally, in recent years, an increasing number of users are playing and listening to music through headphones instead of speakers, and audio reproduction using headphones is becoming mainstream.

一方で、商用コンテンツは基本的にはスピーカでマスタリングされていることが殆どである。そのため、スピーカで再生を行いながらマスタリングした音楽等のコンテンツをヘッドフォンで再生してもスピーカで再生したときのような量感のある低音を聞くことができないという不満もあがっている。すなわち、コンテンツをヘッドフォンで再生すると、スピーカ再生のときとは低域の聞こえ方が異なり、本来作り手が伝えたい音質での再生を実現することができないことがあった。 On the other hand, most commercial content is basically mastered using speakers. As a result, there have been complaints that even if content such as mastered music is played through headphones while being played back through speakers, it is not possible to hear the rich bass tones that can be heard when playing back through speakers. That is, when content is played back through headphones, the way the low frequencies are heard is different from when it is played back through speakers, and it may not be possible to achieve the sound quality that the creator originally wanted to convey.

そこで出願人が調査したところ、低域の聞こえ方は位相の特性に大きく左右されることが分かった。すなわち、スピーカの低域の位相特性とヘッドフォンの低域の位相特性が大きく異なることに原因の一端があることが分かった。 The applicant investigated this and found that the way low frequencies are heard is greatly influenced by the phase characteristics. In other words, it has been found that part of the cause lies in the large difference between the low-frequency phase characteristics of the speaker and the low-frequency phase characteristics of the headphones.

しかしながら上述した技術では、オーディオ信号の振幅特性を調整することはできるが、オーディオ信号の位相特性が所望の特性となるようにすることはできなかった。 However, with the above-mentioned techniques, although the amplitude characteristics of the audio signal can be adjusted, it is not possible to make the phase characteristics of the audio signal a desired characteristic.

本技術は、このような状況に鑑みてなされたものであり、所望の位相特性を得ることができるようにするものである。 The present technology has been developed in view of this situation, and is intended to make it possible to obtain desired phase characteristics.

本技術の一側面のインパルス応答生成装置は、所定のインパルス情報に対して0データを付加する0詰め処理を行う0詰め処理部と、前記0データが付加された前記インパルス情報に対してFFTを行うインパルス情報FFT処理部と、前記FFTにより得られた位相特性と、フラットな振幅特性とに基づいてIFFTを行うことで、所定の位相特性を有する目標特性インパルス応答を生成するIFFT処理部とを備える。 An impulse response generation device according to an aspect of the present technology includes a zero-filling processing unit that performs zero-filling processing that adds zero data to predetermined impulse information, and a zero-filling processing unit that performs FFT on the impulse information to which the zero data is added. an IFFT processing unit that generates a target characteristic impulse response having a predetermined phase characteristic by performing IFFT based on the phase characteristic obtained by the FFT and the flat amplitude characteristic. Be prepared.

本技術の一側面のインパルス応答生成方法またはプログラムは、所定のインパルス情報に対して0データを付加する0詰め処理を行い、前記0データが付加された前記インパルス情報に対してFFTを行い、前記FFTにより得られた位相特性と、フラットな振幅特性とに基づいてIFFTを行うことで、所定の位相特性を有する目標特性インパルス応答を生成するステップを含む。 An impulse response generation method or program according to one aspect of the present technology performs zero padding processing to add 0 data to predetermined impulse information, performs FFT on the impulse information to which the 0 data has been added, and The method includes a step of generating a target characteristic impulse response having a predetermined phase characteristic by performing IFFT based on the phase characteristic obtained by FFT and the flat amplitude characteristic.

本技術の一側面においては、所定のインパルス情報に対して0データを付加する0詰め処理が行われ、前記0データが付加された前記インパルス情報に対してFFTが行われ、前記FFTにより得られた位相特性と、フラットな振幅特性とに基づいてIFFTを行うことで、所定の位相特性を有する目標特性インパルス応答が生成される。 In one aspect of the present technology, zero padding processing is performed to add 0 data to predetermined impulse information, FFT is performed on the impulse information to which the 0 data has been added, and the result obtained by the FFT is By performing IFFT based on the phase characteristic and the flat amplitude characteristic, a target characteristic impulse response having a predetermined phase characteristic is generated.

本技術の一側面によれば、所望の位相特性を得ることができる。 According to one aspect of the present technology, desired phase characteristics can be obtained.

なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載された何れかの効果であってもよい。 Note that the effects described here are not necessarily limited, and may be any of the effects described in this disclosure.

周波数特性とインパルス応答の関係について説明する図である。FIG. 3 is a diagram illustrating the relationship between frequency characteristics and impulse response. インパルス応答の再構築について説明する図である。FIG. 3 is a diagram illustrating reconstruction of an impulse response. 再構築されたインパルス応答の周波数特性を示す図である。FIG. 3 is a diagram showing frequency characteristics of a reconstructed impulse response. インパルス応答の再構築について説明する図である。FIG. 3 is a diagram illustrating reconstruction of an impulse response. 再構築されたインパルス応答の周波数特性を示す図である。FIG. 3 is a diagram showing frequency characteristics of a reconstructed impulse response. インパルス応答の再構築について説明する図である。FIG. 3 is a diagram illustrating reconstruction of an impulse response. 再構築されたインパルス応答の周波数特性を示す図である。FIG. 3 is a diagram showing frequency characteristics of a reconstructed impulse response. インパルス応答生成装置の構成例を示す図である。FIG. 2 is a diagram showing a configuration example of an impulse response generation device. インパルス応答生成処理を説明するフローチャートである。3 is a flowchart illustrating impulse response generation processing. インパルス応答生成装置の構成例を示す図である。FIG. 2 is a diagram showing a configuration example of an impulse response generation device. インパルス応答生成処理を説明するフローチャートである。3 is a flowchart illustrating impulse response generation processing. コンテンツのマスタリングについて説明する図である。FIG. 2 is a diagram illustrating mastering of content. 再生装置の構成例を示す図である。It is a diagram showing an example of the configuration of a playback device. 再生処理を説明するフローチャートである。It is a flowchart explaining playback processing. 再生装置の構成例を示す図である。It is a diagram showing an example of the configuration of a playback device. 再生処理を説明するフローチャートである。It is a flowchart explaining playback processing. 再生装置の構成例を示す図である。It is a diagram showing an example of the configuration of a playback device. 再生処理を説明するフローチャートである。It is a flowchart explaining playback processing. 再生装置の構成例を示す図である。It is a diagram showing an example of the configuration of a playback device. コンピュータの構成例を示す図である。It is a diagram showing an example of the configuration of a computer.

以下、図面を参照して、本技術を適用した実施の形態について説明する。 Embodiments to which the present technology is applied will be described below with reference to the drawings.

〈第1の実施の形態〉
〈本技術について〉
本技術は、オーディオ信号の振幅特性(ゲイン特性)を変えずに位相特性だけを調整することができるようにするものである。
<First embodiment>
<About this technology>
This technology makes it possible to adjust only the phase characteristics of an audio signal without changing the amplitude characteristics (gain characteristics).

すなわち、本技術は振幅特性がフラットまたは略フラットで、かつ所望の位相特性をもつインパルス応答を生成することで、オーディオ信号の振幅特性を維持したまま位相特性のみを調整し、所望の位相特性を得ることができるようにするものである。 In other words, this technology generates an impulse response with a flat or nearly flat amplitude characteristic and a desired phase characteristic, thereby adjusting only the phase characteristic while maintaining the amplitude characteristic of the audio signal, and achieving the desired phase characteristic. It allows you to obtain.

本技術では、目標とする位相特性を有するインパルス応答(インパルスレスポンス)に対してFFT(Fast Fourier Transform)およびIFFT(Inverse Fast Fourier Transform)を行うことで、振幅特性がフラットまたは略フラットで、かつ所望の位相特性をもつインパルス応答を得ることができる。ここで、振幅特性がフラットまたは略フラットとは、例えば振幅特性の各周波数における振幅(ゲイン)の値が1または略1であることである。 In this technology, by performing FFT (Fast Fourier Transform) and IFFT (Inverse Fast Fourier Transform) on an impulse response that has the target phase characteristics, the amplitude characteristics are flat or nearly flat and desired. An impulse response with phase characteristics can be obtained. Here, the amplitude characteristic being flat or substantially flat means that, for example, the amplitude (gain) value at each frequency of the amplitude characteristic is 1 or approximately 1.

具体的には、本技術では以下の手法A1または手法A2によって目標とするインパルス応答が生成される。 Specifically, in the present technology, a target impulse response is generated by the following method A1 or method A2.

すなわち、手法A1では、まず位相をシミュレートしたいインパルス応答の前に適当な長さの0データ(ゼロデータ)が挿入されてFFT(高速フーリエ変換)が行われる。 That is, in method A1, first, 0 data (zero data) of an appropriate length is inserted before the impulse response whose phase is to be simulated, and FFT (fast Fourier transform) is performed.

このようなFFTによって振幅特性と位相特性が得られるが、この振幅特性がフラットとなるように振幅特性の各周波数における振幅(ゲイン)の値が1とされ、フラットとされた振幅特性と、FFTで得られた位相特性とに基づいてIFFT(高速フーリエ逆変換)が行われる。そして、IFFTで得られたインパルス応答の後段が適当な時定数でフェード処理され、目的とするインパルス応答とされる。 An amplitude characteristic and a phase characteristic are obtained by such an FFT, but in order to make this amplitude characteristic flat, the amplitude (gain) value at each frequency of the amplitude characteristic is set to 1, and the flat amplitude characteristic and the FFT IFFT (inverse fast Fourier transform) is performed based on the phase characteristics obtained in . Then, the latter stage of the impulse response obtained by IFFT is fade-processed with an appropriate time constant to obtain the desired impulse response.

このようにして得られたインパルス応答は、振幅特性を維持したまま位相特性のみを変化させるIIR(Infinite Impulse Response)フィルタとして機能する。したがって、このようなインパルス応答をオーディオ信号に畳み込むことで位相特性のみを調整することができる。 The impulse response obtained in this manner functions as an IIR (Infinite Impulse Response) filter that changes only the phase characteristic while maintaining the amplitude characteristic. Therefore, by convolving such an impulse response with an audio signal, only the phase characteristics can be adjusted.

また、手法A2では、位相をシミュレートしたいインパルス応答に対して0データの挿入を行わずにFFTが行われるとともに、単純インパルスに対して0データが挿入されてFFTが行われる。 Further, in method A2, FFT is performed on the impulse response whose phase is to be simulated without inserting 0 data, and FFT is performed with 0 data inserted on the simple impulse.

そして、インパルス応答に対するFFTで得られた位相特性と、0データが挿入された単純インパルスに対するFFTで得られた位相特性とが加算され、その結果得られた位相特性と、各周波数における振幅の値が1であるフラットな振幅特性とに基づいてIFFTが行われる。さらに、IFFTで得られたインパルス応答の後段が適当な時定数でフェードされ、目的とするインパルス応答とされる。 Then, the phase characteristics obtained by FFT for the impulse response and the phase characteristics obtained by FFT for the simple impulse with 0 data inserted are added, and the resulting phase characteristics and the amplitude value at each frequency are added. IFFT is performed based on a flat amplitude characteristic in which . Furthermore, the latter stage of the impulse response obtained by IFFT is faded with an appropriate time constant to obtain the desired impulse response.

手法A2においても手法A1における場合と同様の特性のインパルス応答を得ることができる。換言すれば、振幅特性を維持したまま位相特性のみを変化させるIIRフィルタを得ることができる。 In method A2, an impulse response with similar characteristics to that in method A1 can be obtained. In other words, it is possible to obtain an IIR filter that changes only the phase characteristics while maintaining the amplitude characteristics.

加えて手法A2ではインパルス応答に対するFFTで得られた位相特性と、0データが挿入された単純インパルスに対するFFTで得られた位相特性とを加算するのではなく減算すれば、もとのインパルス応答の位相特性と逆特性のインパルス応答を得ることができる。 In addition, in method A2, if the phase characteristics obtained by FFT for the impulse response and the phase characteristics obtained by FFT for the simple impulse with 0 data inserted are subtracted rather than added, the original impulse response can be obtained. Impulse responses with characteristics opposite to the phase characteristics can be obtained.

以上の手法A1や手法A2で得られたインパルス応答を用いれば、再生機器が異なる場合でも同じ音質の音を再生することが可能となる。 By using the impulse responses obtained by the above methods A1 and A2, it is possible to reproduce sounds of the same quality even when different reproduction devices are used.

具体例として、例えばスピーカで音を再生しながらマスタリングされたコンテンツがあり、そのコンテンツをヘッドフォンで再生するとする。 As a specific example, assume that there is content that has been mastered while playing back sound through speakers, and the content is played back through headphones.

そのような場合、コンテンツのオーディオ信号に対して、ヘッドフォンの位相特性とは逆特性のインパルス応答を畳み込むとともに、スピーカと同じ位相特性のインパルス応答を畳み込むことで、ヘッドフォンの位相特性をキャンセルし、スピーカの位相特性をシミュレートすることができる。すなわち、ヘッドフォンでコンテンツを再生する場合であっても、マスタリング時と同じ音質の音を再生することができる。 In such a case, by convolving the audio signal of the content with an impulse response that has the opposite characteristics to the phase characteristics of the headphones, and also with an impulse response that has the same phase characteristics as the speakers, the phase characteristics of the headphones can be canceled and the speaker The phase characteristics of can be simulated. That is, even when playing back content with headphones, it is possible to play back the same quality of sound as when mastering.

それでは以下、本技術についてより詳細に説明する。 Now, the present technology will be explained in more detail below.

例えばスピーカで音を再生しながらマスタリングされたコンテンツがあり、そのコンテンツをヘッドフォンで再生する場合について考える。 For example, consider a case where there is content that has been mastered while the sound is played back through speakers, and the content is played back through headphones.

この場合、ヘッドフォンでの再生時にコンテンツの音源、つまりコンテンツのオーディオ信号に対して、マスタリングに用いられたスピーカの低域の位相特性だけを付加することができれば、マスタリングスタジオで作り手が制作している音と略同じ音を体感できると想定される。 In this case, if it is possible to add only the low-frequency phase characteristics of the speakers used for mastering to the sound source of the content, that is, the audio signal of the content when played back with headphones, it would be possible to add only the low-frequency phase characteristics of the speakers used for mastering. It is assumed that you will be able to experience almost the same sound as the sound you are experiencing.

一般的に、任意のコンテンツからマスタリングスタジオで用いられたスピーカを特定することは困難である。また、将来的にはコンテンツのメタデータ等から、マスタリングスタジオで用いられたスピーカを特定することも考えられるが、現状ではそのようなことは困難である。 Generally, it is difficult to identify the speakers used in a mastering studio from arbitrary content. Furthermore, in the future, it may be possible to identify the speakers used in the mastering studio from content metadata, etc., but it is currently difficult to do so.

そこで、カットオフ周波数Fc=50HzであるIIR型のHPF(High Pass Filter)の特性がスピーカの特性に近いことから、そのようなHPFの特性を擬似スピーカ特性として考えることとする。 Therefore, since the characteristics of an IIR type HPF (High Pass Filter) with a cutoff frequency Fc = 50 Hz are close to the characteristics of a speaker, the characteristics of such an HPF will be considered as pseudo speaker characteristics.

例えばカットオフ周波数Fcが50HzであるIIR型のHPFの周波数特性、すなわち振幅特性(ゲイン特性)および位相特性と、そのHPFのインパルス応答との関係は図1に示すようになる。 For example, the relationship between the frequency characteristics, that is, the amplitude characteristics (gain characteristics) and phase characteristics of an IIR type HPF with a cutoff frequency Fc of 50 Hz, and the impulse response of the HPF is shown in FIG.

図1では、矢印Q11に示す部分はHPFの周波数特性のうちの振幅特性を示しており、矢印Q12に示す部分はHPFの周波数特性のうちの位相特性を示している。 In FIG. 1, a portion indicated by an arrow Q11 indicates an amplitude characteristic of the frequency characteristics of the HPF, and a portion indicated by an arrow Q12 indicates a phase characteristic of the frequency characteristics of the HPF.

特に振幅特性における縦軸はゲイン(振幅)を示しており、横軸は周波数を示している。また位相特性における縦軸は位相を示しており、横軸は周波数を示している。この周波数特性から、HPFの低域側ではゲインが小さく位相が正の値となっていることが分かる。 In particular, the vertical axis in the amplitude characteristics indicates gain (amplitude), and the horizontal axis indicates frequency. Further, in the phase characteristics, the vertical axis indicates the phase, and the horizontal axis indicates the frequency. From this frequency characteristic, it can be seen that on the low-frequency side of the HPF, the gain is small and the phase is a positive value.

これに対して、矢印Q13に示す部分にはHPFのインパルス応答が示されている。インパルス応答の縦軸は振幅を示しており、横軸は時間、すなわち時間サンプル(サンプル)を示している。なお、ここではHPFのインパルス応答は、0サンプル目付近を拡大したものとなっている。 On the other hand, the portion indicated by arrow Q13 shows the impulse response of the HPF. The vertical axis of the impulse response indicates amplitude, and the horizontal axis indicates time, that is, time samples. Note that here, the impulse response of the HPF is an enlarged version of the vicinity of the 0th sample.

このようなインパルス応答はIIR型フィルタとして用いることができ、矢印Q13に示すインパルス応答をオーディオ信号に畳み込むことで、オーディオ信号に対してHPFのフィルタ処理を施すことができる。 Such an impulse response can be used as an IIR type filter, and by convolving the impulse response shown by arrow Q13 with the audio signal, the HPF filtering process can be performed on the audio signal.

さらに、HPFの周波数特性、すなわち振幅特性および位相特性と、HPFのインパルス応答とは変換誤差はあるものの可逆の関係となっている。 Furthermore, the frequency characteristics of the HPF, that is, the amplitude characteristics and the phase characteristics, and the impulse response of the HPF have a reversible relationship, although there is a conversion error.

具体的には、矢印Q11に示す振幅特性および矢印Q12に示す位相特性からなる周波数特性に対してIFFTを行うと、理想的には矢印Q13に示すインパルス応答が得られる。これに対し、矢印Q13に示すインパルス応答に対してFFTを行うと、理想的には矢印Q11に示す振幅特性および矢印Q12に示す位相特性からなる周波数特性が得られる。 Specifically, when IFFT is performed on a frequency characteristic consisting of an amplitude characteristic shown by arrow Q11 and a phase characteristic shown by arrow Q12, an impulse response shown by arrow Q13 is ideally obtained. On the other hand, when FFT is performed on the impulse response shown by arrow Q13, a frequency characteristic ideally consisting of an amplitude characteristic shown by arrow Q11 and a phase characteristic shown by arrow Q12 is obtained.

このようなHPFのインパルス応答を、上述のスピーカで音を再生しながらマスタリングされたコンテンツのオーディオ信号に畳み込めば、コンテンツの音にスピーカと同様の位相特性を付加することはできるが、低域のゲイン(振幅)が低下してしまう。 If such an impulse response of the HPF is convolved with the audio signal of the mastered content while playing the sound with the above-mentioned speaker, it is possible to add the same phase characteristics to the content sound as the speaker, but the low frequency The gain (amplitude) of the signal decreases.

そこで、矢印Q13に示すインパルス応答に対して実際にFFTを行い、その結果得られた周波数特性について、振幅特性の全周波数の振幅(ゲイン)を1としてフラットな振幅特性とし、さらにIFFTを行ってインパルス応答を再構築することを考える。 Therefore, we actually performed FFT on the impulse response shown by arrow Q13, and the resulting frequency characteristics were made flat by setting the amplitude (gain) of all frequencies in the amplitude characteristics to 1, and then performed IFFT. Consider reconstructing the impulse response.

このとき、再構築により得ようとするインパルス応答は、振幅特性を変化させずに図1に示した位相特性のみをオーディオ信号に対して付加するインパルス応答、つまり振幅特性を変化させずに所望の位相特性のみを付加するインパルス応答とされる。 At this time, the impulse response to be obtained by reconstruction is an impulse response that adds only the phase characteristics shown in Figure 1 to the audio signal without changing the amplitude characteristics, that is, the impulse response that adds only the phase characteristics shown in Figure 1 to the audio signal without changing the amplitude characteristics. It is considered to be an impulse response that adds only phase characteristics.

そうすれば、再構築により得られたインパルス応答を、上述のスピーカで音を再生しながらマスタリングされたコンテンツのオーディオ信号に畳み込むことで、振幅特性を変化させずに目標とするスピーカの位相特性をコンテンツの音に付加することができる。これにより、マスタリングスタジオで作り手が制作している音と略同じ音を受聴者(ユーザ)に体感させることができるようになる。 Then, by convolving the impulse response obtained through reconstruction with the audio signal of the mastered content while playing the sound with the above-mentioned speaker, the phase characteristics of the target speaker can be adjusted without changing the amplitude characteristics. It can be added to the sound of the content. This allows the listener (user) to experience substantially the same sound as the sound produced by the creator in the mastering studio.

なお、以下では、振幅特性を変化させずに所望の位相特性を付加するフィルタとして機能するインパルス応答を、特に目標位相特性インパルス応答とも称することとする。 Note that hereinafter, the impulse response that functions as a filter that adds a desired phase characteristic without changing the amplitude characteristic will also be particularly referred to as a target phase characteristic impulse response.

インパルス応答の再構築により目標位相特性インパルス応答を得ようとする場合、例えば図2に示すように再構築を行うことが考えられる。 When attempting to obtain a target phase characteristic impulse response by reconstructing the impulse response, it is conceivable to perform the reconstruction as shown in FIG. 2, for example.

図2では、矢印Q21に示す部分には、図1の矢印Q13に示したインパルス応答が示されている。 In FIG. 2, the impulse response shown by arrow Q13 in FIG. 1 is shown in the portion shown by arrow Q21.

このインパルス応答は略1024サンプルで収束している。しかし、ここでは変換後の語調を考えて、矢印Q22に示すようにインパルス応答における時間方向の後ろ側、すなわち未来側に0詰め処理を行って4096処理を行うようにする。 This impulse response converges after approximately 1024 samples. However, in this case, considering the tone after conversion, the 4096 process is performed by zero-filling the back side of the impulse response in the time direction, that is, the future side, as shown by arrow Q22.

すなわち、インパルス応答の時間方向の後ろ側(末尾)に対して、サンプル値が0であるサンプルである0データを付加する0詰め処理を行って、インパルス応答全体の長さ(サンプル数)が4096サンプルとなるようにする。 In other words, 0 data, which is a sample with a sample value of 0, is added to the rear side (end) of the impulse response in the time direction. Make it a sample.

このようにして0詰め処理されたインパルス応答に対して矢印Q23に示すようにFFTを行うと、図1に示したものと同様の振幅特性および位相特性が得られる。 When FFT is performed on the impulse response zero-padded in this manner as shown by arrow Q23, amplitude characteristics and phase characteristics similar to those shown in FIG. 1 are obtained.

ここで、目標とする目標位相特性インパルス応答は、振幅特性がフラットまたは略フラットなものであり、位相特性は矢印Q12に示した位相特性である。 Here, the target phase characteristic impulse response that is aimed at is one in which the amplitude characteristic is flat or substantially flat, and the phase characteristic is the phase characteristic shown by arrow Q12.

そのため、FFTで得られた振幅特性における各周波数の振幅(ゲイン)の値が「1」に調整される。換言すればフラットな振幅特性となるように、FFTで得られた振幅特性の振幅が調整される。 Therefore, the amplitude (gain) value of each frequency in the amplitude characteristic obtained by FFT is adjusted to "1". In other words, the amplitude of the amplitude characteristic obtained by FFT is adjusted so as to have a flat amplitude characteristic.

また、FFTで得られた位相特性は、目標とする矢印Q12に示した位相特性となっているはずであるので、FFTで得られた位相特性に対しては特に位相調整は行われない。 Further, since the phase characteristic obtained by FFT should be the target phase characteristic shown by the arrow Q12, no particular phase adjustment is performed on the phase characteristic obtained by FFT.

次に、矢印Q24に示すように、振幅調整により得られたフラットな振幅特性と、FFTで得られた位相特性とからなる周波数特性に対してIFFTが行われる。 Next, as shown by an arrow Q24, IFFT is performed on the frequency characteristic consisting of the flat amplitude characteristic obtained by amplitude adjustment and the phase characteristic obtained by FFT.

さらに、IFFTにより得られたインパルス応答は0に収束しないので、IFFTにより得られたインパルス応答に対して、そのインパルス応答の時間方向の後ろ側(末尾側)をフェードアウトさせて0に収束させるフェード処理が行われる。 Furthermore, since the impulse response obtained by IFFT does not converge to 0, a fade process is performed to fade out the rear (tail side) of the impulse response in the time direction for the impulse response obtained by IFFT and converge to 0. will be held.

このようなフェード処理によりインパルス応答が再構築され、その結果、矢印Q25に示す目標位相特性インパルス応答が得られる。ここでは、長さが4096サンプルであるインパルス応答が目標位相特性インパルス応答として得られている。 The impulse response is reconstructed by such fade processing, and as a result, the target phase characteristic impulse response shown by arrow Q25 is obtained. Here, an impulse response with a length of 4096 samples is obtained as the target phase characteristic impulse response.

矢印Q25に示す目標位相特性インパルス応答は、理想的にはフラットまたは略フラットな振幅特性を有し、かつもとのHPFと同じ位相特性を有しているはずである。 The target phase characteristic impulse response shown by arrow Q25 should ideally have a flat or substantially flat amplitude characteristic and the same phase characteristic as the original HPF.

ところが、実際にはFFTやIFFTといった変換において変換ひずみが生じるため、矢印Q25に示した目標位相特性インパルス応答の周波数特性は、図3に示すようになる。 However, in reality, conversion distortion occurs in conversions such as FFT and IFFT, so the frequency characteristic of the target phase characteristic impulse response shown by arrow Q25 becomes as shown in FIG. 3.

図3では、矢印Q31に示す部分は振幅特性を示しており、矢印Q32に示す部分は位相特性を示している。なお、振幅特性における縦軸はゲイン(振幅)を示しており、横軸は周波数を示している。また位相特性における縦軸は位相を示しており、横軸は周波数を示している。 In FIG. 3, a portion indicated by an arrow Q31 indicates an amplitude characteristic, and a portion indicated by an arrow Q32 indicates a phase characteristic. Note that the vertical axis in the amplitude characteristics indicates gain (amplitude), and the horizontal axis indicates frequency. Further, in the phase characteristics, the vertical axis indicates the phase, and the horizontal axis indicates the frequency.

矢印Q31に示す部分では、曲線L11は図2の矢印Q25に示した目標位相特性インパルス応答の振幅特性を示しており、曲線L12は図2の矢印Q21に示したもとのHPFの振幅特性を示している。曲線L11から、目標位相特性インパルス応答の振幅特性では、もとのHPFほどではないが低域部分、すなわち矢印W11に示す部分のゲインが低下しており、フラットな振幅特性とはなっていないことが分かる。 In the part shown by arrow Q31, curve L11 shows the amplitude characteristic of the target phase characteristic impulse response shown by arrow Q25 in FIG. 2, and curve L12 shows the amplitude characteristic of the original HPF shown by arrow Q21 in FIG. There is. From the curve L11, in the amplitude characteristic of the target phase characteristic impulse response, the gain in the low frequency portion, that is, the portion shown by the arrow W11, has decreased, although not as much as in the original HPF, and the amplitude characteristic is not flat. I understand.

また、矢印Q32に示す部分では、曲線L13は図2の矢印Q25に示した目標位相特性インパルス応答の位相特性を示しており、曲線L14は図2の矢印Q21に示したもとのHPFの位相特性、つまり目標とする位相特性を示している。 Further, in the part indicated by arrow Q32, curve L13 indicates the phase characteristic of the target phase characteristic impulse response indicated by arrow Q25 in FIG. 2, and curve L14 indicates the phase characteristic of the original HPF indicated by arrow Q21 in FIG. In other words, it shows the target phase characteristics.

この例では、曲線L13は曲線L14と略同じとなっており、目標位相特性インパルス応答では位相特性に関しては目標とする特性が得られていることが分かる。 In this example, the curve L13 is substantially the same as the curve L14, and it can be seen that the target phase characteristic is obtained in the target phase characteristic impulse response.

ところで、一般的に目標位相特性インパルス応答とは逆の場合、すなわち位相特性がフラット(直線)で、振幅(ゲイン)が変化する場合には、基本的にインパルス応答は左右対称の形状となることが知られている。 By the way, in general, when the target phase characteristic impulse response is opposite, that is, when the phase characteristic is flat (straight line) and the amplitude (gain) changes, the impulse response basically has a symmetrical shape. It has been known.

そこで、本出願人はパルスが立ち上がっている部分を中心としてインパルス応答が略左右対称となるように0詰め処理を行い、パルスが立ち上がっている部分の前後が同じ長さの区間となるようにすれば、フラットな振幅特性のインパルス応答を得ることができるのではないかと考えた。 Therefore, the applicant performed zero padding processing so that the impulse response was approximately symmetrical around the rising part of the pulse, so that the sections before and after the rising part of the pulse were the same length. For example, we thought that it would be possible to obtain an impulse response with flat amplitude characteristics.

ここで、もとのHPFのインパルス応答に対して、少なくとも時間方向の前側(過去側)に0詰め処理を行い、インパルス応答が略左右対称の形状となるようにしてからFFTおよびIFFTを行って目標位相特性インパルス応答を生成することを考える。 Here, perform FFT and IFFT on the original HPF impulse response by zero-filling it at least on the front side (past side) in the time direction so that the impulse response has a substantially symmetrical shape. Consider generating a target phase characteristic impulse response.

そのような場合、例えば図4に示すようにインパルス応答の再構築が行われ、目標位相特性インパルス応答が生成される。 In such a case, for example, as shown in FIG. 4, the impulse response is reconstructed to generate a target phase characteristic impulse response.

図4では、矢印Q41に示す部分には、図1の矢印Q13に示したHPFのインパルス応答が示されており、このインパルス応答は略1024サンプルで収束している。 In FIG. 4, the portion indicated by arrow Q41 shows the impulse response of the HPF indicated by arrow Q13 in FIG. 1, and this impulse response converges at approximately 1024 samples.

この例では、矢印Q41に示すHPFのインパルス応答に対して矢印Q42に示すように0詰め処理が行われる。 In this example, zero padding processing is performed as shown by arrow Q42 on the impulse response of the HPF shown by arrow Q41.

すなわち、インパルス応答の長さに合わせて、インパルス応答における時間方向の後ろ側(末尾側)だけでなく、前側(先頭側)にも0データが付加されている。 That is, according to the length of the impulse response, 0 data is added not only to the rear side (tail side) of the impulse response in the time direction but also to the front side (head side).

特に、ここではインパルス応答における時間方向の前側に8192サンプル分だけ0データが付加されるとともに、インパルス長自体も長さが8192サンプルとなるようにインパルス応答における時間方向の後ろ側にも0データが付加されている。このような0詰め処理により、矢印Q42に示すインパルス応答は略左右対称の形状となっており、全体の長さが16384サンプルとなっている。 In particular, here, 0 data is added for 8192 samples to the front side of the impulse response in the time direction, and 0 data is also added to the rear side of the impulse response in the time direction so that the impulse length itself is 8192 samples long. It has been added. Due to this zero-filling process, the impulse response shown by the arrow Q42 has a substantially symmetrical shape, and the total length is 16384 samples.

次に、矢印Q43に示すように、0詰め処理されたインパルス応答に対してFFTを行うと、図2の矢印Q23における場合と同様に振幅特性および位相特性が得られる。 Next, as shown by arrow Q43, when FFT is performed on the zero-padded impulse response, amplitude characteristics and phase characteristics are obtained as in the case of arrow Q23 in FIG.

この例においても目標とする目標位相特性インパルス応答の振幅特性はフラットなものであるので、FFTで得られた振幅特性における各周波数の振幅(ゲイン)の値が「1」に調整され、フラットな振幅特性とされる。 In this example as well, the target amplitude characteristic of the target phase characteristic impulse response is flat, so the amplitude (gain) value of each frequency in the amplitude characteristic obtained by FFT is adjusted to "1", making it flat. It is considered to be an amplitude characteristic.

また、FFTで得られた位相特性は、目標とする位相特性となっているはずであるので、FFTで得られた位相特性に対しては特に位相調整は行われない。 Further, since the phase characteristics obtained by FFT should be the target phase characteristics, no particular phase adjustment is performed on the phase characteristics obtained by FFT.

続いて矢印Q44に示すように振幅調整により得られたフラットな振幅特性と、FFTで得られた位相特性とからなる周波数特性に対してIFFTが行われ、その結果得られたインパルス応答に対して図2の矢印Q24における場合と同様にフェード処理が行われる。 Next, as shown by arrow Q44, IFFT is performed on the frequency characteristic consisting of the flat amplitude characteristic obtained by amplitude adjustment and the phase characteristic obtained by FFT, and the impulse response obtained as a result is A fade process is performed in the same manner as in the case of arrow Q24 in FIG.

そして、フェード処理により得られたインパルス応答が目標位相特性インパルス応答とされる。ここでは、矢印Q45に示す目標位相特性インパルス応答が得られており、この目標位相特性インパルス応答は左右対称に近い形状となっている。また、目標位相特性インパルス応答の長さは16384サンプルとなっている。 The impulse response obtained by the fade processing is then set as the target phase characteristic impulse response. Here, the target phase characteristic impulse response shown by arrow Q45 is obtained, and this target phase characteristic impulse response has a shape that is nearly symmetrical. Furthermore, the length of the target phase characteristic impulse response is 16384 samples.

このようにして得られた矢印Q45に示す目標位相特性インパルス応答の周波数特性は、図5に示すようになる。 The frequency characteristic of the target phase characteristic impulse response indicated by the arrow Q45 obtained in this manner is as shown in FIG.

図5では、矢印Q51に示す部分は振幅特性を示しており、矢印Q52に示す部分は位相特性を示している。なお、振幅特性における縦軸はゲイン(振幅)を示しており、横軸は周波数を示している。また位相特性における縦軸は位相を示しており、横軸は周波数を示している。 In FIG. 5, a portion indicated by an arrow Q51 indicates an amplitude characteristic, and a portion indicated by an arrow Q52 indicates a phase characteristic. Note that the vertical axis in the amplitude characteristics indicates gain (amplitude), and the horizontal axis indicates frequency. Further, in the phase characteristics, the vertical axis indicates the phase, and the horizontal axis indicates the frequency.

矢印Q51に示す部分では、曲線L31は図4の矢印Q45に示した目標位相特性インパルス応答の振幅特性を示しており、曲線L32は図4の矢印Q41に示したもとのHPFの振幅特性を示している。 In the part shown by arrow Q51, curve L31 shows the amplitude characteristic of the target phase characteristic impulse response shown by arrow Q45 in FIG. 4, and curve L32 shows the amplitude characteristic of the original HPF shown by arrow Q41 in FIG. There is.

曲線L31に示される目標位相特性インパルス応答の振幅特性は、各周波数における振幅(ゲイン)の値が±0.2dB以内の範囲におさまっており、略フラットな特性が得られていることが分かる。すなわち、目標とする振幅特性が得られていることが分かる。 It can be seen that in the amplitude characteristic of the target phase characteristic impulse response shown by the curve L31, the amplitude (gain) value at each frequency falls within a range of ±0.2 dB, and a substantially flat characteristic is obtained. That is, it can be seen that the target amplitude characteristics are obtained.

また、矢印Q52に示す部分では、曲線L33は図4の矢印Q45に示した目標位相特性インパルス応答の位相特性を示しており、曲線L34は図4の矢印Q41に示したもとのHPFの位相特性、つまり目標とする位相特性を示している。さらに曲線L35は8192サンプルだけディレイ(遅延)させた単純インパルスの位相特性、つまり直線位相を示している。 Further, in the part shown by arrow Q52, curve L33 shows the phase characteristic of the target phase characteristic impulse response shown by arrow Q45 in FIG. 4, and curve L34 shows the phase characteristic of the original HPF shown by arrow Q41 in FIG. In other words, it shows the target phase characteristics. Furthermore, curve L35 shows the phase characteristic of a simple impulse delayed by 8192 samples, that is, the linear phase.

ここでは、曲線L33と曲線L34とは殆ど重なっており、目標位相特性インパルス応答の位相特性として目標とする特性と略同等な特性が得られていることが分かる。 Here, the curve L33 and the curve L34 almost overlap, and it can be seen that the phase characteristics of the target phase characteristic impulse response are substantially equivalent to the target characteristics.

また、曲線L35は比較のために示されているものである。曲線L35は直線位相である単純インパルスの位相特性を示しているので、各周波数における曲線L33と曲線L35との差が図1の矢印Q12に示した位相特性の各周波数における位相の値となっていれば、目標位相特性インパルス応答の位相特性として目標とする特性が得られていることになる。なお、図4の矢印Q41に示したもとのHPFの位相特性は、図1の矢印Q12に示した位相特性と同じである。 Further, curve L35 is shown for comparison. Since the curve L35 shows the phase characteristic of a simple impulse with a linear phase, the difference between the curve L33 and the curve L35 at each frequency becomes the phase value at each frequency of the phase characteristic shown by the arrow Q12 in FIG. If so, it means that the target characteristic is obtained as the phase characteristic of the target phase characteristic impulse response. Note that the phase characteristic of the original HPF shown by arrow Q41 in FIG. 4 is the same as the phase characteristic shown by arrow Q12 in FIG.

この例では、曲線L33と曲線L35とを比較すると、それらの位相の差分は周波数が高くなるにつれて小さくなっている。そのため、曲線L33と曲線L35からも、目標位相特性インパルス応答の位相特性として図1の矢印Q12に示した位相特性と略同じ特性が得られていることが分かる。 In this example, when comparing curve L33 and curve L35, the difference in phase between them becomes smaller as the frequency becomes higher. Therefore, it can be seen from the curve L33 and the curve L35 that substantially the same characteristic as the phase characteristic shown by the arrow Q12 in FIG. 1 is obtained as the phase characteristic of the target phase characteristic impulse response.

以上のことから、目標とする位相特性を有するインパルス応答に対して少なくとも時間方向の前側に0詰め処理を行い、0詰め処理されたインパルス応答に対してFFT、IFFT、およびフェード処理を行うことで、振幅特性がフラットまたは略フラットであり、かつ目標とする位相特性を有する目標位相特性インパルス応答を得ることができることが分かる。 From the above, it is possible to perform zero-filling processing at least on the front side in the time direction for an impulse response that has the target phase characteristics, and perform FFT, IFFT, and fade processing on the zero-padded impulse response. It can be seen that a target phase characteristic impulse response having a flat or substantially flat amplitude characteristic and a target phase characteristic can be obtained.

以上のような図4を参照して説明した目標位相特性インパルス応答の生成手法が上述した手法A1である。 The method of generating the target phase characteristic impulse response described above with reference to FIG. 4 is the method A1 described above.

なお、目標位相特性インパルス応答の生成にあたっては、0詰め処理されたインパルス応答の長さを長くするほど、つまりサンプル数を多くするほど目標位相特性インパルス応答の周波数特性は目標とする特性に近くなる。すなわち、よりよい特性が得られるようになる。特に0詰め処理されたインパルス応答の長さが無限サンプルとなると、目標位相特性インパルス応答の周波数特性と、目標とする特性との誤差は限りなく0に近くなる。 In addition, when generating the target phase characteristic impulse response, the longer the length of the zero-padded impulse response, that is, the greater the number of samples, the closer the frequency characteristic of the target phase characteristic impulse response will be to the target characteristic. . In other words, better characteristics can be obtained. In particular, when the length of the zero-padded impulse response becomes infinite samples, the error between the frequency characteristic of the target phase characteristic impulse response and the target characteristic becomes extremely close to zero.

また、目標位相特性インパルス応答を生成する場合、目標とする特性との誤差をある程度許容してでも処理量を削減したいこともある。例えば目標位相特性インパルス応答の長さを短くすれば、生成時においても生成後の畳み込み時においても処理量は少なくなる。 Furthermore, when generating a target phase characteristic impulse response, it may be desirable to reduce the amount of processing even if some error from the target characteristic is allowed. For example, if the length of the target phase characteristic impulse response is shortened, the amount of processing will be reduced both during generation and during convolution after generation.

そのような場合、例えば図6に示すように0詰め処理においてインパルス応答に付加する0データの数を少なくすることで処理量を削減しつつ十分な特性の目標位相特性インパルス応答が得られるようにしてもよい。 In such a case, for example, as shown in Fig. 6, by reducing the number of 0 data added to the impulse response in the 0-filling process, the amount of processing can be reduced and a target phase characteristic impulse response with sufficient characteristics can be obtained. It's okay.

図6では、矢印Q61に示す部分には、図1の矢印Q13に示したHPFのインパルス応答が示されており、このインパルス応答は略1024サンプルで収束している。 In FIG. 6, the portion indicated by arrow Q61 shows the impulse response of the HPF indicated by arrow Q13 in FIG. 1, and this impulse response converges at approximately 1024 samples.

この例では、矢印Q61に示すHPFのインパルス応答に対して矢印Q62に示すように0詰め処理が行われる。 In this example, zero padding processing is performed as shown by arrow Q62 on the impulse response of the HPF shown by arrow Q61.

ここでは、インパルス応答における時間方向の前側に384サンプル分だけ0データが付加されるとともに、インパルス応答全体の長さが4096サンプルとなるようにインパルス応答における時間方向の後ろ側にも0データが付加されている。 Here, 0 data is added for 384 samples to the front side of the impulse response in the time direction, and 0 data is also added to the rear side of the impulse response in the time direction so that the entire length of the impulse response is 4096 samples. has been done.

この0詰め処理では、インパルス応答における時間方向の前側に付加する0データの数が少ないため、矢印Q62に示す0詰め処理後のインパルス応答は、左右対称の形状とはなっていない。 In this zero-filling process, since the number of zero data added to the front side of the impulse response in the time direction is small, the impulse response after the zero-filling process shown by arrow Q62 does not have a symmetrical shape.

次に、矢印Q63に示すように、0詰め処理されたインパルス応答に対してFFTを行うと、図2の矢印Q23における場合と同様に振幅特性および位相特性が得られる。 Next, as shown by arrow Q63, when FFT is performed on the zero-padded impulse response, amplitude characteristics and phase characteristics are obtained as in the case of arrow Q23 in FIG.

この例においても図4における場合と同様にFFTで得られた振幅特性における各周波数の振幅(ゲイン)の値が「1」に調整されてフラットな振幅特性とされ、FFTで得られた位相特性に対しては特に位相調整は行われない。 In this example, as in the case in Fig. 4, the amplitude (gain) value of each frequency in the amplitude characteristic obtained by FFT is adjusted to "1" to make a flat amplitude characteristic, and the phase characteristic obtained by FFT is No particular phase adjustment is performed for .

続いて矢印Q64に示すように振幅調整により得られたフラットな振幅特性と、FFTで得られた位相特性とからなる周波数特性に対してIFFTが行われ、その結果得られたインパルス応答に対して図2の矢印Q24における場合と同様にフェード処理が行われる。 Next, as shown by arrow Q64, IFFT is performed on the frequency characteristic consisting of the flat amplitude characteristic obtained by amplitude adjustment and the phase characteristic obtained by FFT, and the impulse response obtained as a result is A fade process is performed in the same manner as in the case of arrow Q24 in FIG.

そして、フェード処理により得られたインパルス応答が目標位相特性インパルス応答とされる。ここでは、矢印Q65に示す目標位相特性インパルス応答が得られており、目標位相特性インパルス応答の長さは4096サンプルとなっている。 The impulse response obtained by the fade processing is then set as the target phase characteristic impulse response. Here, the target phase characteristic impulse response shown by arrow Q65 is obtained, and the length of the target phase characteristic impulse response is 4096 samples.

なお、この例ではインパルス応答における時間方向の前側に付加する0データの数が少ないため、矢印Q65に示す目標位相特性インパルス応答は、左右対称な形状とはなっていない。 Note that in this example, since the number of 0 data added to the front side of the impulse response in the time direction is small, the target phase characteristic impulse response shown by arrow Q65 does not have a symmetrical shape.

このようにして得られた矢印Q65に示す目標位相特性インパルス応答の周波数特性は、図7に示すようになる。 The frequency characteristic of the target phase characteristic impulse response obtained in this way and indicated by the arrow Q65 is as shown in FIG.

図7では、矢印Q71に示す部分は振幅特性を示しており、矢印Q72に示す部分は位相特性を示している。なお、振幅特性における縦軸はゲイン(振幅)を示しており、横軸は周波数を示している。また位相特性における縦軸は位相を示しており、横軸は周波数を示している。 In FIG. 7, a portion indicated by an arrow Q71 indicates an amplitude characteristic, and a portion indicated by an arrow Q72 indicates a phase characteristic. Note that the vertical axis in the amplitude characteristics indicates gain (amplitude), and the horizontal axis indicates frequency. Further, in the phase characteristics, the vertical axis indicates the phase, and the horizontal axis indicates the frequency.

矢印Q71に示す部分では、曲線L51は図6の矢印Q65に示した目標位相特性インパルス応答の振幅特性を示しており、曲線L52は図6の矢印Q61に示したもとのHPFの振幅特性を示している。 In the part shown by arrow Q71, curve L51 shows the amplitude characteristic of the target phase characteristic impulse response shown by arrow Q65 in FIG. 6, and curve L52 shows the amplitude characteristic of the original HPF shown by arrow Q61 in FIG. There is.

曲線L51に示される目標位相特性インパルス応答の振幅特性は、各周波数における振幅(ゲイン)の値が±1dB以内の範囲におさまっており、略フラットな特性が得られていることが分かる。すなわち、十分な振幅特性が得られていることが分かる。 It can be seen that the amplitude characteristic of the target phase characteristic impulse response shown by the curve L51 has an amplitude (gain) value at each frequency within a range of ±1 dB, and a substantially flat characteristic is obtained. That is, it can be seen that sufficient amplitude characteristics are obtained.

特に、ここでは曲線L51に示される振幅特性は、図5の曲線L31に示した振幅特性と比較すると目標とする特性からの誤差が大きくなっているが、その誤差は十分に小さい範囲におさまっていることが分かる。 In particular, here, the amplitude characteristic shown by curve L51 has a large error from the target characteristic when compared with the amplitude characteristic shown by curve L31 in FIG. 5, but the error is within a sufficiently small range. I know that there is.

また、矢印Q72に示す部分では、曲線L53は図6の矢印Q65に示した目標位相特性インパルス応答の位相特性を示しており、曲線L54は図6の矢印Q61に示したもとのHPFの位相特性、つまり目標とする位相特性を示している。さらに曲線L55は図5の曲線L35と同様に、ディレイ(遅延)させた単純インパルスの位相特性を示している。 Further, in the part shown by arrow Q72, curve L53 shows the phase characteristic of the target phase characteristic impulse response shown by arrow Q65 in FIG. 6, and curve L54 shows the phase characteristic of the original HPF shown by arrow Q61 in FIG. In other words, it shows the target phase characteristics. Furthermore, the curve L55 shows the phase characteristics of a delayed simple impulse, similar to the curve L35 in FIG.

ここでは、曲線L53と曲線L54とは、図5における場合よりは誤差が大きいものの殆ど重なっており、目標位相特性インパルス応答の位相特性として目標とする特性と略同等な特性が得られていることが分かる。 Here, the curve L53 and the curve L54 almost overlap, although the error is larger than in the case in FIG. 5, and it can be seen that the phase characteristic of the target phase characteristic impulse response has almost the same characteristic as the target characteristic. I understand.

また、曲線L53と曲線L55とを比較すると、それらの位相の差分は周波数が高くなるにつれて小さくなっており、図5における場合と同様に、目標位相特性インパルス応答の位相特性として図1の矢印Q12に示した位相特性と略同じ特性が得られていることが分かる。 Furthermore, when comparing the curve L53 and the curve L55, the difference in their phase becomes smaller as the frequency increases, and as in the case in FIG. 5, the arrow Q12 in FIG. 1 is used as the phase characteristic of the target phase characteristic impulse response. It can be seen that almost the same characteristics as the phase characteristics shown in Figure 1 are obtained.

以上のように目標とする位相特性を有するインパルス応答の時間方向の前側に付加する0データの数をある程度少なくしても、振幅特性がフラットまたは略フラットであり、かつ目標とする位相特性を有する目標位相特性インパルス応答を得ることができる。 As described above, even if the number of 0 data added to the front side of the impulse response in the time direction that has the target phase characteristic is reduced to a certain extent, the amplitude characteristic is flat or almost flat, and the target phase characteristic is still maintained. A target phase characteristic impulse response can be obtained.

なお、インパルス応答の時間方向の前側にどれだけ0データを付加するかは、目標とする特性との許容誤差と、処理量とのトレードオフとなるので、付加する0データの数は必要に応じて調整すればよい。 The amount of 0 data to be added to the front side of the impulse response in the time direction is a trade-off between the tolerance for the target characteristics and the amount of processing, so the number of 0 data to be added can be adjusted as needed. You can adjust it accordingly.

また、目標とする位相特性を有するインパルス応答に0詰め処理を行うのではなく、例えば図5の曲線L35に示したような単純インパルスに対して0詰め処理を行って目標位相特性インパルス応答を生成してもよい。このような目標位相特性インパルス応答の生成手法が上述した手法A2である。 Moreover, instead of performing zero-filling processing on an impulse response having a target phase characteristic, for example, zero-filling processing is performed on a simple impulse as shown in curve L35 in FIG. 5 to generate a target phase characteristic impulse response. You may. A method of generating such a target phase characteristic impulse response is method A2 described above.

手法A2では、単純インパルスの時間方向の前側に対して0データを付加する0詰め処理が行われ、0詰め処理後の単純インパルスに対してFFTが行われる。 In method A2, 0 padding processing is performed to add 0 data to the front side of the simple impulse in the time direction, and FFT is performed on the simple impulse after the 0 padding processing.

なお、以下では、0詰め処理後の単純インパルスに対するFFTにより得られた周波数特性の位相特性を、特に単純インパルスの位相特性とも称することとする。 Note that, hereinafter, the phase characteristic of the frequency characteristic obtained by FFT for the simple impulse after the zero-filling process will also be particularly referred to as the phase characteristic of the simple impulse.

また、手法A2では目標とする位相特性を有するインパルス応答に対しては0詰め処理は行われず、インパルス応答に対してそのままFFTが行われる。以下では、目標とする位相特性を有するインパルス応答に対するFFTにより得られた周波数特性の位相特性を、特に目標位相特性とも称することとする。 Furthermore, in method A2, zero padding processing is not performed on the impulse response having the target phase characteristic, and FFT is performed on the impulse response as it is. Hereinafter, the phase characteristic of the frequency characteristic obtained by FFT for the impulse response having the target phase characteristic will also be particularly referred to as the target phase characteristic.

このようにしてFFTにより単純インパルスの位相特性と、目標位相特性とが得られると、それらの単純インパルスの位相特性と目標位相特性とが加算され、加算により得られた位相特性と、フラットな振幅特性とからなる周波数特性に対してIFFTが行われる。 Once the phase characteristics of a simple impulse and the target phase characteristics are obtained by FFT in this way, the phase characteristics of those simple impulses and the target phase characteristics are added, and the phase characteristics obtained by the addition and the flat amplitude IFFT is performed on the frequency characteristics consisting of the characteristics.

そして、IFFTにより得られたインパルス応答に対してフェード処理が行われ、その結果得られたインパルス応答が目標位相特性インパルス応答とされる。 Then, fade processing is performed on the impulse response obtained by IFFT, and the impulse response obtained as a result is set as the target phase characteristic impulse response.

このようにして得られた目標位相特性インパルス応答は、振幅特性がフラットまたは略フラットであり、かつ目標とする位相特性を有するインパルス応答である。 The target phase characteristic impulse response obtained in this manner is an impulse response that has a flat or substantially flat amplitude characteristic and a target phase characteristic.

なお、手法A2では、単純インパルスの位相特性と目標位相特性とを加算するのではなく、単純インパルスの位相特性から目標位相特性を減算すれば、目標位相特性の逆特性を有するインパルス応答を目標位相特性インパルス応答として得ることができる。 In addition, in method A2, instead of adding the phase characteristics of the simple impulse and the target phase characteristic, if the target phase characteristic is subtracted from the phase characteristic of the simple impulse, the impulse response having the opposite characteristic of the target phase characteristic can be calculated as the target phase characteristic. It can be obtained as a characteristic impulse response.

具体的には、例えば所定のHPFのインパルス応答に対して0詰め処理を行わずにFFTを行って得られた位相特性を、単純インパルスの位相特性から減算し、その結果得られた位相特性と、フラットな振幅特性とからなる周波数特性に対してIFFTが行われる。そして、IFFTにより得られたインパルス応答に対してフェード処理が行われ、その結果得られたインパルス応答が目標位相特性インパルス応答とされる。 Specifically, for example, the phase characteristics obtained by performing FFT on the impulse response of a predetermined HPF without performing zero-filling processing are subtracted from the phase characteristics of a simple impulse, and the resulting phase characteristics and , IFFT is performed on a frequency characteristic consisting of a flat amplitude characteristic. Then, fade processing is performed on the impulse response obtained by IFFT, and the impulse response obtained as a result is set as the target phase characteristic impulse response.

この場合、得られた目標位相特性インパルス応答の位相特性は、もとのHPFの位相特性の逆特性となる。 In this case, the phase characteristic of the obtained target phase characteristic impulse response becomes the inverse characteristic of the phase characteristic of the original HPF.

上述したように手法A1では目標とする位相特性を有するインパルス応答に0詰め処理を行って、その後FFT、IFFT、およびフェード処理を行って目標位相特性インパルス応答を生成している。これに対して、手法A2では単純インパルスに0詰め処理を行って、その後FFT、IFFT、およびフェード処理を行い、目標位相特性インパルス応答を生成している。 As described above, in method A1, an impulse response having a target phase characteristic is subjected to zero-filling processing, and then FFT, IFFT, and fade processing are performed to generate a target phase characteristic impulse response. On the other hand, in method A2, a simple impulse is subjected to 0-filling processing, and then FFT, IFFT, and fade processing are performed to generate a target phase characteristic impulse response.

手法A1で用いるインパルス応答と、手法A2で用いる単純インパルスとは、ともにインパルス情報、すなわちインパルスに関する情報である。したがって、手法A1と手法A2を一般化すると、インパルス情報に対して0詰め処理が行われ、その結果得られた位相特性に対してFFT、IFFT、およびフェード処理が行われて、目標位相特性インパルス応答が生成されているということができる。 The impulse response used in method A1 and the simple impulse used in method A2 are both impulse information, that is, information regarding impulses. Therefore, when method A1 and method A2 are generalized, zero-filling processing is performed on the impulse information, FFT, IFFT, and fade processing are performed on the phase characteristics obtained as a result, and the target phase characteristic impulse is It can be said that a response is generated.

以上のようにして得られる目標位相特性インパルス応答を用いれば、オーディオ信号に対して振幅特性は変化させずに所望の位相特性を付加することができる。 By using the target phase characteristic impulse response obtained as described above, it is possible to add a desired phase characteristic to an audio signal without changing the amplitude characteristic.

具体例として、例えばマスタリング用のスピーカで音を再生しながらマスタリングされたコンテンツがあり、そのコンテンツを再生側のヘッドフォンまたはスピーカで再生する場合について考える。 As a specific example, consider a case in which there is content that has been mastered while playing back sound through a mastering speaker, and the content is played back through headphones or speakers on the playback side.

この場合、再生側のヘッドフォンまたはスピーカの位相特性と逆特性を有する目標位相特性インパルス応答をコンテンツのオーディオ信号に畳み込むことで、コンテンツのオーディオ信号について再生側のヘッドフォンまたはスピーカの位相特性をキャンセルすることができる。ここでは再生側のヘッドフォンまたはスピーカの位相特性がキャンセルされたオーディオ信号を補正オーディオ信号と称することとする。 In this case, by convolving the audio signal of the content with a target phase characteristic impulse response that has characteristics opposite to the phase characteristics of the headphones or speakers on the playback side, the phase characteristics of the headphones or speakers on the playback side can be canceled for the audio signal of the content. I can do it. Here, an audio signal in which the phase characteristics of headphones or speakers on the playback side have been canceled will be referred to as a corrected audio signal.

なお、再生側のヘッドフォンまたはスピーカの位相特性と逆特性を有する目標位相特性インパルス応答は、上述した手法A2により生成してもよいし手法A1により生成してもよい。例えばそのような目標位相特性インパルス応答を手法A1により生成する場合には、再生側のヘッドフォンまたはスピーカの位相特性と逆特性を有するインパルス応答に0詰め処理を行ってFFT、IFFT、およびフェード処理を行えばよい。 Note that the target phase characteristic impulse response having a characteristic opposite to the phase characteristic of the headphones or speakers on the reproduction side may be generated by the method A2 or method A1 described above. For example, when generating such a target phase characteristic impulse response using method A1, zero-filling is performed on the impulse response having a phase characteristic opposite to that of the reproduction side headphones or speakers, and FFT, IFFT, and fade processing are performed. Just go.

さらに、マスタリング用のスピーカの位相特性と同じ特性を有する目標位相特性インパルス応答を補正オーディオ信号に畳み込むことで、補正オーディオ信号に対して、すなわちコンテンツの音に対してマスタリング用のスピーカの位相特性を付加することができる。 Furthermore, by convolving the corrected audio signal with a target phase characteristic impulse response that has the same characteristics as the phase characteristics of the mastering speaker, the phase characteristics of the mastering speaker can be adjusted for the corrected audio signal, that is, for the sound of the content. can be added.

したがって、このようにしてマスタリング用のスピーカの位相特性が付加された補正オーディオ信号に基づいてコンテンツの音を再生すれば、マスタリングスタジオで作り手が制作している音と略同じ音を受聴者(ユーザ)に体感させることができる。 Therefore, if the sound of the content is played back based on the corrected audio signal to which the phase characteristics of the mastering speaker have been added in this way, the listener ( (user) can experience it.

加えて、例えば再生側において受聴者がヘッドフォンでコンテンツの音を再生する場合には、頭部伝達特性、すなわち頭部伝達関数(HRTF(Head Related Transfer Function))を用いれば、マスタリングスタジオで作り手が制作している音により近い音を提示することが可能となる。 In addition, for example, when a listener plays the sound of a content using headphones on the playback side, it is possible to use head-related transfer characteristics (HRTF (Head Related Transfer Function)) to help the creator in the mastering studio. This makes it possible to present a sound that is closer to the sound that is being produced.

ここで、HRTFは音源から受聴者の耳まで、より詳細には受聴者の鼓膜近傍または外耳道入口までの音の伝達特性を示す関数である。 Here, HRTF is a function indicating the transmission characteristics of sound from the sound source to the listener's ears, more specifically to the vicinity of the listener's eardrum or the entrance of the ear canal.

この例では、マスタリング用のスピーカの位相特性が付加された補正オーディオ信号に、さらにHRTFを畳み込むことで、マスタリングスタジオで作り手が制作しているときに受聴した音により近い音を受聴者に体感させることができる。 In this example, by convolving the corrected audio signal with the phase characteristics of the mastering speakers and the HRTF, the listener will experience a sound that is closer to the sound that the creator heard while producing in the mastering studio. can be done.

〈インパルス応答生成装置の構成例〉
続いて、以上において説明した目標位相特性インパルス応答を生成するインパルス応答生成装置の具体的な構成と動作について説明する。
<Example of configuration of impulse response generation device>
Next, the specific configuration and operation of the impulse response generation device that generates the target phase characteristic impulse response described above will be explained.

図8は、上述した手法A1により目標位相特性インパルス応答、すなわち振幅特性がフラットまたは略フラットであり、かつ所望の位相特性を有するインパルス応答を生成するインパルス応答生成装置の構成例を示す図である。 FIG. 8 is a diagram illustrating a configuration example of an impulse response generation device that generates a target phase characteristic impulse response, that is, an impulse response whose amplitude characteristic is flat or approximately flat and has a desired phase characteristic by the method A1 described above. .

図8に示すインパルス応答生成装置11は0詰め処理部21、FFT処理部22、IFFT処理部23、およびフェード処理部24を有している。 The impulse response generation device 11 shown in FIG. 8 includes a zero padding processing section 21, an FFT processing section 22, an IFFT processing section 23, and a fade processing section 24.

0詰め処理部21には、目標位相特性インパルス応答の生成に用いられる、目標とする位相特性を有するインパルス応答が供給される。以下では、このような目標とする位相特性を有するインパルス応答を入力インパルス応答と称することとする。 The zero padding processing unit 21 is supplied with an impulse response having a target phase characteristic, which is used to generate a target phase characteristic impulse response. In the following, an impulse response having such a target phase characteristic will be referred to as an input impulse response.

0詰め処理部21は、供給された入力インパルス応答に対して0詰め処理を行い、FFT処理部22に供給する。 The zero padding processing section 21 performs zero padding processing on the supplied input impulse response and supplies the result to the FFT processing section 22 .

FFT処理部22は、0詰め処理部21から供給された0詰め処理後の入力インパルス応答に対してFFTを行い、その結果得られた周波数特性のうちの位相特性をIFFT処理部23に供給する。 The FFT processing unit 22 performs FFT on the zero-padded input impulse response supplied from the zero-filling processing unit 21 and supplies the phase characteristics of the frequency characteristics obtained as a result to the IFFT processing unit 23. .

IFFT処理部23には、外部から各周波数のゲイン(振幅)が「1」であるフラットな振幅特性(ゲイン特性)が供給される。 The IFFT processing unit 23 is supplied with a flat amplitude characteristic (gain characteristic) in which the gain (amplitude) of each frequency is "1" from the outside.

IFFT処理部23は、外部から供給されたフラットな振幅特性と、FFT処理部22から供給された位相特性とからなる周波数特性に対してIFFTを行い、その結果得られたインパルス応答をフェード処理部24に供給する。換言すれば、フラットな振幅特性と、FFT処理部22から供給された位相特性とに基づいてIFFTが行われ、インパルス応答が生成される。 The IFFT processing section 23 performs IFFT on the frequency characteristics consisting of the flat amplitude characteristics supplied from the outside and the phase characteristics supplied from the FFT processing section 22, and applies the resulting impulse response to the fade processing section. 24. In other words, IFFT is performed based on the flat amplitude characteristic and the phase characteristic supplied from the FFT processing section 22, and an impulse response is generated.

なお、IFFT処理部23では外部から供給されたフラットな振幅特性を用いるのではなく、FFT処理部22でのFFTで得られた周波数特性の振幅特性に対してゲイン調整を行うことでフラットな振幅特性を生成し、その振幅特性をIFFTに用いるようにしてもよい。 Note that the IFFT processing section 23 does not use a flat amplitude characteristic supplied from the outside, but performs gain adjustment on the amplitude characteristic of the frequency characteristic obtained by FFT in the FFT processing section 22 to obtain a flat amplitude. A characteristic may be generated and the amplitude characteristic may be used for IFFT.

フェード処理部24は、IFFT処理部23から供給されたインパルス応答に対してフェード処理を行い、その結果得られたインパルス応答を目標位相特性インパルス応答として出力する。 The fade processing unit 24 performs a fade process on the impulse response supplied from the IFFT processing unit 23, and outputs the resulting impulse response as a target phase characteristic impulse response.

〈インパルス応答生成処理の説明〉
次に、インパルス応答生成装置11の動作について説明する。
<Explanation of impulse response generation processing>
Next, the operation of the impulse response generation device 11 will be explained.

すなわち、以下、図9のフローチャートを参照して、インパルス応答生成装置11により行われるインパルス応答生成処理について説明する。 That is, the impulse response generation process performed by the impulse response generation device 11 will be described below with reference to the flowchart of FIG.

ステップS11において0詰め処理部21は、供給された入力インパルス応答に対して0詰め処理を行い、FFT処理部22に供給する。 In step S<b>11 , the zero padding processing unit 21 performs zero padding processing on the supplied input impulse response and supplies the result to the FFT processing unit 22 .

例えばステップS11では、図4や図6を参照して説明したように、入力インパルス応答における時間方向の後ろ側や前側に0データを付加する0詰め処理が行われる。0詰め処理では、少なくとも入力インパルス応答における時間方向の前側に0データが付加されるようにされる。 For example, in step S11, as described with reference to FIGS. 4 and 6, zero padding processing is performed to add zero data to the rear and front sides of the input impulse response in the time direction. In the zero filling process, zero data is added at least to the front side of the input impulse response in the time direction.

ステップS12においてFFT処理部22は、0詰め処理部21から供給された0詰め処理後の入力インパルス応答に対してFFTを行い、その結果得られた周波数特性のうちの位相特性をIFFT処理部23に供給する。 In step S12, the FFT processing section 22 performs FFT on the input impulse response after the zero padding process supplied from the zero padding processing section 21, and converts the phase characteristic of the frequency characteristics obtained as a result to the IFFT processing section 22. supply to.

ステップS13においてIFFT処理部23は、外部から供給されたフラットな振幅特性と、FFT処理部22から供給された位相特性とからなる周波数特性に対してIFFTを行い、その結果得られたインパルス応答をフェード処理部24に供給する。 In step S13, the IFFT processing section 23 performs IFFT on the frequency characteristic consisting of the flat amplitude characteristic supplied from the outside and the phase characteristic supplied from the FFT processing section 22, and calculates the impulse response obtained as a result. The signal is supplied to the fade processing section 24.

ステップS14においてフェード処理部24は、IFFT処理部23から供給されたインパルス応答に対してフェード処理を行い、その結果得られたインパルス応答を目標位相特性インパルス応答として出力する。 In step S14, the fade processing unit 24 performs a fade process on the impulse response supplied from the IFFT processing unit 23, and outputs the resulting impulse response as a target phase characteristic impulse response.

例えばフェード処理では、IFFT処理部23から供給されたインパルス応答の時間方向の後ろ側(末尾側)をフェードアウトさせて0に収束させることで、目標位相特性インパルス応答が生成される。なお、IFFTにより得られたインパルス応答が0に収束していれば、特にフェード処理は不要である。 For example, in fade processing, the target phase characteristic impulse response is generated by fading out the rear side (tail side) in the time direction of the impulse response supplied from the IFFT processing unit 23 and converging it to 0. Note that if the impulse response obtained by IFFT converges to 0, no particular fade processing is necessary.

また、入力インパルス応答として、例えばヘッドフォンの位相特性の逆特性を有するインパルス応答を用いれば、目標位相特性インパルス応答としてヘッドフォンの位相特性をキャンセルする、つまりヘッドフォンの位相特性の逆特性のインパルス応答を得ることができる。 Furthermore, if an impulse response having, for example, a phase characteristic opposite to that of headphones is used as the input impulse response, the phase characteristic of the headphones can be canceled as the target phase characteristic impulse response, that is, an impulse response having characteristics opposite to the phase characteristic of headphones can be obtained. be able to.

このようにして目標位相特性インパルス応答が生成されると、インパルス応答生成処理は終了する。 Once the target phase characteristic impulse response is generated in this way, the impulse response generation process ends.

以上のようにしてインパルス応答生成装置11は、少なくとも入力インパルス応答における時間方向の前側に0データを付加する0詰め処理を行い、0詰め処理された入力インパルス応答に対してFFT、IFFT、およびフェード処理を行うことで目標位相特性インパルス応答を生成する。 As described above, the impulse response generation device 11 performs zero padding processing that adds zero data to at least the front side of the input impulse response in the time direction, and performs FFT, IFFT, and fade processing on the zero padded input impulse response. By performing the processing, a target phase characteristic impulse response is generated.

このようにすることで、振幅特性を変化させずに目標とする位相特性を付加することが可能なフィルタとして機能する目標位相特性インパルス応答を得ることができる。これにより、目標位相特性インパルス応答を用いて、振幅特性を変化させずに所望の位相特性を得ることができるようになる。 By doing so, it is possible to obtain a target phase characteristic impulse response that functions as a filter to which a target phase characteristic can be added without changing the amplitude characteristic. This makes it possible to obtain a desired phase characteristic using the target phase characteristic impulse response without changing the amplitude characteristic.

〈第2の実施の形態〉
〈インパルス応答生成装置の構成例〉
また、上述した手法A2により目標位相特性インパルス応答を生成する場合、インパルス応答生成装置は例えば図10に示すように構成される。なお、図10において図8における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。
<Second embodiment>
<Example of configuration of impulse response generation device>
Furthermore, when generating the target phase characteristic impulse response using the method A2 described above, the impulse response generation apparatus is configured as shown in FIG. 10, for example. Note that in FIG. 10, parts corresponding to those in FIG. 8 are denoted by the same reference numerals, and the description thereof will be omitted as appropriate.

図10に示すインパルス応答生成装置51はFFT処理部61、0詰め処理部62、FFT処理部63、演算処理部64、IFFT処理部23、およびフェード処理部24を有している。このインパルス応答生成装置51の構成は、インパルス応答生成装置11における0詰め処理部21およびFFT処理部22に代えてFFT処理部61乃至演算処理部64を設けた構成となっている。 The impulse response generation device 51 shown in FIG. 10 includes an FFT processing section 61, a zero padding processing section 62, an FFT processing section 63, an arithmetic processing section 64, an IFFT processing section 23, and a fade processing section 24. The configuration of this impulse response generation device 51 is such that an FFT processing section 61 to an arithmetic processing section 64 are provided in place of the zero padding processing section 21 and FFT processing section 22 in the impulse response generation device 11.

FFT処理部61には、目標位相特性インパルス応答の生成に用いられる、目標とする位相特性を有するインパルス応答、すなわち入力インパルス応答が供給される。 The FFT processing unit 61 is supplied with an impulse response having a target phase characteristic, that is, an input impulse response, which is used to generate the target phase characteristic impulse response.

FFT処理部61は、供給された入力インパルス応答に対してFFTを行い、その結果得られた周波数特性のうちの位相特性を演算処理部64に供給する。なお、目標とする位相特性自体を得ることができ、その目標とする位相特性を演算処理部64に供給することができれば、特にFFT処理部61は設けられる必要はない。 The FFT processing section 61 performs FFT on the supplied input impulse response, and supplies the phase characteristic of the frequency characteristics obtained as a result to the arithmetic processing section 64 . Note that if the target phase characteristic itself can be obtained and the target phase characteristic can be supplied to the arithmetic processing section 64, it is not necessary to provide the FFT processing section 61 in particular.

0詰め処理部62には、目標位相特性インパルス応答の生成に用いられる単純インパルスが供給される。0詰め処理部62は、供給された単純インパルスに対して0詰め処理を行い、FFT処理部63に供給する。 The zero padding processing section 62 is supplied with simple impulses used to generate the target phase characteristic impulse response. The zero padding processing section 62 performs zero padding processing on the supplied simple impulse and supplies it to the FFT processing section 63 .

FFT処理部63は、0詰め処理部62から供給された0詰め処理後の単純インパルスに対してFFTを行い、その結果得られた周波数特性のうちの位相特性を演算処理部64に供給する。 The FFT processing unit 63 performs FFT on the zero-padded simple impulse supplied from the zero-padding processing unit 62, and supplies the phase characteristic of the frequency characteristics obtained as a result to the arithmetic processing unit 64.

演算処理部64は、FFT処理部61から供給された位相特性と、FFT処理部63から供給された位相特性とに基づく演算処理を行い、その結果得られた位相特性をIFFT処理部23に供給する。ここでは演算処理として、加算処理または減算処理が行われる。 The calculation processing unit 64 performs calculation processing based on the phase characteristics supplied from the FFT processing unit 61 and the phase characteristics supplied from the FFT processing unit 63, and supplies the resulting phase characteristics to the IFFT processing unit 23. do. Here, addition processing or subtraction processing is performed as the arithmetic processing.

〈インパルス応答生成処理の説明〉
次に、インパルス応答生成装置51の動作について説明する。
<Explanation of impulse response generation processing>
Next, the operation of the impulse response generation device 51 will be explained.

すなわち、以下、図11のフローチャートを参照して、インパルス応答生成装置51により行われるインパルス応答生成処理について説明する。 That is, the impulse response generation process performed by the impulse response generation device 51 will be described below with reference to the flowchart of FIG.

ステップS41においてFFT処理部61は、供給された入力インパルス応答に対してFFTを行い、その結果得られた周波数特性のうちの位相特性を演算処理部64に供給する。 In step S41, the FFT processing section 61 performs FFT on the supplied input impulse response, and supplies the phase characteristic of the frequency characteristics obtained as a result to the arithmetic processing section 64.

ステップS42において0詰め処理部62は、供給された単純インパルスに対して0詰め処理を行い、FFT処理部63に供給する。0詰め処理では、単純インパルスにおける時間方向の前側に0データが付加され、適切に単純インパルスがディレイされる。 In step S<b>42 , the zero padding processing unit 62 performs zero padding processing on the supplied simple impulse and supplies the result to the FFT processing unit 63 . In the 0-filling process, 0 data is added to the front side of the simple impulse in the time direction, and the simple impulse is appropriately delayed.

ステップS43においてFFT処理部63は、0詰め処理部62から供給された0詰め処理後の単純インパルスに対してFFTを行い、その結果得られた周波数特性のうちの位相特性を演算処理部64に供給する。 In step S43, the FFT processing unit 63 performs FFT on the simple impulse after the zero-filling process supplied from the zero-filling processing unit 62, and sends the phase characteristic of the frequency characteristics obtained as a result to the arithmetic processing unit 64. supply

ステップS44において演算処理部64は、FFT処理部61から供給された位相特性と、FFT処理部63から供給された位相特性とに基づく演算処理を行い、その結果得られた位相特性をIFFT処理部23に供給する。 In step S44, the arithmetic processing section 64 performs arithmetic processing based on the phase characteristics supplied from the FFT processing section 61 and the phase characteristics supplied from the FFT processing section 63, and transfers the obtained phase characteristics to the IFFT processing section. 23.

例えば演算処理部64は、目標位相特性インパルス応答の位相特性として、入力インパルス応答が有する位相特性と同じ特性を得ようとする場合には、FFT処理部61から供給された入力インパルス応答の位相特性と、FFT処理部63から供給された、0詰め処理後の単純インパルスの位相特性とを加算し、その結果得られた位相特性をIFFT処理部23に供給する。 For example, when trying to obtain the same phase characteristic of the input impulse response as the phase characteristic of the target phase characteristic impulse response, the arithmetic processing section 64 uses the phase characteristic of the input impulse response supplied from the FFT processing section 61. and the phase characteristic of the simple impulse after zero-filling processing, which is supplied from the FFT processing section 63 , and the resulting phase characteristic is supplied to the IFFT processing section 23 .

これに対して演算処理部64は、目標位相特性インパルス応答の位相特性として、入力インパルス応答が有する位相特性の逆特性を得ようとする場合には、FFT処理部61から供給された入力インパルス応答の位相特性を、FFT処理部63から供給された、0詰め処理後の単純インパルスの位相特性から減算し、その結果得られた位相特性をIFFT処理部23に供給する。 On the other hand, when attempting to obtain the inverse characteristic of the phase characteristic of the input impulse response as the phase characteristic of the target phase characteristic impulse response, the arithmetic processing section 64 calculates the input impulse response supplied from the FFT processing section 61. is subtracted from the phase characteristic of the zero-padded simple impulse supplied from the FFT processing section 63, and the resulting phase characteristic is supplied to the IFFT processing section 23.

このように位相特性に対する演算処理として加算または減算が行われると、その後、ステップS45およびステップS46の処理が行われてインパルス応答生成処理は終了するが、これらの処理は図9のステップS13およびステップS14の処理と同様であるので、その説明は省略する。 When addition or subtraction is performed as the arithmetic processing for the phase characteristics in this way, the processes of step S45 and step S46 are performed and the impulse response generation process ends, but these processes are performed in step S13 and step S46 of FIG. Since it is the same as the process in S14, its explanation will be omitted.

以上のようにしてインパルス応答生成装置51は、単純インパルスにおける時間方向の前側に0データを付加する0詰め処理を行い、0詰め処理された単純インパルス応答と、入力インパルス応答とに基づいて目標位相特性インパルス応答を生成する。 As described above, the impulse response generation device 51 performs zero padding processing to add zero data to the front side of the simple impulse in the time direction, and based on the zero padded simple impulse response and the input impulse response, the impulse response generation device 51 performs a target phase. Generate a characteristic impulse response.

このようにすることで、振幅特性を変化させずに目標とする位相特性を付加することが可能なフィルタとして機能する目標位相特性インパルス応答を得ることができる。これにより、目標位相特性インパルス応答を用いて、振幅特性を変化させずに所望の位相特性を得ることができるようになる。 By doing so, it is possible to obtain a target phase characteristic impulse response that functions as a filter to which a target phase characteristic can be added without changing the amplitude characteristic. This makes it possible to obtain a desired phase characteristic using the target phase characteristic impulse response without changing the amplitude characteristic.

〈第3の実施の形態〉
〈再生装置の構成例〉
ここで、以上において説明したインパルス応答生成装置11やインパルス応答生成装置51で生成された目標位相特性インパルス応答を用いて、コンテンツの再生を行う再生装置について説明する。
<Third embodiment>
<Example of configuration of playback device>
Here, a reproduction device that reproduces content using the target phase characteristic impulse response generated by the impulse response generation device 11 or the impulse response generation device 51 described above will be described.

以下では、説明を具体的にするため、再生対象となるコンテンツは、図12に示すように所定のスタジオでマスタリングされたものとする。 In the following, in order to make the explanation more concrete, it is assumed that the content to be played back has been mastered in a predetermined studio as shown in FIG. 12.

図12に示す例では、スタジオ内にはマスタリングを行う制作者M11がおり、制作者M11は、スタジオ内に配置されたスピーカ91でコンテンツの音を再生しながら、コンテンツの各帯域の振幅調整等をマスタリングの作業として行う。 In the example shown in FIG. 12, there is a producer M11 who performs mastering in the studio, and the producer M11 adjusts the amplitude of each band of the content while playing back the sound of the content using the speaker 91 arranged in the studio. This is done as mastering work.

また、マスタリングにより得られたコンテンツのオーディオ信号が、受聴者が所持する再生装置等からなる再生システムで再生される。なお、コンテンツの音の再生には、ヘッドフォンやスピーカ、イヤフォンなど、どのようなものが用いられてもよいが、以下では具体的な例としてヘッドフォンが用いられるものとして説明を続ける。 Furthermore, the audio signal of the content obtained through mastering is played back by a playback system including a playback device owned by the listener. Although any device such as headphones, speakers, or earphones may be used to reproduce the sound of the content, the following description will continue assuming that headphones are used as a specific example.

コンテンツの再生に用いる再生装置は、例えば図13に示すように構成される。 A reproducing device used for reproducing content is configured as shown in FIG. 13, for example.

図13に示す例では、再生装置121は少なくとも音声コンテンツの再生制御が可能なポータブルプレーヤやスマートフォン、パーソナルコンピュータなどからなり、再生装置121にはヘッドフォン122が接続されている。 In the example shown in FIG. 13, the playback device 121 includes at least a portable player, a smartphone, a personal computer, etc. that can control the playback of audio content, and headphones 122 are connected to the playback device 121.

再生装置121は、取得部131、スピーカ位相特性畳み込み部132、および再生制御部133を有している。 The playback device 121 includes an acquisition section 131, a speaker phase characteristic convolution section 132, and a playback control section 133.

再生装置121では、制作者M11によるマスタリングによって得られたコンテンツのオーディオ信号がスピーカ位相特性畳み込み部132に供給される。 In the playback device 121, the audio signal of the content obtained by mastering by the producer M11 is supplied to the speaker phase characteristic convolution unit 132.

取得部131は、任意のタイミングで目標位相特性インパルス応答をインパルス応答生成装置11やインパルス応答生成装置51などの外部の装置から取得し、保持している。また、取得部131は保持している目標位相特性インパルス応答をスピーカ位相特性畳み込み部132に供給する。 The acquisition unit 131 acquires and holds the target phase characteristic impulse response from an external device such as the impulse response generation device 11 or the impulse response generation device 51 at an arbitrary timing. Further, the acquisition unit 131 supplies the held target phase characteristic impulse response to the speaker phase characteristic convolution unit 132.

取得部131により取得される目標位相特性インパルス応答は、マスタリングに用いられたスピーカ91の位相特性を有する入力インパルス応答が用いられて、インパルス応答生成装置11またはインパルス応答生成装置51により生成されたものである。すなわち、目標位相特性インパルス応答は、スピーカ91の位相特性と同じ位相特性を有するインパルス応答である。 The target phase characteristic impulse response acquired by the acquisition unit 131 is generated by the impulse response generation device 11 or the impulse response generation device 51 using an input impulse response having the phase characteristic of the speaker 91 used for mastering. It is. That is, the target phase characteristic impulse response is an impulse response having the same phase characteristic as the phase characteristic of the speaker 91.

なお、目標位相特性インパルス応答は取得部131により任意のタイミングで取得されるのではなく、予め取得部131に保持されているようにしてもよい。 Note that the target phase characteristic impulse response may not be acquired by the acquisition unit 131 at an arbitrary timing, but may be held in the acquisition unit 131 in advance.

また、以下では、スピーカ91の位相特性と同じ位相特性を有する目標位相特性インパルス応答を、特にスピーカ特性インパルス応答とも称することとする。 Furthermore, hereinafter, the target phase characteristic impulse response having the same phase characteristic as the phase characteristic of the speaker 91 will also be particularly referred to as a speaker characteristic impulse response.

スピーカ位相特性畳み込み部132は、供給されたオーディオ信号に対して、取得部131から供給されたスピーカ特性インパルス応答を畳み込み、その結果得られたオーディオ信号を再生制御部133に供給する。 The speaker phase characteristic convolution section 132 convolves the speaker characteristic impulse response supplied from the acquisition section 131 with the supplied audio signal, and supplies the resulting audio signal to the reproduction control section 133.

再生制御部133は、スピーカ位相特性畳み込み部132から供給されたオーディオ信号をヘッドフォン122に供給し、コンテンツの音を再生させる。換言すれば、再生制御部133はヘッドフォン122でのコンテンツの音の再生を制御する。 The reproduction control section 133 supplies the audio signal supplied from the speaker phase characteristic convolution section 132 to the headphones 122, and causes the sound of the content to be reproduced. In other words, the playback control unit 133 controls the playback of the sound of the content on the headphones 122.

ヘッドフォン122は、再生制御部133から供給されたオーディオ信号に基づいてコンテンツの音を再生する。 The headphones 122 reproduce the sound of the content based on the audio signal supplied from the reproduction control section 133.

なお、ここでは再生装置121にヘッドフォン122が設けられていない構成とされているが、ヘッドフォン122が再生装置121に設けられているようにしてもよいし、ヘッドフォン122内部に取得部131乃至再生制御部133が設けられているようにしてもよい。 Although the playback device 121 is not provided with the headphone 122 here, the headphone 122 may be provided in the playback device 121, or the acquisition unit 131 or playback control may be provided inside the headphone 122. A portion 133 may be provided.

〈再生処理の説明〉
続いて、再生装置121の動作について説明する。すなわち、以下、図14のフローチャートを参照して再生装置121による再生処理について説明する。なお、この再生処理が開始されるタイミングでは、スピーカ特性インパルス応答が既に取得部131により取得されている。
<Explanation of playback process>
Next, the operation of the playback device 121 will be explained. That is, the reproduction processing by the reproduction device 121 will be described below with reference to the flowchart of FIG. Note that at the timing when this reproduction process is started, the speaker characteristic impulse response has already been acquired by the acquisition unit 131.

ステップS71においてスピーカ位相特性畳み込み部132は、供給されたオーディオ信号に対して、取得部131から供給されたスピーカ特性インパルス応答を畳み込み、その結果得られたオーディオ信号を再生制御部133に供給する。 In step S71, the speaker phase characteristic convolution section 132 convolves the speaker characteristic impulse response supplied from the acquisition section 131 with the supplied audio signal, and supplies the resulting audio signal to the reproduction control section 133.

これにより、オーディオ信号に基づくコンテンツの音に対して、スピーカ特性インパルス応答の位相特性、つまりスピーカ91の位相特性を付加することができる。 Thereby, the phase characteristic of the speaker characteristic impulse response, that is, the phase characteristic of the speaker 91 can be added to the sound of the content based on the audio signal.

ステップS72において再生制御部133は、スピーカ位相特性畳み込み部132から供給されたオーディオ信号をヘッドフォン122に供給してコンテンツの音を再生させ、再生処理は終了する。 In step S72, the reproduction control unit 133 supplies the audio signal supplied from the speaker phase characteristic convolution unit 132 to the headphones 122 to reproduce the sound of the content, and the reproduction process ends.

ヘッドフォン122により再生されたコンテンツの音にはスピーカ91の位相特性と同じ特性が付加されているので、そのコンテンツの音を受聴している受聴者には、制作者M11がスタジオで聞いていたコンテンツの音と略同じ音質の音が聞こえている。しかもスピーカ特性インパルス応答は、振幅特性を変化させずに所望の位相特性のみをコンテンツの音に付加することができるので、コンテンツの音のゲインが変化してしまうようなこともない。 Since the sound of the content reproduced by the headphones 122 has the same characteristics as the phase characteristics of the speaker 91, the listener who is listening to the sound of the content can hear the content that the producer M11 was listening to in the studio. I'm hearing a sound with almost the same quality as the sound. Moreover, since the speaker characteristic impulse response can add only a desired phase characteristic to the sound of the content without changing the amplitude characteristic, the gain of the sound of the content does not change.

以上のようにして再生装置121は、スピーカ特性インパルス応答をコンテンツのオーディオ信号に畳み込んでからコンテンツの音の再生を行う。このようにすることで、コンテンツの音をヘッドフォン122で再生する場合であっても、マスタリングに用いたスピーカ91の位相特性をコンテンツの音に付加することができる。すなわち、所望の位相特性を得ることができる。 As described above, the playback device 121 plays back the sound of the content after convolving the speaker characteristic impulse response with the audio signal of the content. By doing so, even when the sound of the content is played back using the headphones 122, the phase characteristics of the speaker 91 used for mastering can be added to the sound of the content. That is, desired phase characteristics can be obtained.

〈第4の実施の形態〉
〈再生装置の構成例〉
なお、再生装置121では、コンテンツの音にスピーカ91の位相特性と同じ特性を付加すると説明した。しかし、コンテンツの音をヘッドフォン122で再生すると、その音にはヘッドフォン122が有する位相特性も付加されることになる。
<Fourth embodiment>
<Example of configuration of playback device>
It has been explained that the playback device 121 adds the same characteristics as the phase characteristics of the speaker 91 to the sound of the content. However, when the sound of the content is played back with the headphones 122, the phase characteristics of the headphones 122 are also added to the sound.

そこで、コンテンツの音にスピーカ91の位相特性と同じ特性を付加するだけでなく、ヘッドフォン122が有する位相特性をキャンセル(除去)することで、制作者M11がスタジオで聞いていたコンテンツの音により近い音を受聴者に対して聞かせることができるようにしてもよい。 Therefore, by not only adding the same characteristics as the phase characteristics of the speaker 91 to the sound of the content, but also canceling (removing) the phase characteristics of the headphones 122, the sound of the content that the creator M11 was listening to in the studio can be made to be closer to the sound of the content. The sound may be made to be audible to the listener.

そのような場合、再生装置は例えば図15に示すように構成される。なお、図15において図13における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。 In such a case, the playback device is configured as shown in FIG. 15, for example. Note that in FIG. 15, parts corresponding to those in FIG. 13 are denoted by the same reference numerals, and the description thereof will be omitted as appropriate.

図15に示す再生装置161には、ヘッドフォン122が接続されている。また、再生装置161は、取得部131、ヘッドフォン逆特性畳み込み部171、スピーカ位相特性畳み込み部132、および再生制御部133を有している。 Headphones 122 are connected to the playback device 161 shown in FIG. Furthermore, the playback device 161 includes an acquisition section 131 , a headphone inverse characteristic convolution section 171 , a speaker phase characteristic convolution section 132 , and a playback control section 133 .

特に再生装置161の構成は、再生装置121におけるスピーカ位相特性畳み込み部132の前段にヘッドフォン逆特性畳み込み部171が設けられた構成とされている。 In particular, the configuration of the playback device 161 is such that a headphone inverse characteristic convolution section 171 is provided before the speaker phase characteristic convolution section 132 in the playback device 121.

再生装置161では、上述したスピーカ特性インパルス応答だけでなく、ヘッドフォン122が有する位相特性とは逆特性を有する目標位相特性インパルス応答も取得部131によってインパルス応答生成装置11やインパルス応答生成装置51などの外部の装置から取得され、保持されている。以下、ヘッドフォン122が有する位相特性とは逆特性を有する目標位相特性インパルス応答を特にヘッドフォン逆特性インパルス応答とも称することとする。 In the reproduction device 161, the acquisition unit 131 acquires not only the speaker characteristic impulse response described above but also a target phase characteristic impulse response having a characteristic opposite to the phase characteristic of the headphones 122. Retrieved from an external device and maintained. Hereinafter, the target phase characteristic impulse response having a characteristic opposite to that of the headphone 122 will also be particularly referred to as a headphone reverse characteristic impulse response.

このヘッドフォン逆特性インパルス応答は、例えばヘッドフォン122の位相特性を有する入力インパルス応答を用い、演算処理部64での演算処理として減算を行うことでインパルス応答生成装置51により生成された目標位相特性インパルス応答である。 This headphone inverse characteristic impulse response is, for example, a target phase characteristic impulse response generated by the impulse response generation device 51 by using an input impulse response having a phase characteristic of the headphones 122 and performing subtraction as a calculation process in the calculation processing unit 64. It is.

なお、ヘッドフォン逆特性インパルス応答も取得部131により取得されるのではなく、予め取得部131に保持されているようにしてもよい。 Note that the headphone inverse characteristic impulse response may also be stored in advance in the acquisition unit 131 instead of being acquired by the acquisition unit 131.

取得部131は、保持しているヘッドフォン逆特性インパルス応答をヘッドフォン逆特性畳み込み部171に供給する。 The acquisition unit 131 supplies the held headphone inverse characteristic impulse response to the headphone inverse characteristic convolution unit 171 .

ヘッドフォン逆特性畳み込み部171は、供給されたコンテンツのオーディオ信号に対して、取得部131から供給されたヘッドフォン逆特性インパルス応答を畳み込み、その結果得られたオーディオ信号をスピーカ位相特性畳み込み部132に供給する。 The headphone inverse characteristic convolution unit 171 convolves the headphone inverse characteristic impulse response supplied from the acquisition unit 131 with the audio signal of the supplied content, and supplies the resulting audio signal to the speaker phase characteristic convolution unit 132. do.

〈再生処理の説明〉
次に、再生装置161の動作について説明する。すなわち、以下、図16のフローチャートを参照して再生装置161による再生処理について説明する。なお、この再生処理が開始されるタイミングでは、スピーカ特性インパルス応答およびヘッドフォン逆特性インパルス応答が既に取得部131により取得されている。
<Explanation of playback process>
Next, the operation of the playback device 161 will be explained. That is, the reproduction processing by the reproduction device 161 will be described below with reference to the flowchart of FIG. 16. Note that at the timing when this reproduction process is started, the speaker characteristic impulse response and the headphone inverse characteristic impulse response have already been acquired by the acquisition unit 131.

ステップS101においてヘッドフォン逆特性畳み込み部171は、供給されたコンテンツのオーディオ信号に対して、取得部131から供給されたヘッドフォン逆特性インパルス応答を畳み込み、その結果得られたオーディオ信号をスピーカ位相特性畳み込み部132に供給する。 In step S101, the headphone inverse characteristic convolution section 171 convolves the headphone inverse characteristic impulse response supplied from the acquisition section 131 with the audio signal of the supplied content, and the resulting audio signal is transferred to the speaker phase characteristic convolution section. 132.

これにより、コンテンツの音に対して、ヘッドフォン122の位相特性の逆特性を付加することができる。換言すれば、ヘッドフォン122でコンテンツの音を再生するときに付加される、ヘッドフォン122の位相特性がキャンセルされるようになる。しかも、ヘッドフォン逆特性インパルス応答の畳み込みでは、コンテンツの音の振幅(ゲイン)は変化させずに位相特性のみを調整することができる。 Thereby, it is possible to add a phase characteristic opposite to the phase characteristic of the headphones 122 to the sound of the content. In other words, the phase characteristics of the headphones 122 that are added when the sound of the content is reproduced with the headphones 122 are canceled. Moreover, by convolution of the headphone inverse characteristic impulse response, only the phase characteristic can be adjusted without changing the amplitude (gain) of the sound of the content.

オーディオ信号に対してヘッドフォン逆特性インパルス応答が畳み込まれると、その後、ステップS102およびステップS103の処理が行われて再生処理は終了するが、これらの処理は図14のステップS71およびステップS72の処理と同様であるので、その説明は省略する。 When the headphone inverse characteristic impulse response is convolved with the audio signal, the processing of steps S102 and S103 is then performed and the playback processing ends, but these processings are the same as the processing of steps S71 and S72 in FIG. Since it is the same as that, its explanation will be omitted.

再生装置161でのコンテンツの音の再生では、まずコンテンツの音に対してヘッドフォン122の位相特性のキャンセルが行われ、その後、付加したい特性であるスピーカ91の位相特性が付加される。 When the playback device 161 plays back the sound of the content, first, the phase characteristics of the headphones 122 are canceled for the sound of the content, and then the phase characteristics of the speaker 91, which are the characteristics to be added, are added.

なお、ヘッドフォン122の位相特性の逆特性を付加し、同時にスピーカ91の位相特性を付加することができる目標位相特性インパルス応答を生成し、その目標位相特性インパルス応答をコンテンツのオーディオ信号に畳み込むようにしてもよい。 Note that a target phase characteristic impulse response is generated to which an inverse characteristic of the phase characteristic of the headphones 122 and a phase characteristic of the speaker 91 can be added at the same time, and the target phase characteristic impulse response is convolved with the audio signal of the content. It's okay.

しかし、再生装置161のように、スピーカ特性インパルス応答およびヘッドフォン逆特性インパルス応答を別々に畳み込むことで、コンテンツの音に対して付加する位相特性を自由に変えることができる。すなわち、例えば再生装置161ではメーカー等が異なる複数のスピーカ91のなかから任意のスピーカ91を選択し、選択したスピーカ91の位相特性を有するスピーカ特性インパルス応答を畳み込むようにすることなどが可能である。 However, by separately convolving the speaker characteristic impulse response and the headphone inverse characteristic impulse response like the playback device 161, it is possible to freely change the phase characteristic added to the sound of the content. That is, for example, in the playback device 161, it is possible to select an arbitrary speaker 91 from among a plurality of speakers 91 made by different manufacturers, etc., and convolve a speaker characteristic impulse response having the phase characteristic of the selected speaker 91. .

以上のようにして再生装置161は、ヘッドフォン逆特性インパルス応答をコンテンツのオーディオ信号に畳み込み、さらにスピーカ特性インパルス応答をオーディオ信号に畳み込んでからコンテンツの音の再生を行う。 As described above, the playback device 161 convolves the headphone inverse characteristic impulse response into the audio signal of the content, further convolves the speaker characteristic impulse response into the audio signal, and then reproduces the sound of the content.

このようにすることで、コンテンツの音をヘッドフォン122で再生する場合であっても、ヘッドフォン122により付加される位相特性をキャンセルし、かつマスタリングに用いたスピーカ91の位相特性をコンテンツの音に付加することができる。すなわち、所望の位相特性を得ることができる。特に、図16を参照して説明した再生処理では、図14を参照して説明した再生処理における場合よりも、制作者M11がスタジオで聞いていたコンテンツの音により近い音を聞かせることができる。 By doing this, even when the sound of the content is played back with the headphones 122, the phase characteristics added by the headphones 122 are canceled and the phase characteristics of the speaker 91 used for mastering are added to the sound of the content. can do. That is, desired phase characteristics can be obtained. In particular, in the playback process described with reference to FIG. 16, it is possible to hear a sound that is closer to the sound of the content that the creator M11 was listening to in the studio than in the playback process described with reference to FIG. .

〈第5の実施の形態〉
〈再生装置の構成例〉
なお、コンテンツの音をヘッドフォン122で再生する場合、音源、例えばスピーカ91から制作者M11までの音の伝達特性を示すHRTFを畳み込めば、制作者M11がスタジオで聞いていたコンテンツの音により近い音を聞かせることができる。すなわち、マスタリング時のスタジオの受聴環境を再現することができる。
<Fifth embodiment>
<Example of configuration of playback device>
Note that when the sound of the content is played back through the headphones 122, by convolving the HRTF that indicates the transmission characteristics of the sound from the sound source, for example, the speaker 91 to the creator M11, the sound of the content that the creator M11 was listening to in the studio can be reproduced. I can hear the sound. In other words, it is possible to reproduce the studio listening environment at the time of mastering.

コンテンツのオーディオ信号にHRTFを畳み込む場合、再生装置は例えば図17に示すように構成される。なお、図17において図15における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。 When convolving the HRTF with the audio signal of the content, the playback device is configured as shown in FIG. 17, for example. Note that in FIG. 17, parts corresponding to those in FIG. 15 are denoted by the same reference numerals, and the description thereof will be omitted as appropriate.

図17に示す再生装置201には、ヘッドフォン122が接続されている。また、再生装置201は、取得部131、ヘッドフォン逆特性畳み込み部171、スピーカ位相特性畳み込み部132、HRTF畳み込み部211、および再生制御部133を有している。 Headphones 122 are connected to the playback device 201 shown in FIG. The playback device 201 also includes an acquisition section 131 , a headphone inverse characteristic convolution section 171 , a speaker phase characteristic convolution section 132 , an HRTF convolution section 211 , and a playback control section 133 .

特に再生装置201の構成は、再生装置161におけるスピーカ位相特性畳み込み部132の後段にHRTF畳み込み部211が設けられた構成とされている。 In particular, the configuration of the reproducing device 201 is such that the HRTF convolution section 211 is provided after the speaker phase characteristic convolution section 132 in the reproduction device 161.

再生装置201では、上述したスピーカ特性インパルス応答およびヘッドフォン逆特性インパルス応答だけでなく、HRTFも取得部131によって外部の装置から取得され、保持されている。なお、HRTFも取得部131により取得されるのではなく、予め取得部131に保持されているようにしてもよい。 In the reproduction device 201, not only the above-mentioned speaker characteristic impulse response and headphone inverse characteristic impulse response but also the HRTF is acquired from an external device by the acquisition unit 131 and held. Note that the HRTF may also be stored in advance in the acquisition unit 131 instead of being acquired by the acquisition unit 131.

取得部131は、保持しているHRTFをHRTF畳み込み部211に供給する。 The acquisition unit 131 supplies the held HRTF to the HRTF convolution unit 211.

HRTF畳み込み部211は、スピーカ位相特性畳み込み部132から供給されたオーディオ信号に対して、取得部131から供給されたHRTFを畳み込み、その結果得られたオーディオ信号を再生制御部133に供給する。 The HRTF convolution section 211 convolves the HRTF supplied from the acquisition section 131 with the audio signal supplied from the speaker phase characteristic convolution section 132, and supplies the resulting audio signal to the reproduction control section 133.

なお、図13に示した再生装置121にHRTF畳み込み部211が設けられるようにしてもよい。 Note that the reproduction device 121 shown in FIG. 13 may be provided with the HRTF convolution unit 211.

〈再生処理の説明〉
次に、再生装置201の動作について説明する。すなわち、以下、図18のフローチャートを参照して再生装置201による再生処理について説明する。なお、この再生処理が開始されるタイミングでは、スピーカ特性インパルス応答、ヘッドフォン逆特性インパルス応答、およびHRTFが既に取得部131により取得されている。
<Explanation of playback process>
Next, the operation of the playback device 201 will be explained. That is, the reproduction processing by the reproduction device 201 will be described below with reference to the flowchart of FIG. 18. Note that at the timing when this reproduction process is started, the speaker characteristic impulse response, the headphone inverse characteristic impulse response, and the HRTF have already been acquired by the acquisition unit 131.

再生処理が開始されるとステップS131およびステップS132の処理が行われるが、これらの処理は図16のステップS101およびステップS102の処理と同様であるので、その説明は省略する。 When the playback process is started, steps S131 and S132 are performed, but since these processes are the same as those of steps S101 and S102 in FIG. 16, their explanation will be omitted.

ステップS133においてHRTF畳み込み部211は、スピーカ位相特性畳み込み部132から供給されたオーディオ信号に対して取得部131から供給されたHRTFを畳み込み、その結果得られたオーディオ信号を再生制御部133に供給する。 In step S133, the HRTF convolution unit 211 convolves the HRTF supplied from the acquisition unit 131 with the audio signal supplied from the speaker phase characteristic convolution unit 132, and supplies the resulting audio signal to the playback control unit 133. .

ステップS134において再生制御部133は、HRTF畳み込み部211から供給されたオーディオ信号をヘッドフォン122に供給してコンテンツの音を再生させ、再生処理は終了する。これにより、コンテンツの音の再生時には、ヘッドフォン122の位相特性がキャンセルされ、スピーカ91の位相特性とスタジオにおける音の伝達特性が付加されることになる。 In step S134, the reproduction control unit 133 supplies the audio signal supplied from the HRTF convolution unit 211 to the headphones 122 to reproduce the sound of the content, and the reproduction process ends. As a result, when reproducing the sound of the content, the phase characteristics of the headphones 122 are canceled, and the phase characteristics of the speaker 91 and the sound transmission characteristics in the studio are added.

以上のようにして再生装置201は、ヘッドフォン逆特性インパルス応答、スピーカ特性インパルス応答、およびHRTFをオーディオ信号に畳み込んでからコンテンツの音の再生を行う。 As described above, the playback device 201 plays back the sound of the content after convolving the headphone inverse characteristic impulse response, the speaker characteristic impulse response, and the HRTF into the audio signal.

このようにすることで、コンテンツの音をヘッドフォン122で再生する場合であっても所望の位相特性とスタジオ等の所望の受聴環境における伝達特性とを付加し、制作者M11がスタジオで聞いていたコンテンツの音と略同じ音を受聴者に聞かせることができる。 By doing so, even when the sound of the content is played back with the headphones 122, the desired phase characteristics and the transfer characteristics in the desired listening environment such as a studio are added, and the sound that the creator M11 is listening to in the studio is added. Listeners can hear substantially the same sound as the content.

〈変形例〉
〈再生装置の構成例〉
なお、再生装置121や再生装置161、再生装置201内部に目標位相特性インパルス応答を生成する生成部が設けられるようにしてもよい。
<Modified example>
<Example of configuration of playback device>
Note that a generation unit that generates the target phase characteristic impulse response may be provided inside the reproduction device 121, the reproduction device 161, and the reproduction device 201.

例えば再生装置161内部にそのような生成部が設けられる場合、再生装置161は図19に示すように構成される。なお、図19において図15における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。 For example, when such a generating section is provided inside the playback device 161, the playback device 161 is configured as shown in FIG. Note that in FIG. 19, parts corresponding to those in FIG. 15 are denoted by the same reference numerals, and the description thereof will be omitted as appropriate.

図19に示す再生装置161は、生成部241、取得部131、ヘッドフォン逆特性畳み込み部171、スピーカ位相特性畳み込み部132、および再生制御部133を有している。 The reproduction device 161 shown in FIG. 19 includes a generation section 241, an acquisition section 131, a headphone inverse characteristic convolution section 171, a speaker phase characteristic convolution section 132, and a reproduction control section 133.

図19に示す再生装置161の構成は、図15に示した再生装置161に、さらに生成部241が設けられた構成となっている。 The configuration of the playback device 161 shown in FIG. 19 is such that the playback device 161 shown in FIG. 15 is further provided with a generation section 241.

生成部241は、インパルス応答生成装置11やインパルス応答生成装置51に対応する。すなわち、生成部241は、図9や図11を参照して説明したインパルス応答生成処理と同様の処理を行ってヘッドフォン逆特性インパルス応答やスピーカ特性インパルス応答を生成し、取得部131に供給する。 The generation unit 241 corresponds to the impulse response generation device 11 and the impulse response generation device 51. That is, the generation unit 241 performs processing similar to the impulse response generation processing described with reference to FIGS. 9 and 11 to generate a headphone inverse characteristic impulse response and a speaker characteristic impulse response, and supplies them to the acquisition unit 131.

以上の各実施の形態や変形例において説明した本技術によれば、振幅特性は変化させずに位相特性のみを調整し、所望の位相特性を得ることができる。 According to the present technology described in each of the above embodiments and modifications, only the phase characteristic can be adjusted without changing the amplitude characteristic, and a desired phase characteristic can be obtained.

例えば音楽制作でマスタリングに用いられる任意のスピーカの位相特性、特に低域の位相特性を、振幅特性はフラット(平坦)なままで音源に付加することができる。これにより、ヘッドフォンを用いて音を再生するときでも、低域の音質効果としてマスタリングスタジオで得られるものと同等の効果を得ることができる。 For example, the phase characteristics of any speaker used for mastering in music production, especially the low-frequency phase characteristics, can be added to the sound source while the amplitude characteristics remain flat. As a result, even when playing back sound using headphones, it is possible to obtain a low-frequency sound quality effect equivalent to that obtained in a mastering studio.

しかも、対象とするスピーカが未知である場合でも、そのスピーカの位相特性を模した任意の一般的なIIRフィルタのインパルス応答を上述した入力インパルス応答として用いれば、得られたスピーカ特性インパルス応答を用いることで、振幅特性は変化させずにスピーカと同等の低域の位相特性を付加することができる。 Moreover, even if the target speaker is unknown, if the impulse response of any general IIR filter that imitates the phase characteristics of that speaker is used as the above-mentioned input impulse response, the obtained speaker characteristic impulse response can be used. By doing so, it is possible to add a low-frequency phase characteristic equivalent to that of a speaker without changing the amplitude characteristic.

また、ヘッドフォン逆特性インパルス応答によりヘッドフォンの位相特性、特に低域の位相特性の逆特性を付加すれば、ヘッドフォンの位相特性、特に低域の位相特性をキャンセルすることができる。そしてヘッドフォンの位相特性のキャンセル後に、さらにスピーカ特性インパルス応答によりスピーカの位相特性、特に低域の特性を付加すれば、マスタリングスタジオでの低域の音質効果により近い効果を得ることができる。 Further, by adding an inverse characteristic of the phase characteristic of the headphones, especially the phase characteristic of the low frequency range, by the headphone inverse characteristic impulse response, it is possible to cancel the phase characteristic of the headphone, especially the phase characteristic of the low frequency range. After canceling the phase characteristics of the headphones, if the phase characteristics of the speaker, especially the low frequency characteristics, are added using the speaker characteristic impulse response, it is possible to obtain an effect closer to the low frequency sound quality effect in a mastering studio.

なお、将来的にメタデータ等によりマスタリングスタジオで用いられているスピーカを特定できる場合には、そのスピーカの位相特性を有するインパルス応答を入力インパルス応答として用いればよい。また、マスタリングスタジオで用いられているスピーカを特定できない場合には、そのスピーカの位相特性を模したIIR型のHPF等のインパルス応答を入力インパルス応答として用いればよい。 Note that if in the future it is possible to identify a speaker used in a mastering studio using metadata or the like, an impulse response having the phase characteristics of that speaker may be used as the input impulse response. Furthermore, if the speaker used in the mastering studio cannot be specified, an impulse response such as an IIR type HPF that imitates the phase characteristics of the speaker may be used as the input impulse response.

さらに、ヘッドフォンでコンテンツの音を再生するときには、ヘッドフォンの位相特性のキャンセルと、スピーカの位相特性の付加に加えて、コンテンツのオーディオ信号に対してHRTFを畳み込むことで、マスタリングスタジオでの受聴環境の低域の位相特性をヘッドフォンでシミュレートすることができる。 Furthermore, when playing the sound of content with headphones, in addition to canceling the phase characteristics of the headphones and adding the phase characteristics of the speakers, the HRTF is convolved with the audio signal of the content to improve the listening environment in the mastering studio. Low-frequency phase characteristics can be simulated using headphones.

〈コンピュータの構成例〉
ところで、上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウェアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。
<Computer configuration example>
By the way, the series of processes described above can be executed by hardware or software. When a series of processes is executed by software, the programs that make up the software are installed on the computer. Here, the computer includes a computer built into dedicated hardware and, for example, a general-purpose personal computer that can execute various functions by installing various programs.

図20は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。 FIG. 20 is a block diagram showing an example of a hardware configuration of a computer that executes the above-described series of processes using a program.

コンピュータにおいて、CPU(Central Processing Unit)501,ROM(Read Only Memory)502,RAM(Random Access Memory)503は、バス504により相互に接続されている。 In a computer, a CPU (Central Processing Unit) 501, a ROM (Read Only Memory) 502, and a RAM (Random Access Memory) 503 are interconnected by a bus 504.

バス504には、さらに、入出力インターフェース505が接続されている。入出力インターフェース505には、入力部506、出力部507、記録部508、通信部509、及びドライブ510が接続されている。 An input/output interface 505 is further connected to the bus 504. An input section 506 , an output section 507 , a recording section 508 , a communication section 509 , and a drive 510 are connected to the input/output interface 505 .

入力部506は、キーボード、マウス、マイクロホン、撮像素子などよりなる。出力部507は、ディスプレイ、スピーカなどよりなる。記録部508は、ハードディスクや不揮発性のメモリなどよりなる。通信部509は、ネットワークインターフェースなどよりなる。ドライブ510は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブル記録媒体511を駆動する。 The input unit 506 includes a keyboard, a mouse, a microphone, an image sensor, and the like. The output unit 507 includes a display, a speaker, and the like. The recording unit 508 includes a hard disk, nonvolatile memory, and the like. The communication unit 509 includes a network interface and the like. The drive 510 drives a removable recording medium 511 such as a magnetic disk, an optical disk, a magneto-optical disk, or a semiconductor memory.

以上のように構成されるコンピュータでは、CPU501が、例えば、記録部508に記録されているプログラムを、入出力インターフェース505及びバス504を介して、RAM503にロードして実行することにより、上述した一連の処理が行われる。 In the computer configured as described above, the CPU 501 executes the above-described series by, for example, loading a program recorded in the recording unit 508 into the RAM 503 via the input/output interface 505 and the bus 504 and executing it. processing is performed.

コンピュータ(CPU501)が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブル記録媒体511に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。 A program executed by the computer (CPU 501) can be provided by being recorded on a removable recording medium 511 such as a package medium, for example. Additionally, programs may be provided via wired or wireless transmission media, such as local area networks, the Internet, and digital satellite broadcasts.

コンピュータでは、プログラムは、リムーバブル記録媒体511をドライブ510に装着することにより、入出力インターフェース505を介して、記録部508にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部509で受信し、記録部508にインストールすることができる。その他、プログラムは、ROM502や記録部508に、あらかじめインストールしておくことができる。 In the computer, the program can be installed in the recording unit 508 via the input/output interface 505 by installing the removable recording medium 511 into the drive 510. Further, the program can be received by the communication unit 509 via a wired or wireless transmission medium and installed in the recording unit 508. Other programs can be installed in the ROM 502 or the recording unit 508 in advance.

なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。 Note that the program executed by the computer may be a program in which processing is performed chronologically in accordance with the order described in this specification, in parallel, or at necessary timing such as when a call is made. It may also be a program that performs processing.

また、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。 Further, the embodiments of the present technology are not limited to the embodiments described above, and various changes can be made without departing from the gist of the present technology.

例えば、本技術は、1つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。 For example, the present technology can take a cloud computing configuration in which one function is shared and jointly processed by a plurality of devices via a network.

また、上述のフローチャートで説明した各ステップは、1つの装置で実行する他、複数の装置で分担して実行することができる。 Moreover, each step explained in the above-mentioned flowchart can be executed by one device or can be shared and executed by a plurality of devices.

さらに、1つのステップに複数の処理が含まれる場合には、その1つのステップに含まれる複数の処理は、1つの装置で実行する他、複数の装置で分担して実行することができる。 Furthermore, when one step includes multiple processes, the multiple processes included in that one step can be executed by one device or can be shared and executed by multiple devices.

さらに、本技術は、以下の構成とすることも可能である。 Furthermore, the present technology can also have the following configuration.

(1)
振幅特性がフラットまたは略フラットであり、かつ所定の位相特性を有するインパルス応答を取得する取得部と、
入力オーディオ信号に前記インパルス応答を畳み込む位相特性畳み込み部と
を備えるオーディオ信号処理装置。
(2)
前記所定の位相特性は、所定のスピーカが有する位相特性である
(1)に記載のオーディオ信号処理装置。
(3)
前記インパルス応答の畳み込みにより得られたオーディオ信号に基づく音のヘッドフォンでの再生を制御する再生制御部をさらに備える
(1)または(2)に記載のオーディオ信号処理装置。
(4)
前記ヘッドフォンの位相特性の逆特性を有するインパルス応答を前記入力オーディオ信号に畳み込む逆特性畳み込み部をさらに備える
(3)に記載のオーディオ信号処理装置。
(5)
前記位相特性畳み込み部による畳み込みにより得られたオーディオ信号にHRTFを畳み込むHRTF畳み込み部をさらに備える
(1)乃至(4)の何れか一項に記載のオーディオ信号処理装置。
(6)
前記インパルス応答を生成するインパルス応答生成部をさらに備える
(1)乃至(5)の何れか一項に記載のオーディオ信号処理装置。
(7)
オーディオ信号処理装置が、
振幅特性がフラットまたは略フラットであり、かつ所定の位相特性を有するインパルス応答を取得し、
入力オーディオ信号に前記インパルス応答を畳み込む
オーディオ信号処理方法。
(8)
振幅特性がフラットまたは略フラットであり、かつ所定の位相特性を有するインパルス応答を取得し、
入力オーディオ信号に前記インパルス応答を畳み込む
ステップを含む処理をコンピュータに実行させるプログラム。
(9)
振幅特性がフラットまたは略フラットであり、かつ所定の位相特性を有する目標特性インパルス応答を生成する
インパルス応答生成装置。
(10)
所定のインパルス情報に対して0データを付加する0詰め処理を行う0詰め処理部と、
前記0データが付加された前記インパルス情報に対してFFTを行うインパルス情報FFT処理部と、
前記FFTにより得られた位相特性と、フラットな振幅特性とに基づいてIFFTを行うことで前記目標特性インパルス応答を生成するIFFT処理部と
をさらに備える(9)に記載のインパルス応答生成装置。
(11)
前記0詰め処理部は、少なくとも前記インパルス情報の時間方向における前側に前記0データを付加する
(10)に記載のインパルス応答生成装置。
(12)
前記IFFTにより得られたインパルス応答に対してフェード処理を行い、前記目標特性インパルス応答とするフェード処理部をさらに備える
(10)または(11)に記載のインパルス応答生成装置。
(13)
前記インパルス情報は前記所定の位相特性を有するインパルス応答である
(10)乃至(12)の何れか一項に記載のインパルス応答生成装置。
(14)
前記インパルス情報は単純インパルスであり、
前記所定の位相特性を有するインパルス応答に対してFFTを行うインパルス応答FFT処理部と、
前記インパルス情報FFT処理部による前記FFTにより得られた位相特性と、前記インパルス応答FFT処理部による前記FFTにより得られた位相特性とに基づく演算を行う演算処理部と
をさらに備え、
前記IFFT処理部は、前記演算により得られた位相特性と、前記フラットな振幅特性とに基づいて前記IFFTを行う
(10)乃至(12)の何れか一項に記載のインパルス応答生成装置。
(15)
前記演算処理部は、前記演算として、前記インパルス情報FFT処理部による前記FFTにより得られた位相特性と、前記インパルス応答FFT処理部による前記FFTにより得られた位相特性との加算を行う
(14)に記載のインパルス応答生成装置。
(16)
前記演算処理部は、前記演算として、前記インパルス情報FFT処理部による前記FFTにより得られた位相特性からの、前記インパルス応答FFT処理部による前記FFTにより得られた位相特性の減算を行う
(14)に記載のインパルス応答生成装置。
(17)
インパルス応答生成装置が、
振幅特性がフラットまたは略フラットであり、かつ所定の位相特性を有する目標特性インパルス応答を生成する
インパルス応答生成方法。
(18)
振幅特性がフラットまたは略フラットであり、かつ所定の位相特性を有する目標特性インパルス応答を生成する
ステップを含む処理をコンピュータに実行させるプログラム。
(1)
an acquisition unit that acquires an impulse response having a flat or substantially flat amplitude characteristic and a predetermined phase characteristic;
and a phase characteristic convolution unit that convolves the impulse response with an input audio signal.
(2)
The audio signal processing device according to (1), wherein the predetermined phase characteristic is a phase characteristic that a predetermined speaker has.
(3)
The audio signal processing device according to (1) or (2), further comprising a playback control unit that controls playback of sound based on the audio signal obtained by convolution of the impulse response on headphones.
(4)
The audio signal processing device according to (3), further comprising an inverse characteristic convolution unit that convolves an impulse response having a characteristic opposite to the phase characteristic of the headphone into the input audio signal.
(5)
The audio signal processing device according to any one of (1) to (4), further comprising an HRTF convolution unit that convolves an HRTF into the audio signal obtained by convolution by the phase characteristic convolution unit.
(6)
The audio signal processing device according to any one of (1) to (5), further comprising an impulse response generation unit that generates the impulse response.
(7)
The audio signal processing device
Obtaining an impulse response that has flat or approximately flat amplitude characteristics and a predetermined phase characteristic,
An audio signal processing method comprising convolving the impulse response with an input audio signal.
(8)
Obtaining an impulse response that has flat or approximately flat amplitude characteristics and a predetermined phase characteristic,
A program that causes a computer to perform a process including the step of convolving the impulse response with an input audio signal.
(9)
An impulse response generation device that generates a target characteristic impulse response having a flat or substantially flat amplitude characteristic and a predetermined phase characteristic.
(10)
a zero padding processing unit that performs zero padding processing for adding zero data to predetermined impulse information;
an impulse information FFT processing unit that performs FFT on the impulse information to which the 0 data is added;
The impulse response generation device according to (9), further comprising: an IFFT processing unit that generates the target characteristic impulse response by performing IFFT based on the phase characteristic obtained by the FFT and the flat amplitude characteristic.
(11)
The impulse response generation device according to (10), wherein the zero padding processing unit adds the zero data to at least the front side of the impulse information in the time direction.
(12)
The impulse response generation device according to (10) or (11), further comprising a fade processing unit that performs a fade process on the impulse response obtained by the IFFT to obtain the target characteristic impulse response.
(13)
The impulse response generation device according to any one of (10) to (12), wherein the impulse information is an impulse response having the predetermined phase characteristic.
(14)
The impulse information is a simple impulse,
an impulse response FFT processing unit that performs FFT on the impulse response having the predetermined phase characteristic;
further comprising: an arithmetic processing unit that performs calculations based on the phase characteristics obtained by the FFT by the impulse information FFT processing unit and the phase characteristics obtained by the FFT by the impulse response FFT processing unit,
The impulse response generation device according to any one of (10) to (12), wherein the IFFT processing unit performs the IFFT based on the phase characteristic obtained by the calculation and the flat amplitude characteristic.
(15)
The calculation processing unit performs the calculation by adding the phase characteristics obtained by the FFT performed by the impulse information FFT processing unit and the phase characteristics obtained by the FFT performed by the impulse response FFT processing unit. (14) The impulse response generation device described in .
(16)
The arithmetic processing unit subtracts the phase characteristic obtained by the FFT by the impulse response FFT processing unit from the phase characteristic obtained by the FFT by the impulse information FFT processing unit as the calculation. (14) The impulse response generation device described in .
(17)
The impulse response generator is
An impulse response generation method for generating a target characteristic impulse response having a flat or substantially flat amplitude characteristic and a predetermined phase characteristic.
(18)
A program that causes a computer to execute processing including the step of generating a target characteristic impulse response having a flat or substantially flat amplitude characteristic and a predetermined phase characteristic.

11 インパルス応答生成装置, 21 0詰め処理部, 22 FFT処理部, 23 IFFT処理部, 24 フェード処理部, 61 FFT処理部, 62 0詰め処理部, 63 FFT処理部, 64 演算処理部, 121 再生装置, 131 取得部, 132 スピーカ位相特性畳み込み部, 133 再生制御部, 171 ヘッドフォン逆特性畳み込み部, 211 HRTF畳み込み部, 241 生成部 Reference Signs List 11 Impulse response generation device, 21 Zero padding processing section, 22 FFT processing section, 23 IFFT processing section, 24 Fade processing section, 61 FFT processing section, 62 Zero padding processing section, 63 FFT processing section, 64 Arithmetic processing section, 121 Reproduction device, 131 acquisition unit, 132 speaker phase characteristic convolution unit, 133 playback control unit, 171 headphone inverse characteristic convolution unit, 211 HRTF convolution unit, 241 generation unit

Claims (9)

所定のインパルス情報に対して0データを付加する0詰め処理を行う0詰め処理部と、
前記0データが付加された前記インパルス情報に対してFFTを行うインパルス情報FFT処理部と、
前記FFTにより得られた位相特性と、フラットな振幅特性とに基づいてIFFTを行うことで、所定の位相特性を有する目標特性インパルス応答を生成するIFFT処理部と
を備えるインパルス応答生成装置。
a zero padding processing unit that performs zero padding processing for adding zero data to predetermined impulse information;
an impulse information FFT processing unit that performs FFT on the impulse information to which the 0 data is added;
an IFFT processing unit that generates a target characteristic impulse response having a predetermined phase characteristic by performing IFFT based on the phase characteristic obtained by the FFT and the flat amplitude characteristic;
An impulse response generation device comprising :
前記0詰め処理部は、少なくとも前記インパルス情報の時間方向における前側に前記0データを付加する
請求項1に記載のインパルス応答生成装置。
The zero padding processing unit adds the zero data to at least the front side of the impulse information in the time direction.
The impulse response generation device according to claim 1 .
前記IFFTにより得られたインパルス応答に対してフェード処理を行い、前記目標特性インパルス応答とするフェード処理部をさらに備える
請求項1に記載のインパルス応答生成装置。
The apparatus further includes a fade processing unit that performs fade processing on the impulse response obtained by the IFFT to obtain the target characteristic impulse response.
The impulse response generation device according to claim 1 .
前記インパルス情報は前記所定の位相特性を有するインパルス応答である
請求項1に記載のインパルス応答生成装置。
The impulse information is an impulse response having the predetermined phase characteristic.
The impulse response generation device according to claim 1 .
前記インパルス情報は単純インパルスであり、
前記所定の位相特性を有するインパルス応答に対してFFTを行うインパルス応答FFT処理部と、
前記インパルス情報FFT処理部による前記FFTにより得られた位相特性と、前記インパルス応答FFT処理部による前記FFTにより得られた位相特性とに基づく演算を行う演算処理部と
をさらに備え、
前記IFFT処理部は、前記演算により得られた位相特性と、前記フラットな振幅特性とに基づいて前記IFFTを行う
請求項1に記載のインパルス応答生成装置。
The impulse information is a simple impulse,
an impulse response FFT processing unit that performs FFT on the impulse response having the predetermined phase characteristic;
further comprising: an arithmetic processing unit that performs calculations based on the phase characteristics obtained by the FFT by the impulse information FFT processing unit and the phase characteristics obtained by the FFT by the impulse response FFT processing unit,
The IFFT processing unit performs the IFFT based on the phase characteristic obtained by the calculation and the flat amplitude characteristic.
The impulse response generation device according to claim 1 .
前記演算処理部は、前記演算として、前記インパルス情報FFT処理部による前記FFTにより得られた位相特性と、前記インパルス応答FFT処理部による前記FFTにより得られた位相特性との加算を行う
請求項5に記載のインパルス応答生成装置。
The calculation processing unit performs the calculation by adding the phase characteristics obtained by the FFT performed by the impulse information FFT processing unit and the phase characteristics obtained by the FFT performed by the impulse response FFT processing unit.
The impulse response generation device according to claim 5 .
前記演算処理部は、前記演算として、前記インパルス情報FFT処理部による前記FFTにより得られた位相特性からの、前記インパルス応答FFT処理部による前記FFTにより得られた位相特性の減算を行う
請求項5に記載のインパルス応答生成装置。
The arithmetic processing unit subtracts the phase characteristic obtained by the FFT by the impulse response FFT processing unit from the phase characteristic obtained by the FFT by the impulse information FFT processing unit as the calculation.
The impulse response generation device according to claim 5 .
インパルス応答生成装置が、
所定のインパルス情報に対して0データを付加する0詰め処理を行い、
前記0データが付加された前記インパルス情報に対してFFTを行い、
前記FFTにより得られた位相特性と、フラットな振幅特性とに基づいてIFFTを行うことで、所定の位相特性を有する目標特性インパルス応答を生成する
インパルス応答生成方法。
The impulse response generator is
Performs 0 padding processing to add 0 data to predetermined impulse information,
performing FFT on the impulse information to which the 0 data has been added;
By performing IFFT based on the phase characteristics obtained by the FFT and the flat amplitude characteristics, a target characteristic impulse response having a predetermined phase characteristic is generated.
Impulse response generation method.
所定のインパルス情報に対して0データを付加する0詰め処理を行い、
前記0データが付加された前記インパルス情報に対してFFTを行い、
前記FFTにより得られた位相特性と、フラットな振幅特性とに基づいてIFFTを行うことで、所定の位相特性を有する目標特性インパルス応答を生成する
ステップを含む処理をコンピュータに実行させるプログラム。
Performs 0 padding processing to add 0 data to predetermined impulse information,
performing FFT on the impulse information to which the 0 data has been added;
A program that causes a computer to execute processing including a step of generating a target characteristic impulse response having a predetermined phase characteristic by performing IFFT based on the phase characteristic obtained by the FFT and the flat amplitude characteristic.
JP2020528786A 2018-07-04 2019-06-20 Impulse response generation device, method, and program Active JP7359146B2 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2018127664 2018-07-04
JP2018127664 2018-07-04
PCT/JP2019/024440 WO2020008889A1 (en) 2018-07-04 2019-06-20 Audio signal processing device and method, impulse response generation device and method, and program

Publications (2)

Publication Number Publication Date
JPWO2020008889A1 JPWO2020008889A1 (en) 2021-07-08
JP7359146B2 true JP7359146B2 (en) 2023-10-11

Family

ID=69060578

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020528786A Active JP7359146B2 (en) 2018-07-04 2019-06-20 Impulse response generation device, method, and program

Country Status (3)

Country Link
EP (1) EP3820161A4 (en)
JP (1) JP7359146B2 (en)
WO (1) WO2020008889A1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7447533B2 (en) * 2020-02-19 2024-03-12 ヤマハ株式会社 Sound signal processing method and sound signal processing device

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120033829A1 (en) 2010-08-04 2012-02-09 Lewis Ivan Lawayne Audio phase corrector
JP2014168116A (en) 2013-02-28 2014-09-11 Jvc Kenwood Corp Audio signal processor, audio signal processing method, audio signal processing program and headphone

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2681349B2 (en) * 1986-08-08 1997-11-26 ヤマハ株式会社 Speaker playback device
JP2002171589A (en) 2000-11-30 2002-06-14 Sony Corp Audio unit
WO2008090897A1 (en) * 2007-01-22 2008-07-31 Toa Corporation Filter
RU2529591C2 (en) * 2009-06-30 2014-09-27 Нокиа Корпорейшн Elimination of position uncertainty when generating surround sound
JP2012054863A (en) * 2010-09-03 2012-03-15 Mitsubishi Electric Corp Sound reproducing apparatus

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120033829A1 (en) 2010-08-04 2012-02-09 Lewis Ivan Lawayne Audio phase corrector
JP2014168116A (en) 2013-02-28 2014-09-11 Jvc Kenwood Corp Audio signal processor, audio signal processing method, audio signal processing program and headphone

Also Published As

Publication number Publication date
WO2020008889A1 (en) 2020-01-09
EP3820161A4 (en) 2021-11-24
JPWO2020008889A1 (en) 2021-07-08
EP3820161A1 (en) 2021-05-12

Similar Documents

Publication Publication Date Title
KR100626233B1 (en) Equalisation of the output in a stereo widening network
KR100717066B1 (en) Front surround system and method for reproducing sound using psychoacoustic models
JP6102179B2 (en) Audio processing apparatus and method, and program
US20050238176A1 (en) Binaural sound reproduction apparatus and method, and recording medium
US11611828B2 (en) Systems and methods for improving audio virtualization
JP2013539289A (en) Optimal crosstalk removal without spectral coloring of audio through loudspeakers
JP4786701B2 (en) Acoustic correction device, acoustic measurement device, acoustic reproduction device, acoustic correction method, and acoustic measurement method
US20170373656A1 (en) Loudspeaker-room equalization with perceptual correction of spectral dips
JP2012509632A (en) Converter and method for converting audio signals.
JP7113920B2 (en) Spectral Impairment Compensation for Crosstalk Processing of Spatial Audio Signals
JP7359146B2 (en) Impulse response generation device, method, and program
JP2007329631A (en) Acoustic correction device
JP2013007944A (en) Signal processing apparatus, signal processing method, and program
JP5651813B1 (en) Audio signal processing apparatus and audio signal processing method
JP2007336080A (en) Sound compensation device
JP2007202021A (en) Audio signal processing apparatus, audio signal processing system, and program
US20210329396A1 (en) Signal processing device, signal processing method, and program
WO2024134805A1 (en) Reproduction sound correction device, reproduction sound correction method, and program
WO2023218917A1 (en) Information processing device, information processing method, and program
US11039266B1 (en) Binaural reproduction of surround sound using a virtualized line array
Lindau et al. Perceptual evaluation of discretization and interpolation for motion-tracked binaural (MTB) recordings (Perzeptive Evaluation von Diskretisierungs-und Interpolationsansätzen
JP2012100117A (en) Acoustic processing apparatus and method
KR20240144414A (en) Device and method for reducing spectral distortion in a system for reproducing virtual sound through loudspeakers
KR20230119192A (en) Stereo headphone psychoacoustic sound localization system and method for reconstructing stereo psychoacoustic sound signal using the same
JPH0937400A (en) Sound image localization controller

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220428

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230418

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230516

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230829

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230911

R151 Written notification of patent or utility model registration

Ref document number: 7359146

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151