WO2020008889A1 - オーディオ信号処理装置および方法、インパルス応答生成装置および方法、並びにプログラム - Google Patents

オーディオ信号処理装置および方法、インパルス応答生成装置および方法、並びにプログラム Download PDF

Info

Publication number
WO2020008889A1
WO2020008889A1 PCT/JP2019/024440 JP2019024440W WO2020008889A1 WO 2020008889 A1 WO2020008889 A1 WO 2020008889A1 JP 2019024440 W JP2019024440 W JP 2019024440W WO 2020008889 A1 WO2020008889 A1 WO 2020008889A1
Authority
WO
WIPO (PCT)
Prior art keywords
impulse response
characteristic
phase characteristic
fft
processing unit
Prior art date
Application number
PCT/JP2019/024440
Other languages
English (en)
French (fr)
Inventor
福井 隆郎
Original Assignee
ソニー株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ソニー株式会社 filed Critical ソニー株式会社
Priority to EP19831112.8A priority Critical patent/EP3820161A4/en
Priority to JP2020528786A priority patent/JP7359146B2/ja
Publication of WO2020008889A1 publication Critical patent/WO2020008889A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/033Headphones for stereophonic communication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • H04S1/005For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]

Definitions

  • the present technology relates to an audio signal processing device and method, an impulse response generation device and method, and a program, and in particular, an audio signal processing device and method, an impulse response generation device and method capable of obtaining a desired phase characteristic, And the program.
  • the amplitude characteristic of the audio signal can be adjusted, but the phase characteristic of the audio signal cannot be set to a desired characteristic.
  • the present technology has been made in view of such a situation, and is intended to obtain a desired phase characteristic.
  • An audio signal processing device includes an acquisition unit that acquires an impulse response having a flat or substantially flat amplitude characteristic and a predetermined phase characteristic, and a phase that convolves the impulse response with an input audio signal.
  • a characteristic folding section .
  • An audio signal processing method or program includes a step of acquiring an impulse response having a flat or substantially flat amplitude characteristic and having a predetermined phase characteristic, and convolving the impulse response with an input audio signal. Including.
  • an impulse response having a flat or substantially flat amplitude characteristic and a predetermined phase characteristic is obtained, and the impulse response is convolved with an input audio signal.
  • the impulse response generation device generates a target characteristic impulse response having a flat or substantially flat amplitude characteristic and a predetermined phase characteristic.
  • the impulse response generation method or program according to the second aspect of the present technology includes a step of generating a target characteristic impulse response having a flat or substantially flat amplitude characteristic and a predetermined phase characteristic.
  • a target characteristic impulse response having a flat or substantially flat amplitude characteristic and a predetermined phase characteristic is generated.
  • desired phase characteristics can be obtained.
  • FIG. 3 is a diagram illustrating a relationship between a frequency characteristic and an impulse response.
  • FIG. 4 is a diagram for describing reconstruction of an impulse response.
  • FIG. 4 is a diagram illustrating frequency characteristics of a reconstructed impulse response.
  • FIG. 4 is a diagram for describing reconstruction of an impulse response.
  • FIG. 4 is a diagram illustrating frequency characteristics of a reconstructed impulse response.
  • FIG. 4 is a diagram for describing reconstruction of an impulse response.
  • FIG. 4 is a diagram illustrating frequency characteristics of a reconstructed impulse response. It is a figure showing the example of composition of an impulse response generation device. It is a flowchart explaining an impulse response generation process. It is a figure showing the example of composition of an impulse response generation device. It is a flowchart explaining an impulse response generation process.
  • FIG. 3 is a diagram illustrating content mastering. It is a figure showing the example of composition of a reproducing device. It is a flowchart explaining a reproduction process. It is a figure showing the example of composition of a reproducing device. It is a flowchart explaining a reproduction process. It is a figure showing the example of composition of a reproducing device. It is a flowchart explaining a reproduction process. It is a figure showing the example of composition of a reproducing device. It is a flowchart explaining a reproduction process. It is a figure showing the example of composition of a reproducing device.
  • FIG. 11 is a diagram illustrating a configuration example of a computer.
  • the present technology generates an impulse response having a flat or substantially flat amplitude characteristic and a desired phase characteristic, thereby adjusting only the phase characteristic while maintaining the amplitude characteristic of the audio signal, and achieving the desired phase characteristic. That you can get.
  • the amplitude characteristic is flat or almost flat, and Impulse response having the following phase characteristics can be obtained.
  • the amplitude characteristic is flat or substantially flat means, for example, that the value of the amplitude (gain) at each frequency of the amplitude characteristic is 1 or substantially 1.
  • a target impulse response is generated by the following method A1 or method A2.
  • 0 data zero data
  • FFT fast Fourier transform
  • the amplitude characteristic and the phase characteristic can be obtained by such an FFT.
  • the amplitude (gain) value at each frequency of the amplitude characteristic is set to 1 so that the amplitude characteristic becomes flat, and the flat amplitude characteristic and the FFT IFFT (Inverse Fast Fourier Transform) is performed on the basis of the phase characteristics obtained in step (1). Then, the subsequent stage of the impulse response obtained by the IFFT is subjected to fade processing with an appropriate time constant to obtain a target impulse response.
  • the impulse response thus obtained functions as an IIR (InfiniteInImpulse Response) filter that changes only the phase characteristic while maintaining the amplitude characteristic. Therefore, only the phase characteristic can be adjusted by convolving such an impulse response with the audio signal.
  • IIR InfiniteInImpulse Response
  • FFT is performed without inserting zero data into an impulse response whose phase is to be simulated, and FFT is performed with zero data inserted into a simple impulse.
  • phase characteristic obtained by the FFT for the impulse response and the phase characteristic obtained by the FFT for the simple impulse in which 0 data is inserted are added, and the obtained phase characteristic and the value of the amplitude at each frequency are added.
  • IFFT is performed based on the flat amplitude characteristic in which is 1. Further, the subsequent stage of the impulse response obtained by the IFFT is faded with an appropriate time constant to obtain a desired impulse response.
  • an impulse response having characteristics similar to those in method A1 can be obtained.
  • an IIR filter that changes only the phase characteristic while maintaining the amplitude characteristic can be obtained.
  • the phase characteristic obtained by the FFT for the impulse response and the phase characteristic obtained by the FFT for the simple impulse into which 0 data is inserted are subtracted instead of added, so that the original impulse response is obtained. It is possible to obtain an impulse response having a characteristic opposite to the phase characteristic.
  • the audio signal of the content is convolved with the impulse response having the opposite characteristic to the phase characteristic of the headphone, and the impulse response having the same phase characteristic as that of the speaker is convolved to cancel the phase characteristic of the headphone.
  • the creator will produce it in the mastering studio. It is assumed that the user can experience the same sound as the sound that is present.
  • FIG. 1 shows the relationship between the frequency characteristics of an IIR HPF having a cutoff frequency Fc of 50 Hz, that is, the amplitude characteristics (gain characteristics) and phase characteristics, and the impulse response of the HPF.
  • the portion indicated by arrow Q11 indicates the amplitude characteristics of the frequency characteristics of the HPF
  • the portion indicated by arrow Q12 indicates the phase characteristics of the frequency characteristics of the HPF.
  • the vertical axis in the amplitude characteristics indicates gain (amplitude), and the horizontal axis indicates frequency.
  • the vertical axis in the phase characteristic indicates the phase, and the horizontal axis indicates the frequency. From this frequency characteristic, it can be seen that the gain is small and the phase is a positive value on the low frequency side of the HPF.
  • the impulse response of the HPF is shown in the portion indicated by arrow Q13.
  • the vertical axis of the impulse response indicates amplitude, and the horizontal axis indicates time, that is, a time sample (sample).
  • the impulse response of the HPF is enlarged in the vicinity of the 0th sample.
  • Such an impulse response can be used as an IIR filter.
  • the audio signal By convolving the impulse response indicated by arrow Q13 with the audio signal, the audio signal can be subjected to HPF filtering.
  • the frequency characteristics of the HPF that is, the amplitude characteristics and the phase characteristics, and the impulse response of the HPF have a reversible relationship although there is a conversion error.
  • an impulse response indicated by arrow Q13 is ideally obtained.
  • the FFT is performed on the impulse response indicated by the arrow Q13, ideally, a frequency characteristic including the amplitude characteristic indicated by the arrow Q11 and the phase characteristic indicated by the arrow Q12 is obtained.
  • the impulse response to be obtained by reconstruction is an impulse response in which only the phase characteristic shown in FIG. 1 is added to the audio signal without changing the amplitude characteristic, that is, a desired impulse response without changing the amplitude characteristic.
  • This is an impulse response to which only the phase characteristic is added.
  • the phase characteristic of the target speaker can be changed without changing the amplitude characteristic. It can be added to the sound of the content. This allows the listener (user) to experience substantially the same sound as the sound produced by the creator in the mastering studio.
  • an impulse response that functions as a filter that adds a desired phase characteristic without changing the amplitude characteristic is also referred to as a target phase characteristic impulse response.
  • a zero padding process of adding 0 data which is a sample whose sample value is 0, is performed on the rear side (end) of the impulse response in the time direction, and the entire length (number of samples) of the impulse response is 4096. Make it a sample.
  • the target target phase characteristic impulse response has a flat or substantially flat amplitude characteristic
  • the phase characteristic is the phase characteristic indicated by arrow Q12.
  • the amplitude (gain) value of each frequency in the amplitude characteristic obtained by the FFT is adjusted to “1”.
  • the amplitude of the amplitude characteristic obtained by the FFT is adjusted so as to have a flat amplitude characteristic.
  • phase characteristic obtained by the FFT should be the target phase characteristic shown by the arrow Q12, no particular phase adjustment is performed on the phase characteristic obtained by the FFT.
  • IFFT is performed on the frequency characteristic including the flat amplitude characteristic obtained by the amplitude adjustment and the phase characteristic obtained by the FFT.
  • the impulse response obtained by the IFFT does not converge to 0
  • the impulse response obtained by the IFFT is faded out on the rear side (the tail side) in the time direction of the impulse response to converge to 0. Is performed.
  • the target phase characteristic impulse response indicated by the arrow Q25 ideally has a flat or substantially flat amplitude characteristic, and should have the same phase characteristic as the original HPF.
  • the portion indicated by arrow Q31 indicates amplitude characteristics
  • the portion indicated by arrow Q32 indicates phase characteristics.
  • the vertical axis indicates gain (amplitude)
  • the horizontal axis indicates frequency
  • the vertical axis in the phase characteristic indicates the phase
  • the horizontal axis indicates the frequency.
  • the curve L11 indicates the amplitude characteristic of the target phase characteristic impulse response indicated by the arrow Q25 in FIG. 2
  • the curve L12 indicates the amplitude characteristic of the original HPF indicated by the arrow Q21 in FIG. I have. From the curve L11, in the amplitude characteristic of the target phase characteristic impulse response, although not as high as the original HPF, the gain in the low-frequency part, that is, the part shown by the arrow W11 is reduced, and the amplitude characteristic is not flat. I understand.
  • the curve L13 indicates the phase characteristic of the target phase characteristic impulse response indicated by the arrow Q25 in FIG. 2
  • the curve L14 indicates the phase characteristic of the original HPF indicated by the arrow Q21 in FIG. That is, a target phase characteristic is shown.
  • the curve L13 is substantially the same as the curve L14, and it can be seen that the target characteristic is obtained with respect to the phase characteristic in the target phase characteristic impulse response.
  • the impulse response basically has a symmetrical shape. It has been known.
  • the present applicant performs a zero padding process so that the impulse response becomes substantially symmetrical with respect to the portion where the pulse rises, and the front and the back of the portion where the pulse rises have the same length section. For example, it was thought that an impulse response having a flat amplitude characteristic could be obtained.
  • the initial impulse response of the HPF is padded with zeros at least on the front side (past side) in the time direction so that the impulse response has a substantially symmetrical shape, and then the FFT and IFFT are performed.
  • the impulse response is reconstructed, and the target phase characteristic impulse response is generated.
  • FIG. 4 the portion indicated by arrow Q41 shows the impulse response of the HPF shown by arrow Q13 in FIG. 1, and this impulse response converges at approximately 1024 samples.
  • zero-padding processing is performed on the impulse response of the HPF indicated by arrow Q41 as indicated by arrow Q42.
  • 0 data is added not only on the rear side (end side) but also on the front side (head side) of the impulse response in the time direction.
  • 0 data is added to the front of the impulse response in the time direction by 8192 samples, and 0 data is also added to the rear of the impulse response in the time direction so that the impulse length itself is 8192 samples. Has been added.
  • the impulse response indicated by the arrow Q42 has a substantially symmetrical shape, and the overall length is 16384 samples.
  • the amplitude characteristic of the target target phase characteristic impulse response is flat
  • the value of the amplitude (gain) of each frequency in the amplitude characteristic obtained by the FFT is adjusted to “1”, and the flat characteristic is obtained. It is assumed to be an amplitude characteristic.
  • phase characteristics obtained by the FFT should be the target phase characteristics, no particular phase adjustment is performed on the phase characteristics obtained by the FFT.
  • IFFT is performed on the frequency characteristic including the flat amplitude characteristic obtained by the amplitude adjustment and the phase characteristic obtained by the FFT, and the impulse response obtained as a result is obtained.
  • Fade processing is performed in the same manner as in the case of arrow Q24 in FIG.
  • the impulse response obtained by the fade processing is set as the target phase characteristic impulse response.
  • a target phase characteristic impulse response indicated by arrow Q45 is obtained, and the target phase characteristic impulse response has a shape close to left-right symmetry.
  • the length of the target phase characteristic impulse response is 16384 samples.
  • the portion indicated by arrow Q51 indicates amplitude characteristics
  • the portion indicated by arrow Q52 indicates phase characteristics.
  • the vertical axis indicates gain (amplitude)
  • the horizontal axis indicates frequency
  • the vertical axis in the phase characteristic indicates the phase
  • the horizontal axis indicates the frequency.
  • the curve L31 indicates the amplitude characteristic of the target phase characteristic impulse response indicated by the arrow Q45 in FIG. 4, and the curve L32 indicates the amplitude characteristic of the original HPF indicated by the arrow Q41 in FIG. I have.
  • the value of the amplitude (gain) at each frequency falls within a range of ⁇ 0.2 dB, and it can be seen that a substantially flat characteristic is obtained. That is, it can be seen that the target amplitude characteristic is obtained.
  • the curve L33 indicates the phase characteristic of the target phase characteristic impulse response indicated by the arrow Q45 in FIG. 4, and the curve L34 indicates the phase characteristic of the original HPF indicated by the arrow Q41 in FIG. That is, a target phase characteristic is shown. Further, a curve L35 shows a phase characteristic of a simple impulse delayed by 8192 samples, that is, a linear phase.
  • the curve L33 and the curve L34 almost overlap each other, and it can be seen that the phase characteristic of the target phase characteristic impulse response is substantially the same as the target characteristic.
  • the curve L35 is shown for comparison. Since the curve L35 shows the phase characteristic of a simple impulse that is a linear phase, the difference between the curve L33 and the curve L35 at each frequency is the phase value at each frequency of the phase characteristic shown by the arrow Q12 in FIG. Then, the target characteristic is obtained as the phase characteristic of the target phase characteristic impulse response.
  • the phase characteristic of the original HPF indicated by the arrow Q41 in FIG. 4 is the same as the phase characteristic indicated by the arrow Q12 in FIG.
  • the method of generating the target phase characteristic impulse response described with reference to FIG. 4 as described above is the above-described method A1.
  • the length of the impulse response subjected to the zero padding processing becomes an infinite sample, the error between the frequency characteristic of the target phase characteristic impulse response and the target characteristic becomes extremely close to zero.
  • the processing amount is reduced both at the time of generation and at the time of convolution after generation.
  • FIG. 6 the portion indicated by arrow Q61 shows the impulse response of the HPF shown by arrow Q13 in FIG. 1, and this impulse response converges at approximately 1024 samples.
  • zero-padding processing is performed on the impulse response of the HPF shown by arrow Q61 as shown by arrow Q62.
  • 0 data is added to the front of the impulse response in the time direction by 384 samples, and 0 data is also added to the rear of the impulse response in the time direction so that the entire length of the impulse response is 4096 samples. Have been.
  • the amplitude (gain) value of each frequency in the amplitude characteristic obtained by the FFT is adjusted to “1” to obtain a flat amplitude characteristic, and the phase characteristic obtained by the FFT is obtained. No phase adjustment is performed.
  • IFFT is performed on a frequency characteristic including a flat amplitude characteristic obtained by the amplitude adjustment and a phase characteristic obtained by the FFT, and the impulse response obtained as a result is obtained.
  • Fade processing is performed in the same manner as in the case of arrow Q24 in FIG.
  • the impulse response obtained by the fade processing is set as the target phase characteristic impulse response.
  • the target phase characteristic impulse response indicated by arrow Q65 is obtained, and the length of the target phase characteristic impulse response is 4096 samples.
  • the target phase characteristic impulse response indicated by the arrow Q65 is not symmetrical.
  • the portion indicated by arrow Q71 indicates amplitude characteristics
  • the portion indicated by arrow Q72 indicates phase characteristics.
  • the vertical axis indicates gain (amplitude)
  • the horizontal axis indicates frequency
  • the vertical axis in the phase characteristic indicates the phase
  • the horizontal axis indicates the frequency.
  • curve L51 shows the amplitude characteristic of the target phase characteristic impulse response shown by arrow Q65 in FIG. 6, and curve L52 shows the amplitude characteristic of the original HPF shown by arrow Q61 in FIG. I have.
  • the value of the amplitude (gain) at each frequency falls within a range of ⁇ 1 dB, and it can be seen that a substantially flat characteristic is obtained. That is, it can be seen that sufficient amplitude characteristics are obtained.
  • the amplitude characteristic shown by the curve L51 has a larger error from the target characteristic as compared with the amplitude characteristic shown by the curve L31 in FIG. 5, but the error falls within a sufficiently small range. I understand that there is.
  • the curve L53 indicates the phase characteristic of the target phase characteristic impulse response indicated by the arrow Q65 in FIG. 6, and the curve L54 indicates the phase characteristic of the original HPF indicated by the arrow Q61 in FIG. That is, a target phase characteristic is shown. Further, the curve L55 shows the phase characteristic of the delayed simple impulse, similarly to the curve L35 of FIG.
  • the curve L53 and the curve L54 have a larger error than in the case of FIG. 5, but almost overlap each other, and a characteristic substantially equivalent to the target characteristic is obtained as the phase characteristic of the target phase characteristic impulse response. I understand.
  • the amplitude characteristic is flat or substantially flat and the amplitude characteristic is flat.
  • a target phase characteristic impulse response can be obtained.
  • the amount of 0 data to be added before the impulse response in the time direction is a trade-off between an allowable error with a target characteristic and a processing amount. And adjust it.
  • zero padding processing is performed on a simple impulse as shown by a curve L35 in FIG. 5 to generate a target phase characteristic impulse response. May be.
  • Such a method for generating the target phase characteristic impulse response is the method A2 described above.
  • phase characteristic of the frequency characteristic obtained by the FFT for the simple impulse after the zero padding process will be particularly referred to as the phase characteristic of the simple impulse.
  • the zero filling process is not performed on the impulse response having the target phase characteristic, and the FFT is performed on the impulse response as it is.
  • the phase characteristics of the frequency characteristics obtained by the FFT for the impulse response having the target phase characteristics will be particularly referred to as target phase characteristics.
  • phase characteristic of the simple impulse and the target phase characteristic are obtained by the FFT in this way, the phase characteristic of the simple impulse and the target phase characteristic are added, and the phase characteristic obtained by the addition and the flat amplitude IFFT is performed on the frequency characteristic including the characteristic.
  • Fade processing is performed on the impulse response obtained by the IFFT, and the impulse response obtained as a result is set as a target phase characteristic impulse response.
  • the target phase characteristic impulse response obtained in this way is an impulse response having a flat or substantially flat amplitude characteristic and having a target phase characteristic.
  • the target phase characteristic is subtracted from the phase characteristic of the simple impulse. It can be obtained as a characteristic impulse response.
  • a phase characteristic obtained by performing FFT without performing zero padding processing on a predetermined HPF impulse response is subtracted from a phase characteristic of a simple impulse, and a phase characteristic obtained as a result is obtained.
  • IFFT is performed on a frequency characteristic including a flat amplitude characteristic.
  • a fade process is performed on the impulse response obtained by the IFFT, and the resulting impulse response is used as a target phase characteristic impulse response.
  • the phase characteristic of the obtained target phase characteristic impulse response is the inverse characteristic of the original HPF phase characteristic.
  • the zero impulse response is performed on the impulse response having the target phase characteristic, and then the FFT, IFFT, and the fade processing are performed to generate the target phase characteristic impulse response.
  • the simple impulse is subjected to zero padding processing, and thereafter, FFT, IFFT, and fade processing are performed to generate a target phase characteristic impulse response.
  • Both the impulse response used in the method A1 and the simple impulse used in the method A2 are impulse information, that is, information on the impulse. Therefore, when the method A1 and the method A2 are generalized, zero-padding processing is performed on the impulse information, and FFT, IFFT, and fade processing are performed on the resulting phase characteristic, and the target phase characteristic impulse is obtained. It can be said that a response has been generated.
  • a desired phase characteristic can be added to the audio signal without changing the amplitude characteristic.
  • the phase characteristic of the reproducing headphone or speaker can be canceled for the audio signal of the content.
  • an audio signal in which the phase characteristics of the headphone or speaker on the reproduction side has been canceled is referred to as a corrected audio signal.
  • the target phase characteristic impulse response having the opposite characteristic to the phase characteristic of the reproducing headphone or speaker may be generated by the above-described method A2 or by the method A1.
  • the FFT, IFFT, and fade processing are performed by performing a zero padding process on an impulse response having a characteristic opposite to that of a reproducing headphone or a speaker. Just do it.
  • the phase characteristic of the mastering speaker is corrected with respect to the corrected audio signal, that is, the sound of the content. Can be added.
  • the listener plays the sound of the content with headphones on the playback side
  • the head-related transfer function that is, the head-related transfer function (HRTF)
  • the creator can use the head-related transfer function (HRTF). It is possible to present a sound that is closer to the sound that is being produced.
  • the HRTF is a function indicating a sound transfer characteristic from the sound source to the listener's ear, more specifically, to the vicinity of the listener's eardrum or to the ear canal entrance.
  • the HRTF is further convoluted with the corrected audio signal to which the phase characteristics of the mastering speaker have been added, so that the listener can experience a sound closer to the sound received when the creator is producing in the mastering studio. Can be done.
  • FIG. 8 is a diagram illustrating a configuration example of an impulse response generation device that generates a target phase characteristic impulse response, that is, an impulse response having a flat or substantially flat amplitude characteristic and a desired phase characteristic by the above-described method A1. .
  • the impulse response generation device 11 shown in FIG. 8 has a zero padding processing unit 21, an FFT processing unit 22, an IFFT processing unit 23, and a fade processing unit 24.
  • the # 0 padding processing unit 21 is supplied with an impulse response having a target phase characteristic used for generating a target phase characteristic impulse response.
  • an impulse response having such a target phase characteristic is referred to as an input impulse response.
  • the $ 0 padding processing unit 21 performs a zero padding process on the supplied input impulse response, and supplies the result to the FFT processing unit 22.
  • the FFT processing unit 22 performs an FFT on the input impulse response after the zero padding processing supplied from the zero padding processing unit 21 and supplies a phase characteristic of the resulting frequency characteristic to the IFFT processing unit 23. .
  • the IFFT processing unit 23 is supplied with a flat amplitude characteristic (gain characteristic) in which the gain (amplitude) of each frequency is “1” from the outside.
  • the IFFT processing unit 23 performs an IFFT on a frequency characteristic composed of a flat amplitude characteristic supplied from the outside and a phase characteristic supplied from the FFT processing unit 22, and converts the resulting impulse response into a fade processing unit. 24.
  • the IFFT is performed based on the flat amplitude characteristic and the phase characteristic supplied from the FFT processing unit 22, and an impulse response is generated.
  • the IFFT processing unit 23 does not use a flat amplitude characteristic supplied from the outside, but performs a gain adjustment on the amplitude characteristic of the frequency characteristic obtained by the FFT in the FFT processing unit 22 to obtain a flat amplitude characteristic.
  • a characteristic may be generated, and the amplitude characteristic may be used for IFFT.
  • the fade processing unit 24 performs a fade process on the impulse response supplied from the IFFT processing unit 23, and outputs the resulting impulse response as a target phase characteristic impulse response.
  • step S11 the zero padding processing unit 21 performs zero padding processing on the supplied input impulse response and supplies the result to the FFT processing unit 22.
  • step S11 in step S11, as described with reference to FIG. 4 and FIG. 6, zero padding processing for adding zero data to the rear or front in the time direction of the input impulse response is performed.
  • zero padding processing zero data is added at least on the front side in the time direction in the input impulse response.
  • step S12 the FFT processing unit 22 performs FFT on the input impulse response after the zero padding process supplied from the zero padding processing unit 21, and converts the phase characteristic of the resulting frequency characteristic to the IFFT processing unit 23. To supply.
  • step S13 the IFFT processing unit 23 performs an IFFT on a frequency characteristic including a flat amplitude characteristic supplied from the outside and a phase characteristic supplied from the FFT processing unit 22, and converts the impulse response obtained as a result. It is supplied to the fade processing unit 24.
  • step S14 the fade processing unit 24 performs a fade process on the impulse response supplied from the IFFT processing unit 23, and outputs the impulse response obtained as a target phase characteristic impulse response.
  • the target phase characteristic impulse response is generated by fading out the rear side (tail side) of the impulse response supplied from the IFFT processing unit 23 in the time direction and converging to 0. If the impulse response obtained by the IFFT converges to 0, no particular fade processing is required.
  • an impulse response having the inverse characteristic of the headphone phase characteristic is used as the input impulse response, for example, the headphone phase characteristic is canceled as the target phase characteristic impulse response, that is, an impulse response having the inverse characteristic of the headphone phase characteristic is obtained. be able to.
  • the impulse response generation device 11 performs the zero padding process of adding 0 data at least to the front side in the time direction of the input impulse response, and performs FFT, IFFT, and fade on the zero-padded input impulse response. By performing the processing, a target phase characteristic impulse response is generated.
  • FIG. 10 ⁇ Second embodiment> ⁇ Configuration example of impulse response generation device>
  • the impulse response generation device is configured as shown in FIG. 10, for example.
  • parts corresponding to those in FIG. 8 are denoted by the same reference numerals, and description thereof will be omitted as appropriate.
  • the impulse response generation device 51 shown in FIG. 10 includes an FFT processing unit 61, a zero filling processing unit 62, an FFT processing unit 63, an arithmetic processing unit 64, an IFFT processing unit 23, and a fade processing unit 24.
  • the configuration of the impulse response generation device 51 has a configuration in which an FFT processing unit 61 to an arithmetic processing unit 64 are provided instead of the zero padding processing unit 21 and the FFT processing unit 22 in the impulse response generation device 11.
  • the FFT processing unit 61 is supplied with an impulse response having a target phase characteristic, that is, an input impulse response, which is used for generating a target phase characteristic impulse response.
  • the FFT processing unit 61 performs an FFT on the supplied input impulse response, and supplies a phase characteristic among the obtained frequency characteristics to the arithmetic processing unit 64. Note that the FFT processing unit 61 does not need to be provided as long as the target phase characteristic itself can be obtained and the target phase characteristic can be supplied to the arithmetic processing unit 64.
  • a simple impulse used to generate a target phase characteristic impulse response is supplied to the # 0 padding processing unit 62.
  • the zero padding processing unit 62 performs a zero padding process on the supplied simple impulse and supplies the simple impulse to the FFT processing unit 63.
  • the FFT processing unit 63 performs an FFT on the simple impulse after the zero padding process supplied from the zero padding processing unit 62 and supplies the phase characteristic of the frequency characteristics obtained as a result to the arithmetic processing unit 64.
  • the arithmetic processing unit 64 performs arithmetic processing based on the phase characteristics supplied from the FFT processing unit 61 and the phase characteristics supplied from the FFT processing unit 63, and supplies the obtained phase characteristics to the IFFT processing unit 23. I do.
  • addition processing or subtraction processing is performed as arithmetic processing.
  • step S41 the FFT processing unit 61 performs an FFT on the supplied input impulse response, and supplies a phase characteristic of the obtained frequency characteristic to the arithmetic processing unit 64.
  • step S42 the zero padding processing unit 62 performs a zero padding process on the supplied simple impulse, and supplies the simple impulse to the FFT processing unit 63.
  • the zero padding process 0 data is added to the front side of the simple impulse in the time direction, and the simple impulse is appropriately delayed.
  • step S43 the FFT processing unit 63 performs the FFT on the simple impulse after the zero padding process supplied from the zero padding processing unit 62, and outputs the phase characteristic of the resulting frequency characteristic to the arithmetic processing unit 64. Supply.
  • step S44 the arithmetic processing unit 64 performs arithmetic processing based on the phase characteristics supplied from the FFT processing unit 61 and the phase characteristics supplied from the FFT processing unit 63, and compares the resulting phase characteristic with the IFFT processing unit. 23.
  • the arithmetic processing unit 64 determines the phase characteristic of the input impulse response supplied from the FFT processing unit 61. And the phase characteristic of the simple impulse after the zero padding supplied from the FFT processing unit 63, and the resulting phase characteristic is supplied to the IFFT processing unit 23.
  • the arithmetic processing unit 64 attempts to obtain the inverse characteristic of the phase characteristic of the input impulse response as the phase characteristic of the target phase characteristic impulse response, the input impulse response supplied from the FFT processing unit 61 Is subtracted from the phase characteristic of the simple impulse after the zero padding process supplied from the FFT processing unit 63, and the resulting phase characteristic is supplied to the IFFT processing unit 23.
  • the impulse response generation device 51 performs the zero padding process of adding 0 data to the front side in the time direction of the simple impulse, and performs the target phase based on the simple impulse response subjected to the zero padding and the input impulse response. Generate a characteristic impulse response.
  • the audio signal of the content obtained by the mastering is reproduced by a reproduction system including a reproduction device or the like owned by the listener.
  • a reproduction system including a reproduction device or the like owned by the listener.
  • any sound such as a headphone, a speaker, and an earphone may be used to reproduce the sound of the content, but the description will be continued below assuming that a headphone is used as a specific example.
  • the playback device used to play back the content is configured, for example, as shown in FIG.
  • the playback device 121 is configured by a portable player, a smartphone, a personal computer, or the like capable of controlling playback of at least audio content, and the playback device 121 is connected to headphones 122.
  • the playback device 121 includes an acquisition unit 131, a speaker phase characteristic convolution unit 132, and a playback control unit 133.
  • the audio signal of the content obtained by the mastering by the creator M11 is supplied to the speaker phase characteristic convolution unit 132.
  • the acquisition unit 131 acquires and holds a target phase characteristic impulse response from an external device such as the impulse response generation device 11 or the impulse response generation device 51 at an arbitrary timing. Further, the acquisition unit 131 supplies the held target phase characteristic impulse response to the speaker phase characteristic convolution unit 132.
  • the target phase characteristic impulse response obtained by the obtaining unit 131 is generated by the impulse response generator 11 or the impulse response generator 51 using the input impulse response having the phase characteristic of the speaker 91 used for mastering. It is. That is, the target phase characteristic impulse response is an impulse response having the same phase characteristic as that of the speaker 91.
  • the target phase characteristic impulse response may not be acquired by the acquisition unit 131 at an arbitrary timing, but may be held in the acquisition unit 131 in advance.
  • a target phase characteristic impulse response having the same phase characteristic as that of the speaker 91 will be particularly referred to as a speaker characteristic impulse response.
  • the speaker phase characteristic convolution unit 132 convolves the speaker characteristic impulse response supplied from the acquisition unit 131 with the supplied audio signal, and supplies the resulting audio signal to the reproduction control unit 133.
  • the reproduction control unit 133 supplies the audio signal supplied from the speaker phase characteristic convolution unit 132 to the headphones 122 to reproduce the sound of the content.
  • the playback control unit 133 controls playback of the sound of the content on the headphones 122.
  • the headphone 122 reproduces the sound of the content based on the audio signal supplied from the reproduction control unit 133.
  • the playback device 121 is not provided with the headphone 122 here, the headphone 122 may be provided in the playback device 121, or the acquisition unit 131 and the playback control The unit 133 may be provided.
  • step S71 the speaker phase characteristic convolution unit 132 convolves the supplied audio signal with the speaker characteristic impulse response supplied from the acquisition unit 131, and supplies the resulting audio signal to the reproduction control unit 133.
  • phase characteristic of the speaker characteristic impulse response that is, the phase characteristic of the speaker 91 can be added to the sound of the content based on the audio signal.
  • step S72 the reproduction control unit 133 supplies the audio signal supplied from the speaker phase characteristic convolution unit 132 to the headphones 122 to reproduce the sound of the content, and the reproduction process ends.
  • the listener who is listening to the sound of the content receives the content that the creator M11 has heard in the studio. A sound of almost the same sound quality as the sound of is heard.
  • the desired phase characteristic can be added to the sound of the content without changing the amplitude characteristic, so that the gain of the sound of the content does not change.
  • the reproducing device 121 reproduces the sound of the content after convolving the speaker characteristic impulse response with the audio signal of the content. By doing so, even when the sound of the content is reproduced by the headphones 122, the phase characteristic of the speaker 91 used for mastering can be added to the sound of the content. That is, desired phase characteristics can be obtained.
  • ⁇ Fourth embodiment> ⁇ Configuration example of playback device> It has been described that the playback device 121 adds the same characteristic as the phase characteristic of the speaker 91 to the sound of the content. However, when the sound of the content is reproduced by the headphones 122, the phase characteristics of the headphones 122 are also added to the sound.
  • the sound of the content closer to the sound of the content that the creator M11 has heard in the studio.
  • the sound may be made available to the listener.
  • the playback device is configured as shown in FIG. 15, for example.
  • FIG. 15 portions corresponding to those in FIG. 13 are denoted by the same reference numerals, and description thereof will be omitted as appropriate.
  • the headphones 122 are connected to the playback device 161 shown in FIG.
  • the playback device 161 includes an acquisition unit 131, a headphone inverse characteristic convolution unit 171, a speaker phase characteristic convolution unit 132, and a reproduction control unit 133.
  • the configuration of the playback device 161 is such that a headphone inverse characteristic convolution unit 171 is provided in a stage preceding the speaker phase characteristic convolution unit 132 in the reproduction device 121.
  • the reproducing device 161 not only the above-described speaker characteristic impulse response but also a target phase characteristic impulse response having a characteristic opposite to the phase characteristic of the headphones 122 is obtained by the acquisition unit 131 such as the impulse response generating device 11 or the impulse response generating device 51. Obtained from an external device and held.
  • a target phase characteristic impulse response having a characteristic opposite to the phase characteristic of the headphone 122 will be particularly referred to as a headphone reverse characteristic impulse response.
  • the headphone inverse characteristic impulse response is obtained by, for example, using an input impulse response having the phase characteristic of the headphone 122 and performing subtraction as an arithmetic processing in the arithmetic processing unit 64 to generate the target phase characteristic impulse response generated by the impulse response generating device 51. It is.
  • the headphone inverse characteristic impulse response may not be acquired by the acquiring unit 131 but may be held in the acquiring unit 131 in advance.
  • the acquisition unit 131 supplies the held headphone inverse characteristic impulse response to the headphone inverse characteristic convolution unit 171.
  • the headphone inverse characteristic convolution unit 171 convolves the headphone inverse characteristic impulse response supplied from the acquisition unit 131 with the supplied audio signal of the content, and supplies the resulting audio signal to the speaker phase characteristic convolution unit 132. I do.
  • step S101 the headphone inverse characteristic convolution unit 171 convolves the headphone inverse characteristic impulse response supplied from the acquisition unit 131 with the supplied content audio signal, and converts the resulting audio signal into the speaker phase characteristic convolution unit. 132.
  • phase characteristic of the headphones 122 can be added to the sound of the content.
  • the phase characteristic of the headphone 122 added when the headphone 122 reproduces the sound of the content is canceled.
  • the phase characteristic can be adjusted without changing the amplitude (gain) of the sound of the content.
  • the phase characteristic of the headphones 122 is canceled for the content sound, and then the phase characteristic of the speaker 91, which is the characteristic to be added, is added.
  • a target phase characteristic impulse response to which the phase characteristic of the headphone 122 can be added and the phase characteristic of the speaker 91 can be added at the same time is generated, and the target phase characteristic impulse response is convolved with the audio signal of the content. May be.
  • the phase characteristic added to the sound of the content can be freely changed. That is, for example, in the reproducing apparatus 161, it is possible to select an arbitrary speaker 91 from among a plurality of speakers 91 of different manufacturers and convolve a speaker characteristic impulse response having a phase characteristic of the selected speaker 91. .
  • the reproducing device 161 convolves the headphone reverse characteristic impulse response with the audio signal of the content, and further convolves the speaker characteristic impulse response with the audio signal, and then reproduces the sound of the content.
  • phase characteristic added by the headphones 122 is canceled, and the phase characteristic of the speaker 91 used for mastering is added to the sound of the content. can do. That is, desired phase characteristics can be obtained.
  • a sound closer to the sound of the content that the creator M11 has heard in the studio can be heard than in the reproduction processing described with reference to FIG. .
  • ⁇ Fifth Embodiment> ⁇ Configuration example of playback device>
  • the sound source for example, HRTF indicating the transmission characteristic of the sound from the speaker 91 to the creator M11 is folded, it is closer to the sound of the content that the creator M11 was listening to in the studio. You can hear the sound. That is, the listening environment of the studio at the time of mastering can be reproduced.
  • the playback device When the HRTF is convolved with the audio signal of the content, the playback device is configured, for example, as shown in FIG. In FIG. 17, portions corresponding to those in FIG. 15 are denoted by the same reference numerals, and description thereof will be omitted as appropriate.
  • a headphone 122 is connected to the playback device 201 shown in FIG. Further, the playback device 201 includes an acquisition unit 131, a headphone inverse characteristic convolution unit 171, a speaker phase characteristic convolution unit 132, an HRTF convolution unit 211, and a reproduction control unit 133.
  • the configuration of the playback apparatus 201 is such that the HRTF convolution section 211 is provided at the subsequent stage of the speaker phase characteristic convolution section 132 in the playback apparatus 161.
  • the reproducing device 201 not only the above-described speaker characteristic impulse response and the headphone reverse characteristic impulse response but also the HRTF are acquired from the external device by the acquisition unit 131 and held.
  • the HRTF may not be acquired by the acquiring unit 131 but may be held in the acquiring unit 131 in advance.
  • the acquisition unit 131 supplies the held HRTF to the HRTF convolution unit 211.
  • the HRTF convolution unit 211 convolves the HRTF supplied from the acquisition unit 131 with the audio signal supplied from the speaker phase characteristic convolution unit 132, and supplies the obtained audio signal to the reproduction control unit 133.
  • the HRTF convolution unit 211 may be provided in the playback device 121 shown in FIG.
  • steps S131 and S132 are performed. However, since these processes are the same as the processes of steps S101 and S102 in FIG. 16, description thereof will be omitted.
  • step S133 the HRTF convolution unit 211 convolves the HRTF supplied from the acquisition unit 131 with the audio signal supplied from the speaker phase characteristic convolution unit 132, and supplies the resulting audio signal to the reproduction control unit 133. .
  • step S134 the reproduction control unit 133 supplies the audio signal supplied from the HRTF convolution unit 211 to the headphones 122 to reproduce the sound of the content, and the reproduction process ends.
  • the phase characteristic of the headphones 122 is canceled, and the phase characteristic of the speaker 91 and the transmission characteristic of the sound in the studio are added.
  • the reproducing apparatus 201 reproduces the sound of the content after convolving the headphone reverse characteristic impulse response, the speaker characteristic impulse response, and the HRTF into the audio signal.
  • the headphones 122 By doing so, even when the sound of the content is reproduced by the headphones 122, the desired phase characteristic and the transfer characteristic in a desired listening environment such as a studio are added, and the creator M11 listens in the studio. The listener can hear substantially the same sound as the sound of the content.
  • a generator that generates a target phase characteristic impulse response may be provided inside the playback device 121, the playback device 161, or the playback device 201.
  • the playback device 161 is configured as shown in FIG. In FIG. 19, parts corresponding to those in FIG. 15 are denoted by the same reference numerals, and description thereof will be omitted as appropriate.
  • 19 includes a generation unit 241, an acquisition unit 131, a headphone inverse characteristic convolution unit 171, a speaker phase characteristic convolution unit 132, and a reproduction control unit 133.
  • the configuration of the playback device 161 shown in FIG. 19 is such that the generation unit 241 is further provided in the playback device 161 shown in FIG.
  • the generation unit 241 corresponds to the impulse response generation device 11 or the impulse response generation device 51. That is, the generation unit 241 performs the same processing as the impulse response generation processing described with reference to FIGS. 9 and 11 to generate the headphone reverse characteristic impulse response and the speaker characteristic impulse response, and supplies the headphone inverse characteristic impulse response and the speaker characteristic impulse response to the acquisition unit 131.
  • phase characteristics of any speaker used for mastering in music production can be added to the sound source while the amplitude characteristics remain flat (flat).
  • the amplitude characteristics remain flat (flat).
  • the target speaker is unknown, if the impulse response of an arbitrary general IIR filter imitating the phase characteristic of the speaker is used as the above-described input impulse response, the obtained speaker characteristic impulse response is used.
  • a low-frequency phase characteristic equivalent to that of a speaker can be added without changing the amplitude characteristic.
  • the headphone phase characteristic particularly the reverse characteristic of the low-frequency phase characteristic
  • the headphone phase characteristic can be canceled.
  • the phase characteristic of the speaker especially the low frequency characteristic is added by the speaker characteristic impulse response, an effect closer to the low frequency sound quality effect in the mastering studio can be obtained.
  • an impulse response having the phase characteristic of the speaker may be used as an input impulse response. If the speaker used in the mastering studio cannot be specified, an impulse response such as an IIR type HPF that simulates the phase characteristic of the speaker may be used as the input impulse response.
  • the HRTF is convolved with the audio signal of the content, thereby improving the listening environment in the mastering studio.
  • Low-frequency phase characteristics can be simulated with headphones.
  • the above-described series of processing can be executed by hardware or can be executed by software.
  • a program constituting the software is installed in a computer.
  • the computer includes a computer incorporated in dedicated hardware, a general-purpose personal computer capable of executing various functions by installing various programs, and the like, for example.
  • FIG. 20 is a block diagram illustrating a configuration example of hardware of a computer that executes the series of processes described above by a program.
  • a CPU Central Processing Unit
  • ROM Read Only Memory
  • RAM Random Access Memory
  • the input / output interface 505 is further connected to the bus 504.
  • the input / output interface 505 is connected to an input unit 506, an output unit 507, a recording unit 508, a communication unit 509, and a drive 510.
  • the input unit 506 includes a keyboard, a mouse, a microphone, an image sensor, and the like.
  • the output unit 507 includes a display, a speaker, and the like.
  • the recording unit 508 includes a hard disk, a nonvolatile memory, and the like.
  • the communication unit 509 includes a network interface and the like.
  • the drive 510 drives a removable recording medium 511 such as a magnetic disk, an optical disk, a magneto-optical disk, or a semiconductor memory.
  • the CPU 501 loads, for example, a program recorded in the recording unit 508 to the RAM 503 via the input / output interface 505 and the bus 504 and executes the program. Is performed.
  • the program executed by the computer (CPU 501) can be provided by being recorded on a removable recording medium 511 as a package medium or the like, for example. Further, the program can be provided via a wired or wireless transmission medium such as a local area network, the Internet, or digital satellite broadcasting.
  • the program can be installed in the recording unit 508 via the input / output interface 505 by attaching the removable recording medium 511 to the drive 510. Further, the program can be received by the communication unit 509 via a wired or wireless transmission medium and installed in the recording unit 508. In addition, the program can be installed in the ROM 502 or the recording unit 508 in advance.
  • the program executed by the computer may be a program in which processing is performed in chronological order according to the order described in this specification, or may be performed in parallel or at a necessary timing such as when a call is made. It may be a program that performs processing.
  • Embodiments of the present technology are not limited to the above-described embodiments, and various modifications can be made without departing from the gist of the present technology.
  • the present technology can adopt a configuration of cloud computing in which one function is shared by a plurality of devices via a network and processed jointly.
  • each step described in the above-described flowchart can be executed by a single device, or can be shared and executed by a plurality of devices.
  • one step includes a plurality of processes
  • the plurality of processes included in the one step may be executed by one device or may be shared and executed by a plurality of devices.
  • the present technology may have the following configurations.
  • An acquisition unit whose amplitude characteristic is flat or substantially flat, and acquires an impulse response having a predetermined phase characteristic
  • a phase characteristic convolution unit for convolving the impulse response with an input audio signal.
  • the audio signal processing device (2) The audio signal processing device according to (1), wherein the predetermined phase characteristic is a phase characteristic of a predetermined speaker.
  • the audio signal processing device further including a reproduction control unit configured to control reproduction of a sound based on an audio signal obtained by convolution of the impulse response with a headphone.
  • the audio signal processing device according to (3) further including an inverse characteristic convolution unit that convolves an impulse response having an inverse characteristic of a phase characteristic of the headphones with the input audio signal.
  • the audio signal processing device according to any one of (1) to (4), further including an HRTF convolution unit that convolves an HRTF with the audio signal obtained by convolution by the phase characteristic convolution unit.
  • the audio signal processing device according to any one of (1) to (5), further including an impulse response generation unit that generates the impulse response.
  • Audio signal processing device The amplitude characteristic is flat or almost flat, and acquires an impulse response having a predetermined phase characteristic, An audio signal processing method for convolving the impulse response with an input audio signal.
  • the amplitude characteristic is flat or almost flat, and acquires an impulse response having a predetermined phase characteristic, A program for causing a computer to execute a process including a step of convolving the impulse response with an input audio signal.
  • An impulse response generation device that generates a target characteristic impulse response having a flat or substantially flat amplitude characteristic and a predetermined phase characteristic.
  • a zero padding processing unit that performs a zero padding process of adding 0 data to predetermined impulse information;
  • An impulse information FFT processing unit that performs an FFT on the impulse information to which the 0 data is added;
  • the zero padding processing unit adds the zero data to at least a front side of the impulse information in a time direction.
  • the impulse response generation device according to (10) or (11), further comprising a fade processing unit that performs a fade process on the impulse response obtained by the IFFT and sets the target characteristic impulse response.
  • the impulse response generation device according to any one of (10) to (12), wherein the impulse information is an impulse response having the predetermined phase characteristic.
  • the impulse information is a simple impulse, An impulse response FFT processing unit that performs FFT on the impulse response having the predetermined phase characteristic, A phase characteristic obtained by the FFT by the impulse information FFT processing unit, and an arithmetic processing unit that performs an operation based on the phase characteristic obtained by the FFT by the impulse response FFT processing unit.
  • the impulse response generation device according to any one of (10) to (12), wherein the IFFT processing unit performs the IFFT based on the phase characteristics obtained by the calculation and the flat amplitude characteristics.
  • the arithmetic processing unit performs, as the arithmetic operation, addition of a phase characteristic obtained by the FFT by the impulse information FFT processing unit and a phase characteristic obtained by the FFT by the impulse response FFT processing unit (14)
  • the arithmetic processing unit subtracts the phase characteristic obtained by the FFT by the impulse response FFT processing unit from the phase characteristic obtained by the FFT by the impulse information FFT processing unit as the calculation (14)
  • the impulse response generation device 1.
  • the impulse response generator is An impulse response generation method for generating a target characteristic impulse response having a flat or substantially flat amplitude characteristic and a predetermined phase characteristic.
  • a program for causing a computer to execute a process including a step of generating a target characteristic impulse response having a flat or substantially flat amplitude characteristic and a predetermined phase characteristic.
  • 11 impulse response generator ⁇ 21 ⁇ zero padding processing unit, ⁇ 22 ⁇ FFT processing unit, ⁇ 23 ⁇ IFFT processing unit, ⁇ 24 ⁇ fade processing unit, ⁇ 61 ⁇ FFT processing unit, ⁇ 62 ⁇ zero padding processing unit, ⁇ 63 ⁇ FFT processing unit, ⁇ 64 ⁇ arithmetic processing unit, ⁇ 121 ⁇ reproduction Device, ⁇ 131 ⁇ acquisition unit, ⁇ 132 ⁇ speaker phase characteristic convolution unit, ⁇ 133 ⁇ reproduction control unit, ⁇ 171 ⁇ headphone inverse characteristic convolution unit, ⁇ 211 ⁇ HRTF convolution unit, ⁇ 241 ⁇ generation unit

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Stereophonic System (AREA)

Abstract

本技術は、所望の位相特性を得ることができるようにするオーディオ信号処理装置および方法、インパルス応答生成装置および方法、並びにプログラムに関する。 オーディオ信号処理装置は、振幅特性がフラットまたは略フラットであり、かつ所定の位相特性を有するインパルス応答を取得する取得部と、入力オーディオ信号にインパルス応答を畳み込む位相特性畳み込み部とを備える。本技術はオーディオ信号処理装置およびインパルス応答生成装置に適用することができる。

Description

オーディオ信号処理装置および方法、インパルス応答生成装置および方法、並びにプログラム
 本技術は、オーディオ信号処理装置および方法、インパルス応答生成装置および方法、並びにプログラムに関し、特に、所望の位相特性を得ることができるようにしたオーディオ信号処理装置および方法、インパルス応答生成装置および方法、並びにプログラムに関する。
 例えば音楽などのオーディオ再生を行う場合に、オーディオ信号に対してフィルタ処理を行うことで、再生する音楽等に対してエフェクトなどの効果を施す技術が知られている。
 そのような技術として、例えば複数のフィルタを組み合わせることで、低音強調効果をもたらすようにオーディオ信号の振幅特性を変化させるものが提案されている(例えば、特許文献1参照)。
特開2002-171589号公報
 ところで、近年では音楽をスピーカではなくヘッドフォンで再生し、受聴するユーザが増えてきており、ヘッドフォンでのオーディオ再生が主流になりつつある。
 一方で、商用コンテンツは基本的にはスピーカでマスタリングされていることが殆どである。そのため、スピーカで再生を行いながらマスタリングした音楽等のコンテンツをヘッドフォンで再生してもスピーカで再生したときのような量感のある低音を聞くことができないという不満もあがっている。すなわち、コンテンツをヘッドフォンで再生すると、スピーカ再生のときとは低域の聞こえ方が異なり、本来作り手が伝えたい音質での再生を実現することができないことがあった。
 そこで出願人が調査したところ、低域の聞こえ方は位相の特性に大きく左右されることが分かった。すなわち、スピーカの低域の位相特性とヘッドフォンの低域の位相特性が大きく異なることに原因の一端があることが分かった。
 しかしながら上述した技術では、オーディオ信号の振幅特性を調整することはできるが、オーディオ信号の位相特性が所望の特性となるようにすることはできなかった。
 本技術は、このような状況に鑑みてなされたものであり、所望の位相特性を得ることができるようにするものである。
 本技術の第1の側面のオーディオ信号処理装置は、振幅特性がフラットまたは略フラットであり、かつ所定の位相特性を有するインパルス応答を取得する取得部と、入力オーディオ信号に前記インパルス応答を畳み込む位相特性畳み込み部とを備える。
 本技術の第1の側面のオーディオ信号処理方法またはプログラムは、振幅特性がフラットまたは略フラットであり、かつ所定の位相特性を有するインパルス応答を取得し、入力オーディオ信号に前記インパルス応答を畳み込むステップを含む。
 本技術の第1の側面においては、振幅特性がフラットまたは略フラットであり、かつ所定の位相特性を有するインパルス応答が取得され、入力オーディオ信号に前記インパルス応答が畳み込まれる。
 本技術の第2の側面のインパルス応答生成装置は、振幅特性がフラットまたは略フラットであり、かつ所定の位相特性を有する目標特性インパルス応答を生成する。
 本技術の第2の側面のインパルス応答生成方法またはプログラムは、振幅特性がフラットまたは略フラットであり、かつ所定の位相特性を有する目標特性インパルス応答を生成するステップを含む。
 本技術の第2の側面においては、振幅特性がフラットまたは略フラットであり、かつ所定の位相特性を有する目標特性インパルス応答が生成される。
 本技術の第1の側面および第2の側面によれば、所望の位相特性を得ることができる。
 なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載された何れかの効果であってもよい。
周波数特性とインパルス応答の関係について説明する図である。 インパルス応答の再構築について説明する図である。 再構築されたインパルス応答の周波数特性を示す図である。 インパルス応答の再構築について説明する図である。 再構築されたインパルス応答の周波数特性を示す図である。 インパルス応答の再構築について説明する図である。 再構築されたインパルス応答の周波数特性を示す図である。 インパルス応答生成装置の構成例を示す図である。 インパルス応答生成処理を説明するフローチャートである。 インパルス応答生成装置の構成例を示す図である。 インパルス応答生成処理を説明するフローチャートである。 コンテンツのマスタリングについて説明する図である。 再生装置の構成例を示す図である。 再生処理を説明するフローチャートである。 再生装置の構成例を示す図である。 再生処理を説明するフローチャートである。 再生装置の構成例を示す図である。 再生処理を説明するフローチャートである。 再生装置の構成例を示す図である。 コンピュータの構成例を示す図である。
 以下、図面を参照して、本技術を適用した実施の形態について説明する。
〈第1の実施の形態〉
〈本技術について〉
 本技術は、オーディオ信号の振幅特性(ゲイン特性)を変えずに位相特性だけを調整することができるようにするものである。
 すなわち、本技術は振幅特性がフラットまたは略フラットで、かつ所望の位相特性をもつインパルス応答を生成することで、オーディオ信号の振幅特性を維持したまま位相特性のみを調整し、所望の位相特性を得ることができるようにするものである。
 本技術では、目標とする位相特性を有するインパルス応答(インパルスレスポンス)に対してFFT(Fast Fourier Transform)およびIFFT(Inverse Fast Fourier Transform)を行うことで、振幅特性がフラットまたは略フラットで、かつ所望の位相特性をもつインパルス応答を得ることができる。ここで、振幅特性がフラットまたは略フラットとは、例えば振幅特性の各周波数における振幅(ゲイン)の値が1または略1であることである。
 具体的には、本技術では以下の手法A1または手法A2によって目標とするインパルス応答が生成される。
 すなわち、手法A1では、まず位相をシミュレートしたいインパルス応答の前に適当な長さの0データ(ゼロデータ)が挿入されてFFT(高速フーリエ変換)が行われる。
 このようなFFTによって振幅特性と位相特性が得られるが、この振幅特性がフラットとなるように振幅特性の各周波数における振幅(ゲイン)の値が1とされ、フラットとされた振幅特性と、FFTで得られた位相特性とに基づいてIFFT(高速フーリエ逆変換)が行われる。そして、IFFTで得られたインパルス応答の後段が適当な時定数でフェード処理され、目的とするインパルス応答とされる。
 このようにして得られたインパルス応答は、振幅特性を維持したまま位相特性のみを変化させるIIR(Infinite Impulse Response)フィルタとして機能する。したがって、このようなインパルス応答をオーディオ信号に畳み込むことで位相特性のみを調整することができる。
 また、手法A2では、位相をシミュレートしたいインパルス応答に対して0データの挿入を行わずにFFTが行われるとともに、単純インパルスに対して0データが挿入されてFFTが行われる。
 そして、インパルス応答に対するFFTで得られた位相特性と、0データが挿入された単純インパルスに対するFFTで得られた位相特性とが加算され、その結果得られた位相特性と、各周波数における振幅の値が1であるフラットな振幅特性とに基づいてIFFTが行われる。さらに、IFFTで得られたインパルス応答の後段が適当な時定数でフェードされ、目的とするインパルス応答とされる。
 手法A2においても手法A1における場合と同様の特性のインパルス応答を得ることができる。換言すれば、振幅特性を維持したまま位相特性のみを変化させるIIRフィルタを得ることができる。
 加えて手法A2ではインパルス応答に対するFFTで得られた位相特性と、0データが挿入された単純インパルスに対するFFTで得られた位相特性とを加算するのではなく減算すれば、もとのインパルス応答の位相特性と逆特性のインパルス応答を得ることができる。
 以上の手法A1や手法A2で得られたインパルス応答を用いれば、再生機器が異なる場合でも同じ音質の音を再生することが可能となる。
 具体例として、例えばスピーカで音を再生しながらマスタリングされたコンテンツがあり、そのコンテンツをヘッドフォンで再生するとする。
 そのような場合、コンテンツのオーディオ信号に対して、ヘッドフォンの位相特性とは逆特性のインパルス応答を畳み込むとともに、スピーカと同じ位相特性のインパルス応答を畳み込むことで、ヘッドフォンの位相特性をキャンセルし、スピーカの位相特性をシミュレートすることができる。すなわち、ヘッドフォンでコンテンツを再生する場合であっても、マスタリング時と同じ音質の音を再生することができる。
 それでは以下、本技術についてより詳細に説明する。
 例えばスピーカで音を再生しながらマスタリングされたコンテンツがあり、そのコンテンツをヘッドフォンで再生する場合について考える。
 この場合、ヘッドフォンでの再生時にコンテンツの音源、つまりコンテンツのオーディオ信号に対して、マスタリングに用いられたスピーカの低域の位相特性だけを付加することができれば、マスタリングスタジオで作り手が制作している音と略同じ音を体感できると想定される。
 一般的に、任意のコンテンツからマスタリングスタジオで用いられたスピーカを特定することは困難である。また、将来的にはコンテンツのメタデータ等から、マスタリングスタジオで用いられたスピーカを特定することも考えられるが、現状ではそのようなことは困難である。
 そこで、カットオフ周波数Fc=50HzであるIIR型のHPF(High Pass Filter)の特性がスピーカの特性に近いことから、そのようなHPFの特性を擬似スピーカ特性として考えることとする。
 例えばカットオフ周波数Fcが50HzであるIIR型のHPFの周波数特性、すなわち振幅特性(ゲイン特性)および位相特性と、そのHPFのインパルス応答との関係は図1に示すようになる。
 図1では、矢印Q11に示す部分はHPFの周波数特性のうちの振幅特性を示しており、矢印Q12に示す部分はHPFの周波数特性のうちの位相特性を示している。
 特に振幅特性における縦軸はゲイン(振幅)を示しており、横軸は周波数を示している。また位相特性における縦軸は位相を示しており、横軸は周波数を示している。この周波数特性から、HPFの低域側ではゲインが小さく位相が正の値となっていることが分かる。
 これに対して、矢印Q13に示す部分にはHPFのインパルス応答が示されている。インパルス応答の縦軸は振幅を示しており、横軸は時間、すなわち時間サンプル(サンプル)を示している。なお、ここではHPFのインパルス応答は、0サンプル目付近を拡大したものとなっている。
 このようなインパルス応答はIIR型フィルタとして用いることができ、矢印Q13に示すインパルス応答をオーディオ信号に畳み込むことで、オーディオ信号に対してHPFのフィルタ処理を施すことができる。
 さらに、HPFの周波数特性、すなわち振幅特性および位相特性と、HPFのインパルス応答とは変換誤差はあるものの可逆の関係となっている。
 具体的には、矢印Q11に示す振幅特性および矢印Q12に示す位相特性からなる周波数特性に対してIFFTを行うと、理想的には矢印Q13に示すインパルス応答が得られる。これに対し、矢印Q13に示すインパルス応答に対してFFTを行うと、理想的には矢印Q11に示す振幅特性および矢印Q12に示す位相特性からなる周波数特性が得られる。
 このようなHPFのインパルス応答を、上述のスピーカで音を再生しながらマスタリングされたコンテンツのオーディオ信号に畳み込めば、コンテンツの音にスピーカと同様の位相特性を付加することはできるが、低域のゲイン(振幅)が低下してしまう。
 そこで、矢印Q13に示すインパルス応答に対して実際にFFTを行い、その結果得られた周波数特性について、振幅特性の全周波数の振幅(ゲイン)を1としてフラットな振幅特性とし、さらにIFFTを行ってインパルス応答を再構築することを考える。
 このとき、再構築により得ようとするインパルス応答は、振幅特性を変化させずに図1に示した位相特性のみをオーディオ信号に対して付加するインパルス応答、つまり振幅特性を変化させずに所望の位相特性のみを付加するインパルス応答とされる。
 そうすれば、再構築により得られたインパルス応答を、上述のスピーカで音を再生しながらマスタリングされたコンテンツのオーディオ信号に畳み込むことで、振幅特性を変化させずに目標とするスピーカの位相特性をコンテンツの音に付加することができる。これにより、マスタリングスタジオで作り手が制作している音と略同じ音を受聴者(ユーザ)に体感させることができるようになる。
 なお、以下では、振幅特性を変化させずに所望の位相特性を付加するフィルタとして機能するインパルス応答を、特に目標位相特性インパルス応答とも称することとする。
 インパルス応答の再構築により目標位相特性インパルス応答を得ようとする場合、例えば図2に示すように再構築を行うことが考えられる。
 図2では、矢印Q21に示す部分には、図1の矢印Q13に示したインパルス応答が示されている。
 このインパルス応答は略1024サンプルで収束している。しかし、ここでは変換後の語調を考えて、矢印Q22に示すようにインパルス応答における時間方向の後ろ側、すなわち未来側に0詰め処理を行って4096処理を行うようにする。
 すなわち、インパルス応答の時間方向の後ろ側(末尾)に対して、サンプル値が0であるサンプルである0データを付加する0詰め処理を行って、インパルス応答全体の長さ(サンプル数)が4096サンプルとなるようにする。
 このようにして0詰め処理されたインパルス応答に対して矢印Q23に示すようにFFTを行うと、図1に示したものと同様の振幅特性および位相特性が得られる。
 ここで、目標とする目標位相特性インパルス応答は、振幅特性がフラットまたは略フラットなものであり、位相特性は矢印Q12に示した位相特性である。
 そのため、FFTで得られた振幅特性における各周波数の振幅(ゲイン)の値が「1」に調整される。換言すればフラットな振幅特性となるように、FFTで得られた振幅特性の振幅が調整される。
 また、FFTで得られた位相特性は、目標とする矢印Q12に示した位相特性となっているはずであるので、FFTで得られた位相特性に対しては特に位相調整は行われない。
 次に、矢印Q24に示すように、振幅調整により得られたフラットな振幅特性と、FFTで得られた位相特性とからなる周波数特性に対してIFFTが行われる。
 さらに、IFFTにより得られたインパルス応答は0に収束しないので、IFFTにより得られたインパルス応答に対して、そのインパルス応答の時間方向の後ろ側(末尾側)をフェードアウトさせて0に収束させるフェード処理が行われる。
 このようなフェード処理によりインパルス応答が再構築され、その結果、矢印Q25に示す目標位相特性インパルス応答が得られる。ここでは、長さが4096サンプルであるインパルス応答が目標位相特性インパルス応答として得られている。
 矢印Q25に示す目標位相特性インパルス応答は、理想的にはフラットまたは略フラットな振幅特性を有し、かつもとのHPFと同じ位相特性を有しているはずである。
 ところが、実際にはFFTやIFFTといった変換において変換ひずみが生じるため、矢印Q25に示した目標位相特性インパルス応答の周波数特性は、図3に示すようになる。
 図3では、矢印Q31に示す部分は振幅特性を示しており、矢印Q32に示す部分は位相特性を示している。なお、振幅特性における縦軸はゲイン(振幅)を示しており、横軸は周波数を示している。また位相特性における縦軸は位相を示しており、横軸は周波数を示している。
 矢印Q31に示す部分では、曲線L11は図2の矢印Q25に示した目標位相特性インパルス応答の振幅特性を示しており、曲線L12は図2の矢印Q21に示したもとのHPFの振幅特性を示している。曲線L11から、目標位相特性インパルス応答の振幅特性では、もとのHPFほどではないが低域部分、すなわち矢印W11に示す部分のゲインが低下しており、フラットな振幅特性とはなっていないことが分かる。
 また、矢印Q32に示す部分では、曲線L13は図2の矢印Q25に示した目標位相特性インパルス応答の位相特性を示しており、曲線L14は図2の矢印Q21に示したもとのHPFの位相特性、つまり目標とする位相特性を示している。
 この例では、曲線L13は曲線L14と略同じとなっており、目標位相特性インパルス応答では位相特性に関しては目標とする特性が得られていることが分かる。
 ところで、一般的に目標位相特性インパルス応答とは逆の場合、すなわち位相特性がフラット(直線)で、振幅(ゲイン)が変化する場合には、基本的にインパルス応答は左右対称の形状となることが知られている。
 そこで、本出願人はパルスが立ち上がっている部分を中心としてインパルス応答が略左右対称となるように0詰め処理を行い、パルスが立ち上がっている部分の前後が同じ長さの区間となるようにすれば、フラットな振幅特性のインパルス応答を得ることができるのではないかと考えた。
 ここで、もとのHPFのインパルス応答に対して、少なくとも時間方向の前側(過去側)に0詰め処理を行い、インパルス応答が略左右対称の形状となるようにしてからFFTおよびIFFTを行って目標位相特性インパルス応答を生成することを考える。
 そのような場合、例えば図4に示すようにインパルス応答の再構築が行われ、目標位相特性インパルス応答が生成される。
 図4では、矢印Q41に示す部分には、図1の矢印Q13に示したHPFのインパルス応答が示されており、このインパルス応答は略1024サンプルで収束している。
 この例では、矢印Q41に示すHPFのインパルス応答に対して矢印Q42に示すように0詰め処理が行われる。
 すなわち、インパルス応答の長さに合わせて、インパルス応答における時間方向の後ろ側(末尾側)だけでなく、前側(先頭側)にも0データが付加されている。
 特に、ここではインパルス応答における時間方向の前側に8192サンプル分だけ0データが付加されるとともに、インパルス長自体も長さが8192サンプルとなるようにインパルス応答における時間方向の後ろ側にも0データが付加されている。このような0詰め処理により、矢印Q42に示すインパルス応答は略左右対称の形状となっており、全体の長さが16384サンプルとなっている。
 次に、矢印Q43に示すように、0詰め処理されたインパルス応答に対してFFTを行うと、図2の矢印Q23における場合と同様に振幅特性および位相特性が得られる。
 この例においても目標とする目標位相特性インパルス応答の振幅特性はフラットなものであるので、FFTで得られた振幅特性における各周波数の振幅(ゲイン)の値が「1」に調整され、フラットな振幅特性とされる。
 また、FFTで得られた位相特性は、目標とする位相特性となっているはずであるので、FFTで得られた位相特性に対しては特に位相調整は行われない。
 続いて矢印Q44に示すように振幅調整により得られたフラットな振幅特性と、FFTで得られた位相特性とからなる周波数特性に対してIFFTが行われ、その結果得られたインパルス応答に対して図2の矢印Q24における場合と同様にフェード処理が行われる。
 そして、フェード処理により得られたインパルス応答が目標位相特性インパルス応答とされる。ここでは、矢印Q45に示す目標位相特性インパルス応答が得られており、この目標位相特性インパルス応答は左右対称に近い形状となっている。また、目標位相特性インパルス応答の長さは16384サンプルとなっている。
 このようにして得られた矢印Q45に示す目標位相特性インパルス応答の周波数特性は、図5に示すようになる。
 図5では、矢印Q51に示す部分は振幅特性を示しており、矢印Q52に示す部分は位相特性を示している。なお、振幅特性における縦軸はゲイン(振幅)を示しており、横軸は周波数を示している。また位相特性における縦軸は位相を示しており、横軸は周波数を示している。
 矢印Q51に示す部分では、曲線L31は図4の矢印Q45に示した目標位相特性インパルス応答の振幅特性を示しており、曲線L32は図4の矢印Q41に示したもとのHPFの振幅特性を示している。
 曲線L31に示される目標位相特性インパルス応答の振幅特性は、各周波数における振幅(ゲイン)の値が±0.2dB以内の範囲におさまっており、略フラットな特性が得られていることが分かる。すなわち、目標とする振幅特性が得られていることが分かる。
 また、矢印Q52に示す部分では、曲線L33は図4の矢印Q45に示した目標位相特性インパルス応答の位相特性を示しており、曲線L34は図4の矢印Q41に示したもとのHPFの位相特性、つまり目標とする位相特性を示している。さらに曲線L35は8192サンプルだけディレイ(遅延)させた単純インパルスの位相特性、つまり直線位相を示している。
 ここでは、曲線L33と曲線L34とは殆ど重なっており、目標位相特性インパルス応答の位相特性として目標とする特性と略同等な特性が得られていることが分かる。
 また、曲線L35は比較のために示されているものである。曲線L35は直線位相である単純インパルスの位相特性を示しているので、各周波数における曲線L33と曲線L35との差が図1の矢印Q12に示した位相特性の各周波数における位相の値となっていれば、目標位相特性インパルス応答の位相特性として目標とする特性が得られていることになる。なお、図4の矢印Q41に示したもとのHPFの位相特性は、図1の矢印Q12に示した位相特性と同じである。
 この例では、曲線L33と曲線L35とを比較すると、それらの位相の差分は周波数が高くなるにつれて小さくなっている。そのため、曲線L33と曲線L35からも、目標位相特性インパルス応答の位相特性として図1の矢印Q12に示した位相特性と略同じ特性が得られていることが分かる。
 以上のことから、目標とする位相特性を有するインパルス応答に対して少なくとも時間方向の前側に0詰め処理を行い、0詰め処理されたインパルス応答に対してFFT、IFFT、およびフェード処理を行うことで、振幅特性がフラットまたは略フラットであり、かつ目標とする位相特性を有する目標位相特性インパルス応答を得ることができることが分かる。
 以上のような図4を参照して説明した目標位相特性インパルス応答の生成手法が上述した手法A1である。
 なお、目標位相特性インパルス応答の生成にあたっては、0詰め処理されたインパルス応答の長さを長くするほど、つまりサンプル数を多くするほど目標位相特性インパルス応答の周波数特性は目標とする特性に近くなる。すなわち、よりよい特性が得られるようになる。特に0詰め処理されたインパルス応答の長さが無限サンプルとなると、目標位相特性インパルス応答の周波数特性と、目標とする特性との誤差は限りなく0に近くなる。
 また、目標位相特性インパルス応答を生成する場合、目標とする特性との誤差をある程度許容してでも処理量を削減したいこともある。例えば目標位相特性インパルス応答の長さを短くすれば、生成時においても生成後の畳み込み時においても処理量は少なくなる。
 そのような場合、例えば図6に示すように0詰め処理においてインパルス応答に付加する0データの数を少なくすることで処理量を削減しつつ十分な特性の目標位相特性インパルス応答が得られるようにしてもよい。
 図6では、矢印Q61に示す部分には、図1の矢印Q13に示したHPFのインパルス応答が示されており、このインパルス応答は略1024サンプルで収束している。
 この例では、矢印Q61に示すHPFのインパルス応答に対して矢印Q62に示すように0詰め処理が行われる。
 ここでは、インパルス応答における時間方向の前側に384サンプル分だけ0データが付加されるとともに、インパルス応答全体の長さが4096サンプルとなるようにインパルス応答における時間方向の後ろ側にも0データが付加されている。
 この0詰め処理では、インパルス応答における時間方向の前側に付加する0データの数が少ないため、矢印Q62に示す0詰め処理後のインパルス応答は、左右対称の形状とはなっていない。
 次に、矢印Q63に示すように、0詰め処理されたインパルス応答に対してFFTを行うと、図2の矢印Q23における場合と同様に振幅特性および位相特性が得られる。
 この例においても図4における場合と同様にFFTで得られた振幅特性における各周波数の振幅(ゲイン)の値が「1」に調整されてフラットな振幅特性とされ、FFTで得られた位相特性に対しては特に位相調整は行われない。
 続いて矢印Q64に示すように振幅調整により得られたフラットな振幅特性と、FFTで得られた位相特性とからなる周波数特性に対してIFFTが行われ、その結果得られたインパルス応答に対して図2の矢印Q24における場合と同様にフェード処理が行われる。
 そして、フェード処理により得られたインパルス応答が目標位相特性インパルス応答とされる。ここでは、矢印Q65に示す目標位相特性インパルス応答が得られており、目標位相特性インパルス応答の長さは4096サンプルとなっている。
 なお、この例ではインパルス応答における時間方向の前側に付加する0データの数が少ないため、矢印Q65に示す目標位相特性インパルス応答は、左右対称な形状とはなっていない。
 このようにして得られた矢印Q65に示す目標位相特性インパルス応答の周波数特性は、図7に示すようになる。
 図7では、矢印Q71に示す部分は振幅特性を示しており、矢印Q72に示す部分は位相特性を示している。なお、振幅特性における縦軸はゲイン(振幅)を示しており、横軸は周波数を示している。また位相特性における縦軸は位相を示しており、横軸は周波数を示している。
 矢印Q71に示す部分では、曲線L51は図6の矢印Q65に示した目標位相特性インパルス応答の振幅特性を示しており、曲線L52は図6の矢印Q61に示したもとのHPFの振幅特性を示している。
 曲線L51に示される目標位相特性インパルス応答の振幅特性は、各周波数における振幅(ゲイン)の値が±1dB以内の範囲におさまっており、略フラットな特性が得られていることが分かる。すなわち、十分な振幅特性が得られていることが分かる。
 特に、ここでは曲線L51に示される振幅特性は、図5の曲線L31に示した振幅特性と比較すると目標とする特性からの誤差が大きくなっているが、その誤差は十分に小さい範囲におさまっていることが分かる。
 また、矢印Q72に示す部分では、曲線L53は図6の矢印Q65に示した目標位相特性インパルス応答の位相特性を示しており、曲線L54は図6の矢印Q61に示したもとのHPFの位相特性、つまり目標とする位相特性を示している。さらに曲線L55は図5の曲線L35と同様に、ディレイ(遅延)させた単純インパルスの位相特性を示している。
 ここでは、曲線L53と曲線L54とは、図5における場合よりは誤差が大きいものの殆ど重なっており、目標位相特性インパルス応答の位相特性として目標とする特性と略同等な特性が得られていることが分かる。
 また、曲線L53と曲線L55とを比較すると、それらの位相の差分は周波数が高くなるにつれて小さくなっており、図5における場合と同様に、目標位相特性インパルス応答の位相特性として図1の矢印Q12に示した位相特性と略同じ特性が得られていることが分かる。
 以上のように目標とする位相特性を有するインパルス応答の時間方向の前側に付加する0データの数をある程度少なくしても、振幅特性がフラットまたは略フラットであり、かつ目標とする位相特性を有する目標位相特性インパルス応答を得ることができる。
 なお、インパルス応答の時間方向の前側にどれだけ0データを付加するかは、目標とする特性との許容誤差と、処理量とのトレードオフとなるので、付加する0データの数は必要に応じて調整すればよい。
 また、目標とする位相特性を有するインパルス応答に0詰め処理を行うのではなく、例えば図5の曲線L35に示したような単純インパルスに対して0詰め処理を行って目標位相特性インパルス応答を生成してもよい。このような目標位相特性インパルス応答の生成手法が上述した手法A2である。
 手法A2では、単純インパルスの時間方向の前側に対して0データを付加する0詰め処理が行われ、0詰め処理後の単純インパルスに対してFFTが行われる。
 なお、以下では、0詰め処理後の単純インパルスに対するFFTにより得られた周波数特性の位相特性を、特に単純インパルスの位相特性とも称することとする。
 また、手法A2では目標とする位相特性を有するインパルス応答に対しては0詰め処理は行われず、インパルス応答に対してそのままFFTが行われる。以下では、目標とする位相特性を有するインパルス応答に対するFFTにより得られた周波数特性の位相特性を、特に目標位相特性とも称することとする。
 このようにしてFFTにより単純インパルスの位相特性と、目標位相特性とが得られると、それらの単純インパルスの位相特性と目標位相特性とが加算され、加算により得られた位相特性と、フラットな振幅特性とからなる周波数特性に対してIFFTが行われる。
 そして、IFFTにより得られたインパルス応答に対してフェード処理が行われ、その結果得られたインパルス応答が目標位相特性インパルス応答とされる。
 このようにして得られた目標位相特性インパルス応答は、振幅特性がフラットまたは略フラットであり、かつ目標とする位相特性を有するインパルス応答である。
 なお、手法A2では、単純インパルスの位相特性と目標位相特性とを加算するのではなく、単純インパルスの位相特性から目標位相特性を減算すれば、目標位相特性の逆特性を有するインパルス応答を目標位相特性インパルス応答として得ることができる。
 具体的には、例えば所定のHPFのインパルス応答に対して0詰め処理を行わずにFFTを行って得られた位相特性を、単純インパルスの位相特性から減算し、その結果得られた位相特性と、フラットな振幅特性とからなる周波数特性に対してIFFTが行われる。そして、IFFTにより得られたインパルス応答に対してフェード処理が行われ、その結果得られたインパルス応答が目標位相特性インパルス応答とされる。
 この場合、得られた目標位相特性インパルス応答の位相特性は、もとのHPFの位相特性の逆特性となる。
 上述したように手法A1では目標とする位相特性を有するインパルス応答に0詰め処理を行って、その後FFT、IFFT、およびフェード処理を行って目標位相特性インパルス応答を生成している。これに対して、手法A2では単純インパルスに0詰め処理を行って、その後FFT、IFFT、およびフェード処理を行い、目標位相特性インパルス応答を生成している。
 手法A1で用いるインパルス応答と、手法A2で用いる単純インパルスとは、ともにインパルス情報、すなわちインパルスに関する情報である。したがって、手法A1と手法A2を一般化すると、インパルス情報に対して0詰め処理が行われ、その結果得られた位相特性に対してFFT、IFFT、およびフェード処理が行われて、目標位相特性インパルス応答が生成されているということができる。
 以上のようにして得られる目標位相特性インパルス応答を用いれば、オーディオ信号に対して振幅特性は変化させずに所望の位相特性を付加することができる。
 具体例として、例えばマスタリング用のスピーカで音を再生しながらマスタリングされたコンテンツがあり、そのコンテンツを再生側のヘッドフォンまたはスピーカで再生する場合について考える。
 この場合、再生側のヘッドフォンまたはスピーカの位相特性と逆特性を有する目標位相特性インパルス応答をコンテンツのオーディオ信号に畳み込むことで、コンテンツのオーディオ信号について再生側のヘッドフォンまたはスピーカの位相特性をキャンセルすることができる。ここでは再生側のヘッドフォンまたはスピーカの位相特性がキャンセルされたオーディオ信号を補正オーディオ信号と称することとする。
 なお、再生側のヘッドフォンまたはスピーカの位相特性と逆特性を有する目標位相特性インパルス応答は、上述した手法A2により生成してもよいし手法A1により生成してもよい。例えばそのような目標位相特性インパルス応答を手法A1により生成する場合には、再生側のヘッドフォンまたはスピーカの位相特性と逆特性を有するインパルス応答に0詰め処理を行ってFFT、IFFT、およびフェード処理を行えばよい。
 さらに、マスタリング用のスピーカの位相特性と同じ特性を有する目標位相特性インパルス応答を補正オーディオ信号に畳み込むことで、補正オーディオ信号に対して、すなわちコンテンツの音に対してマスタリング用のスピーカの位相特性を付加することができる。
 したがって、このようにしてマスタリング用のスピーカの位相特性が付加された補正オーディオ信号に基づいてコンテンツの音を再生すれば、マスタリングスタジオで作り手が制作している音と略同じ音を受聴者(ユーザ)に体感させることができる。
 加えて、例えば再生側において受聴者がヘッドフォンでコンテンツの音を再生する場合には、頭部伝達特性、すなわち頭部伝達関数(HRTF(Head Related Transfer Function))を用いれば、マスタリングスタジオで作り手が制作している音により近い音を提示することが可能となる。
 ここで、HRTFは音源から受聴者の耳まで、より詳細には受聴者の鼓膜近傍または外耳道入口までの音の伝達特性を示す関数である。
 この例では、マスタリング用のスピーカの位相特性が付加された補正オーディオ信号に、さらにHRTFを畳み込むことで、マスタリングスタジオで作り手が制作しているときに受聴した音により近い音を受聴者に体感させることができる。
〈インパルス応答生成装置の構成例〉
 続いて、以上において説明した目標位相特性インパルス応答を生成するインパルス応答生成装置の具体的な構成と動作について説明する。
 図8は、上述した手法A1により目標位相特性インパルス応答、すなわち振幅特性がフラットまたは略フラットであり、かつ所望の位相特性を有するインパルス応答を生成するインパルス応答生成装置の構成例を示す図である。
 図8に示すインパルス応答生成装置11は0詰め処理部21、FFT処理部22、IFFT処理部23、およびフェード処理部24を有している。
 0詰め処理部21には、目標位相特性インパルス応答の生成に用いられる、目標とする位相特性を有するインパルス応答が供給される。以下では、このような目標とする位相特性を有するインパルス応答を入力インパルス応答と称することとする。
 0詰め処理部21は、供給された入力インパルス応答に対して0詰め処理を行い、FFT処理部22に供給する。
 FFT処理部22は、0詰め処理部21から供給された0詰め処理後の入力インパルス応答に対してFFTを行い、その結果得られた周波数特性のうちの位相特性をIFFT処理部23に供給する。
 IFFT処理部23には、外部から各周波数のゲイン(振幅)が「1」であるフラットな振幅特性(ゲイン特性)が供給される。
 IFFT処理部23は、外部から供給されたフラットな振幅特性と、FFT処理部22から供給された位相特性とからなる周波数特性に対してIFFTを行い、その結果得られたインパルス応答をフェード処理部24に供給する。換言すれば、フラットな振幅特性と、FFT処理部22から供給された位相特性とに基づいてIFFTが行われ、インパルス応答が生成される。
 なお、IFFT処理部23では外部から供給されたフラットな振幅特性を用いるのではなく、FFT処理部22でのFFTで得られた周波数特性の振幅特性に対してゲイン調整を行うことでフラットな振幅特性を生成し、その振幅特性をIFFTに用いるようにしてもよい。
 フェード処理部24は、IFFT処理部23から供給されたインパルス応答に対してフェード処理を行い、その結果得られたインパルス応答を目標位相特性インパルス応答として出力する。
〈インパルス応答生成処理の説明〉
 次に、インパルス応答生成装置11の動作について説明する。
 すなわち、以下、図9のフローチャートを参照して、インパルス応答生成装置11により行われるインパルス応答生成処理について説明する。
 ステップS11において0詰め処理部21は、供給された入力インパルス応答に対して0詰め処理を行い、FFT処理部22に供給する。
 例えばステップS11では、図4や図6を参照して説明したように、入力インパルス応答における時間方向の後ろ側や前側に0データを付加する0詰め処理が行われる。0詰め処理では、少なくとも入力インパルス応答における時間方向の前側に0データが付加されるようにされる。
 ステップS12においてFFT処理部22は、0詰め処理部21から供給された0詰め処理後の入力インパルス応答に対してFFTを行い、その結果得られた周波数特性のうちの位相特性をIFFT処理部23に供給する。
 ステップS13においてIFFT処理部23は、外部から供給されたフラットな振幅特性と、FFT処理部22から供給された位相特性とからなる周波数特性に対してIFFTを行い、その結果得られたインパルス応答をフェード処理部24に供給する。
 ステップS14においてフェード処理部24は、IFFT処理部23から供給されたインパルス応答に対してフェード処理を行い、その結果得られたインパルス応答を目標位相特性インパルス応答として出力する。
 例えばフェード処理では、IFFT処理部23から供給されたインパルス応答の時間方向の後ろ側(末尾側)をフェードアウトさせて0に収束させることで、目標位相特性インパルス応答が生成される。なお、IFFTにより得られたインパルス応答が0に収束していれば、特にフェード処理は不要である。
 また、入力インパルス応答として、例えばヘッドフォンの位相特性の逆特性を有するインパルス応答を用いれば、目標位相特性インパルス応答としてヘッドフォンの位相特性をキャンセルする、つまりヘッドフォンの位相特性の逆特性のインパルス応答を得ることができる。
 このようにして目標位相特性インパルス応答が生成されると、インパルス応答生成処理は終了する。
 以上のようにしてインパルス応答生成装置11は、少なくとも入力インパルス応答における時間方向の前側に0データを付加する0詰め処理を行い、0詰め処理された入力インパルス応答に対してFFT、IFFT、およびフェード処理を行うことで目標位相特性インパルス応答を生成する。
 このようにすることで、振幅特性を変化させずに目標とする位相特性を付加することが可能なフィルタとして機能する目標位相特性インパルス応答を得ることができる。これにより、目標位相特性インパルス応答を用いて、振幅特性を変化させずに所望の位相特性を得ることができるようになる。
〈第2の実施の形態〉
〈インパルス応答生成装置の構成例〉
 また、上述した手法A2により目標位相特性インパルス応答を生成する場合、インパルス応答生成装置は例えば図10に示すように構成される。なお、図10において図8における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。
 図10に示すインパルス応答生成装置51はFFT処理部61、0詰め処理部62、FFT処理部63、演算処理部64、IFFT処理部23、およびフェード処理部24を有している。このインパルス応答生成装置51の構成は、インパルス応答生成装置11における0詰め処理部21およびFFT処理部22に代えてFFT処理部61乃至演算処理部64を設けた構成となっている。
 FFT処理部61には、目標位相特性インパルス応答の生成に用いられる、目標とする位相特性を有するインパルス応答、すなわち入力インパルス応答が供給される。
 FFT処理部61は、供給された入力インパルス応答に対してFFTを行い、その結果得られた周波数特性のうちの位相特性を演算処理部64に供給する。なお、目標とする位相特性自体を得ることができ、その目標とする位相特性を演算処理部64に供給することができれば、特にFFT処理部61は設けられる必要はない。
 0詰め処理部62には、目標位相特性インパルス応答の生成に用いられる単純インパルスが供給される。0詰め処理部62は、供給された単純インパルスに対して0詰め処理を行い、FFT処理部63に供給する。
 FFT処理部63は、0詰め処理部62から供給された0詰め処理後の単純インパルスに対してFFTを行い、その結果得られた周波数特性のうちの位相特性を演算処理部64に供給する。
 演算処理部64は、FFT処理部61から供給された位相特性と、FFT処理部63から供給された位相特性とに基づく演算処理を行い、その結果得られた位相特性をIFFT処理部23に供給する。ここでは演算処理として、加算処理または減算処理が行われる。
〈インパルス応答生成処理の説明〉
 次に、インパルス応答生成装置51の動作について説明する。
 すなわち、以下、図11のフローチャートを参照して、インパルス応答生成装置51により行われるインパルス応答生成処理について説明する。
 ステップS41においてFFT処理部61は、供給された入力インパルス応答に対してFFTを行い、その結果得られた周波数特性のうちの位相特性を演算処理部64に供給する。
 ステップS42において0詰め処理部62は、供給された単純インパルスに対して0詰め処理を行い、FFT処理部63に供給する。0詰め処理では、単純インパルスにおける時間方向の前側に0データが付加され、適切に単純インパルスがディレイされる。
 ステップS43においてFFT処理部63は、0詰め処理部62から供給された0詰め処理後の単純インパルスに対してFFTを行い、その結果得られた周波数特性のうちの位相特性を演算処理部64に供給する。
 ステップS44において演算処理部64は、FFT処理部61から供給された位相特性と、FFT処理部63から供給された位相特性とに基づく演算処理を行い、その結果得られた位相特性をIFFT処理部23に供給する。
 例えば演算処理部64は、目標位相特性インパルス応答の位相特性として、入力インパルス応答が有する位相特性と同じ特性を得ようとする場合には、FFT処理部61から供給された入力インパルス応答の位相特性と、FFT処理部63から供給された、0詰め処理後の単純インパルスの位相特性とを加算し、その結果得られた位相特性をIFFT処理部23に供給する。
 これに対して演算処理部64は、目標位相特性インパルス応答の位相特性として、入力インパルス応答が有する位相特性の逆特性を得ようとする場合には、FFT処理部61から供給された入力インパルス応答の位相特性を、FFT処理部63から供給された、0詰め処理後の単純インパルスの位相特性から減算し、その結果得られた位相特性をIFFT処理部23に供給する。
 このように位相特性に対する演算処理として加算または減算が行われると、その後、ステップS45およびステップS46の処理が行われてインパルス応答生成処理は終了するが、これらの処理は図9のステップS13およびステップS14の処理と同様であるので、その説明は省略する。
 以上のようにしてインパルス応答生成装置51は、単純インパルスにおける時間方向の前側に0データを付加する0詰め処理を行い、0詰め処理された単純インパルス応答と、入力インパルス応答とに基づいて目標位相特性インパルス応答を生成する。
 このようにすることで、振幅特性を変化させずに目標とする位相特性を付加することが可能なフィルタとして機能する目標位相特性インパルス応答を得ることができる。これにより、目標位相特性インパルス応答を用いて、振幅特性を変化させずに所望の位相特性を得ることができるようになる。
〈第3の実施の形態〉
〈再生装置の構成例〉
 ここで、以上において説明したインパルス応答生成装置11やインパルス応答生成装置51で生成された目標位相特性インパルス応答を用いて、コンテンツの再生を行う再生装置について説明する。
 以下では、説明を具体的にするため、再生対象となるコンテンツは、図12に示すように所定のスタジオでマスタリングされたものとする。
 図12に示す例では、スタジオ内にはマスタリングを行う制作者M11がおり、制作者M11は、スタジオ内に配置されたスピーカ91でコンテンツの音を再生しながら、コンテンツの各帯域の振幅調整等をマスタリングの作業として行う。
 また、マスタリングにより得られたコンテンツのオーディオ信号が、受聴者が所持する再生装置等からなる再生システムで再生される。なお、コンテンツの音の再生には、ヘッドフォンやスピーカ、イヤフォンなど、どのようなものが用いられてもよいが、以下では具体的な例としてヘッドフォンが用いられるものとして説明を続ける。
 コンテンツの再生に用いる再生装置は、例えば図13に示すように構成される。
 図13に示す例では、再生装置121は少なくとも音声コンテンツの再生制御が可能なポータブルプレーヤやスマートフォン、パーソナルコンピュータなどからなり、再生装置121にはヘッドフォン122が接続されている。
 再生装置121は、取得部131、スピーカ位相特性畳み込み部132、および再生制御部133を有している。
 再生装置121では、制作者M11によるマスタリングによって得られたコンテンツのオーディオ信号がスピーカ位相特性畳み込み部132に供給される。
 取得部131は、任意のタイミングで目標位相特性インパルス応答をインパルス応答生成装置11やインパルス応答生成装置51などの外部の装置から取得し、保持している。また、取得部131は保持している目標位相特性インパルス応答をスピーカ位相特性畳み込み部132に供給する。
 取得部131により取得される目標位相特性インパルス応答は、マスタリングに用いられたスピーカ91の位相特性を有する入力インパルス応答が用いられて、インパルス応答生成装置11またはインパルス応答生成装置51により生成されたものである。すなわち、目標位相特性インパルス応答は、スピーカ91の位相特性と同じ位相特性を有するインパルス応答である。
 なお、目標位相特性インパルス応答は取得部131により任意のタイミングで取得されるのではなく、予め取得部131に保持されているようにしてもよい。
 また、以下では、スピーカ91の位相特性と同じ位相特性を有する目標位相特性インパルス応答を、特にスピーカ特性インパルス応答とも称することとする。
 スピーカ位相特性畳み込み部132は、供給されたオーディオ信号に対して、取得部131から供給されたスピーカ特性インパルス応答を畳み込み、その結果得られたオーディオ信号を再生制御部133に供給する。
 再生制御部133は、スピーカ位相特性畳み込み部132から供給されたオーディオ信号をヘッドフォン122に供給し、コンテンツの音を再生させる。換言すれば、再生制御部133はヘッドフォン122でのコンテンツの音の再生を制御する。
 ヘッドフォン122は、再生制御部133から供給されたオーディオ信号に基づいてコンテンツの音を再生する。
 なお、ここでは再生装置121にヘッドフォン122が設けられていない構成とされているが、ヘッドフォン122が再生装置121に設けられているようにしてもよいし、ヘッドフォン122内部に取得部131乃至再生制御部133が設けられているようにしてもよい。
〈再生処理の説明〉
 続いて、再生装置121の動作について説明する。すなわち、以下、図14のフローチャートを参照して再生装置121による再生処理について説明する。なお、この再生処理が開始されるタイミングでは、スピーカ特性インパルス応答が既に取得部131により取得されている。
 ステップS71においてスピーカ位相特性畳み込み部132は、供給されたオーディオ信号に対して、取得部131から供給されたスピーカ特性インパルス応答を畳み込み、その結果得られたオーディオ信号を再生制御部133に供給する。
 これにより、オーディオ信号に基づくコンテンツの音に対して、スピーカ特性インパルス応答の位相特性、つまりスピーカ91の位相特性を付加することができる。
 ステップS72において再生制御部133は、スピーカ位相特性畳み込み部132から供給されたオーディオ信号をヘッドフォン122に供給してコンテンツの音を再生させ、再生処理は終了する。
 ヘッドフォン122により再生されたコンテンツの音にはスピーカ91の位相特性と同じ特性が付加されているので、そのコンテンツの音を受聴している受聴者には、制作者M11がスタジオで聞いていたコンテンツの音と略同じ音質の音が聞こえている。しかもスピーカ特性インパルス応答は、振幅特性を変化させずに所望の位相特性のみをコンテンツの音に付加することができるので、コンテンツの音のゲインが変化してしまうようなこともない。
 以上のようにして再生装置121は、スピーカ特性インパルス応答をコンテンツのオーディオ信号に畳み込んでからコンテンツの音の再生を行う。このようにすることで、コンテンツの音をヘッドフォン122で再生する場合であっても、マスタリングに用いたスピーカ91の位相特性をコンテンツの音に付加することができる。すなわち、所望の位相特性を得ることができる。
〈第4の実施の形態〉
〈再生装置の構成例〉
 なお、再生装置121では、コンテンツの音にスピーカ91の位相特性と同じ特性を付加すると説明した。しかし、コンテンツの音をヘッドフォン122で再生すると、その音にはヘッドフォン122が有する位相特性も付加されることになる。
 そこで、コンテンツの音にスピーカ91の位相特性と同じ特性を付加するだけでなく、ヘッドフォン122が有する位相特性をキャンセル(除去)することで、制作者M11がスタジオで聞いていたコンテンツの音により近い音を受聴者に対して聞かせることができるようにしてもよい。
 そのような場合、再生装置は例えば図15に示すように構成される。なお、図15において図13における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。
 図15に示す再生装置161には、ヘッドフォン122が接続されている。また、再生装置161は、取得部131、ヘッドフォン逆特性畳み込み部171、スピーカ位相特性畳み込み部132、および再生制御部133を有している。
 特に再生装置161の構成は、再生装置121におけるスピーカ位相特性畳み込み部132の前段にヘッドフォン逆特性畳み込み部171が設けられた構成とされている。
 再生装置161では、上述したスピーカ特性インパルス応答だけでなく、ヘッドフォン122が有する位相特性とは逆特性を有する目標位相特性インパルス応答も取得部131によってインパルス応答生成装置11やインパルス応答生成装置51などの外部の装置から取得され、保持されている。以下、ヘッドフォン122が有する位相特性とは逆特性を有する目標位相特性インパルス応答を特にヘッドフォン逆特性インパルス応答とも称することとする。
 このヘッドフォン逆特性インパルス応答は、例えばヘッドフォン122の位相特性を有する入力インパルス応答を用い、演算処理部64での演算処理として減算を行うことでインパルス応答生成装置51により生成された目標位相特性インパルス応答である。
 なお、ヘッドフォン逆特性インパルス応答も取得部131により取得されるのではなく、予め取得部131に保持されているようにしてもよい。
 取得部131は、保持しているヘッドフォン逆特性インパルス応答をヘッドフォン逆特性畳み込み部171に供給する。
 ヘッドフォン逆特性畳み込み部171は、供給されたコンテンツのオーディオ信号に対して、取得部131から供給されたヘッドフォン逆特性インパルス応答を畳み込み、その結果得られたオーディオ信号をスピーカ位相特性畳み込み部132に供給する。
〈再生処理の説明〉
 次に、再生装置161の動作について説明する。すなわち、以下、図16のフローチャートを参照して再生装置161による再生処理について説明する。なお、この再生処理が開始されるタイミングでは、スピーカ特性インパルス応答およびヘッドフォン逆特性インパルス応答が既に取得部131により取得されている。
 ステップS101においてヘッドフォン逆特性畳み込み部171は、供給されたコンテンツのオーディオ信号に対して、取得部131から供給されたヘッドフォン逆特性インパルス応答を畳み込み、その結果得られたオーディオ信号をスピーカ位相特性畳み込み部132に供給する。
 これにより、コンテンツの音に対して、ヘッドフォン122の位相特性の逆特性を付加することができる。換言すれば、ヘッドフォン122でコンテンツの音を再生するときに付加される、ヘッドフォン122の位相特性がキャンセルされるようになる。しかも、ヘッドフォン逆特性インパルス応答の畳み込みでは、コンテンツの音の振幅(ゲイン)は変化させずに位相特性のみを調整することができる。
 オーディオ信号に対してヘッドフォン逆特性インパルス応答が畳み込まれると、その後、ステップS102およびステップS103の処理が行われて再生処理は終了するが、これらの処理は図14のステップS71およびステップS72の処理と同様であるので、その説明は省略する。
 再生装置161でのコンテンツの音の再生では、まずコンテンツの音に対してヘッドフォン122の位相特性のキャンセルが行われ、その後、付加したい特性であるスピーカ91の位相特性が付加される。
 なお、ヘッドフォン122の位相特性の逆特性を付加し、同時にスピーカ91の位相特性を付加することができる目標位相特性インパルス応答を生成し、その目標位相特性インパルス応答をコンテンツのオーディオ信号に畳み込むようにしてもよい。
 しかし、再生装置161のように、スピーカ特性インパルス応答およびヘッドフォン逆特性インパルス応答を別々に畳み込むことで、コンテンツの音に対して付加する位相特性を自由に変えることができる。すなわち、例えば再生装置161ではメーカー等が異なる複数のスピーカ91のなかから任意のスピーカ91を選択し、選択したスピーカ91の位相特性を有するスピーカ特性インパルス応答を畳み込むようにすることなどが可能である。
 以上のようにして再生装置161は、ヘッドフォン逆特性インパルス応答をコンテンツのオーディオ信号に畳み込み、さらにスピーカ特性インパルス応答をオーディオ信号に畳み込んでからコンテンツの音の再生を行う。
 このようにすることで、コンテンツの音をヘッドフォン122で再生する場合であっても、ヘッドフォン122により付加される位相特性をキャンセルし、かつマスタリングに用いたスピーカ91の位相特性をコンテンツの音に付加することができる。すなわち、所望の位相特性を得ることができる。特に、図16を参照して説明した再生処理では、図14を参照して説明した再生処理における場合よりも、制作者M11がスタジオで聞いていたコンテンツの音により近い音を聞かせることができる。
〈第5の実施の形態〉
〈再生装置の構成例〉
 なお、コンテンツの音をヘッドフォン122で再生する場合、音源、例えばスピーカ91から制作者M11までの音の伝達特性を示すHRTFを畳み込めば、制作者M11がスタジオで聞いていたコンテンツの音により近い音を聞かせることができる。すなわち、マスタリング時のスタジオの受聴環境を再現することができる。
 コンテンツのオーディオ信号にHRTFを畳み込む場合、再生装置は例えば図17に示すように構成される。なお、図17において図15における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。
 図17に示す再生装置201には、ヘッドフォン122が接続されている。また、再生装置201は、取得部131、ヘッドフォン逆特性畳み込み部171、スピーカ位相特性畳み込み部132、HRTF畳み込み部211、および再生制御部133を有している。
 特に再生装置201の構成は、再生装置161におけるスピーカ位相特性畳み込み部132の後段にHRTF畳み込み部211が設けられた構成とされている。
 再生装置201では、上述したスピーカ特性インパルス応答およびヘッドフォン逆特性インパルス応答だけでなく、HRTFも取得部131によって外部の装置から取得され、保持されている。なお、HRTFも取得部131により取得されるのではなく、予め取得部131に保持されているようにしてもよい。
 取得部131は、保持しているHRTFをHRTF畳み込み部211に供給する。
 HRTF畳み込み部211は、スピーカ位相特性畳み込み部132から供給されたオーディオ信号に対して、取得部131から供給されたHRTFを畳み込み、その結果得られたオーディオ信号を再生制御部133に供給する。
 なお、図13に示した再生装置121にHRTF畳み込み部211が設けられるようにしてもよい。
〈再生処理の説明〉
 次に、再生装置201の動作について説明する。すなわち、以下、図18のフローチャートを参照して再生装置201による再生処理について説明する。なお、この再生処理が開始されるタイミングでは、スピーカ特性インパルス応答、ヘッドフォン逆特性インパルス応答、およびHRTFが既に取得部131により取得されている。
 再生処理が開始されるとステップS131およびステップS132の処理が行われるが、これらの処理は図16のステップS101およびステップS102の処理と同様であるので、その説明は省略する。
 ステップS133においてHRTF畳み込み部211は、スピーカ位相特性畳み込み部132から供給されたオーディオ信号に対して取得部131から供給されたHRTFを畳み込み、その結果得られたオーディオ信号を再生制御部133に供給する。
 ステップS134において再生制御部133は、HRTF畳み込み部211から供給されたオーディオ信号をヘッドフォン122に供給してコンテンツの音を再生させ、再生処理は終了する。これにより、コンテンツの音の再生時には、ヘッドフォン122の位相特性がキャンセルされ、スピーカ91の位相特性とスタジオにおける音の伝達特性が付加されることになる。
 以上のようにして再生装置201は、ヘッドフォン逆特性インパルス応答、スピーカ特性インパルス応答、およびHRTFをオーディオ信号に畳み込んでからコンテンツの音の再生を行う。
 このようにすることで、コンテンツの音をヘッドフォン122で再生する場合であっても所望の位相特性とスタジオ等の所望の受聴環境における伝達特性とを付加し、制作者M11がスタジオで聞いていたコンテンツの音と略同じ音を受聴者に聞かせることができる。
〈変形例〉
〈再生装置の構成例〉
 なお、再生装置121や再生装置161、再生装置201内部に目標位相特性インパルス応答を生成する生成部が設けられるようにしてもよい。
 例えば再生装置161内部にそのような生成部が設けられる場合、再生装置161は図19に示すように構成される。なお、図19において図15における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。
 図19に示す再生装置161は、生成部241、取得部131、ヘッドフォン逆特性畳み込み部171、スピーカ位相特性畳み込み部132、および再生制御部133を有している。
 図19に示す再生装置161の構成は、図15に示した再生装置161に、さらに生成部241が設けられた構成となっている。
 生成部241は、インパルス応答生成装置11やインパルス応答生成装置51に対応する。すなわち、生成部241は、図9や図11を参照して説明したインパルス応答生成処理と同様の処理を行ってヘッドフォン逆特性インパルス応答やスピーカ特性インパルス応答を生成し、取得部131に供給する。
 以上の各実施の形態や変形例において説明した本技術によれば、振幅特性は変化させずに位相特性のみを調整し、所望の位相特性を得ることができる。
 例えば音楽制作でマスタリングに用いられる任意のスピーカの位相特性、特に低域の位相特性を、振幅特性はフラット(平坦)なままで音源に付加することができる。これにより、ヘッドフォンを用いて音を再生するときでも、低域の音質効果としてマスタリングスタジオで得られるものと同等の効果を得ることができる。
 しかも、対象とするスピーカが未知である場合でも、そのスピーカの位相特性を模した任意の一般的なIIRフィルタのインパルス応答を上述した入力インパルス応答として用いれば、得られたスピーカ特性インパルス応答を用いることで、振幅特性は変化させずにスピーカと同等の低域の位相特性を付加することができる。
 また、ヘッドフォン逆特性インパルス応答によりヘッドフォンの位相特性、特に低域の位相特性の逆特性を付加すれば、ヘッドフォンの位相特性、特に低域の位相特性をキャンセルすることができる。そしてヘッドフォンの位相特性のキャンセル後に、さらにスピーカ特性インパルス応答によりスピーカの位相特性、特に低域の特性を付加すれば、マスタリングスタジオでの低域の音質効果により近い効果を得ることができる。
 なお、将来的にメタデータ等によりマスタリングスタジオで用いられているスピーカを特定できる場合には、そのスピーカの位相特性を有するインパルス応答を入力インパルス応答として用いればよい。また、マスタリングスタジオで用いられているスピーカを特定できない場合には、そのスピーカの位相特性を模したIIR型のHPF等のインパルス応答を入力インパルス応答として用いればよい。
 さらに、ヘッドフォンでコンテンツの音を再生するときには、ヘッドフォンの位相特性のキャンセルと、スピーカの位相特性の付加に加えて、コンテンツのオーディオ信号に対してHRTFを畳み込むことで、マスタリングスタジオでの受聴環境の低域の位相特性をヘッドフォンでシミュレートすることができる。
〈コンピュータの構成例〉
 ところで、上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウェアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。
 図20は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。
 コンピュータにおいて、CPU(Central Processing Unit)501,ROM(Read Only Memory)502,RAM(Random Access Memory)503は、バス504により相互に接続されている。
 バス504には、さらに、入出力インターフェース505が接続されている。入出力インターフェース505には、入力部506、出力部507、記録部508、通信部509、及びドライブ510が接続されている。
 入力部506は、キーボード、マウス、マイクロホン、撮像素子などよりなる。出力部507は、ディスプレイ、スピーカなどよりなる。記録部508は、ハードディスクや不揮発性のメモリなどよりなる。通信部509は、ネットワークインターフェースなどよりなる。ドライブ510は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブル記録媒体511を駆動する。
 以上のように構成されるコンピュータでは、CPU501が、例えば、記録部508に記録されているプログラムを、入出力インターフェース505及びバス504を介して、RAM503にロードして実行することにより、上述した一連の処理が行われる。
 コンピュータ(CPU501)が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブル記録媒体511に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。
 コンピュータでは、プログラムは、リムーバブル記録媒体511をドライブ510に装着することにより、入出力インターフェース505を介して、記録部508にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部509で受信し、記録部508にインストールすることができる。その他、プログラムは、ROM502や記録部508に、あらかじめインストールしておくことができる。
 なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
 また、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
 例えば、本技術は、1つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。
 また、上述のフローチャートで説明した各ステップは、1つの装置で実行する他、複数の装置で分担して実行することができる。
 さらに、1つのステップに複数の処理が含まれる場合には、その1つのステップに含まれる複数の処理は、1つの装置で実行する他、複数の装置で分担して実行することができる。
 さらに、本技術は、以下の構成とすることも可能である。
(1)
 振幅特性がフラットまたは略フラットであり、かつ所定の位相特性を有するインパルス応答を取得する取得部と、
 入力オーディオ信号に前記インパルス応答を畳み込む位相特性畳み込み部と
 を備えるオーディオ信号処理装置。
(2)
 前記所定の位相特性は、所定のスピーカが有する位相特性である
 (1)に記載のオーディオ信号処理装置。
(3)
 前記インパルス応答の畳み込みにより得られたオーディオ信号に基づく音のヘッドフォンでの再生を制御する再生制御部をさらに備える
 (1)または(2)に記載のオーディオ信号処理装置。
(4)
 前記ヘッドフォンの位相特性の逆特性を有するインパルス応答を前記入力オーディオ信号に畳み込む逆特性畳み込み部をさらに備える
 (3)に記載のオーディオ信号処理装置。
(5)
 前記位相特性畳み込み部による畳み込みにより得られたオーディオ信号にHRTFを畳み込むHRTF畳み込み部をさらに備える
 (1)乃至(4)の何れか一項に記載のオーディオ信号処理装置。
(6)
 前記インパルス応答を生成するインパルス応答生成部をさらに備える
 (1)乃至(5)の何れか一項に記載のオーディオ信号処理装置。
(7)
 オーディオ信号処理装置が、
 振幅特性がフラットまたは略フラットであり、かつ所定の位相特性を有するインパルス応答を取得し、
 入力オーディオ信号に前記インパルス応答を畳み込む
 オーディオ信号処理方法。
(8)
 振幅特性がフラットまたは略フラットであり、かつ所定の位相特性を有するインパルス応答を取得し、
 入力オーディオ信号に前記インパルス応答を畳み込む
 ステップを含む処理をコンピュータに実行させるプログラム。
(9)
 振幅特性がフラットまたは略フラットであり、かつ所定の位相特性を有する目標特性インパルス応答を生成する
 インパルス応答生成装置。
(10)
 所定のインパルス情報に対して0データを付加する0詰め処理を行う0詰め処理部と、
 前記0データが付加された前記インパルス情報に対してFFTを行うインパルス情報FFT処理部と、
 前記FFTにより得られた位相特性と、フラットな振幅特性とに基づいてIFFTを行うことで前記目標特性インパルス応答を生成するIFFT処理部と
 をさらに備える(9)に記載のインパルス応答生成装置。
(11)
 前記0詰め処理部は、少なくとも前記インパルス情報の時間方向における前側に前記0データを付加する
 (10)に記載のインパルス応答生成装置。
(12)
 前記IFFTにより得られたインパルス応答に対してフェード処理を行い、前記目標特性インパルス応答とするフェード処理部をさらに備える
 (10)または(11)に記載のインパルス応答生成装置。
(13)
 前記インパルス情報は前記所定の位相特性を有するインパルス応答である
 (10)乃至(12)の何れか一項に記載のインパルス応答生成装置。
(14)
 前記インパルス情報は単純インパルスであり、
 前記所定の位相特性を有するインパルス応答に対してFFTを行うインパルス応答FFT処理部と、
 前記インパルス情報FFT処理部による前記FFTにより得られた位相特性と、前記インパルス応答FFT処理部による前記FFTにより得られた位相特性とに基づく演算を行う演算処理部と
 をさらに備え、
 前記IFFT処理部は、前記演算により得られた位相特性と、前記フラットな振幅特性とに基づいて前記IFFTを行う
 (10)乃至(12)の何れか一項に記載のインパルス応答生成装置。
(15)
 前記演算処理部は、前記演算として、前記インパルス情報FFT処理部による前記FFTにより得られた位相特性と、前記インパルス応答FFT処理部による前記FFTにより得られた位相特性との加算を行う
 (14)に記載のインパルス応答生成装置。
(16)
 前記演算処理部は、前記演算として、前記インパルス情報FFT処理部による前記FFTにより得られた位相特性からの、前記インパルス応答FFT処理部による前記FFTにより得られた位相特性の減算を行う
 (14)に記載のインパルス応答生成装置。
(17)
 インパルス応答生成装置が、
 振幅特性がフラットまたは略フラットであり、かつ所定の位相特性を有する目標特性インパルス応答を生成する
 インパルス応答生成方法。
(18)
 振幅特性がフラットまたは略フラットであり、かつ所定の位相特性を有する目標特性インパルス応答を生成する
 ステップを含む処理をコンピュータに実行させるプログラム。
 11 インパルス応答生成装置, 21 0詰め処理部, 22 FFT処理部, 23 IFFT処理部, 24 フェード処理部, 61 FFT処理部, 62 0詰め処理部, 63 FFT処理部, 64 演算処理部, 121 再生装置, 131 取得部, 132 スピーカ位相特性畳み込み部, 133 再生制御部, 171 ヘッドフォン逆特性畳み込み部, 211 HRTF畳み込み部, 241 生成部

Claims (18)

  1.  振幅特性がフラットまたは略フラットであり、かつ所定の位相特性を有するインパルス応答を取得する取得部と、
     入力オーディオ信号に前記インパルス応答を畳み込む位相特性畳み込み部と
     を備えるオーディオ信号処理装置。
  2.  前記所定の位相特性は、所定のスピーカが有する位相特性である
     請求項1に記載のオーディオ信号処理装置。
  3.  前記インパルス応答の畳み込みにより得られたオーディオ信号に基づく音のヘッドフォンでの再生を制御する再生制御部をさらに備える
     請求項1に記載のオーディオ信号処理装置。
  4.  前記ヘッドフォンの位相特性の逆特性を有するインパルス応答を前記入力オーディオ信号に畳み込む逆特性畳み込み部をさらに備える
     請求項3に記載のオーディオ信号処理装置。
  5.  前記位相特性畳み込み部による畳み込みにより得られたオーディオ信号にHRTFを畳み込むHRTF畳み込み部をさらに備える
     請求項1に記載のオーディオ信号処理装置。
  6.  前記インパルス応答を生成するインパルス応答生成部をさらに備える
     請求項1に記載のオーディオ信号処理装置。
  7.  オーディオ信号処理装置が、
     振幅特性がフラットまたは略フラットであり、かつ所定の位相特性を有するインパルス応答を取得し、
     入力オーディオ信号に前記インパルス応答を畳み込む
     オーディオ信号処理方法。
  8.  振幅特性がフラットまたは略フラットであり、かつ所定の位相特性を有するインパルス応答を取得し、
     入力オーディオ信号に前記インパルス応答を畳み込む
     ステップを含む処理をコンピュータに実行させるプログラム。
  9.  振幅特性がフラットまたは略フラットであり、かつ所定の位相特性を有する目標特性インパルス応答を生成する
     インパルス応答生成装置。
  10.  所定のインパルス情報に対して0データを付加する0詰め処理を行う0詰め処理部と、
     前記0データが付加された前記インパルス情報に対してFFTを行うインパルス情報FFT処理部と、
     前記FFTにより得られた位相特性と、フラットな振幅特性とに基づいてIFFTを行うことで前記目標特性インパルス応答を生成するIFFT処理部と
     をさらに備える請求項9に記載のインパルス応答生成装置。
  11.  前記0詰め処理部は、少なくとも前記インパルス情報の時間方向における前側に前記0データを付加する
     請求項10に記載のインパルス応答生成装置。
  12.  前記IFFTにより得られたインパルス応答に対してフェード処理を行い、前記目標特性インパルス応答とするフェード処理部をさらに備える
     請求項10に記載のインパルス応答生成装置。
  13.  前記インパルス情報は前記所定の位相特性を有するインパルス応答である
     請求項10に記載のインパルス応答生成装置。
  14.  前記インパルス情報は単純インパルスであり、
     前記所定の位相特性を有するインパルス応答に対してFFTを行うインパルス応答FFT処理部と、
     前記インパルス情報FFT処理部による前記FFTにより得られた位相特性と、前記インパルス応答FFT処理部による前記FFTにより得られた位相特性とに基づく演算を行う演算処理部と
     をさらに備え、
     前記IFFT処理部は、前記演算により得られた位相特性と、前記フラットな振幅特性とに基づいて前記IFFTを行う
     請求項10に記載のインパルス応答生成装置。
  15.  前記演算処理部は、前記演算として、前記インパルス情報FFT処理部による前記FFTにより得られた位相特性と、前記インパルス応答FFT処理部による前記FFTにより得られた位相特性との加算を行う
     請求項14に記載のインパルス応答生成装置。
  16.  前記演算処理部は、前記演算として、前記インパルス情報FFT処理部による前記FFTにより得られた位相特性からの、前記インパルス応答FFT処理部による前記FFTにより得られた位相特性の減算を行う
     請求項14に記載のインパルス応答生成装置。
  17.  インパルス応答生成装置が、
     振幅特性がフラットまたは略フラットであり、かつ所定の位相特性を有する目標特性インパルス応答を生成する
     インパルス応答生成方法。
  18.  振幅特性がフラットまたは略フラットであり、かつ所定の位相特性を有する目標特性インパルス応答を生成する
     ステップを含む処理をコンピュータに実行させるプログラム。
PCT/JP2019/024440 2018-07-04 2019-06-20 オーディオ信号処理装置および方法、インパルス応答生成装置および方法、並びにプログラム WO2020008889A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
EP19831112.8A EP3820161A4 (en) 2018-07-04 2019-06-20 AUDIO SIGNAL PROCESSING METHOD AND DEVICE, PULSE RESPONSE GENERATION METHOD AND DEVICE, AND PROGRAM
JP2020528786A JP7359146B2 (ja) 2018-07-04 2019-06-20 インパルス応答生成装置および方法、並びにプログラム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018-127664 2018-07-04
JP2018127664 2018-07-04

Publications (1)

Publication Number Publication Date
WO2020008889A1 true WO2020008889A1 (ja) 2020-01-09

Family

ID=69060578

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2019/024440 WO2020008889A1 (ja) 2018-07-04 2019-06-20 オーディオ信号処理装置および方法、インパルス応答生成装置および方法、並びにプログラム

Country Status (3)

Country Link
EP (1) EP3820161A4 (ja)
JP (1) JP7359146B2 (ja)
WO (1) WO2020008889A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2762879C1 (ru) * 2020-02-19 2021-12-23 Ямаха Корпорейшн Способ обработки звукового сигнала и устройство обработки звукового сигнала

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6342599A (ja) * 1986-08-08 1988-02-23 Yamaha Corp スピ−カ再生装置
JP2002171589A (ja) 2000-11-30 2002-06-14 Sony Corp オーディオ装置
JP2012054863A (ja) * 2010-09-03 2012-03-15 Mitsubishi Electric Corp 音響再生装置
JP2013102476A (ja) * 2007-01-22 2013-05-23 Toa Corp 音響調整方法
JP2014168116A (ja) * 2013-02-28 2014-09-11 Jvc Kenwood Corp オーディオ信号処理装置、オーディオ信号処理方法、オーディオ信号処理プログラムおよびヘッドホン

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2529591C2 (ru) * 2009-06-30 2014-09-27 Нокиа Корпорейшн Устранение позиционной неоднозначности при формировании пространственного звука
US20120033829A1 (en) * 2010-08-04 2012-02-09 Lewis Ivan Lawayne Audio phase corrector

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6342599A (ja) * 1986-08-08 1988-02-23 Yamaha Corp スピ−カ再生装置
JP2002171589A (ja) 2000-11-30 2002-06-14 Sony Corp オーディオ装置
JP2013102476A (ja) * 2007-01-22 2013-05-23 Toa Corp 音響調整方法
JP2012054863A (ja) * 2010-09-03 2012-03-15 Mitsubishi Electric Corp 音響再生装置
JP2014168116A (ja) * 2013-02-28 2014-09-11 Jvc Kenwood Corp オーディオ信号処理装置、オーディオ信号処理方法、オーディオ信号処理プログラムおよびヘッドホン

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2762879C1 (ru) * 2020-02-19 2021-12-23 Ямаха Корпорейшн Способ обработки звукового сигнала и устройство обработки звукового сигнала

Also Published As

Publication number Publication date
EP3820161A1 (en) 2021-05-12
JPWO2020008889A1 (ja) 2021-07-08
JP7359146B2 (ja) 2023-10-11
EP3820161A4 (en) 2021-11-24

Similar Documents

Publication Publication Date Title
JP5298199B2 (ja) モノフォニック対応およびラウドスピーカ対応のバイノーラルフィルタ
KR100626233B1 (ko) 스테레오 확장 네트워크에서의 출력의 등화
US20180279062A1 (en) Audio surround processing system
JP6968376B2 (ja) ステレオ仮想バス拡張
US9307338B2 (en) Upmixing method and system for multichannel audio reproduction
US20140334650A1 (en) Methods and devices for reproducing surround audio signals
JPH11504478A (ja) ステレオ増強システム
US11611828B2 (en) Systems and methods for improving audio virtualization
KR20140116152A (ko) 베이스 강화 시스템
US20170373656A1 (en) Loudspeaker-room equalization with perceptual correction of spectral dips
JP7370415B2 (ja) 空間オーディオ信号のクロストーク処理のためのスペクトル欠陥補償
US20120328123A1 (en) Signal processing apparatus, signal processing method, and program
JP7359146B2 (ja) インパルス応答生成装置および方法、並びにプログラム
JP5651813B1 (ja) 音声信号処理装置、および音声信号処理方法
JP2007336080A (ja) 音響補正装置
CN112602338A (zh) 信号处理装置、信号处理方法和程序
WO2023218917A1 (ja) 情報処理装置、情報処理方法、およびプログラム
WO2024134805A1 (ja) 再生音補正装置、再生音補正方法、プログラム
US11950089B2 (en) Perceptual bass extension with loudness management and artificial intelligence (AI)
Lindau et al. Perceptual evaluation of discretization and interpolation for motion-tracked binaural (MTB) recordings (Perzeptive Evaluation von Diskretisierungs-und Interpolationsansätzen
US20240305950A1 (en) Information processing device, information processing method, and program
JP6774912B2 (ja) 音像生成装置
WO2023156274A1 (en) Apparatus and method for reducing spectral distortion in a system for reproducing virtual acoustics via loudspeakers
Norcross Evaluation and alternative regularization of audio equalization techniques
JP2006174078A (ja) オーディオ信号処理方法及び装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19831112

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2020528786

Country of ref document: JP

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 2019831112

Country of ref document: EP

ENP Entry into the national phase

Ref document number: 2019831112

Country of ref document: EP

Effective date: 20210204