WO2018150719A1 - フィルタ生成装置、及びフィルタ生成方法 - Google Patents
フィルタ生成装置、及びフィルタ生成方法 Download PDFInfo
- Publication number
- WO2018150719A1 WO2018150719A1 PCT/JP2017/045615 JP2017045615W WO2018150719A1 WO 2018150719 A1 WO2018150719 A1 WO 2018150719A1 JP 2017045615 W JP2017045615 W JP 2017045615W WO 2018150719 A1 WO2018150719 A1 WO 2018150719A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- spectrum
- synchronous addition
- signal
- synchronous
- unit
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/027—Spatial or constructional arrangements of microphones, e.g. in dummy heads
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/406—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/04—Circuits for transducers, loudspeakers or microphones for correcting frequency response
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/033—Headphones for stereophonic communication
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/002—Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
- H04S3/004—For headphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
- H04S7/303—Tracking of listener position or orientation
- H04S7/304—For headphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/305—Electronic adaptation of stereophonic audio signals to reverberation of the listening space
- H04S7/306—For headphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
Definitions
- the present invention relates to a filter generation device and a filter generation method.
- the sound image localization technology there is an out-of-head localization technology that uses a headphone to localize a sound image outside the listener's head.
- the sound image is localized out of the head by canceling the characteristics from the headphones to the ears and giving four characteristics from the stereo speakers to the ears.
- a measurement signal (impulse sound, etc.) emitted from a speaker of two channels (hereinafter referred to as “ch”) is recorded with a microphone (hereinafter referred to as a microphone) installed in the ear of the listener.
- the processing device creates a filter based on the collected sound signal obtained by the impulse response. By convolving the created filter with a 2-channel audio signal, it is possible to realize out-of-head localization reproduction.
- Patent Document 1 discloses a method for obtaining a set of personalized indoor impulse responses.
- a microphone is installed near each ear of a listener.
- the left and right microphones record the impulse sound when the speaker is driven.
- the present embodiment has been made in view of the above points, and an object thereof is to provide a filter generation device and a filter generation method that can appropriately generate a filter according to transfer characteristics while reducing a user's burden.
- the filter generation device picks up the measurement signal output from the sound source that outputs the measurement signal, acquires the sound collection signal, and based on the sound collection signal, the filter generates the sound source from the sound source.
- a filter generation unit that generates a filter according to a transfer characteristic to the microphone, and the filter generation unit outputs the collected sound signal acquired with the microphone attached to the listener to the first synchronous addition count
- the first synchronous adder that generates the first synchronous addition signal by performing the synchronous addition in the above and the sound collection signal acquired in a state where a microphone is attached to other than the listener, the first synchronization addition unit
- a second synchronous addition unit that generates a second synchronous addition signal by performing synchronous addition at a second synchronous addition number that is greater than the number of additions; and a first spectrum corresponding to the first synchronous addition signal; ,
- the second synchronous addition signal The first and second synchronous addition signals are converted to a frequency domain so as to obtain a corresponding second spectrum, and the second spectrum in a
- the filter generation method is a filter generation method for generating a filter corresponding to a transfer characteristic by collecting a measurement signal output from a sound source with a microphone, in a state where the microphone is attached to the listener
- Generating a second synchronous addition signal by synchronously adding the signals at a second synchronous addition number greater than the first synchronous addition number, and a first corresponding to the first synchronous addition signal
- the present embodiment it is possible to provide a filter generation device and a filter generation method capable of appropriately generating a filter according to transfer characteristics while reducing the burden on the user.
- Example 1 which shows the logarithmic power spectrum of personal measurement, and the logarithmic power spectrum after correction
- Example 2 which shows the logarithmic power spectrum of personal measurement, and the logarithmic power spectrum after correction
- Example 3 which shows the logarithmic power spectrum of personal measurement, and the logarithmic power spectrum after correction
- Example 4 which shows the logarithmic power spectrum of personal measurement, and the logarithmic power spectrum after correction
- Example 5 which shows the logarithmic power spectrum of personal measurement, and the logarithmic power spectrum after correction
- the transfer characteristic from the speaker to the microphone is measured. Based on the measured transfer characteristic, the filter generation device generates a filter.
- the out-of-head localization processing performs out-of-head localization processing using an individual's spatial acoustic transfer characteristic (also referred to as a spatial acoustic transfer function) and an external auditory canal transfer characteristic (also referred to as an external auditory canal transfer function).
- the ear canal transfer characteristic is a transfer characteristic from the ear canal entrance to the eardrum.
- the out-of-head localization processing is realized by using the spatial acoustic transmission characteristic from the speaker to the listener's ear and the inverse characteristic of the external auditory canal transmission characteristic when the headphones are worn.
- the out-of-head localization processing apparatus is an information processing apparatus such as a personal computer, a smartphone, or a tablet PC, processing means such as a processor, storage means such as a memory or a hard disk, display means such as a liquid crystal monitor, Input means such as a touch panel, buttons, a keyboard, and a mouse, and output means having headphones or earphones are provided.
- processing means such as a processor
- storage means such as a memory or a hard disk
- display means such as a liquid crystal monitor
- Input means such as a touch panel, buttons, a keyboard, and a mouse
- output means having headphones or earphones are provided.
- FIG. 1 shows an out-of-head localization processing apparatus 100 that is an example of a sound field reproducing apparatus according to the present embodiment.
- FIG. 1 is a block diagram of an out-of-head localization processing apparatus.
- the out-of-head localization processing apparatus 100 reproduces a sound field for the user U wearing the headphones 43. Therefore, the out-of-head localization processing apparatus 100 performs sound image localization processing on the Lch and Rch stereo input signals XL and XR.
- the Lch and Rch stereo input signals XL and XR are analog audio playback signals output from a CD (Compact Disc) player or the like, or digital audio data such as mp3 (MPEG Audio Layer-3). It is.
- the out-of-head localization processing apparatus 100 is not limited to a physically single apparatus, and some processes may be performed by different apparatuses. For example, a part of the processing may be performed by a personal computer or the like, and the remaining processing may be performed by a DSP (Digital Signal Processor) built in the headphones 43 or the like.
- DSP Digital Signal Processor
- the out-of-head localization processing apparatus 100 includes an out-of-head localization processing unit 10, a filter unit 41, a filter unit 42, and headphones 43.
- the out-of-head localization processing unit 10 includes convolution operation units 11 to 12 and 21 to 22 and adders 24 and 25.
- the convolution operation units 11 to 12 and 21 to 22 perform convolution processing using spatial acoustic transfer characteristics.
- Stereo input signals XL and XR from a CD player or the like are input to the out-of-head localization processing unit 10.
- Spatial acoustic transfer characteristics are set in the out-of-head localization processing unit 10.
- the out-of-head localization processing unit 10 convolves the spatial acoustic transfer characteristics with the stereo input signals XL and XR of each channel.
- the spatial acoustic transfer characteristic may be a head-related transfer function HRTF measured with the head or auricle of the user U himself, or may be a dummy head or a third-party head-related transfer function. These transfer characteristics may be measured on the spot or may be prepared in advance.
- the spatial acoustic transfer characteristic has filters corresponding to the four transfer characteristics Hls, Hlo, Hro, and Hrs. Filters corresponding to the four transfer characteristics can be obtained using a filter generation device to be described later.
- the convolution operation unit 11 convolves a filter corresponding to the transfer characteristic Hls with respect to the Lch stereo input signal XL.
- the convolution operation unit 11 outputs the convolution operation data to the adder 24.
- the convolution operation unit 21 convolves a filter corresponding to the transfer characteristic Hro with respect to the Rch stereo input signal XR.
- the convolution operation unit 21 outputs the convolution operation data to the adder 24.
- the adder 24 adds the two convolution calculation data and outputs the result to the filter unit 41.
- the convolution operation unit 12 convolves a filter corresponding to the transfer characteristic Hlo with respect to the Lch stereo input signal XL.
- the convolution operation unit 12 outputs the convolution operation data to the adder 25.
- the convolution operation unit 22 convolves a filter corresponding to the transfer characteristic Hrs with respect to the Rch stereo input signal XR.
- the convolution operation unit 22 outputs the convolution operation data to the adder 25.
- the adder 25 adds the two convolution calculation data and outputs the result to the filter unit 42.
- an inverse filter for canceling the headphone characteristic (characteristic between the headphone reproduction unit and the microphone) is set. Then, an inverse filter is convoluted with the reproduction signal that has been processed by the out-of-head localization processing unit 10.
- the filter unit 41 convolves an inverse filter with the Lch signal from the adder 24.
- the filter unit 42 convolves an inverse filter with the Rch signal from the adder 25.
- the reverse filter cancels the characteristics from the headphone unit to the microphone when the headphones 43 are attached.
- the microphone may be placed anywhere from the ear canal entrance to the eardrum.
- the inverse filter may be calculated from the result of measuring the characteristics of the user U on the spot, or an inverse filter calculated from the headphone characteristics measured using an arbitrary outer ear such as a dummy head may be prepared in advance. .
- the filter unit 41 outputs the corrected Lch signal to the left unit 43L of the headphones 43.
- the filter unit 42 outputs the corrected Rch signal to the right unit 43R of the headphones 43.
- User U is wearing headphones 43.
- the headphone 43 outputs the Lch signal and the Rch signal toward the user U. Thereby, the sound image localized outside the user U's head can be reproduced.
- FIG. 2 is a diagram schematically illustrating a measurement configuration of the filter generation device 200.
- the filter generation device 200 may be a common device with the out-of-head localization processing device 100 shown in FIG.
- part or all of the filter generation device 200 may be a device different from the out-of-head localization processing device 100.
- the filter generation device 200 includes a stereo speaker 5 and a stereo microphone 2.
- a stereo speaker 5 is installed in the measurement environment.
- the measurement environment may be a room at the user U's home, an audio system sales store, a showroom, or the like.
- the processing device (not shown in FIG. 2) of the filter generation device 200 performs arithmetic processing for appropriately generating a filter according to the transfer characteristics.
- the processing device includes, for example, an MP3 (MPEG-13Audio Layer-3) player, a music player such as a CD player, and the like.
- the processing device may be a personal computer (PC), a tablet terminal, a smart phone, or the like.
- the stereo speaker 5 includes a left speaker 5L and a right speaker 5R.
- a left speaker 5L and a right speaker 5R are installed in front of the listener 1.
- the left speaker 5L and the right speaker 5R output an impulse sound or the like for performing impulse response measurement.
- the number of speakers serving as sound sources is described as two (stereo speakers), but the number of sound sources used for measurement is not limited to two and may be one or more. That is, the present embodiment can be similarly applied to a so-called multi-channel environment such as 1ch monaural or 5.1ch or 7.1ch.
- the stereo microphone 2 has a left microphone 2L and a right microphone 2R.
- the left microphone 2L is installed in the left ear 9L of the listener 1
- the right microphone 2R is installed in the right ear 9R of the listener 1.
- the microphones 2L and 2R collect the measurement signal output from the stereo speaker 5 and acquire the collected sound signal.
- the measurement signal may be an impulse signal, a TSP (Time Stretched Pulse) signal, or the like.
- the microphones 2L and 2R output the collected sound signal to the filter generation device 200 described later.
- the listener 1 may be a person or a dummy head. That is, in this embodiment, the listener 1 is a concept including not only a person but also a dummy head.
- the impulse response is measured by measuring the impulse sound output from the left and right speakers 5L and 5R with the microphones 2L and 2R.
- the filter generation device 200 stores the collected sound signal acquired based on the impulse response measurement in a memory or the like.
- the transfer characteristic Hls between the left speaker 5L and the left microphone 2L, the transfer characteristic Hlo between the left speaker 5L and the right microphone 2R, the transfer characteristic Hro between the right speaker 5L and the left microphone 2L, and the right speaker A transfer characteristic Hrs between 5R and the right microphone 2R is measured. That is, the transfer characteristic Hls is acquired by the left microphone 2L collecting the measurement signal output from the left speaker 5L.
- the transfer characteristic Hlo is acquired by the right microphone 2R collecting the measurement signal output from the left speaker 5L.
- the transfer characteristic Hro is acquired.
- the transfer characteristic Hrs is acquired.
- the filter generation device 200 generates a filter corresponding to the transfer characteristics Hls, Hlo, Hro, and Hrs from the left and right speakers 5L and 5R to the left and right microphones 2L and 2R based on the collected sound signal. Specifically, the filter generation device 200 cuts out the transfer characteristics Hls, Hlo, Hro, and Hrs with a predetermined filter length and performs arithmetic processing. By doing in this way, the filter production
- the out-of-head localization processing apparatus 100 uses a filter corresponding to the transfer characteristics Hls, Hlo, Hro, and Hrs between the left and right speakers 5L and 5R and the left and right microphones 2L and 2R. Performs external localization processing. That is, the out-of-head localization process is performed by convolving a filter corresponding to the transfer characteristic into the audio reproduction signal.
- the filter generation device 200 performs synchronous addition.
- the left speaker 5L or the right speaker 5R repeatedly outputs the same measurement signal at regular time intervals.
- the left microphone 2L and the right microphone 2R pick up a plurality of measurement signals, and add the sound pickup signals corresponding to the respective measurement signals in synchronization. For example, when the number of synchronous additions is 16, the left speaker 5L or the right speaker 5R outputs the measurement signal 16 times.
- the left microphone 2L and the right microphone 2R add 16 sound pickup signals in synchronization.
- the left speaker 5L or the right speaker 5R needs to output the next measurement signal in a state where there is no reverberation of the previous measurement signal. Therefore, the time interval for outputting the measurement signal must be increased to some extent. For this reason, if the number of synchronous additions increases, the overall measurement time becomes longer.
- the listener 1 must remain stationary during the measurement. When the listener 1 is a user U individual, it is a burden on the user U to increase the measurement time. For this reason, in the present embodiment, the number of times of synchronous addition is reduced in the measurement of individual users.
- the number of synchronous additions is changed between the measurement using the dummy head and the measurement of the individual user U.
- the number of times of synchronous addition is measured 64 times.
- measurement with the number of synchronous additions of 16 is performed.
- the measurement obtained with the stereo microphone 2 attached to the dummy head is referred to as configuration measurement
- the data based on the configuration measurement is referred to as configuration data.
- the measurement in a state where the microphone 2 is attached to the user U who actually performs out-of-head localization listening is assumed to be personal measurement, and data based on the personal measurement is assumed to be personal measurement data.
- the filter generation device 200 corrects the personal measurement data with the configuration data.
- the personal measurement data is corrected with the configuration data.
- the value of personal measurement data for example, power or amplitude
- the value of the personal measurement data is used as it is.
- the filter generation device 200 generates a filter corresponding to the transfer characteristic by combining the configuration data and the personal measurement data.
- the phase spectrum is not corrected, but only the power spectrum is corrected.
- the burden on the user can be reduced. That is, by reducing the number of times of individual addition for personal measurement, the measurement time for the user U to actually listen to the measurement signal can be shortened. Thereby, a user burden can be reduced.
- the low frequency band of a filter can be set appropriately by increasing the number of synchronous additions in configuration measurement.
- FIG. 3 shows measurement data in which the number of synchronous additions is 16, and FIG. 4 shows measurement data in which the number of synchronous additions is 64.
- 3 and 4 show logarithmic power spectra obtained by analyzing a synchronous addition signal obtained by synchronous addition by fast Fourier transform (FFT). 3 and 4 also show measurement data when a dummy head is used as the listener 1.
- the sampling frequency is 48 kHz and the measurement frame length is 8192 samples.
- 3 and 4 show logarithmic power spectra of data of 8192 samples (hereinafter, RAW data).
- FIG. 3 and 4 show the logarithmic power spectrum of the four transfer characteristics Hls, Hlo, Hro, and Hrs.
- FIG. 3 shows the results of 5 sets of measurements with 16 synchronous additions as one set
- FIG. 4 shows the results of 5 sets of measurements with 64 synchronous additions as one set. ing. Accordingly, in each of FIGS. 3 and 4, five logarithmic power spectra are shown for the transfer measurement Hls. Similarly, five logarithmic power spectra are shown for each of the transfer characteristics, Hlo, Hro, and Hrs.
- FIG. 3 and FIG. 4 each show 20 logarithmic power spectra.
- the transfer characteristic is more stable with 64 synchronous additions than with 16 synchronous additions. It can be seen that the accuracy is high. That is, when the number of synchronous additions is 16, as shown in FIG. 3, the variation for each set increases in the frequency band of about 40 Hz to 200 Hz.
- FIG. 5 and 6 show the logarithmic power spectrum of the synchronous addition signal subjected to the correction of the microphone characteristics, the extraction of the filter to 4096 sample length, and the windowing process.
- FIG. 5 shows a logarithmic power spectrum obtained by processing the measurement data with 16 synchronous additions, that is, the RAW data corresponding to FIG.
- FIG. 6 shows a logarithmic power spectrum obtained by processing the measurement data having 64 synchronous additions, that is, the RAW data corresponding to FIG.
- the number of times of synchronous addition is 64 times than the number of times of synchronous addition of 16. It can be seen that the characteristics are stable and the accuracy is high. That is, when the number of synchronous additions is 16, as shown in FIG. 5, the variation for each set increases in the frequency band of about 40 Hz to 200 Hz.
- FIG. 7 shows the standing wave attenuation rate by synchronous addition.
- FIG. 7 shows a standing wave attenuation rate for every 1 Hz from a pure tone of 1 Hz to 200 Hz when the sampling frequency is 48 kHz and the number of samples in the synchronization frame is 8192.
- FIG. 7 shows the standing wave attenuation rate when the number of synchronous additions is 16 times and 64 times. It can be seen that when the number of synchronous additions is 64, an attenuation rate of approximately ⁇ 20 dB or more can be obtained. That is, when the number of synchronous additions is 64, it can be seen that the standing wave due to disturbance is sufficiently attenuated.
- the number of synchronous additions is increased by performing configuration measurement using a dummy head. That is, by measuring the transfer characteristics with the stereo microphone 2 attached to the dummy head, the burden on the user can be reduced even when the number of synchronous additions is increased. Then, the filter generation device 200 corrects the personal measurement data with the configuration data.
- FIG. 8 is a graph showing measurement results when the listener 1 is the user U.
- FIG. 8 shows the logarithmic power spectrum analyzed by FFT for the data obtained by correcting the microphone characteristics, cutting out the filter to 4096 sample length, and windowing, as in FIG. FIG. 8 shows personal measurement data when the number of synchronous additions is 64.
- the shape of the logarithmic power spectrum in the low frequency band is the same between the configuration data and the personal measurement data.
- the head-related transfer function in the low frequency band has almost no difference among individuals. That is, the shape of the logarithmic power spectrum in the low frequency band has almost no individual difference by the user U. Therefore, it is possible to correct the personal measurement data in the low frequency band with the configuration data.
- the data is normalized so that That is, normalization is performed by multiplying the four transfer characteristics Hls, Hlo, Hro, and Hrs by the same coefficient.
- normalization is performed by multiplying the four transfer characteristics Hls, Hlo, Hro, and Hrs by the same coefficient.
- the adjustment band includes a frequency higher than the correction upper limit frequency.
- the adjustment band is, for example, 200 Hz to 500 Hz. That is, details of this level adjustment will be described later.
- FIG. 9 is a flowchart showing an outline of the filter generation method.
- the filter generation device 200 performs measurement with the number of synchronous additions of 64 using a dummy head (S11). That is, in the measurement environment shown in FIG. 2, a dummy head is installed at the listening position, and the stereo microphone 2 is attached to the dummy head. Then, the stereo speaker 5 outputs the same measurement signal 64 times. The 64 sound pickup signals picked up by the stereo microphone 2 are added in synchronization. Thereby, the synchronous addition signal corresponding to each of the transfer characteristics Hls, Hlo, Hro, and Hrs is acquired.
- a dummy head that is, in the measurement environment shown in FIG. 2, a dummy head is installed at the listening position, and the stereo microphone 2 is attached to the dummy head. Then, the stereo speaker 5 outputs the same measurement signal 64 times. The 64 sound pickup signals picked up by the stereo microphone 2 are added in synchronization. Thereby, the synchronous addition signal corresponding to each of the transfer characteristics Hls, Hlo, Hro, and Hrs is acquired
- the filter is cut out (S12).
- filter extraction processing to 4096 sample length is performed as preprocessing for the synchronous addition signal acquired in S11. Since the synchronous addition signal is data of a sufficiently long time in consideration of room reverberation and the like, the filter generation apparatus 200 performs extraction into a data length of a necessary number of samples. Note that the filter generation apparatus 200 may perform pre-processing such as DC component cut, microphone characteristic correction, and windowing on the cut out filter.
- the filter generation device 200 stores the preprocessed data as configuration data (S13). Specifically, the configuration data preprocessed by the filter generation device 200 is converted into data in the frequency domain.
- the filter generation device 200 stores the frequency domain data as configuration data.
- the filter generation device 200 calculates a logarithmic power spectrum and a phase spectrum by performing FFT. A logarithmic power spectrum and a phase spectrum are stored as configuration data in a memory or the like.
- the stereo microphone 2 is attached to the user U, and measurement is performed with 16 synchronization additions (S21). That is, the user U sits at the listening position in the measurement environment shown in FIG. Then, the stereo speaker 5 outputs the same measurement signal 16 times. Sixteen sound pickup signals picked up by the stereo microphone 2 are added in synchronization. Thereby, the synchronous addition signal corresponding to each of the transfer characteristics Hls, Hlo, Hro, and Hrs is acquired.
- the filter is cut out (S22). For example, filter extraction processing to 4096 sample length is performed as preprocessing for the synchronous addition signal acquired in S21. Since the synchronous addition signal is data of a sufficiently long time in consideration of room reverberation and the like, the filter generation apparatus 200 performs extraction into a data length of a necessary number of samples. Note that the filter generation apparatus 200 may perform pre-processing such as DC component cut, microphone characteristic correction, and windowing on the cut out filter.
- the filter generation device 200 corrects the personal measurement data using the configuration data (S23). Therefore, first, the filter generation device 200 converts the personal measurement data preprocessed in S22 into frequency domain data. For example, the filter generation device 200 calculates a logarithmic power spectrum and a phase spectrum by performing FFT.
- the logarithmic power spectrum of the personal measurement data is corrected with the logarithmic power spectrum of the configuration data.
- the filter generation device 200 replaces the power value of the personal measurement data with the power value of the configuration data in a low frequency band lower than the correction upper limit frequency.
- the filter generation apparatus 200 uses the power value of the personal measurement data as it is in a high frequency band higher than the correction upper limit frequency. That is, the filter generation device 200 generates correction data by combining the power value of the configuration data in the low frequency band and the power value of the personal measurement data in the high frequency band.
- the filter generation device 200 may adjust the levels of the personal measurement data and the configuration data when performing the correction. Specifically, the level adjustment of the logarithmic power spectrum of the configuration data is performed based on the logarithmic power spectrum of the individual measurement data and the configuration data in the adjustment band.
- the adjustment band is a band between the first frequency and the second frequency.
- the first frequency is higher than the second frequency and higher than the correction upper limit frequency described above. Although the second frequency is set higher than the correction upper limit frequency here, the first frequency may be lower than the correction upper limit frequency.
- FIG. 10 and 11 show an example of the logarithmic power spectrum before correction and the logarithmic power spectrum after correction.
- personal measurement data before correction is indicated by a broken line
- configuration data is indicated by a solid line.
- the corrected data is indicated by a broken line
- the configuration data is indicated by a solid line.
- the corrected logarithmic power spectrum matches the configuration data.
- the correction upper limit frequency is 150 Hz
- the first frequency is 500 Hz
- the second frequency is 200 Hz. That is, the adjustment band is 200 Hz to 500 Hz.
- the filter generation device 200 replaces the power value of 150 Hz or less in the personal measurement data with the configuration data.
- the low frequency band for correcting the personal measurement data is a band from the lowest frequency to 150 Hz.
- the high frequency band in which the personal measurement data is not corrected is a band higher than the correction upper limit frequency.
- the correction upper limit frequency is preferably 100 Hz or more and 200 Hz or less.
- FIG. 12 is a control block diagram illustrating the processing device 210 of the filter generation device 200.
- FIG. 13 is a flowchart showing processing in the processing device 210.
- the processing device 210 functions as a filter generation device (filter generation unit).
- the processing device 210 includes a measurement signal generation unit 211, a collected sound signal acquisition unit 212, a first synchronization addition unit 213, a second synchronization addition unit 214, a waveform cutout unit 215, a DC cut unit 216, and a first window hanging unit. 217, normalization unit 218, phase matching unit 219, first conversion unit 220, level adjustment unit 221, first correction unit 222, first inverse conversion unit 223, second windowing unit 224, second A conversion unit 225, a second correction unit 226, a second inverse conversion unit 227, and a third window hanging unit 228 are provided.
- the processing device 210 is an information processing device such as a personal computer, a smart phone, or a tablet terminal, and includes an audio input interface (IF) and an audio output interface. That is, the processing apparatus 210 is an acoustic device having input / output terminals connected to the stereo microphone 2 and the stereo speaker 5.
- IF audio input interface
- the processing apparatus 210 is an acoustic device having input / output terminals connected to the stereo microphone 2 and the stereo speaker 5.
- the measurement signal generation unit 211 includes a D / A converter, an amplifier, and the like, and generates a measurement signal.
- the measurement signal generation unit 211 outputs the generated measurement signal to the stereo speaker 5.
- the left speaker 5L and the right speaker 5R each output a measurement signal for measuring transfer characteristics. Impulse response measurement by the left speaker 5L and impulse response measurement by the right speaker 5R are performed.
- the measurement signal includes measurement sound such as impulse sound.
- the left microphone 2 ⁇ / b> L and the right microphone 2 ⁇ / b> R of the stereo microphone 2 each collects the measurement signal and outputs the sound collection signal to the processing device 210.
- the sound collection signal acquisition unit 212 acquires sound collection signals from the left microphone 2L and the right microphone 2R.
- the collected sound signal acquisition unit 212 includes an A / D converter, an amplifier, and the like, and may perform A / D conversion, amplification, and the like on the collected sound signal from the left microphone 2L and the right microphone 2R.
- the collected sound signal acquisition unit 212 outputs the acquired sound collection signal to the first synchronous addition unit 213 or the second synchronous addition unit 214.
- the measurement signal generator 211 repeats the measurement signal 16 times and outputs it to the left speaker 5L or the right speaker 5R. Then, the measurement signal generation unit 211 outputs a sound collection signal corresponding to the 16 measurement signals to the first synchronous addition unit 213.
- the first synchronous addition unit 213 generates the first synchronous addition signal by synchronously adding the 16 sound pickup signals.
- the first synchronous adder 213 generates a synchronous addition signal for each of the transfer characteristics Hls, Hlo, Hro, and Hrs.
- the measurement signal generator 211 repeats the measurement signal 64 times and outputs it to the left speaker 5L or the right speaker 5R. Then, the measurement signal generation unit 211 outputs a sound collection signal corresponding to the 64 measurement signals to the second synchronous addition unit 214.
- the second synchronous adder 214 generates the second synchronous addition signal by synchronously adding the 64 collected sound signals.
- the second synchronous adder 214 generates a synchronous addition signal for each of the transfer characteristics Hls, Hlo, Hro, and Hrs.
- the first synchronous addition signal is personal measurement data
- the second synchronous addition signal is configuration data
- the waveform cutout unit 215 cuts out a waveform having a necessary data sample length from the first and second synchronous addition signals (S31). Specifically, data of 4096 sample length is extracted from the first and second synchronous addition signals of 8192 sample length.
- the DC cut unit 216 cuts the DC components (DC components) of the first and second synchronous addition signals after the cutout (S32). Thereby, the DC noise component of the first and second synchronous addition signals is removed.
- the first windowing unit 217 performs first windowing on the first and second synchronous addition signals after the DC component cut (S33).
- the window function is multiplied by half of the window functions having different front and rear window lengths based on the absolute maximum value of the synchronous addition signal.
- the window function may be a Hanning window or a Hamming window. Further, the window function may be applied only to a part of both ends without applying the window function to the whole.
- the window function used in the first window hanging portion 217 is not particularly limited.
- the processing from S31 to S33 is the same for the first synchronous addition signal and the second synchronous addition signal. That is, the sample length and window function to be cut out are the same between the first synchronous addition signal and the second synchronous addition signal. Further, the processing order of the first synchronous addition signal and the second synchronous addition signal is not particularly limited. After the preprocessing of S31 to S33 is performed on the second synchronous addition signal, the preprocessing of S31 to S33 may be performed on the first synchronous addition signal. Alternatively, after the preprocessing of S31 to S33 is performed on the first synchronous addition signal, the preprocessing of S31 to S33 may be performed on the second synchronous addition signal.
- the pre-processing of S31 to S33 may be performed on the first synchronous addition signal prior to the second synchronous addition signal, and the first synchronous addition signal may be performed on the second synchronous addition signal rather than the first synchronous addition signal.
- the preprocessing of S31 to S33 may be performed first.
- the normalization unit 218 normalizes the synchronous addition signal after the windowing process (S34). Specifically, the normalization unit 218 obtains the sum of squares of data for the four synchronous addition signals of the transfer characteristics Hls, Hlo, Hro, and Hrs. The normalizing unit 218 obtains a coefficient such that the maximum value among the four square sums is 1. The normalizing unit 218 multiplies the four synchronous addition signals of the transfer characteristics Hls, Hlo, Hro, and Hrs by the coefficients. For example, in the first synchronous addition signal, the coefficient K1 of the transfer characteristics Hls, Hlo, Hro, and Hrs has the same value. In the second synchronous addition signal, the coefficient K2 of the transfer characteristics Hls, Hlo, Hro, and Hrs has the same value.
- the phase matching unit 219 performs phase matching between the normalized first synchronous addition signal and the second synchronous addition signal (S35). Specifically, the phase matching unit 219 obtains a sample position having an absolute maximum value for each of the transfer characteristics Hls, Hlo, Hro, and Hrs. Then, the second synchronous addition signal is shifted so that the sample positions having the absolute maximum value are the same in the first synchronous addition signal and the second synchronous addition signal.
- the phase of the first synchronous addition signal having the transfer characteristic Hls and the second synchronous addition signal having the transfer characteristic Hls is performed.
- the absolute maximum value of the first synchronous addition signal of the transfer characteristic Hls is the sample position N1
- the absolute maximum value of the second synchronous addition signal of the transfer characteristic Hls is the sample position N2.
- the second synchronization addition signal is shifted by (N1-N2) so that the absolute maximum values of the first synchronization addition signal and the second synchronization addition signal coincide at the sample position N1.
- the second synchronous addition signal is shifted so that the absolute maximum values of the first synchronous addition signal and the second synchronous addition signal match.
- the second synchronous addition signal is shifted so that the absolute maximum values of the first synchronous addition signal and the second synchronous addition signal match.
- the second synchronous addition signal is shifted so that the absolute maximum values of the first synchronous addition signal and the second synchronous addition signal match.
- the phase matching method is not limited to the above method, and a correlation between the first synchronous addition signal and the second synchronous addition signal may be used.
- the first converter 220 converts the first and second synchronous addition signals after phase matching into data in the frequency domain (S36).
- the 1st conversion part 220 produces
- the 1st conversion part 220 produces
- the first logarithmic power spectrum and the first phase spectrum are personal measurement data, and the second logarithmic power spectrum and the second phase spectrum are configuration data.
- the first converter 220 may generate an amplitude spectrum instead of the logarithmic power spectrum.
- the first conversion unit 220 may convert the synchronous addition signal into frequency domain data by discrete Fourier transform or discrete cosine transform.
- the level adjusting unit 221 adjusts the level of the configuration data based on the logarithmic power spectrum reference value (S37). Specifically, the level adjustment unit 221 obtains reference values for the first logarithmic power spectrum and the second logarithmic power spectrum.
- the reference value is, for example, an average value of logarithmic power spectra in a predetermined frequency range. Note that the level adjustment unit 221 may exclude outliers that are greater than or equal to a certain value. Alternatively, the level adjustment unit 221 may limit an outlier that is a certain value or more to a certain value.
- the reference value calculation method is not limited to this. For example, an average value of data subjected to smoothing or conversion by cepstrum smoothing, moving average, linear approximation, or the like can be used as a reference value, or a median value thereof can be used as a reference value.
- the level adjusting unit 221 calculates the reference value of the first logarithmic power spectrum as the first reference value, and calculates the reference value of the second logarithmic power spectrum as the second reference value. Then, the level adjusting unit 221 adjusts the level of the second logarithmic power spectrum based on the first reference value and the second reference value. Specifically, the power value of the second logarithmic power spectrum is adjusted so that the second reference value matches the first reference value. For example, a coefficient K3 corresponding to the ratio between the first reference value and the second reference value is added to or subtracted from the second logarithmic power spectrum. When an amplitude spectrum is used instead of the logarithmic power spectrum, the amplitude value is adjusted by multiplying by a coefficient K3. A constant value that does not depend on the frequency can be used as the coefficient K3. In this way, the level adjustment unit 221 adjusts the level of the second logarithmic power spectrum based on the first logarithmic power spectrum.
- the first correction unit 222 corrects the first logarithmic power spectrum using the logarithmic power spectrum after the level adjustment (S38). Specifically, the power value in the low frequency band of the first logarithmic power spectrum is replaced with the power value of the second logarithmic power spectrum. As a result, the logarithmic power spectrum shown in FIG. 10 is corrected to the logarithmic power spectrum shown in FIG. Note that the low frequency band is a band below the correction upper limit frequency as described above. For example, since the correction upper limit frequency is 150 Hz, the low frequency band is the lowest frequency to 150 Hz. In a high frequency band higher than the correction upper limit frequency, the first correction unit 222 uses the power value of the first logarithmic power spectrum without correcting it.
- the logarithmic power spectrum corrected by the first correction unit 222 is also referred to as first correction data or third logarithmic power spectrum.
- the first inverse transform unit 223 inversely transforms the third logarithmic power spectrum into the time domain (S39). Specifically, the first inverse transform unit 223 inversely transforms the first correction data into the time domain using inverse fast Fourier transform (IFFT). For example, the first inverse transform unit 223 performs inverse discrete Fourier transform on the third logarithmic power spectrum and the first phase spectrum, so that the first correction data becomes time domain data.
- the first inverse transform unit 223 may perform inverse transform not by inverse discrete Fourier transform but by inverse discrete cosine transform or the like.
- the second windowing unit 224 performs the second windowing on the inversely converted first correction data (S40). Since the second windowing process is the same as the first windowing process of S33, the description thereof is omitted.
- the window function used for the second windowing may be the same as or different from the window function used for the first windowing.
- the second conversion unit 225 converts the first correction data after the second windowing into the frequency domain (S41). Similar to the first conversion unit 220, the second conversion unit 225 uses FFT to convert the first correction data after the second windowing in the time domain into the first correction data in the frequency domain. .
- the logarithmic power spectrum and phase spectrum calculated by the second conversion unit 225 are taken as a fourth logarithmic power spectrum and a fourth phase spectrum.
- the fourth log power spectrum and the fourth phase spectrum are the log power spectrum and the fourth phase spectrum after the second windowing.
- the second correction unit 226 corrects the third logarithmic power spectrum from the attenuation rate due to the second windowing (S42). Specifically, the second correction unit 226 obtains the power attenuation rate of the third logarithmic power spectrum calculated in S38 and the fourth logarithmic power spectrum calculated in S41. The second correction unit 226 compares the first correction data before and after the second windowing to calculate a power reduction rate in a predetermined frequency band. Then, the second correction unit 226 performs the second correction on the third logarithmic power spectrum according to the attenuation rate. The logarithmic power spectrum corrected by the second correction unit 226 is set as a fifth logarithmic power spectrum or second correction data.
- the frequency band for calculating the attenuation rate is defined as a calculation band.
- the calculation band is a partial band of the logarithmic power spectrum.
- the calculation band can be obtained using the number of samples of the synchronous addition signal and the sampling rate.
- the calculation band is a band having a frequency lower than a predetermined frequency.
- the calculation band may be a band different from the low frequency band or the same band.
- the second correction unit 226 obtains the attenuation rate by the second windowing process by comparing the power value of the third logarithmic power spectrum with the power value of the fourth logarithmic power spectrum in the calculation band. Then, the power value of the third logarithmic power spectrum is raised in the calculation band according to the attenuation rate. For example, the power value of the third logarithmic power spectrum in the calculation band is raised by adding or multiplying the power value of the third logarithmic power spectrum in the calculation band with a value corresponding to the attenuation rate. Specifically, the second correction unit 226 corrects the third logarithmic power spectrum so that the attenuation rate between the fourth logarithmic power spectrum and the fifth logarithmic power spectrum is 1.
- the second inverse transform unit 227 inversely transforms the fifth logarithmic power spectrum into the time domain (S43).
- the second inverse transform unit 227 performs inverse discrete Fourier transform or the like as in S39, and transforms the second correction data into the time domain.
- the second inverse transform unit 227 performs inverse discrete Fourier transform on the fifth logarithmic power spectrum and the first phase spectrum, so that the second correction data becomes time domain data.
- the second inverse transform unit 227 may perform inverse transform not by inverse discrete Fourier transform but by inverse discrete cosine transform.
- the third windowing unit 228 performs windowing on the second correction data in the time domain (S44).
- the third windowing unit 228 performs windowing using the same window function as that of S40. Thereby, the process ends.
- the processing device 210 can generate a filter according to the transfer characteristics.
- the characteristics of the low frequency band are difficult to eliminate the influence of so-called background noise (standing wave and standing wave) caused by power supply noise, air conditioning, etc., which are close to the frequency band. Further, the individual characteristics of the low frequency band characteristics are small. Therefore, for the low frequency band, the personal measurement data is replaced with the configuration data. Thereby, the filter according to the transfer characteristic can be generated appropriately.
- the processing device 210 generates a filter for each of the transfer characteristics Hls, Hlo, Hro, and Hrs. And the filter which the processing apparatus 210 produced
- the burden on the user U can be reduced.
- the burden on the user U can be reduced.
- the above-described filter it is possible to improve the sound quality of the reproduced sound that is localized outside the head.
- (1) the sound image in the low frequency band remaining around the ear is clear, (2) the right / left bias is corrected and the uncomfortable feeling is reduced, and (3) the sound pressure balance in the middle / low range is good. The effects such as are obtained.
- FIGS. 14 to 18 show the logarithmic power spectrum of the personal measurement data measured for five different users U and the corrected logarithmic power spectrum.
- the thick line is the logarithmic power spectrum after correction
- the thin line is the personal measurement spectrum before correction. 14 to 18, the same configuration data is used. 14 to 18, it can be seen that the variation in characteristics in the low frequency band is stabilized by the correction process.
- a boundary frequency band may be set in the vicinity of the correction upper limit frequency, and the power value may be made asymptotically exponentially or linearly in the boundary frequency band.
- the correction upper limit frequency can be 200 Hz and the boundary frequency band can be 200 Hz to 1 kHz.
- the power value of the first logarithmic power spectrum is replaced with the power value of the second logarithmic power spectrum. Above 1 kHz, the power value of the first logarithmic power spectrum is used as it is.
- the power value is set based on a function that asymptotically connects the power value of 200 Hz and the power value of 1 kHz. This function can be, for example, an exponential function or a linear function.
- the correction upper limit frequency can be made variable according to individual measurement. For example, by designating a certain frequency width, a frequency point at which the difference between the first log power spectrum and the second log power spectrum is minimized is searched within the range of the frequency width.
- the searched frequency point can be set as the correction upper limit frequency.
- the correction upper limit frequency can be set to 130 Hz.
- the number of synchronization additions in configuration measurement is 64 times and the number of synchronization additions in individual measurement is 16.
- the number of synchronization additions is not limited to this. That is, it is sufficient that the number of synchronization additions in the configuration measurement is larger than the number of synchronization additions in the individual measurement.
- the number of synchronous additions in personal measurement may be two or more.
- the configuration measurement using the dummy head can reduce the burden on the user U, but the configuration measurement may be an individual different from the individual (user U) who performed the personal measurement. . That is, one person's configuration data may be used for a plurality of users U. Even in this case, the burden on the user U can be reduced.
- All processes performed in the processing apparatus 210 are not essential. For example, a part or all of the processes of S31 to S34 and the process of S35 can be omitted.
- the filter can be appropriately generated by performing S37 by the level adjustment unit 221, but may be omitted as appropriate. It is also possible to omit some or all of the processes such as S40 to S44.
- the processing device 210 is not limited to a single physical device. That is, a part of the processing of the processing device 210 can be performed by another device. For example, configuration data measured by another device is prepared. Then, the processing device 210 stores the second logarithmic power spectrum of the configuration data in a memory or the like. By storing the configuration data in the memory in advance, the configuration data can be used for correcting individual measurement data of a plurality of users U.
- Non-transitory computer readable media include various types of tangible storage media.
- Examples of non-transitory computer-readable media include magnetic recording media (for example, flexible disks, magnetic tapes, hard disk drives), magneto-optical recording media (for example, magneto-optical disks), CD-ROMs (Read Only Memory), CD-Rs, CD-R / W, semiconductor memory (for example, mask ROM, PROM (Programmable ROM), EPROM (Erasable PROM), flash ROM, RAM (Random Access Memory)).
- the program may be supplied to a computer by various types of temporary computer readable media.
- Examples of transitory computer readable media include electrical signals, optical signals, and electromagnetic waves.
- the temporary computer-readable medium can supply the program to the computer via a wired communication path such as an electric wire and an optical fiber, or a wireless communication path.
- the present application is applicable to a filter generation device that generates a filter according to transfer characteristics.
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Multimedia (AREA)
- Stereophonic System (AREA)
- Stereophonic Arrangements (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本実施の形態にかかるフィルタ生成装置の処理装置(210)は、第1の同期加算信号を生成する第1の同期加算部(213)と、受聴者以外にマイクが装着された状態で取得された収音信号を、第1の同期加算回数よりも多い第2の同期加算回数で同期加算することで、第2の同期加算信号を生成する第2の同期加算部(214)と、第1及び第2の同期加算信号に対応する第1及び第2のスペクトルを取得するように、第1及び第2の同期加算信号を周波数領域のデータに変換する第1の変換部(220)と、補正帯域における第1のスペクトルのデータを補正して、第3のスペクトルを生成する第1の補正部(222)と、第3のスペクトルを時間領域のデータに逆変換する第1の逆変換部(223)と、を備えたものである。
Description
本発明は、フィルタ生成装置、及びフィルタ生成方法に関する。
音像定位技術として、ヘッドホンを用いて受聴者の頭部の外側に音像を定位させる頭外定位技術がある。頭外定位技術では、ヘッドホンから耳までの特性をキャンセルし、ステレオスピーカから耳までの4本の特性を与えることにより、音像を頭外に定位させている。
頭外定位再生においては、2チャンネル(以下、chと記載)のスピーカから発した測定信号(インパルス音等)を聴取者本人の耳に設置したマイクロフォン(以下、マイクとする)で録音する。そして、インパルス応答で得られた収音信号に基づいて、処理装置がフィルタを作成する。作成したフィルタを2chのオーディオ信号に畳み込むことにより、頭外定位再生を実現することができる。
特許文献1には、個人化された室内インパルス応答のセットを取得する方法が開示されている。特許文献1では、聴取者の各耳の近くにマイクを設置している。そして、スピーカを駆動した時のインパルス音を、左右のマイクが録音する。
インパルス応答測定時には、暗騒音や電源ノイズといった外乱がある。このため、インパルス応答測定では、同じ条件でのインパルス応答測定を複数回行い、マイクで収音された収音信号を同期加算している(特許文献2)。これにより、外乱の影響を排除することができ、S/N比を向上させることができる。同期加算を行う場合、同期加算回数が多ければ多い程、外乱の影響が少なくなる。しかしながら、測定時にはユーザは動かずに静止していなければならず、また測定音を何度も聴き続けることは、ユーザにとって負担となる。
本実施形態は上記の点に鑑みなされたもので、ユーザの負担を軽減しつつ、伝達特性に応じたフィルタを適切に生成することができるフィルタ生成装置、及びフィルタ生成方法を提供することを目的とする。
本実施形態にかかるフィルタ生成装置は、測定信号を出力する音源から出力された前記測定信号を収音して、収音信号を取得するマイクと、前記収音信号に基づいて、前記音源から前記マイクまでの伝達特性に応じたフィルタを生成するフィルタ生成部と、を備え、前記フィルタ生成部は、受聴者にマイクが装着された状態で取得された前記収音信号を第1の同期加算回数で同期加算することで、第1の同期加算信号を生成する第1の同期加算部と、前記受聴者以外にマイクが装着された状態で取得された前記収音信号を、前記第1の同期加算回数よりも多い第2の同期加算回数で同期加算することで、第2の同期加算信号を生成する第2の同期加算部と、前記第1の同期加算信号に対応する第1のスペクトルと、前記第2の同期加算信号に対応する第2のスペクトルを取得するように、前記第1及び第2の同期加算信号を周波数領域に変換する変換部と、所定の周波数以下の帯域における第2のスペクトルを用いて、前記第1のスペクトルを補正して、第3のスペクトルを生成する補正部と、前記第3のスペクトルを時間領域に逆変換する逆変換部と、を備えたものである。
本実施形態にかかるフィルタ生成方法は、音源から出力された測定信号をマイクで収音することで伝達特性に応じたフィルタを生成するフィルタ生成方法であって、受聴者にマイクが装着された状態で取得された収音信号を第1の同期加算回数で同期加算することで、第1の同期加算信号を生成するステップと、前記受聴者以外にマイクが装着された状態で取得された収音信号を、前記第1の同期加算回数よりも多い第2の同期加算回数で同期加算することで、第2の同期加算信号を生成するステップと、前記第1の同期加算信号に対応する第1のスペクトルと、前記第2の同期加算信号に対応する第2のスペクトルを取得するように、前記第1及び第2の同期加算信号を周波数領域に変換するステップと、所定の周波数以下の帯域における第2のスペクトルを用いて、前記第1のスペクトルを補正して、第3のスペクトルを生成するステップと、前記第3のスペクトルを時間領域のデータに逆変換するステップと、を備えたものである。
本実施形態によれば、ユーザの負担を軽減しつつ、伝達特性に応じたフィルタを適切に生成することができるフィルタ生成装置、及びフィルタ生成方法を提供することができる。
本実施の形態では、スピーカからマイクまでの伝達特性を測定している。そして、測定された伝達特性に基づいて、フィルタ生成装置がフィルタを生成している。
本実施の形態にかかるフィルタ生成装置で生成したフィルタを用いた音像定位処理の概要について説明する。ここでは、音像定位処理装置の一例である頭外定位処理について説明する。本実施形態にかかる頭外定位処理は、個人の空間音響伝達特性(空間音響伝達関数ともいう)と外耳道伝達特性(外耳道伝達関数ともいう)を用いて頭外定位処理を行うものである。外耳道伝達特性は、外耳道入口から鼓膜までの伝達特性である。本実施形態では、スピーカから聴取者の耳までの空間音響伝達特性、及びヘッドホンを装着した状態での外耳道伝達特性の逆特性を用いて頭外定位処理を実現している。
本実施の形態にかかる頭外定位処理装置は、パーソナルコンピュータ、スマートホン、タブレットPCなどの情報処理装置であり、プロセッサ等の処理手段、メモリやハードディスクなどの記憶手段、液晶モニタ等の表示手段、タッチパネル、ボタン、キーボード、マウスなどの入力手段、ヘッドホン又はイヤホンを有する出力手段を備えている。
実施の形態1.
本実施の形態にかかる音場再生装置の一例である頭外定位処理装置100を図1に示す。図1は、頭外定位処理装置のブロック図である。頭外定位処理装置100は、ヘッドホン43を装着するユーザUに対して音場を再生する。そのため、頭外定位処理装置100は、LchとRchのステレオ入力信号XL、XRについて、音像定位処理を行う。LchとRchのステレオ入力信号XL、XRは、CD(Compact Disc)プレイヤーなどから出力されるアナログのオーディオ再生信号、又は、mp3(MPEG Audio Layer-3)等のデジタルオーディオデータである。である。なお、頭外定位処理装置100は、物理的に単一な装置に限られるものではなく、一部の処理が異なる装置で行われてもよい。例えば、一部の処理がパソコンなどにより行われ、残りの処理がヘッドホン43に内蔵されたDSP(Digital Signal Processor)などにより行われてもよい。
本実施の形態にかかる音場再生装置の一例である頭外定位処理装置100を図1に示す。図1は、頭外定位処理装置のブロック図である。頭外定位処理装置100は、ヘッドホン43を装着するユーザUに対して音場を再生する。そのため、頭外定位処理装置100は、LchとRchのステレオ入力信号XL、XRについて、音像定位処理を行う。LchとRchのステレオ入力信号XL、XRは、CD(Compact Disc)プレイヤーなどから出力されるアナログのオーディオ再生信号、又は、mp3(MPEG Audio Layer-3)等のデジタルオーディオデータである。である。なお、頭外定位処理装置100は、物理的に単一な装置に限られるものではなく、一部の処理が異なる装置で行われてもよい。例えば、一部の処理がパソコンなどにより行われ、残りの処理がヘッドホン43に内蔵されたDSP(Digital Signal Processor)などにより行われてもよい。
頭外定位処理装置100は、頭外定位処理部10と、フィルタ部41、フィルタ部42、及びヘッドホン43を備えている。
頭外定位処理部10は、畳み込み演算部11~12、21~22、及び加算器24、25を備えている。畳み込み演算部11~12、21~22は、空間音響伝達特性を用いた畳み込み処理を行う。頭外定位処理部10には、CDプレイヤーなどからのステレオ入力信号XL、XRが入力される。頭外定位処理部10には、空間音響伝達特性が設定されている。頭外定位処理部10は、各chのステレオ入力信号XL、XRに対し、空間音響伝達特性を畳み込む。空間音響伝達特性はユーザU本人の頭部や耳介で測定した頭部伝達関数HRTFでもよいし、ダミーヘッドまたは第三者の頭部伝達関数であってもよい。これらの伝達特性は、その場で測定してもよいし、予め用意してもよい。
空間音響伝達特性は、4つの伝達特性Hls、Hlo、Hro、Hrsに応じたフィルタを有している。4つの伝達特性に応じたフィルタは、後述するフィルタ生成装置を用いて求めることができる。
そして、畳み込み演算部11は、Lchのステレオ入力信号XLに対して伝達特性Hlsに応じたフィルタを畳み込む。畳み込み演算部11は、畳み込み演算データを加算器24に出力する。畳み込み演算部21は、Rchのステレオ入力信号XRに対して伝達特性Hroに応じたフィルタを畳み込む。畳み込み演算部21は、畳み込み演算データを加算器24に出力する。加算器24は2つの畳み込み演算データを加算して、フィルタ部41に出力する。
畳み込み演算部12は、Lchのステレオ入力信号XLに対して伝達特性Hloに応じたフィルタを畳み込む。畳み込み演算部12は、畳み込み演算データを、加算器25に出力する。畳み込み演算部22は、Rchのステレオ入力信号XRに対して伝達特性Hrsに応じたフィルタを畳み込む。畳み込み演算部22は、畳み込み演算データを、加算器25に出力する。加算器25は2つの畳み込み演算データを加算して、フィルタ部42に出力する。
フィルタ部41、42にはヘッドホン特性(ヘッドホンの再生ユニットとマイク間の特性)をキャンセルする逆フィルタが設定されている。そして、頭外定位処理部10での処理が施された再生信号に逆フィルタを畳み込む。フィルタ部41で加算器24からのLch信号に対して、逆フィルタを畳み込む。同様に、フィルタ部42は加算器25からのRch信号に対して逆フィルタを畳み込む。逆フィルタは、ヘッドホン43を装着した場合に、ヘッドホンユニットからマイクまでの特性をキャンセルする。マイクは、外耳道入口から鼓膜までの間ならばどこに配置してもよい。逆フィルタは、ユーザU本人の特性をその場で測定した結果から算出してもよいし、ダミーヘッド等の任意の外耳を用いて測定したヘッドホン特性から算出した逆フィルタを予め用意してもよい。
フィルタ部41は、補正されたLch信号をヘッドホン43の左ユニット43Lに出力する。フィルタ部42は、補正されたRch信号をヘッドホン43の右ユニット43Rに出力する。ユーザUは、ヘッドホン43を装着している。ヘッドホン43は、Lch信号とRch信号をユーザUに向けて出力する。これにより、ユーザUの頭外に定位された音像を再生することができる。
(フィルタ生成装置)
図2を用いて、空間音響伝達特性(以下、伝達特性とする)を測定して、フィルタを生成するフィルタ生成装置について説明する。図2は、フィルタ生成装置200の測定構成を模式的に示す図である。なお、フィルタ生成装置200は、図1に示す頭外定位処理装置100と共通の装置であってもよい。あるいは、フィルタ生成装置200の一部又は全部が頭外定位処理装置100と異なる装置となっていてもよい。
図2を用いて、空間音響伝達特性(以下、伝達特性とする)を測定して、フィルタを生成するフィルタ生成装置について説明する。図2は、フィルタ生成装置200の測定構成を模式的に示す図である。なお、フィルタ生成装置200は、図1に示す頭外定位処理装置100と共通の装置であってもよい。あるいは、フィルタ生成装置200の一部又は全部が頭外定位処理装置100と異なる装置となっていてもよい。
図2に示すように、フィルタ生成装置200は、ステレオスピーカ5とステレオマイク2を有している。ステレオスピーカ5が測定環境に設置されている。測定環境は、ユーザUの自宅の部屋やオーディオシステムの販売店舗やショールーム等でもよい。
本実施の形態では、フィルタ生成装置200の処理装置(図2では不図示)が、伝達特性に応じたフィルタを適切に生成するための演算処理を行っている。処理装置は、例えば、MP3(MPEG-1 Audio Layer-3)プレイヤー、CDプレイヤー等の音楽プレイヤーなどを有している。処理装置は、パーソナルコンピュータ(PC)、タブレット端末、スマートホン等であってもよい。
ステレオスピーカ5は、左スピーカ5Lと右スピーカ5Rを備えている。例えば、受聴者1の前方に左スピーカ5Lと右スピーカ5Rが設置されている。左スピーカ5Lと右スピーカ5Rは、インパルス応答測定を行うためのインパルス音等を出力する。
以下、本実施の形態では、音源となるスピーカの数を2(ステレオスピーカ)として説明するが、測定に用いる音源の数は2に限らず、1以上であればよい。すなわち、1chのモノラル、または、5.1ch、7.1ch等の、いわゆるマルチチャンネル環境においても同様に、本実施の形態を適用することができる。
ステレオマイク2は、左のマイク2Lと右のマイク2Rを有している。左のマイク2Lは、受聴者1の左耳9Lに設置され、右のマイク2Rは、受聴者1の右耳9Rに設置されている。具体的には、左耳9L、右耳9Rの外耳道入口又は鼓膜位置にマイク2L、2Rを設置することが好ましい。マイク2L、2Rは、ステレオスピーカ5から出力された測定信号を収音して、収音信号を取得する。例えば、測定信号はインパルス信号やTSP(Time Streched Pule)信号等でもよい。マイク2L、2Rは収音信号を後述するフィルタ生成装置200に出力する。受聴者1は、人でもよく、ダミーヘッドでもよい。すなわち、本実施形態において、受聴者1は人だけでなく、ダミーヘッドを含む概念である。
上記のように、左右のスピーカ5L、5Rで出力されたインパルス音をマイク2L、2Rで測定することでインパルス応答が測定される。フィルタ生成装置200は、インパルス応答測定に基づいて取得した収音信号をメモリなどに記憶する。これにより、左スピーカ5Lと左マイク2Lとの間の伝達特性Hls、左スピーカ5Lと右マイク2Rとの間の伝達特性Hlo、右スピーカ5Lと左マイク2Lとの間の伝達特性Hro、右スピーカ5Rと右マイク2Rとの間の伝達特性Hrsが測定される。すなわち、左スピーカ5Lから出力された測定信号を左マイク2Lが収音することで、伝達特性Hlsが取得される。左スピーカ5Lから出力された測定信号を右マイク2Rが収音することで、伝達特性Hloが取得される。右スピーカ5Rから出力された測定信号を左マイク2Lが収音することで、伝達特性Hroが取得される。右スピーカ5Rから出力された測定信号を右マイク2Rが収音することで、伝達特性Hrsが取得される。
そして、フィルタ生成装置200は、収音信号に基づいて、左右のスピーカ5L、5Rから左右のマイク2L、2Rまでの伝達特性Hls、Hlo、Hro、Hrsに応じたフィルタを生成する。具体的には、フィルタ生成装置200は、伝達特性Hls、Hlo、Hro、Hrsを所定のフィルタ長で切り出して、演算処理を行う。このようにすることで、フィルタ生成装置200は、頭外定位処理装置100の畳み込み演算に用いられるフィルタとして生成する。図1で示したように、頭外定位処理装置100が、左右のスピーカ5L、5Rと左右のマイク2L、2Rとの間の伝達特性Hls、Hlo、Hro、Hrsに応じたフィルタを用いて頭外定位処理を行う。すなわち、伝達特性に応じたフィルタをオーディオ再生信号に畳み込むことにより、頭外定位処理を行う。
ここで、電源ノイズや空調等によるいわゆる暗騒音(定在波、定常波)と近い周波数帯域である、低周波数帯域に対して、測定により得られる特性の精度をさらに向上させるための検討について説明する。ここでは、ダミーヘッドによる詳細な測定と、その測定によって得られる特性を用いた各個人の特性データの補正を検討する。
上述した暗騒音等または突発的なノイズ等の外乱による影響を軽減するため、フィルタ生成装置200は、同期加算を行っている。左のスピーカ5L又は右のスピーカ5Rが同じ測定信号を一定の時間間隔で繰り返し出力する。そして、左マイク2L、及び右マイク2Rが複数の測定信号を収音して、それぞれの測定信号に対応する収音信号を同期して加算している。例えば、同期加算回数が16回の場合、左のスピーカ5L又は右のスピーカ5Rが測定信号を16回出力する。そして、左マイク2L、及び右マイク2Rが16個の収音信号を同期して加算している。このようにすることで、暗騒音等または突発的なノイズ等の外乱による影響を軽減することができ、適切なフィルタを生成することができる。
左のスピーカ5L又は右のスピーカ5Rは、前の測定信号の残響などが無い状態で、次の測定信号を出力する必要がある。よって、測定信号を出力する時間間隔をある程度長くしなければならない。そのため、同期加算回数が多くなると、全体の測定時間が長くなってしまう。受聴者1は、測定中、動かずに静止していなければならない。受聴者1がユーザU個人の場合、測定時間を長くすることはユーザUにとって負担になる。そのため、本実施の形態では、ユーザ個人の測定では、同期加算回数を少なくしている。
一方、同期加算回数を多くすることで、外乱の影響をより少なくすることができる。そのため、ダミーヘッドを用いた測定では、同期加算回数を多くしても、ユーザUの放胆とはならない。よって、本実施の形態では、ダミーヘッドを用いた測定と、ユーザU個人の測定で同期加算回数を変えている。
例えば、受聴者1としてのダミーヘッドにステレオマイク2を装着した状態では、同期加算回数が64回の測定が行われる。一方、実際のユーザUにマイク2を装着した状態では、同期加算回数が16回の測定が行われる。ここで、ダミーヘッドにステレオマイク2を装着した状態で得られた測定をコンフィギュレーション測定とし、コンフィギュレーション測定に基づくデータをコンフィギュレーションデータとする。実際に頭外定位受聴を行うユーザUにマイク2を装着した状態の測定を個人測定とし、個人測定に基づくデータを個人測定データとする。フィルタ生成装置200は、個人測定データをコンフィギュレーションデータで補正する。
具体的には、補正上限周波数よりも低い低周波数帯域(補正帯域とも称する)については、個人測定データをコンフィギュレーションデータで補正する。例えば、低周波数帯域については、個人測定データの値(例えば、パワー、又は振幅)をコンフィギュレーションデータの値(例えば、パワー、又は振幅)で置き換える。補正上限周波数よりも高い高周波数帯域については、個人測定データの値をそのまま用いる。このように、フィルタ生成装置200は、コンフィギュレーションデータと個人測定データを合成することで、伝達特性に応じたフィルタを生成する。本実施の形態では、位相スペクトルは補正せず、パワースペクトルのみを補正している。
個人測定の同期加算回数をコンフィギュレーション測定の同期加算回数よりも少なくすることで、ユーザの負担を軽減することができる。すなわち、個人測定の同期加算回数を少なくすることで、ユーザUが実際に測定信号を受聴する測定時間を短くすることができる。これにより、ユーザ負担を軽減することができる。また、コンフィギュレーション測定での同期加算回数を多くすることで、フィルタの低周波数帯域を適切に設定することができる。
ここで、同期加算回数による測定データの違いについて、説明する。図3は、同期加算回数を16回とした測定データを示し、図4は、同期加算回数を64回とした測定データを示す。図3、図4は、同期加算した同期加算信号を高速フーリエ変換(FFT)で解析した対数パワースペクトルを示している。また、図3、図4とも受聴者1としてダミーヘッドを用いた場合の測定データを示している。本実施の形態の測定では、サンプリング周波数は48kHz、測定フレーム長は8192サンプルとしている。図3、図4は、8192サンプルのデータ(以下、RAWデータ)の対数パワースペクトルを示している。
図3、図4は、4つの伝達特性Hls、Hlo、Hro、Hrsの対数パワースペクトルを示している。図3では、16回の同期加算回数を1セットとして、5セットの測定を行った結果を示し、図4は64回の同期加算回数を1セットとして、5セットの測定を行った結果を示している。したがって、図3、図4のそれぞれには、伝達測定Hlsについて、5つの対数パワースペクトルが示されている。同様に、伝達特性、Hlo、Hro、Hrsについても、それぞれ5つの対数パワースペクトルが示されている。図3、図4には、それぞれ20個の対数パワースペクトルが示されている。
図3、図4中の丸枠に囲まれた箇所から見て取れるように、約40Hz~200Hzの周波数帯域において、16回の同期加算回数よりも64回の同期加算回数のほうが、伝達特性が安定しており、精度が高いことがわかる。すなわち、同期加算回数が16回の場合、図3に示すように、約40Hz~200Hzの周波数帯域において、セット毎のばらつきが大きくなる。
図5、図6は、マイク特性の補正、4096サンプル長へのフィルタの切り出し、及び窓掛けの処理が行われた同期加算信号の対数パワースペクトルを示している。図5は、同期加算回数が16回の測定データ、すなわち、図3に対応するRAWデータに処理を行った対数パワースペクトルを示している。図6は、同期加算回数が64回の測定データ、すなわち、図4に対応するRAWデータに処理を行った対数パワースペクトルを示している。
この場合も、図5、図6中の丸枠に囲まれた箇所から見て取れるように、約40Hz~200Hzの周波数帯域において、16回の同期加算回数よりも64回の同期加算回数のほうが、伝達特性が安定しており、精度が高いことがわかる。すなわち、同期加算回数が16回の場合、図5に示すように、約40Hz~200Hzの周波数帯域において、セット毎のばらつきが大きくなる。
図7に、同期加算による定常波減衰率を示す。図7は、サンプリング周波数48kHz、同期フレーム内サンプル数8192、の場合における、純音1Hzから200Hzまでの1Hz毎の定常波減衰率を示している。また、図7では、同期加算回数が16回と64回の場合の定常波減衰率を示している。同期加算回数が64回の場合、概ね-20dB以上の減衰率が得られることが分かる。すなわち、同期加算回数が64回の場合、外乱による定常波が十分に減衰していることが分かる。さらに、同期加算回数が16回と比較すると、64回の場合、全体的に数十dBの改善が得られていることが分かる。したがって、200Hz以下の低周波数帯域において、同期加算回数を64回とすることで、外乱の影響を十分低減することができる。
暗騒音の周波数帯域と近い低周波数帯域の測定制度を向上させるためには、同期加算回数を多くすることが好ましい。そこで、本実施の形態では、低周波数帯域については、ダミーヘッドを用いたコンフィギュレーション測定を行うことで、同期加算回数を多くしている。すなわち、ダミーヘッドにステレオマイク2を装着した状態で伝達特性の測定を行うことで、同期加算回数を多くした場合でも、ユーザの負担を軽減することができる。そして、フィルタ生成装置200は、個人測定データをコンフィギュレーションデータで補正する。
ここで、個人測定データの一例を図8に示す。図8は、受聴者1をユーザUとした場合の測定結果を示すグラフである。図8では、図6と同様に、マイク特性の補正、4096サンプル長へのフィルタの切り出し、窓掛けを行ったデータに対して、FFTで解析した対数パワースペクトルを示している。図8は、同期加算回数を64回にした時の個人測定データを示している。
図6と図8とを比較してわかるように、低周波数帯域の対数パワースペクトルの形状は、コンフィギュレーションデータと個人測定データとの間で同等となっている。理論的にも、低周波数帯域の頭部伝達関数は、各個人でほとんど差がないことが分かっている。すなわち、低周波数帯域の対数パワースペクトルの形状は、ユーザUによる個人差がほとんどない。したがって、低周波数帯域の個人測定データを、コンフィギュレーションデータで補正することが可能である。
ここで、図6、図8等に示した対数パワースペクトルにおいて、同期加算信号の時間波形におけるサンプル値の二乗総和(=セグメンタルパワー)について、伝達特性Hls,Hrsのいずれか大きい方が1となるように、データを正規化している。すなわち、4つの伝達特性Hls、Hlo、Hro、Hrsに同じ係数を乗じることで、正規化が行われている。しかしながら、正規化を行ったとしても、図6、図8の丸枠に示すように、低周波数帯域のレベルに違いが生じていることが分かる。
そこで、本実施の形態では、調整帯域におけるコンフィギュレーションデータと個人測定データに応じて、レベル調整を行うことが好ましい。調整帯域は、補正上限周波数よりも高い周波数を含んでいる。調整帯域は、例えば、200Hz~500Hzとなっている。すなわち、このレベル調整の詳細については後述する。
次に、本実施の形態にかかるフィルタ生成方法について、図9を用いて説明する。図9は、フィルタ生成方法の概要を示すフローチャートである。
まず、コンフィギュレーション測定を行うため、フィルタ生成装置200が、ダミーヘッドを用いて、同期加算回数64回での測定を行う(S11)。すなわち、図2に示した測定環境において、受聴位置にダミーヘッドを設置して、ダミーヘッドにステレオマイク2を装着する。そして、ステレオスピーカ5が、同じ測定信号を64回出力する。ステレオマイク2が収音した64個の収音信号を同期して加算する。これにより、伝達特性Hls、Hlo、Hro、Hrsのそれぞれに対応する同期加算信号が取得される。
次に、フィルタの切り出しを行う(S12)。例えば、S11で取得した同期加算信号に対して、4096サンプル長へのフィルタの切り出し処理を前処理として行う。同期加算信号は部屋の残響などを考慮し、十分に長い時間のデータであるため、フィルタ生成装置200は、必要なサンプル数のデータ長に切り出しを行う。なお、フィルタ生成装置200が、切り出されたフィルタに対して、DC成分のカット、マイク特性の補正、及び窓掛け等の処理を前処理として行ってもよい。
そして、フィルタ生成装置200が、前処理されたデータをコンフィギュレーションデータとして保存する(S13)。具体的には、フィルタ生成装置200が前処理されたコンフィギュレーションデータを、周波数領域のデータに変換する。フィルタ生成装置200が周波数領域のデータをコンフィギュレーションデータとして保存する。例えば、フィルタ生成装置200は、FFTを行うことで、対数パワースペクトルと位相スペクトルを算出する。対数パワースペクトルと位相スペクトルとがコンフィギュレーションデータとしてメモリなどに保存される。
次に、個人測定データを取得するため、ユーザUにステレオマイク2を装着して、同期加算回数16回での測定を行う(S21)。すなわち、ユーザUが図2で示した測定環境の受聴位置に座り、ステレオマイク2を装着する。そして、ステレオスピーカ5が、同じ測定信号を16回出力する。ステレオマイク2が収音した16個の収音信号を同期して加算する。これにより、伝達特性Hls、Hlo、Hro、Hrsのそれぞれに対応する同期加算信号が取得される。
次に、フィルタの切り出しを行う(S22)。例えば、S21で取得した同期加算信号に対して、4096サンプル長へのフィルタの切り出し処理を前処理として行う。同期加算信号は部屋の残響などを考慮し、十分に長い時間のデータであるため、フィルタ生成装置200は、必要なサンプル数のデータ長に切り出しを行う。なお、フィルタ生成装置200が、切り出されたフィルタに対して、DC成分のカット、マイク特性の補正、及び窓掛け等の処理を前処理として行ってもよい。
次に、フィルタ生成装置200が、個人測定データに対して、コンフィギュレーションデータを用いた補正を行う(S23)。そのため、まず、フィルタ生成装置200は、S22で前処理された個人測定データを周波数領域のデータに変換する。例えば、フィルタ生成装置200は、FFTを行うことで、対数パワースペクトルと位相スペクトルを算出する。
そして、個人測定データの対数パワースペクトルをコンフィギュレーションデータの対数パワースペクトルで補正する。具体的には、フィルタ生成装置200は、補正上限周波数よりも低い低周波数帯域では、個人測定データのパワー値をコンフィギュレーションデータのパワー値で置き換える。フィルタ生成装置200は、補正上限周波数よりも高い高周波数帯域では、個人測定データのパワー値をそのまま用いる。すなわち、フィルタ生成装置200は、低周波数帯域のコンフィギュレーションデータのパワー値と、高周波数帯域の個人測定データのパワー値とを組み合わせることで、補正データを生成している。
なお、フィルタ生成装置200は、補正を行う際において、個人測定データとコンフィギュレーションデータとのレベルを調整してもよい。具体的には、調整帯域の個人測定データとコンフィギュレーションデータとの対数パワースペクトルに基づいて、コンフィギュレーションデータの対数パワースペクトルのレベル調整を行っている。調整帯域は、第1の周波数と第2の周波数との間の帯域である。第1の周波数は第2の周波数より高く、かつ、上記した、補正上限周波数よりも高い。また、ここでは、第2の周波数を補正上限周波数よりも高くしているが、第1の周波数は補正上限周波数よりも低い周波数であってもよい。
図10、図11に補正前の対数パワースペクトルと補正後の対数パワースペクトルの一例を示す。図10では、補正前の個人測定データが破線で示され、コンフィギュレーションデータが実線で示されている。図11では、補正後のデータが破線で示され、コンフィギュレーションデータが実線で示されている。低周波数帯域において、補正後の対数パワースペクトルとコンフィギュレーションデータは一致する。
具体的な一例では、補正上限周波数は150Hz、第1の周波数は500Hz、第2の周波数は200Hzである。すなわち、調整帯域は、200Hz~500Hzとなる。フィルタ生成装置200は、個人測定データにおける150Hz以下のパワー値を、コンフィギュレーションンデータで置換する。個人測定データを補正する低周波数帯域は、最低周波数から150Hzの帯域である。個人測定データを補正しない高周波数帯域は補正上限周波数よりも高い帯域である。補正上限周波数は100Hz以上、200Hz以下とすることが好ましい。
次に、フィルタ生成装置200の処理装置と、その処理について詳細に説明する。図12は、フィルタ生成装置200の処理装置210を示す制御ブロック図である。図13は、処理装置210における処理を示すフローチャートである。
処理装置210は、フィルタ生成装置(フィルタ生成部)として機能する。処理装置210は、測定信号生成部211、収音信号取得部212、第1の同期加算部213、第2の同期加算部214、波形切り出し部215、DCカット部216、第1の窓掛部217、正規化部218、位相合わせ部219、第1の変換部220、レベル調整部221、第1の補正部222、第1の逆変換部223、第2の窓掛部224、第2の変換部225、第2の補正部226、第2の逆変換部227、及び第3の窓掛部228を備えている。
例えば、処理装置210は、パーソナルコンピュータ、スマートホン、タブレット端末などの情報処理装置であり、音声入力インターフェース(IF)と音声出力インターフェースを備えている。すなわち、処理装置210は、ステレオマイク2、及びステレオスピーカ5に接続される入出力端子を有する音響デバイスである。
測定信号生成部211は、D/A変換器やアンプなどを備えており、測定信号を生成する。測定信号生成部211は、生成した測定信号をステレオスピーカ5にそれぞれ出力する。左スピーカ5Lと右スピーカ5Rがそれぞれ伝達特性を測定するための測定信号を出力する。左スピーカ5Lによるインパルス応答測定と、右スピーカ5Rによるインパルス応答測定がそれぞれ行われる。測定信号はインパルス音等の測定音を含んでいる。
ステレオマイク2の左マイク2L、右マイク2Rがそれぞれ測定信号を収音し、収音信号を処理装置210に出力する。収音信号取得部212は、左マイク2L、右マイク2Rからの収音信号を取得する。なお、収音信号取得部212は、A/D変換器、及びアンプなどを有しており、左マイク2L、右マイク2Rからの収音信号をA/D変換、増幅などしてもよい。収音信号取得部212は、取得した収音信号を第1の同期加算部213又は第2の同期加算部214に出力する。
個人測定の場合、測定信号生成部211は、16回の測定信号を繰り返し、左スピーカ5L又は右スピーカ5Rに出力する。そして測定信号生成部211は、16回の測定信号に対応する収音信号を第1の同期加算部213に出力する。第1の同期加算部213は、16回の収音信号を同期加算することで、第1の同期加算信号を生成する。第1の同期加算部213は、それぞれ伝達特性Hls、Hlo,Hro、Hrs毎に同期加算信号を生成する。
コンフィギュレーション測定の場合、測定信号生成部211は、64回の測定信号を繰り返し、左スピーカ5L又は右スピーカ5Rに出力する。そして測定信号生成部211は、64回の測定信号に対応する収音信号を第2の同期加算部214に出力する。第2の同期加算部214は、64回の収音信号を同期加算することで、第2の同期加算信号を生成する。第2の同期加算部214は、それぞれ伝達特性Hls、Hlo,Hro、Hrs毎に同期加算信号を生成する。
第1の同期加算信号は、個人測定データとなり、第2の同期加算信号はコンフィギュレーションデータとなる。
次に、波形切り出し部215が、第1及び第2の同期加算信号から必要なデータサンプル長の波形を切り出す(S31)。具体的には、8192サンプル長の第1及び第2の同期加算信号から4096サンプル長のデータを切り出す。
DCカット部216は、切り出し後の第1及び第2の同期加算信号のDC成分(直流成分)をカットする(S32)。これにより、第1及び第2の同期加算信号のDCノイズ成分が除去される。
第1の窓掛部217は、DC成分カット後の第1及び第2の同期加算信号に対して、第1の窓掛けを行う(S33)。窓関数は、同期加算信号の絶対最大値を基準に前後窓長の異なる窓関数の半分を掛ける。例えば、窓関数はハニング窓でもよいし、ハミング窓でもよい。また、全体に窓関数をかけずに、両端の一部にのみ窓関数をかけてもよい。第1の窓掛部217で用いられる窓関数は特に限定されるものではない。
なお、S31からS33の処理は、第1の同期加算信号及び第2の同期加算信号に対して同じとなっている。すなわち、切り出すサンプル長と窓関数は、第1の同期加算信号と第2の同期加算信号の間で同じとなっている。また、第1の同期加算信号と第2の同期加算信号との処理順は特に限定されるものではない。第2の同期加算信号に対してS31~S33の前処理を行った後、第1の同期加算信号に対してS31~S33の前処理を行ってもよい。あるいは、第1の同期加算信号に対してS31~S33の前処理を行った後、第2の同期加算信号に対してS31~S33の前処理を行ってもよい。すなわち、第1の同期加算信号に対して第2の同期加算信号よりも先にS31~S33の前処理を行ってもよく、第2の同期加算信号に対して第1の同期加算信号よりも先にS31~S33の前処理を行ってもよい。
次に、正規化部218は、窓掛処理後の同期加算信号に対して正規化を行う(S34)。具体的には、正規化部218は、伝達特性Hls、Hlo,Hro、Hrsの4つの同期加算信号についてデータの二乗総和を求める。正規化部218は、4つの二乗総和の中の最大値が1となるような係数を求める。正規化部218は、伝達特性Hls、Hlo,Hro、Hrsの4つの同期加算信号に対して、その係数を掛ける。例えば、第1の同期加算信号において、伝達特性Hls、Hlo,Hro、Hrsの係数K1は同じ値である。第2の同期加算信号において、伝達特性Hls、Hlo,Hro、Hrsの係数K2は同じ値である。
位相合わせ部219は、正規化後の第1の同期加算信号と第2の同期加算信号の位相合わせを行う(S35)。具体的には、位相合わせ部219は、伝達特性Hls、Hlo,Hro、Hrsのそれぞれに対して、絶対最大値をもつサンプル位置を求める。そして、第1の同期加算信号と第2の同期加算信号とにおいて、絶対最大値を持つサンプル位置が同じになるように、第2の同期加算信号をシフトする。
例えば、伝達特性Hlsの第1の同期加算信号と、伝達特性Hlsの第2の同期加算信号の位相合わせを行う場合を説明する。伝達特性Hlsの第1の同期加算信号の絶対最大値がサンプル位置N1であり、伝達特性Hlsの第2の同期加算信号の絶対最大値がサンプル位置N2であるとする。この場合、第1の同期加算信号と第2の同期加算信号の絶対最大値がサンプル位置N1で一致するよう、第2の同期加算信号を(N1-N2)だけシフトする。
同様に伝達特性Hloについても、第1の同期加算信号と第2の同期加算信号の絶対最大値が一致するように、第2の同期加算信号をシフトする。伝達特性Hroについても、第1の同期加算信号と第2の同期加算信号の絶対最大値が一致するように、第2の同期加算信号をシフトする。伝達特性Hrsについても、第1の同期加算信号と第2の同期加算信号の絶対最大値が一致するように、第2の同期加算信号をシフトする。なお、位相合わせの方法は上記の手法に限らず、第1の同期加算信号と第2の同期加算信号の相関などを用いてもよい。
次に、第1の変換部220は、位相合わせ後の第1及び第2の同期加算信号を周波数領域のデータに変換する(S36)。第1の変換部220は、FFTを用いて、第1の同期加算信号を第1の対数パワースペクトル及び第1の位相スペクトルを生成する。同様に第1の変換部220は、FFTを用いて、第2の同期加算信号を第2の対数パワースペクトル及び第2の位相スペクトルを生成する。
第1の対数パワースペクトル及び第1の位相スペクトルは、個人測定データであり、第2の対数パワースペクトル及び第2の位相スペクトルは、コンフィギュレーションデータである。なお、第1の変換部220は、対数パワースペクトルの代わりに振幅スペクトルを生成してもよい。また、第1の変換部220は、離散フーリエ変換や離散コサイン変換により、同期加算信号を周波数領域のデータに変換してもよい。
レベル調整部221は、対数パワースペクトルの基準値に基づいて、コンフィギュレーションデータのレベル調整を行う(S37)。具体的には、レベル調整部221は、第1の対数パワースペクトルと第2の対数パワースペクトルの基準値を求める。基準値は、例えば、所定の周波数範囲における対数パワースペクトルの平均値である。なお、レベル調整部221は、一定値以上の外れ値を、除外してもよい。あるいは、レベル調整部221は、一定値以上の外れ値を一定値に制限してもよい。なお、基準値の算出方法は、これに限られるものではない。例えば、ケプストラムスムージング、移動平均、直線近似等によるスムージングや変換を施したデータの平均値を基準値として用いることも可能であり、または、それらの中央値を基準値として用いることができる。
レベル調整部221は、第1の対数パワースペクトルの基準値を第1の基準値として算出し、第2の対数パワースペクトルの基準値を第2の基準値として算出する。そして、レベル調整部221は、第1の基準値及び第2の基準値に基づいて、第2の対数パワースペクトルのレベル調整を行う。具体的には、第2の基準値が、第1の基準値と一致するように第2の対数パワースペクトルのパワー値を調整する。例えば、第1の基準値と第2の基準値の比に応じた係数K3を第2の対数パワースペクトルに加算または減算する。なお、対数パワースペクトルに代えて振幅スペクトルを用いる場合は、係数K3を乗算することで振幅値を調整する。係数K3には、周波数によらない一定値を用いることができる。このようにして、レベル調整部221は、第1の対数パワースペクトルに基づいて、第2の対数パワースペクトルのレベル調整を行う。
第1の補正部222は、レベル調整後に対数パワースペクトルを用いて、第1の対数パワースペクトルを補正する(S38)。具体的には、第1の対数パワースペクトルの低周波数帯域のパワー値を第2の対数パワースペクトルのパワー値に置き換える。これにより、図10に示した対数パワースペクトルが図11に示す対数パワースペクトルに補正される。なお、低周波数帯域とは、上記の通り、補正上限周波数以下の帯域である。例えば、補正上限周波数は150Hzであるため、低周波数帯域は最低周波数~150Hzとなる。補正上限周波数よりも高い高周波数帯域では、第1の補正部222が第1の対数パワースペクトルのパワー値を補正せずに、そのまま用いる。なお、第1の補正部222により補正された対数パワースペクトルを第1の補正データ、又は第3の対数パワースペクトルとも称する。
第1の逆変換部223が第3の対数パワースペクトルを時間領域に逆変換する(S39)。具体的には、第1の逆変換部223が逆高速フーリエ変換(IFFT)を用いて、第1の補正データを時間領域に逆変換する。例えば、第1の逆変換部223が第3の対数パワースペクトルと第1の位相スペクトルとに逆離散フーリエ変換を施すことで、第1の補正データが時間領域のデータとなる。第1の逆変換部223は、逆離散フーリエ変換ではなく、逆離散コサイン変換等により、逆変換を行ってもよい。
第2の窓掛部224は、逆変換された第1の補正データに第2の窓掛けを施す(S40)。第2の窓掛けの処理は、S33の第1の窓掛けの処理と同じ処理であるため、説明を省略する。第2の窓掛けに用いる窓関数は、第1の窓掛けに用いる窓関数と同じものでもよく、異なるものでもよい。
第2の変換部225は、第2の窓掛け後の第1の補正データを周波数領域に変換する(S41)。第2の変換部225は、第1の変換部220と同様に、FFTを用いて、時間領域における第2の窓掛け後の第1の補正データを周波数領域の第1の補正データに変換する。第2の変換部225が算出した対数パワースペクトル及び位相スペクトルを第4の対数パワースペクトル、及び第4の位相スペクトルとする。第4の対数パワースペクトル、及び第4の位相スペクトルは、第2の窓掛け後の対数パワースペクトル、及び第4の位相スペクトルである。
次に、第2の補正部226は、第2の窓掛けによる減衰率から、第3の対数パワースペクトルを補正する(S42)。具体的には、第2の補正部226は、S38で算出された第3の対数パワースペクトルと、S41で算出された第4の対数パワースペクトルとのパワーの減衰率を求める。第2の補正部226は、第2の窓掛け前後の第1の補正データを比較して、所定の周波数帯域におけるパワーの減数率を算出する。そして、第2の補正部226は、減衰率に応じて、第3の対数パワースペクトルに対する第2の補正を行う。なお、第2の補正部226によって補正された対数パワースペクトルを第5の対数パワースペクトル、又は第2の補正データとする。
ここで、減衰率を算出するための周波数帯域を算出用帯域とする。算出用帯域は、対数パワースペクトルの一部の帯域である。算出用帯域は、同期加算信号のサンプル数やサンプリングレートを用いて求めることができる。算出用帯域は、所定の周波数よりも低い周波数の帯域である。算出用帯域は、低周波数帯域と異なる帯域となっていてもよく、同じ帯域であってもよい。
第2の補正部226は、算出用帯域における第3の対数パワースペクトルのパワー値と第4の対数パワースペクトルのパワー値を比較することで、第2の窓掛け処理による減衰率を求める。そして、算出用帯域に第3の対数パワースペクトルのパワー値を減衰率に応じて底上げする。例えば、算出用帯域における第3の対数パワースペクトルのパワー値に減衰率に応じた値を加えたり、乗じたりすることで、算出用帯域における第3の対数パワースペクトルのパワー値が底上げされる。具体的には、第4の対数パワースペクトルと第5の対数パワースペクトルとの減衰率が1となるように、第2の補正部226は第3の対数パワースペクトルを補正する。
そして、第2の逆変換部227は、第5の対数パワースペクトルを時間領域に逆変換する(S43)。第2の逆変換部227は、S39と同様に逆離散フーリエ変換等を行って、第2の補正データを時間領域に変換する。例えば、第2の逆変換部227が第5の対数パワースペクトルと第1の位相スペクトルとに逆離散フーリエ変換を施すことで、第2の補正データが時間領域のデータとなる。第2の逆変換部227は、逆離散フーリエ変換ではなく、逆離散コサイン変換により、逆変換を行ってもよい。
そして、第3の窓掛部228は、時間領域の第2の補正データに対して、窓掛けを行う(S44)。第3の窓掛部228は、S40の窓掛けと同じ窓関数を用いて、窓掛けを行う。これにより、処理が終了する。
上記の処理を行うことで、処理装置210が伝達特性に応じたフィルタを生成することができる。低周波数帯域の特性は、周波数帯域が近い、電源ノイズや空調等によるいわゆる暗騒音(定在波、定常波)の影響を排除することが難しい。また、低周波数帯域の特性は、個人差が小さい。よって、低周波数帯域については、コンフィギュレーションデータで個人測定データを置き換えている。これより、伝達特性に応じたフィルタを適切に生成することができる。処理装置210は、伝達特性Hls、Hlo、Hro、Hrs毎にフィルタを生成する。そして、処理装置210が生成したフィルタを、図1の畳み込み演算部11、12、21、22に設定する。このようにすることで、適切に頭外定位処理することができる。
頭外定位処理装置100のユーザUは短時間の簡易な測定のみでよいため、ユーザUの負担を軽減することができる。上記のフィルタを用いた結果、頭外定位された再生音の音質を向上することができる。これにより、聴感上、(1)耳の周囲に残る低周波数帯域の音像が明瞭となる、(2)左右の偏りが補正され違和感が減少する、(3)中低域の音圧バランスが良くなる、等の効果が得られる。
個人測定データの対数パワースペクトルと補正後の対数パワースペクトルを図14~図18に示す。図14~図18は異なる5人のユーザUに対して測定された個人測定データの対数パワースペクトルと、補正後の対数パワースペクトルを示している。図14~図18において、太線が補正後の対数パワースペクトルであり、細線が補正前の個人測定スペクトルである。また、図14~図18では、同じコンフィギュレーションデータが用いられている。図14~図18から、低周波数帯域の特性のばらつきが、補正処理により安定化していることが分かる。
なお、第1の補正部222が、低周波数帯域のパワー値を置き換えることで、第1の補正を行っていたが、補正する方法は、特に限定されるものではない。補正上限周波数の近傍に境界周波数帯域を設定して、境界周波数帯域において、指数関数的あるいは、線形的にパワー値を漸近させてもよい。
例えば、補正上限周波数を200Hzとし、200Hz~1kHzを境界周波数帯域とすることができる。200Hz以下の低周波数帯域では、第1の対数パワースペクトルのパワー値を第2の対数パワースペクトルのパワー値で置換する。1kHz以上では、第1の対数パワースペクトルのパワー値をそのまま用いる。境界周波数帯(200Hz~1kHz)では、200Hzのパワー値と1kHzのパワー値を漸近的につなぎ合わせる関数に基づいて、パワー値を設定する。この関数は、例えば、指数関数や線形関数とすることができる。
さらには、個人測定に応じて、補正上限周波数を可変とすることも可能である。例えば、一定の周波数幅を指定して、その周波数幅の範囲内で、第1の対数パワースペクトルと第2の対数パワースペクトルの差異が最小となる周波数点を探索する。探索された周波数点を補正上限周波数とすることができる。例えば、周波数幅が50Hzとして探索した場合において、80Hz~130Hzの周波数幅で、第1の対数パワースペクトルと第2の対数パワースペクトルの差異が最小となったとする。この場合、補正上限周波数を130Hzとすることができる。
コンフィギュレーション測定での同期加算回数を64回、個人測定での同期加算回数を16回としたが、それぞれの同期加算回数はこれに限られるものではない。すなわち、コンフィギュレーション測定での同期加算回数が個人測定での同期加算回数よりも多ければよい。個人測定での同期加算回数は2回以上であればよい。
個人測定での同期加算回数をコンフィギュレーション測定での同期加算回数よりも少なくすることで、個人測定時間を短縮することができる。よって、ユーザUの負担を軽減することができる。
ダミーヘッドを用いることで、同期加算回数を多くすることができるので、外乱などの影響を低減することができる。なお、ダミーヘッドを用いてコンフィギュレーション測定を行うことで、ユーザUの負担を軽減することができるが、コンフィギュレーション測定は、個人測定を行った個人(ユーザU)と異なる個人であってもよい。すなわち、1人のコンフィギュレーションデータを複数のユーザUに使用するようにしてもよい。このようにしても、ユーザUの負担を軽減することができる。
処理装置210において実施された全ての処理は必須ではない。例えば、S31~S34の処理、及びS35などの処理の一部又は全部は省略することが可能である。また、レベル調整部221によるS37を行うことで、適切にフィルタを生成することができるが、適宜省略することも可能である。S40~S44等の処理の一部又は全部を省略することも可能である。
なお、処理装置210は、物理的な単一な装置に限られるものではない。すなわち、処理装置210の一部の処理を他の装置で行うことも可能である。例えば、他の装置で測定したコンフィギュレーションデータを用意しておく。そして、処理装置210は、コンフィギュレーションデータの第2の対数パワースペクトルをメモリなどに格納しておく。コンフィギュレーションデータを予めメモリに格納しておくことで、複数のユーザUの個人測定データの補正に用いることができる。
上記処理のうちの一部又は全部は、コンピュータプログラムによって実行されてもよい。上述したプログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば光磁気ディスク)、CD-ROM(Read Only Memory)、CD-R、CD-R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(Random Access Memory))を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。
以上、本発明者によってなされた発明を実施の形態に基づき具体的に説明したが、本発明は上記実施の形態に限られたものではなく、その要旨を逸脱しない範囲で種々変更可能であることは言うまでもない。
この出願は、2017年2月15日に出願された日本出願特願2017-25707を基礎とする優先権を主張し、その開示の全てをここに取り込む。
本願は、伝達特性に応じたフィルタを生成するフィルタ生成装置に適用可能である。
U ユーザ
1 受聴者
2L 左マイク
2R 右マイク
5L 左スピーカ
5R 右スピーカ
9L 左耳
9R 右耳
10 頭外定位処理部
11 畳み込み演算部
12 畳み込み演算部
21 畳み込み演算部
22 畳み込み演算部
24 加算器
25 加算器
41 フィルタ部
42 フィルタ部
43 ヘッドホン
100 頭外定位処理装置
200 フィルタ生成装置
210 処理装置
211 測定信号生成部
212 収音信号取得部
213 第1の同期加算部
214 第2の同期加算部
215 波形切り出し部
216 DCカット部
217 第1の窓掛部
218 正規化部
219 位相合わせ部
220 第1の変換部
221 レベル調整部
222 第1の補正部
223 第1の逆変換部
224 第2の窓掛部
225 第2の変換部
226 第2の補正部
227 第2の逆変換部
228 第3の窓掛部
1 受聴者
2L 左マイク
2R 右マイク
5L 左スピーカ
5R 右スピーカ
9L 左耳
9R 右耳
10 頭外定位処理部
11 畳み込み演算部
12 畳み込み演算部
21 畳み込み演算部
22 畳み込み演算部
24 加算器
25 加算器
41 フィルタ部
42 フィルタ部
43 ヘッドホン
100 頭外定位処理装置
200 フィルタ生成装置
210 処理装置
211 測定信号生成部
212 収音信号取得部
213 第1の同期加算部
214 第2の同期加算部
215 波形切り出し部
216 DCカット部
217 第1の窓掛部
218 正規化部
219 位相合わせ部
220 第1の変換部
221 レベル調整部
222 第1の補正部
223 第1の逆変換部
224 第2の窓掛部
225 第2の変換部
226 第2の補正部
227 第2の逆変換部
228 第3の窓掛部
Claims (8)
- 測定信号を出力する音源から出力された前記測定信号を収音して、収音信号を取得するマイクと、
前記収音信号に基づいて、前記音源から前記マイクまでの伝達特性に応じたフィルタを生成するフィルタ生成部と、を備え、
前記フィルタ生成部は、
受聴者にマイクが装着された状態で取得された前記収音信号を第1の同期加算回数で同期加算することで、第1の同期加算信号を生成する第1の同期加算部と、
前記受聴者以外にマイクが装着された状態で取得された前記収音信号を、前記第1の同期加算回数よりも多い第2の同期加算回数で同期加算することで、第2の同期加算信号を生成する第2の同期加算部と、
前記第1の同期加算信号に対応する第1のスペクトルと、前記第2の同期加算信号に対応する第2のスペクトルを取得するように、前記第1及び第2の同期加算信号を周波数領域に変換する変換部と、
所定の周波数以下の帯域における第2のスペクトルを用いて、前記第1のスペクトルを補正して、第3のスペクトルを生成する補正部と、
前記第3のスペクトルを時間領域に逆変換する逆変換部と、を備えたフィルタ生成装置。 - 前記所定の周波数よりも高い第1の周波数と、前記第1の周波数よりも低い第2の周波数との間の帯域に含まれるデータを用いて、前記第2のスペクトルのレベルを調整する調整部をさらに備え、
前記補正部が前記調整部で調整された前記第2のスペクトルのデータを用いて、前記所定の周波数以下の帯域における前記第1のスペクトルのデータを補正する請求項1に記載のフィルタ生成装置。 - 前記補正部が、前記所定の周波数以下の帯域における前記第1のスペクトルのデータを、前記第2のスペクトルのデータに置換する請求項1、又は2に記載のフィルタ生成装置。
- 前記第2の同期加算部が、ダミーヘッドに前記マイクを装着した状態で取得された前記収音信号を加算することで、前記第2の同期加算信号を生成する請求項1から3のいずれか1項に記載のフィルタ生成装置。
- 音源から出力された測定信号をマイクで収音することで伝達特性に応じたフィルタを生成するフィルタ生成方法であって、
受聴者にマイクが装着された状態で取得された収音信号を第1の同期加算回数で同期加算することで、第1の同期加算信号を生成するステップと、
前記受聴者以外にマイクが装着された状態で取得された収音信号を、前記第1の同期加算回数よりも多い第2の同期加算回数で同期加算することで、第2の同期加算信号を生成するステップと、
前記第1の同期加算信号に対応する第1のスペクトルと、前記第2の同期加算信号に対応する第2のスペクトルを取得するように、前記第1及び第2の同期加算信号を周波数領域に変換するステップと、
所定の周波数以下の帯域における第2のスペクトルを用いて、前記第1のスペクトルを補正して、第3のスペクトルを生成するステップと、
前記第3のスペクトルを時間領域のデータに逆変換するステップと、を備えたフィルタ生成方法。 - 前記所定の周波数よりも高い第1の周波数と、前記第1の周波数よりも低い第2の周波数との間の帯域に含まれるデータを用いて、前記第2のスペクトルのレベルを調整するステップをさらに備え、
前記補正するステップでは、レベルが調整された前記第2のスペクトルを用いて、前記所定の周波数以下の帯域における前記第1のスペクトルを補正する請求項5に記載のフィルタ生成方法。 - 前記補正するステップでは、前記所定の周波数以下の帯域における前記第1のスペクトルのデータを、前記第2のスペクトルのデータに置換する請求項5、又は6に記載のフィルタ生成方法。
- ダミーヘッドに前記マイクを装着した状態で取得された前記収音信号を加算することで、前記第2の同期加算信号を生成する請求項5~7のいずれか1項に記載のフィルタ生成方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201780086106.XA CN110268722B (zh) | 2017-02-15 | 2017-12-20 | 滤波器生成装置以及滤波器生成方法 |
EP17897146.1A EP3585068B1 (en) | 2017-02-15 | 2017-12-20 | Filter generation device and filter generation method |
US16/540,857 US10687144B2 (en) | 2017-02-15 | 2019-08-14 | Filter generation device and filter generation method |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017025707A JP6753329B2 (ja) | 2017-02-15 | 2017-02-15 | フィルタ生成装置、及びフィルタ生成方法 |
JP2017-025707 | 2017-02-15 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
US16/540,857 Continuation US10687144B2 (en) | 2017-02-15 | 2019-08-14 | Filter generation device and filter generation method |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2018150719A1 true WO2018150719A1 (ja) | 2018-08-23 |
Family
ID=63170202
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2017/045615 WO2018150719A1 (ja) | 2017-02-15 | 2017-12-20 | フィルタ生成装置、及びフィルタ生成方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10687144B2 (ja) |
EP (1) | EP3585068B1 (ja) |
JP (1) | JP6753329B2 (ja) |
CN (1) | CN110268722B (ja) |
WO (1) | WO2018150719A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3588987A4 (en) * | 2017-02-24 | 2020-01-01 | JVC KENWOOD Corporation | FILTER GENERATION DEVICE, FILTER GENERATION METHOD AND PROGRAM |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111615045B (zh) * | 2020-06-23 | 2021-06-11 | 腾讯音乐娱乐科技(深圳)有限公司 | 音频处理方法、装置、设备及存储介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0833092A (ja) * | 1994-07-14 | 1996-02-02 | Nissan Motor Co Ltd | 立体音響再生装置の伝達関数補正フィルタ設計装置 |
JP2002159100A (ja) * | 2000-09-29 | 2002-05-31 | Nokia Mobile Phones Ltd | 2チャネル・ステレオ・フォーマットの左及び右のチャネル入力信号を左及び右のチャネル出力信号に変換する方法及び信号処理装置 |
JP2004526364A (ja) * | 2001-03-05 | 2004-08-26 | ビーイーフォー リミッテッド | 3次元音響環境をシミュレートするための方法とシステム |
JP2005223713A (ja) * | 2004-02-06 | 2005-08-18 | Sony Corp | 音響再生装置、音響再生方法 |
WO2006077953A1 (ja) * | 2005-01-24 | 2006-07-27 | Matsushita Electric Industrial Co., Ltd. | 音像定位制御装置 |
JP2008512015A (ja) | 2004-09-01 | 2008-04-17 | スミス リサーチ エルエルシー | 個人化されたヘッドフォン仮想化処理 |
JP2008154082A (ja) * | 2006-12-19 | 2008-07-03 | Yamaha Corp | 音場再生装置 |
JP4184420B2 (ja) | 2005-02-28 | 2008-11-19 | パイオニア株式会社 | 特性測定装置及び特性測定プログラム |
JP2014060691A (ja) * | 2012-08-23 | 2014-04-03 | Sony Corp | 音声処理装置および方法、並びにプログラム |
JP2017025707A (ja) | 2015-07-15 | 2017-02-02 | マツダ株式会社 | 気体燃料エンジンの燃料制御装置 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3385725B2 (ja) * | 1994-06-21 | 2003-03-10 | ソニー株式会社 | 映像を伴うオーディオ再生装置 |
JP2002135898A (ja) * | 2000-10-19 | 2002-05-10 | Matsushita Electric Ind Co Ltd | 音像定位制御ヘッドホン |
JP5540224B2 (ja) * | 2009-07-17 | 2014-07-02 | エタニ電機株式会社 | インパルス応答測定方法およびインパルス応答測定装置 |
JP5533248B2 (ja) * | 2010-05-20 | 2014-06-25 | ソニー株式会社 | 音声信号処理装置および音声信号処理方法 |
CN102347028A (zh) * | 2011-07-14 | 2012-02-08 | 瑞声声学科技(深圳)有限公司 | 双麦克风语音增强装置及方法 |
CN104244164A (zh) * | 2013-06-18 | 2014-12-24 | 杜比实验室特许公司 | 生成环绕立体声声场 |
CN105323666B (zh) * | 2014-07-11 | 2018-05-22 | 中国科学院声学研究所 | 一种外耳声音信号传递函数的计算方法及应用 |
CN104661153B (zh) * | 2014-12-31 | 2018-02-02 | 歌尔股份有限公司 | 一种耳机音效补偿方法、装置及耳机 |
JP6701824B2 (ja) * | 2016-03-10 | 2020-05-27 | 株式会社Jvcケンウッド | 測定装置、フィルタ生成装置、測定方法、及びフィルタ生成方法 |
-
2017
- 2017-02-15 JP JP2017025707A patent/JP6753329B2/ja active Active
- 2017-12-20 WO PCT/JP2017/045615 patent/WO2018150719A1/ja unknown
- 2017-12-20 EP EP17897146.1A patent/EP3585068B1/en active Active
- 2017-12-20 CN CN201780086106.XA patent/CN110268722B/zh active Active
-
2019
- 2019-08-14 US US16/540,857 patent/US10687144B2/en active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0833092A (ja) * | 1994-07-14 | 1996-02-02 | Nissan Motor Co Ltd | 立体音響再生装置の伝達関数補正フィルタ設計装置 |
JP2002159100A (ja) * | 2000-09-29 | 2002-05-31 | Nokia Mobile Phones Ltd | 2チャネル・ステレオ・フォーマットの左及び右のチャネル入力信号を左及び右のチャネル出力信号に変換する方法及び信号処理装置 |
JP2004526364A (ja) * | 2001-03-05 | 2004-08-26 | ビーイーフォー リミッテッド | 3次元音響環境をシミュレートするための方法とシステム |
JP2005223713A (ja) * | 2004-02-06 | 2005-08-18 | Sony Corp | 音響再生装置、音響再生方法 |
JP2008512015A (ja) | 2004-09-01 | 2008-04-17 | スミス リサーチ エルエルシー | 個人化されたヘッドフォン仮想化処理 |
WO2006077953A1 (ja) * | 2005-01-24 | 2006-07-27 | Matsushita Electric Industrial Co., Ltd. | 音像定位制御装置 |
JP4184420B2 (ja) | 2005-02-28 | 2008-11-19 | パイオニア株式会社 | 特性測定装置及び特性測定プログラム |
JP2008154082A (ja) * | 2006-12-19 | 2008-07-03 | Yamaha Corp | 音場再生装置 |
JP2014060691A (ja) * | 2012-08-23 | 2014-04-03 | Sony Corp | 音声処理装置および方法、並びにプログラム |
JP2017025707A (ja) | 2015-07-15 | 2017-02-02 | マツダ株式会社 | 気体燃料エンジンの燃料制御装置 |
Non-Patent Citations (1)
Title |
---|
See also references of EP3585068A4 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3588987A4 (en) * | 2017-02-24 | 2020-01-01 | JVC KENWOOD Corporation | FILTER GENERATION DEVICE, FILTER GENERATION METHOD AND PROGRAM |
Also Published As
Publication number | Publication date |
---|---|
CN110268722A (zh) | 2019-09-20 |
JP2018133682A (ja) | 2018-08-23 |
US20190373368A1 (en) | 2019-12-05 |
EP3585068A4 (en) | 2019-12-25 |
EP3585068A1 (en) | 2019-12-25 |
JP6753329B2 (ja) | 2020-09-09 |
EP3585068B1 (en) | 2023-06-14 |
US10687144B2 (en) | 2020-06-16 |
CN110268722B (zh) | 2021-04-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11115743B2 (en) | Signal processing device, signal processing method, and program | |
US10264387B2 (en) | Out-of-head localization processing apparatus and out-of-head localization processing method | |
US10555108B2 (en) | Filter generation device, method for generating filter, and program | |
US10687144B2 (en) | Filter generation device and filter generation method | |
WO2018150766A1 (ja) | 頭外定位処理装置、頭外定位処理方法、及び頭外定位処理プログラム | |
WO2018155164A1 (ja) | フィルタ生成装置、フィルタ生成方法、及びプログラム | |
JP6805879B2 (ja) | フィルタ生成装置、フィルタ生成方法、及びプログラム | |
WO2021059984A1 (ja) | 頭外定位フィルタ決定システム、頭外定位処理装置、頭外定位フィルタ決定装置、頭外定位フィルタ決定方法、及びプログラム | |
CN113412630B (zh) | 处理装置、处理方法、再现方法和程序 | |
US20230040821A1 (en) | Processing device and processing method | |
US20230114777A1 (en) | Filter generation device and filter generation method | |
US11228837B2 (en) | Processing device, processing method, reproduction method, and program | |
WO2021131337A1 (ja) | 処理装置、処理方法、フィルタ生成方法、再生方法、及びプログラム | |
JP2023024040A (ja) | 処理装置、及び処理方法 | |
JP2023024038A (ja) | 処理装置、及び処理方法 | |
JP2023047707A (ja) | フィルタ生成装置、及びフィルタ生成方法 | |
JP2023047706A (ja) | フィルタ生成装置、及びフィルタ生成方法 | |
JP2016181886A (ja) | 音場再生装置、音場再生方法、音場再生プログラム | |
JP2024097515A (ja) | フィルタ生成装置、フィルタ生成方法、及び頭外定位処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 17897146 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
ENP | Entry into the national phase |
Ref document number: 2017897146 Country of ref document: EP Effective date: 20190916 |