WO2014136629A1 - 信号処理装置、信号処理方法および信号処理プログラム - Google Patents

信号処理装置、信号処理方法および信号処理プログラム Download PDF

Info

Publication number
WO2014136629A1
WO2014136629A1 PCT/JP2014/054634 JP2014054634W WO2014136629A1 WO 2014136629 A1 WO2014136629 A1 WO 2014136629A1 JP 2014054634 W JP2014054634 W JP 2014054634W WO 2014136629 A1 WO2014136629 A1 WO 2014136629A1
Authority
WO
WIPO (PCT)
Prior art keywords
signal
phase
amplitude
sudden change
unit
Prior art date
Application number
PCT/JP2014/054634
Other languages
English (en)
French (fr)
Inventor
昭彦 杉山
良次 宮原
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Priority to US14/773,273 priority Critical patent/US9715885B2/en
Priority to JP2015504258A priority patent/JP6528679B2/ja
Publication of WO2014136629A1 publication Critical patent/WO2014136629A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/02Detecting, measuring or recording pulse, heart rate, blood pressure or blood flow; Combined pulse/heart-rate/blood pressure determination; Evaluating a cardiovascular condition not otherwise provided for, e.g. using combinations of techniques provided for in this group with electrocardiography or electroauscultation; Heart catheters for measuring blood pressure
    • A61B5/024Detecting, measuring or recording pulse rate or heart rate
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7203Signal processing specially adapted for physiological signals or for diagnostic purposes for noise prevention, reduction or removal
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/0002Remote monitoring of patients using telemetry, e.g. transmission of vital signals via a communication network
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/24Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
    • A61B5/316Modalities, i.e. specific diagnostic methods
    • A61B5/318Heart-related electrical modalities, e.g. electrocardiography [ECG]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Definitions

  • the present invention relates to a technique for detecting a change in a signal.
  • Patent Document 1 discloses a technique for evaluating the continuity of the phase component in the time direction and smoothing the amplitude component for each frequency (paragraphs 0135 to 0138).
  • Japanese Patent Application Laid-Open No. H10-228707 describes that a sudden frequency change is detected by measuring the amount of phase variation in the time direction.
  • Patent Document 3 in paragraph 0024, “pulses in a strong electric field environment are constantly monitored by monitoring the phase change of the complex vectors of the I and Q signals on the complex plane accompanying the superposition of the pulse noise. ”Is reliably detected. This phase change is along the time axis.
  • paragraph 0031 of Patent Document 4 states that “the phase linearization unit 25 corrects the jump of the phase signal ⁇ input from the polar coordinate conversion unit 24 by linearization and detects the phase signal ⁇ ′ as a result of the phase detection. Output to the unit 26 ". Further, paragraph 0051 of Patent Document 4 describes a phase tilt detection means, and paragraph 0040 includes “the input / output signal of the phase detector 26 (phase ⁇ ′ as an input signal, output signal” in FIG. 5). An example of the phase inclination d ⁇ ′) is shown.
  • Patent Document 4 states that “the phase linearization unit 25 corrects the jump of the phase signal ⁇ input from the polar coordinate conversion unit 24 by linearization and outputs the phase signal ⁇ ′ as a result of the phase detection unit 26. Output to ".
  • Patent Document 5 discloses a technique for detecting an impact sound using amplitude.
  • JP 2010-237703 A JP 2011-254122 A JP 2007-251908 A JP 2011-199808 JP WO2008 / 111462
  • Patent Documents 1 and 4 are not techniques for detecting a sudden change in an input signal.
  • Patent Document 2 an attempt is made to detect a sudden change in “frequency”
  • Patent Document 3 an attempt is made to detect pulse noise using a temporal change in the phase of an AM signal.
  • Patent Document 5 is an impact sound detection technique that uses only amplitude, and lacks robustness. That is, the techniques described in these documents cannot effectively detect a sudden change in signal.
  • An object of the present invention is to provide a technique for solving the above-described problems.
  • an apparatus provides: Conversion means for converting the input signal into a phase component signal and an amplitude component signal in the frequency domain; Calculation means for calculating feature quantities of the phase component signal and the amplitude component signal; Determination means for determining the possibility of existence of a sudden change in the input signal based on the feature amount calculated by the calculation means; It is provided with.
  • another apparatus provides: Conversion means for converting the input signal into a phase component signal in the frequency domain; First calculation means for calculating a first phase gradient based on the position of the sudden increase portion of the input signal; Second calculating means for calculating a second phase gradient of the phase component signal in the frequency domain; Determining means for determining the possibility of existence of a sudden change in the input signal based on the first phase gradient and the second phase gradient; It is provided with.
  • Still another apparatus provides: Conversion means for converting the input signal into a phase component signal in the frequency domain; Generating means for generating a low correlation signal by removing a time-correlated component included in the input signal from the input signal; Determination means for determining the presence of a sudden change included in the input signal based on the low correlation signal and the phase component signal; It is provided with.
  • Still another apparatus provides: Conversion means for converting the input signal into a phase component signal in the frequency domain; Linearity calculating means for calculating linearity of the phase component signal in the frequency domain; Determining means for calculating the possibility of a sudden change in the input signal based on the linearity calculated by the linearity calculating means;
  • a signal processing apparatus comprising:
  • the method according to the present invention comprises: Convert the input signal into a phase component signal and an amplitude component signal in the frequency domain, Calculating feature quantities of the phase component signal and the amplitude component signal, and determining the possibility of existence of a sudden change in the input signal based on the calculated feature quantity; Each step is included.
  • another method includes: Convert the input signal to a phase component signal in the frequency domain, Based on the position of the rapidly increasing portion of the input signal, the first phase gradient is calculated, Calculating a second phase slope of the phase component signal in the frequency domain; Determining the presence of a sudden change in the input signal based on the first phase slope and the second phase slope; Each step is included.
  • still another method includes: Convert the input signal to a phase component signal in the frequency domain, Removing a time-correlated component included in the input signal from the input signal to generate a low correlation signal; Based on the low correlation signal and the phase component signal, determine the possibility of the presence of a sudden change included in the input signal, Each step is included.
  • still another method includes: Convert the input signal to a phase component signal in the frequency domain, Calculate the linearity of the phase component signal in the frequency domain, Calculating the likelihood of a sudden change in the input signal based on the calculated linearity; Each step is included.
  • a program provides: Convert the input signal into a phase component signal and an amplitude component signal in the frequency domain, Calculating feature quantities of the phase component signal and the amplitude component signal, and determining the possibility of existence of a sudden change in the input signal based on the calculated feature quantity; Each step is executed by a computer.
  • another program provides: Convert the input signal to a phase component signal in the frequency domain, Based on the position of the rapidly increasing portion of the input signal, the first phase gradient is calculated, Calculating a second phase slope of the phase component signal in the frequency domain; Determining the presence of a sudden change in the input signal based on the first phase slope and the second phase slope; Each step is executed by a computer.
  • another program provides: Convert the input signal to a phase component signal in the frequency domain, Removing a time-correlated component included in the input signal from the input signal to generate a low correlation signal; Based on the low correlation signal and the phase component signal, determine the possibility of the presence of a sudden change included in the input signal, Each step is executed by a computer.
  • a sudden change in signal can be detected effectively.
  • the “voice signal” is a direct electrical change that occurs in accordance with voice and other sounds, and is used to transmit voice and other sounds, and is not limited to voice.
  • the signal processing device 100 is a device for detecting an input signal sudden change.
  • the signal processing device 100 includes a conversion unit 101, a calculation unit 102, and a signal sudden change determination unit 103.
  • the conversion unit 101 converts the input signal 110 into a phase component signal 120 and an amplitude component signal 130 in the frequency domain.
  • the calculation unit 102 calculates changes in the phase component signal 120 and the amplitude component signal 130.
  • the signal sudden change determination unit 103 determines a sudden change in the input signal based on the calculated change.
  • noise suppression apparatus as a second embodiment of the present invention will be described with reference to FIGS.
  • the noise suppression device of the present embodiment can be applied to noise suppression of, for example, a digital camera, a notebook computer, a mobile phone, a keyboard, a game machine controller, and a mobile phone push button. That is, a target signal such as voice, music, and environmental sound can be emphasized with respect to a signal (noise or interference signal) superimposed thereon.
  • the present invention is not limited to this, and can be applied to any signal processing apparatus that is required to detect a sudden signal change from an input signal.
  • a noise suppression device that detects and suppresses an impact sound will be described as an example of a sudden change in signal.
  • the noise suppression device according to the present embodiment appropriately suppresses the impact sound generated by the button operation in a mode in which an operation such as a button press is performed near the microphone, for example. Briefly, a time domain signal including an impact sound is converted into a frequency domain signal, and changes in phase component and amplitude component in the frequency space are calculated. Then, the presence of the impact sound is determined according to the combination of those changes.
  • FIG. 2 is a block diagram showing the overall configuration of the noise suppression apparatus 200.
  • a degradation signal (a signal in which a desired signal and noise are mixed) is supplied to the input terminal 206 as a sample value series.
  • the degradation signal supplied to the input terminal 206 is subjected to transformation such as Fourier transformation in the transformation unit 201 and is divided into a plurality of frequency components. A plurality of frequency components are processed independently for each frequency. Here, the description will be continued focusing on a specific frequency component.
  • the amplitude spectrum (amplitude component) 230 is supplied to the noise suppression unit 205 and the calculation unit 208
  • the phase spectrum (phase component) 220 is supplied to the phase control unit 202 and the calculation unit 208.
  • the conversion unit 201 supplies the degradation signal amplitude spectrum 230 to the noise suppression unit 205, but the present invention is not limited to this, and the power spectrum corresponding to the square of the amplitude spectrum is used as the noise suppression unit. You may supply to 205.
  • the noise suppression unit 205 estimates noise using the degraded signal amplitude spectrum 230 supplied from the conversion unit 201, and generates an estimated noise spectrum. Also, the noise suppression unit 205 suppresses noise using the degraded signal amplitude spectrum 230 supplied from the conversion unit 201 and the generated estimated noise spectrum, and the enhanced signal amplitude spectrum as a noise suppression result is used as the amplitude control unit 203. To communicate. Furthermore, the noise suppression unit 205 receives the determination result from the sudden change determination unit 209, and changes the degree of noise suppression according to whether or not there is a sudden change in the signal. While the noise suppression unit 205 protects the target sound using target sound detection, the amplitude may be replaced with the estimated background sound when a sudden signal change is detected.
  • the phase control unit 202 rotates (shifts) the deteriorated signal phase spectrum 220 supplied from the conversion unit 201 and supplies it to the inverse conversion unit 204 as the enhanced signal phase spectrum 240. Further, the rotation amount (shift amount) of the phase is transmitted to the amplitude control unit 203.
  • the amplitude control unit 203 receives the phase rotation amount (shift amount) from the phase control unit 202, calculates the amplitude correction amount, uses the amplitude correction amount to correct the emphasized signal amplitude spectrum at each frequency, and corrects the corrected amplitude.
  • the spectrum 250 is supplied to the inverse transform unit 204.
  • the inverse conversion unit 204 synthesizes the enhancement signal phase spectrum 240 supplied from the phase control unit 202 and the corrected amplitude spectrum 250 supplied from the amplitude control unit 203, performs inverse conversion, and outputs the enhancement signal as an output terminal 207. To supply.
  • the calculation unit 208 calculates each change in the frequency domain using the phase component signal 220 and the amplitude component signal 230 supplied from the conversion unit 201.
  • the sudden change determination unit 209 determines, for each frequency point, how much a sudden change in the signal exists (possibility of existence) based on the change calculated by the calculation unit 208.
  • FIG. 3 is a block diagram illustrating a configuration of the conversion unit 201.
  • the converting unit 201 includes a frame dividing unit 301, a windowing unit 302, and a Fourier transform unit 303.
  • the deteriorated signal samples are supplied to the frame dividing unit 301 and divided into frames for each K / 2 sample.
  • K is an even number.
  • the deteriorated signal samples divided into frames are supplied to the windowing processing unit 302 and multiplied by w (t) which is a window function.
  • the windowed output is supplied to the Fourier transform unit 303 and converted into a degraded signal spectrum Yn (k).
  • the degraded signal spectrum Yn (k) is separated into phase and amplitude, the degraded signal phase spectrum arg Yn (k) is sent to the phase control unit 202 and the calculation unit 208, and the degraded signal amplitude spectrum
  • a power spectrum can be used instead of an amplitude spectrum.
  • FIG. 4 is a block diagram showing the configuration of the inverse transform unit 204.
  • the inverse transform unit 204 includes an inverse Fourier transform unit 401, a windowing processing unit 402, and a frame synthesis unit 403.
  • the inverse Fourier transform unit 401 multiplies the enhancement signal amplitude spectrum 250 supplied from the amplitude control unit 203 by the enhancement signal phase spectrum 240 (arg Xn (k)) supplied from the phase control unit 202 to obtain an enhancement signal ( The left side of the following formula (4) is obtained.
  • the output signal at -1 (the left side of equation (7)) is obtained.
  • the obtained enhanced speech signal 260 is transmitted from the frame synthesis unit 403 to the output terminal 207.
  • the transformation in the transformation unit and the inverse transformation unit has been described as Fourier transformation, but other transformations such as Hadamard transformation, Haar transformation, wavelet transformation, etc. can be used instead of the Fourier transformation.
  • the Haar transform does not require multiplication and can reduce the area when the LSI is formed. Since the wavelet transform can change the time resolution depending on the frequency, an improvement in the noise suppression effect can be expected.
  • the noise suppression unit 205 can perform actual suppression after integrating a plurality of frequency components obtained in the conversion unit 201. At that time, high sound quality can be achieved by integrating more frequency components from a low frequency region having a high ability to discriminate auditory characteristics toward a high frequency region having a low ability. As described above, when noise suppression is executed after integrating a plurality of frequency components, the number of frequency components to which noise suppression is applied is reduced, and the overall calculation amount can be reduced.
  • the noise suppression unit 205 estimates noise using the deteriorated signal amplitude spectrum supplied from the conversion unit 201 and generates an estimated noise spectrum. Then, a suppression coefficient is obtained using the deteriorated signal amplitude spectrum from the conversion unit 201 and the generated estimated noise spectrum, is multiplied by the deteriorated signal amplitude spectrum, and is supplied to the amplitude control unit 203 as an enhanced signal amplitude spectrum.
  • noise suppression is performed according to the possibility that the sudden change in the signal exists.
  • the degree can also be changed.
  • the possibility of a sudden change in the signal is determined by frequency component, frequency band (integrated with an arbitrary number of continuous frequency components) or frame unit, and the frequency component and frequency are suppressed in order to suppress the sudden change. Different signal processing can be performed for each band or frame.
  • Non-Patent Document 1 For noise estimation, various estimation methods such as those described in Non-Patent Document 1 and Non-Patent Document 2 can be used.
  • Non-Patent Document 1 discloses a method in which an estimated noise spectrum is an average value of a deteriorated signal amplitude spectrum of a frame in which a target sound is not generated. In this method, it is necessary to detect the generation of the target sound. The section in which the target sound is generated can be determined by the power of the enhancement signal.
  • the enhancement signal is the target sound other than noise. Also, the target sound and noise levels do not change greatly between adjacent frames. For these reasons, the enhancement signal level in the past of one frame is used as an index for determining the noise interval. When the emphasized signal power of one frame in the past is below a certain value, the current frame is determined as a noise section.
  • the noise spectrum can be estimated by averaging the deteriorated signal amplitude spectrum of the frame determined as the noise interval.
  • Non-Patent Document 1 also discloses a method in which the estimated noise spectrum is an average value at the initial stage of estimation when the deteriorated signal amplitude spectrum is supplied. In this case, it is necessary to satisfy the condition that the target sound is not included immediately after the estimation is started. When the condition is satisfied, the degradation signal amplitude spectrum at the initial stage of estimation can be set as the estimated noise spectrum.
  • Non-Patent Document 2 discloses a method for obtaining an estimated noise spectrum from a statistical minimum value of a degraded signal amplitude spectrum.
  • the minimum value of the degradation signal amplitude spectrum in a certain period of time is statistically maintained, and the noise spectrum is estimated from the minimum value. Since the minimum value of the degraded signal amplitude spectrum is similar to the spectrum shape of the noise spectrum, it can be used as an estimated value of the noise spectrum shape. However, the minimum value is smaller than the original noise level. For this reason, a value obtained by appropriately amplifying the minimum value is used as the estimated noise spectrum.
  • the noise suppression unit 205 can perform various types of suppression, but representative examples include SS (Spectrum Subtraction) method and MMSE STSA (Minimum Mean-Square Error Short-Time Spectral Amplitude Estimator: And least square mean error short time amplitude spectrum estimation) method.
  • SS Specific Subtraction
  • MMSE STSA Minimum Mean-Square Error Short-Time Spectral Amplitude Estimator: And least square mean error short time amplitude spectrum estimation
  • the noise suppression unit 205 receives the sudden change determination result (information on whether or not there is a sudden change in the signal) from the sudden change determination unit 209, and determines the degree of noise suppression according to whether or not there is a sudden change in the signal. change. For example, signal processing can be performed to suppress the sudden change in the frequency component, frequency band, or frame unit where the signal suddenly changed.
  • the sudden change determination unit 209 determines a sudden change
  • the smaller one of the deteriorated signal amplitude spectrum and the estimated noise spectrum is supplied to the amplitude control unit 203 as an enhanced signal amplitude spectrum. That is, when the deteriorated signal amplitude spectrum is smaller than the estimated noise spectrum, the deteriorated signal amplitude spectrum can be output as it is, and otherwise, the input signal can be replaced with the estimated noise spectrum and output.
  • an important deteriorated signal amplitude spectrum component can be detected, and the detected important deteriorated signal amplitude spectrum component can be excluded from replacement by the estimated noise spectrum.
  • the magnitude of the degradation signal amplitude spectrum can be used as an index of importance when detecting an important degradation signal amplitude spectrum component.
  • a component having a large amplitude has a high probability that it is a component of the target signal, and holding this leads to prevention of sound quality deterioration of the target signal.
  • the peak property of the degraded signal amplitude spectrum can be used as an index of importance. It is highly probable that a deteriorated signal amplitude having a peak, that is, a value larger than the surroundings along the frequency axis, is a component of the target signal, and maintaining this will prevent deterioration of the sound quality of the target signal. Connected. In particular, since a significant peak, that is, an amplitude value that is significantly larger than the surrounding amplitude values, has a high importance, the sound quality of the target signal can be further enhanced by reliably protecting it.
  • the detection of the peak is disclosed in, for example, the pure tone component detection method of Non-Patent Document 3 and Non-Patent Document 4.
  • the detected peak may be evaluated according to a predetermined condition, and peaks that do not satisfy the condition may be excluded. For example, a peak having a value smaller than the estimated noise is unlikely to be a target signal. In other words, with the estimated noise as a reference, only a sufficiently larger peak can be left as a peak, and the others can be excluded. Whether it is sufficiently large can be determined by comparing with a constant multiple of the estimated noise. In this way, by evaluating whether the detected peak satisfies a predetermined condition and then selecting the final peak component, the detection of an erroneous peak is reduced and the suppression effect of the sudden signal change portion is increased. be able to.
  • the signal supplied to the amplitude control unit 203 can be changed according to the probability of sudden change.
  • a result obtained by mixing the result of the replacement and the deteriorated signal amplitude spectrum corresponding to the probability of sudden change is output as an enhanced signal amplitude spectrum.
  • the mixing process is executed with a greater weight applied to the result of the replacement.
  • the noise suppression unit 205 may perform suppression in multiple stages, such as suppression degree 0, suppression degree 1, and suppression degree 2, in accordance with the possibility of a sudden change in the signal.
  • the degree of suppression may be changed steplessly according to the determination result (for example, a numerical value of 0 to 1) of the sudden change determination unit.
  • FIG. 5 is a block diagram showing the configuration of the phase control unit 202 and the amplitude control unit 203.
  • the phase control unit 202 includes a phase rotation unit 501 and a rotation amount generation unit 502
  • the amplitude control unit 203 includes a correction amount calculation unit 503 and an amplitude correction unit 504.
  • the rotation amount generation unit 502 generates a rotation amount of the deteriorated signal phase spectrum for the frequency component determined by the sudden change determination unit 209 as “a sudden change in the signal”, and sends it to the phase rotation unit 501 and the correction amount calculation unit 503. Supply.
  • the phase rotation unit 501 rotates (shifts) the deteriorated signal phase spectrum 220 supplied from the conversion unit 201 by the supplied rotation amount, and the enhanced signal phase spectrum.
  • 240 is supplied to the inverse transform unit 204.
  • the correction amount calculation unit 503 determines an amplitude correction coefficient based on the rotation amount supplied from the rotation amount generation unit 502 and supplies it to the amplitude correction unit 504.
  • the rotation amount generation unit 502 generates a rotation amount using, for example, a random number.
  • a rotation amount using, for example, a random number.
  • the random number includes a uniform random number having a uniform occurrence probability, a normal random number having a normal distribution of occurrence probability, and the like.
  • Uniform random numbers can be generated by a linear congruential method or the like.
  • uniform random numbers generated by the linear congruential method are uniformly distributed in the range of 0 to (2 ⁇ M) -1.
  • M is an arbitrary integer
  • represents a power.
  • the phase rotation amount ⁇ needs to be distributed in the range of 0 to 2 ⁇ . Therefore, the generated uniform random number is converted.
  • the conversion is performed by the following equation (8).
  • R is a uniform random number
  • Rmax is the maximum value that the uniform random number can generate.
  • Rmax (2 ⁇ M) ⁇ 1.
  • the value of R can be used as the rotation amount. Since it is the amount of rotation, 2 ⁇ represents exactly one rotation. When the phase is rotated by 2 ⁇ , it is the same as when the phase is not rotated. Therefore, the rotation amount of 2 ⁇ + ⁇ is the same as that when the rotation amount is ⁇ .
  • the rotation amount ⁇ may be obtained by Expression (8).
  • the determination result of the sudden change determination unit 209 when and how much randomization is performed may be determined.
  • the phase rotation unit 501 receives the rotation amount from the rotation amount generation unit 502 and rotates the deterioration signal phase spectrum. If the degradation signal phase spectrum is expressed by an angle, it can be rotated by adding the value of the rotation amount ⁇ to the angle. When the deteriorated signal phase spectrum is expressed by a complex normal vector, it can be rotated by obtaining a normal vector of the rotation amount ⁇ and multiplying the deteriorated signal phase spectrum.
  • a normal vector of the rotation amount ⁇ is obtained by Expression (9).
  • is a rotation vector
  • j indicates sqrt ( ⁇ 1). Note that sqrt represents the square root.
  • FIGS. 6 and 7 show signals when the deteriorated signal is processed by the block diagram shown in FIG. The difference between FIG. 6 and FIG. 7 is the presence or absence of phase rotation.
  • FIG. 6 shows a signal when phase rotation is not performed
  • FIG. 7 shows a signal when phase rotation is performed from the frame 3.
  • a signal when the phase is not rotated will be described with reference to FIG. Depicted at the top of FIG. 6 is a degraded signal.
  • the deteriorated signal is divided into frames by the frame dividing unit 301.
  • the second signal from the top divided by the dotted line is a signal after frame division.
  • signals for four consecutive frames are shown.
  • the overlap rate of frames is 50%.
  • the signal divided into frames is windowed by the windowing processing unit 302.
  • the third signal from the top divided by the dotted line is the signal after the windowing process.
  • weighting by a rectangular window is performed in order to clearly show the influence of phase rotation.
  • the signal is converted into a frequency domain signal by the Fourier transform unit 303, but the signal in the frequency domain is omitted in FIG.
  • the signal converted into the time domain by the inverse Fourier transform unit 401 of the inverse transform unit 204 is illustrated.
  • the fourth signal from the top divided by the dotted line is the signal after phase rotation.
  • phase rotation is not performed in FIG. 6, there is no change from the signal after the windowing process.
  • the windowing process is performed again on the enhancement signal output from the inverse Fourier transform unit 401 of the inverse transform unit 204.
  • FIG. 6 shows a case where weighting by a rectangular window is performed.
  • the signal subjected to the windowing process is synthesized by the frame synthesis unit 403. At this time, it is necessary to align the time between frames. Since the overlap rate of frames is 50%, the frames overlap by exactly half. When phase rotation is not performed, the input signal and the output signal match as shown in FIG.
  • FIG. 7 shows a signal when the phase rotation is performed from the frame 3. Depicted at the top is the same degraded signal as in FIG. Signals after frame division and windowing processing are the same as in FIG.
  • FIG. 7 illustrates a case where a constant phase rotation is performed from the frame 3. Pay attention to the right-triangulated section shown below the dotted line in the phase rotation process. Due to the phase rotation process, the signals of frames 3 and 4 are shifted in the time direction. The signal subjected to phase rotation is subjected to windowing processing again, and frame synthesis is performed. At this time, a difference occurs in the signals of the frames 2 and 3 in the section ii where the frames 2 and 3 overlap. As a result, the output signal level after frame synthesis decreases in the interval ii. That is, when phase rotation is performed, the output signal level decreases in the section ii in FIG.
  • the decrease in the output signal level due to this phase rotation can be explained by frequency domain vector synthesis by replacing the time domain addition with the frequency domain addition.
  • FIG. 8 shows the deteriorated signals of two consecutive frames after the frame division and windowing process as x1 [n] and x2 [m].
  • the overlap rate is 50%.
  • n represents the discrete time of x1
  • m represents the discrete time of x2.
  • the frequency domain signal X [k] is expressed by the following equation (12) by Fourier transform of the time domain signal x [n].
  • k represents a discrete frequency
  • L is a frame length.
  • the inverse transform unit transforms the frequency domain signal into a time domain signal by Fourier transform.
  • Equation (18) Substituting Equation (16) and Equation (17) for time domain addition, the following Equation (18) is obtained. Furthermore, when Expressions (14) and (15) are substituted into the frequency domain signals X1 [k] and X2 [k] in Expression (18), the following Expression (19) is obtained. Furthermore, when the expression (19) is expanded, it is expressed as the following expression (20). Here, a summation operation included in each term of Expression (20) is considered. An arbitrary integer g is introduced, and the following formula (21) is established.
  • the correction amount calculation unit 503 determines the amplitude correction amount of the emphasized signal amplitude spectrum so as to correct the decrease amount of the output signal level.
  • phase rotation amount is determined by a uniform random number
  • a method of calculating the correction amount will be specifically described.
  • each frequency component is normalized to a unit vector by paying attention to the magnitude variation due to phase rotation.
  • the correction amount calculation unit 503 sets the correction coefficient to sqrt (2) and transmits it to the amplitude correction unit 504.
  • the occurrence probability of ⁇ is determined by a normal distribution. Therefore, in order to obtain the expected power value when phase rotation is performed using normal random numbers, it is necessary to perform weighting based on the occurrence probability of ⁇ .
  • a weight function f ( ⁇ ) based on the occurrence probability of ⁇ is introduced.
  • the cos ( ⁇ ) is weighted by the weight function f ( ⁇ ).
  • the expected power value can be obtained by normalizing with the integral value of the weighting function f ( ⁇ ).
  • the expected output power E (S " ⁇ 2) when phase rotation is performed with normal random numbers is the weighted function f ( ⁇ ) and its integral value in equation (35), which is the expected output power of uniform random numbers. It can be expressed as the following formula (40). Since the weight function f ( ⁇ ) can be expressed by a normal distribution, the following equation (41) is established. Here, ⁇ represents the variance and ⁇ represents the average.
  • the correction amount calculation unit 503 transmits the correction coefficient to the amplitude correction unit 504 as sqrt (1 / 0.805) when rotating the phase with a normal random number of the standard normal distribution.
  • the phase rotation may be performed for all the frequencies in the frame, but may be performed for a part of the frequencies in which the sudden change of the signal is detected. Amplitude correction is performed on the frequency at which phase rotation is performed, that is, the frequency at which a sudden signal change is detected. Therefore, the correction coefficient for the frequency at which phase rotation is not performed is 1.0. Only the correction coefficient of the frequency subjected to phase rotation is the value derived above.
  • the amplitude control unit 203 calculates the amplitude correction coefficient using the phase rotation amount transmitted from the phase control unit 202, multiplies the enhancement signal amplitude spectrum supplied from the noise suppression unit 205, and the inverse conversion unit 204. To supply. As a result, the degradation of the output signal when the deteriorated signal phase spectrum is rotated to obtain the enhanced signal phase spectrum can be eliminated.
  • phase rotation is to eliminate or weaken the peculiar pattern existing in the phase characteristics of the input degradation signal
  • any sequence that can achieve the purpose can be used for phase rotation.
  • it is effective to use a sequence having a period longer than half of the frame length (the number of frequency components having independent amplitude and power spectrum) and having a small correlation within one period.
  • FIG. 12 is a diagram for describing the internal configuration of calculation unit 208 and sudden change determination unit 209.
  • the calculation unit 208 includes a change amount calculation unit 1201 that calculates a phase change amount in the frequency direction, a flatness calculation unit 1202 that calculates a flatness of the phase change amount, and an amplitude in the frequency direction.
  • An amplitude flatness calculation unit 1203 for calculating the flatness of the image is included.
  • One flatness 1220 may be obtained for each frequency component, each band, or all frequencies. Further, flatness in a single band or a plurality of bands may be integrated and used instead of flatness in all frequencies.
  • the reason why the amount of change in the frequency direction of the phase becomes flat when there is a sudden change in the signal is as follows. Assume that an isolated pulse exists in the frame of the conversion unit 201. It is known that the phase gradient in the frequency direction when an isolated pulse is Fourier-transformed is uniquely determined corresponding to the position of the isolated pulse. For example, when the frame length in the conversion unit is L samples and the isolated pulse position is n0 (0 ⁇ n0 ⁇ L ⁇ 1), the phase gradient is ⁇ 2 ⁇ n0 / L. This is because the k-th frequency component D (k) obtained by Fourier transform is given by the following equation for an isolated pulse of amplitude a.
  • the determination result for each frequency may be corrected using the determination result for each frequency band or each frame. For example, when the determination result of a certain frequency band is “signal sudden change exists”, the determination result of all frequencies in the frequency band is forcibly set to “signal sudden change”. It is possible to reduce determination errors due to interference of signal components. On the other hand, when the determination result of a certain frequency band is "There is no signal sudden change”, by forcibly setting the determination result of all frequencies in that frequency band to "No signal sudden change”, It is also possible to reduce determination errors due to interference with other signal components.
  • each frequency is determined independently by correcting the ease of determination (threshold) in a direction in which it is easy to determine “existence” at each frequency in the band may be maintained.
  • the determination result is obtained for each frequency or frequency band, a sudden change can be suppressed for each frequency or frequency band, and more accurate suppression can be performed.
  • the differential value of the phase may be the amount of phase change, and the differential value may be the flatness 1220. In that case, if the second-order differential value of the phase is close to 0 (less than a predetermined value), it can be determined that the phase is flat. If the determination is made for each band or frequency component, a more detailed signal abrupt change determination process can be performed. That is, signal sudden changes can be suppressed independently for each band or frequency component, and more accurate signal sudden changes can be suppressed.
  • the change amount calculation unit 1201 calculates the change amount using the phase difference between adjacent frequencies
  • the linearity may be determined by differentiation based on the phase frequency. The smaller the variation of the plurality of differential results at the plurality of frequencies, the higher the linearity. Local linearity can be evaluated using local differential results. In particular, since differentiation between two adjacent frequency components can be approximated by a difference, in this case, it is determined that the linearity is higher as the variation of the plurality of differences is smaller. Flatness can be used as an index of variation.
  • the amplitude flatness calculation unit 1203 calculates an amplitude change 1225 along the frequency axis and supplies the change to the sudden change determination unit 209.
  • a frequency having a small change in amplitude between adjacent frequencies represents a sudden signal change.
  • one flatness 1225 may be obtained for each band or for all frequencies.
  • FM (Flatness Measure) representing flatness is obtained as in the following equation (46).
  • x (n) is the amplitude or power spectrum at the frequency n
  • N is the number of frequency components included in the flatness calculation section.
  • FM takes a value of 0.0 to 1.0. If completely flat, FM is 1.0.
  • Non-patent document 3 discloses the flatness.
  • Flatness can also be expressed using another index.
  • the average of x (n) is obtained for each band or for all frequencies, and the sum of squared differences between x (n) and the average value in each frequency component n is calculated for each band or for all frequencies. It can be flatness. Instead of all frequencies, one sum of squared difference values can be obtained in a single or a plurality of frequency bands, and this can be used as flatness. The flatness obtained in this way is 0.0 when the flatness is completely, and takes a larger value as the flatness decreases.
  • Smoothness may be used as another index of flatness. Smoothness can be expressed by the sum of absolute differences between adjacent samples along the frequency axis. Smoothness takes a large value for a waveform with many irregularities (non-smooth), and takes a small value for a waveform with few (smooth). This indicator is known as the total variation (TV: Total Variation).
  • the flatness along the frequency axis has been used as the flatness, but the flatness along the time axis can also be used. Since the amplitude and power suddenly increase in the signal sudden change portion, when this property is used, it can be determined that there is a signal sudden change when the flatness along the time axis is low. Specifically, when the difference in amplitude or power between the current frame and the immediately preceding frame is a certain value or more, it is determined that the flatness is low, that is, there is a sudden signal change. It is also possible to determine the difference in amplitude or power between adjacent frames for a plurality of frames from several frames in the past to the current frame, and define the result of linear or nonlinear combination of these as flatness.
  • the amplitude or power difference By using the information of the past frame, it becomes easy to detect a signal sudden change portion including a low frequency component, and the suppression performance thereof is improved.
  • this may be calculated for each frequency component, for each band, or for all frequencies.
  • the amplitude or power difference can be calculated for single or multiple bands. For example, by calculating the amplitude or power difference in a single band, particularly in a high frequency range, it is possible to reduce the influence of voice and other signals, and to detect a sudden signal change part more accurately. .
  • the two flatnesses described so far that is, the flatness along the frequency axis and the flatness along the time axis can be used singly or in combination.
  • Examples of combinations include detection of signal abrupt changes based on linear or nonlinear combination of two flatnesses, and combinations of detection results based on the respective flatnesses.
  • the flatness in the frequency direction is large and when the flatness in the time direction is small, it is determined that a sudden signal change has been detected. Therefore, it is necessary to devise methods such as combining them after reversing one of them.
  • the sudden change determination unit 209 determines a sudden change in the signal using two indexes of flatness of the phase change amount and amplitude flatness. This is because, when the amplitude is flat along the frequency axis (the variation is small), it is considered that there is a high possibility of a signal sudden change portion. This is self-evident because the sudden change in signal is pulsed (the amplitude increases and decreases in a short time) and the Fourier transform of the impulse becomes a white signal (with the same amplitude and power at all frequencies). . For example, one of the following can be selected as the determination method.
  • amplitude or power When processing a specific signal, for example, when detecting / suppressing an impact sound with small noise and close to an impulse, information on amplitude or power may be more reliable than phase information. For example, when detecting the shooting sound of a pistol in a quiet environment, it may be detected using only the amplitude. On the other hand, when the amplitude or power of the noise changes greatly, for example, in the case of detecting a shooting sound at the security of an airport, the amplitude and phase are weighted in a quiet (low noise) situation and a high noise situation. It is effective to change. In this case, the weighting of the amplitude and phase may be changed according to the presence or absence of noise and the time zone.
  • the plane takeoff and landing time can be known. Therefore, when the plane arrives (the timing when there is a lot of noise), the phase weight should be increased and used to detect the firing sound. Can do. This is because the detection of the impact sound using the phase information is more effective than the detection using the amplitude when signals other than the firing sound (impact sound to be detected) are mixed. On the other hand, in a situation where the noise is small, it is possible to detect the impact sound more effectively by making a determination with emphasis on the absolute value of the frequency domain vector of the input degraded signal, that is, the amplitude value. Of course, the value of the power spectrum may be used here instead of the amplitude spectrum.
  • the amplitude of the impact sound may not be flat depending on the type of signal. In that case, a sudden change in the signal can be detected with high accuracy by performing detection by increasing the weight of the phase flatness.
  • the calculation result of the amplitude flatness may be corrected using the obtained information so that the same result as when the amplitude is flat is obtained. it can. Specifically, the amplitude flatness is calculated after the amplitude spectrum 230 is multiplied by the amplitude of the impact sound or the inverse of the power spectrum shape by each frequency component.
  • the sudden change determination unit 209 outputs, as the determination result 1230, a signal sudden change (1) or no signal sudden change (0). However, a value between 0 and 1 corresponding to the absolute value of the flatness may be output as the determination result 1230. In that case, it is possible to obtain the likelihood (presence of existence) that the signal sudden change exists.
  • the possibility of existence can be obtained as follows, for example. First, a positive value is determined as a threshold value. The reason why the threshold value is positive is that a larger positive value for both the phase flatness and the amplitude flatness indicates a high possibility of a sudden signal change. The minimum value of both is zero.
  • the possibility of sudden signal change is set to 1.
  • the combination index is 0
  • the existence possibility is set to 0.
  • the general value of the possibility of existence is defined as a function of the combination index.
  • the simplest of such functions is a straight line.
  • the slope of the straight line and the y-intercept are determined so as to satisfy the boundary condition when the combination index is equal to 0 and 1.
  • the function any linear or non-linear function, polynomial, or the like may be used.
  • FIG. 13 is a graph showing the phase and the amount of change.
  • the amount of phase change changes as shown in the graph 1302 along the frequency axis in the frequency domain. This change leads to a flat frequency 1303 to determine the phase linearity.
  • the presence or degree of the sudden change of the signal is determined by determining the flatness by obtaining the linearity of the phase in this way. Is possible. Then, by rotating the phase spectrum or suppressing the amplitude spectrum in frequency components, frequency bands, or all frequencies where there is a sudden signal change such as impact sound, the sudden change can be suppressed or the effect can be weakened. Therefore, a high quality enhancement signal can be obtained.
  • FIG. 14 is a diagram illustrating a hardware configuration when the noise suppression apparatus 200 according to the present embodiment is realized using software.
  • the noise suppression apparatus 200 includes a processor 1410, a ROM (Read Only Memory) 1420, a RAM (Random Access Memory) 1440, a storage 1450, an input / output interface 1460, an operation unit 1461, an input unit 1462, and an output unit 1463.
  • the noise suppression apparatus 200 may include a camera 1464.
  • the processor 1410 is a central processing unit, and controls the entire noise suppression apparatus 200 by executing various programs.
  • the ROM 1420 stores various parameters in addition to the boot program that the processor 1410 should execute first.
  • the RAM 1440 includes an input signal 210, a phase component signal 220, an amplitude component signal 230, an emphasis signal 260, a phase change amount 1210, a phase change flatness 1220, an amplitude flatness 1225, and a sudden change determination result in addition to a program load area (not shown). It has an area for storing 1230 and the like.
  • the storage 1450 stores a noise suppression program 1451.
  • the noise suppression program 1451 includes a conversion module, a phase control module, an amplitude control module, an inverse conversion module, a noise suppression module, a phase linearity calculation module, an amplitude flatness determination module, and a sudden change determination module.
  • the processor 1410 executes each module included in the noise suppression program 1451, the conversion unit 201, phase control unit 202, amplitude control unit 203, inverse conversion unit 204, noise suppression unit 205, calculation unit 208, sudden change in FIG.
  • the storage 1450 may store a noise database.
  • the enhancement signal that is the output of the noise suppression program 1451 executed by the processor 1410 is output from the output unit 1463 via the input / output interface 1460.
  • the operation sound of the operation unit 1461 input from the input unit 1462 can be suppressed.
  • an application method such as detecting that a signal sudden change is included in the input signal input from the input unit 1462 and starting shooting by the camera 1464 is also possible.
  • FIG. 15 is a flowchart for explaining the flow of signal sudden change determination processing by the noise suppression program 1451.
  • step S1501 when a signal is input from the input unit 1462, the process proceeds to step S1503.
  • step S1503 the conversion unit 210 converts the input signal into the frequency domain and divides it into amplitude and phase.
  • step S1505 the calculation unit 208 sets the discrete frequency k to 1 and the count value I (k) to 0, and sequentially starts processing in the frequency space.
  • the calculation unit 208 calculates a phase change (differential value or difference value) at the set frequency.
  • step S1509 the calculation unit 208 calculates a change in phase change (differential value or difference value).
  • step S1510 calculation unit 208 calculates flatness FM (k) of amplitude A (k) using equation (46) described above.
  • the above steps S1501 to S1514 are repeated for all frames.
  • step S1517 I (k) is integrated in the frame, and when the integrated value of I (k) exceeds a predetermined threshold, the sudden change determination unit 209 determines that the frame includes a sudden signal change. Also good. At this time, the sudden change determination result may be integrated in the next frequency band. Further, as an effect of hangover, the threshold value N in the subsequent frame can be set large and ⁇ can be set small. By setting the threshold value of the subsequent frame in this way, it is possible to facilitate detection of a sudden signal change (impact sound) and to reduce detection omissions.
  • the threshold values N and ⁇ in the subsequent frame can be set for either one or both at the same time.
  • FIG. 16 is a diagram for describing a functional configuration of a noise suppression device 1600 according to the present embodiment.
  • the conversion unit 1601 generates a complex signal 1650
  • the calculation unit 1608 and the sudden change determination unit 1609 are based on the complex signal 1650 based on the phase linearity.
  • the difference is that the calculation of the signal and the determination of the sudden signal change are performed. Since other configurations and operations are the same as those of the second embodiment, the same configurations and operations are denoted by the same reference numerals, and detailed description thereof is omitted.
  • FIG. 17 is a diagram for explaining the internal configuration of the calculation unit 1608 and the sudden change determination unit 209.
  • the calculation unit 1608 includes a change amount calculation unit 1701 that calculates a phase change amount in the frequency direction, and a flatness calculation unit 1202 that calculates the flatness of the phase change amount.
  • One flatness 1220 may be obtained for each frequency component, each band, or all frequencies. Further, flatness in a single band or a plurality of bands may be integrated and used instead of flatness in all frequencies.
  • the differential value of the phase may be the amount of phase change, and the differential value may be the flatness 1220. In that case, if the second-order differential value of the phase is close to 0 (less than a predetermined value), it can be determined that the phase is flat. If the determination is made for each band or each frequency component, a finer signal sudden change detection process can be performed. That is, signal sudden changes can be suppressed independently for each band or frequency component, and more accurate suppression can be performed.
  • the sudden change determination unit 209 changes the frequency corresponding to the flatness (one frequency component, frequency band, or all frequencies (that is, one frame)) Is determined to be included.
  • the determination result 1230 signal sudden change (1) or signal sudden change (0) is output.
  • a value between 0 and 1 corresponding to the absolute value of the flatness may be output as the determination result 1230. In that case, it is possible to obtain the likelihood (possibility) that there is a sudden signal change.
  • phase linearity can be detected using a complex signal instead of a phase component signal.
  • FIG. 18 is a diagram for describing a functional configuration of a calculation unit 1808 included in the noise suppression device according to the present embodiment.
  • the calculation unit 1808 according to this embodiment is different from the third embodiment in that a unit vector generation unit 1881 and rotation vector generation units 1882 and 1883 are provided.
  • the sudden change determination unit 1809 determines whether or not there is a sudden change in the signal based on the rotation vector. Since other configurations and operations are the same as those of the third embodiment, the same configurations and operations are denoted by the same reference numerals, and detailed description thereof is omitted.
  • the unit vector generation unit 1881 uses the complex signal 1650 to convert the input spectrum (complex vector) into a unit vector for each frequency component. Specifically, the real part and imaginary part of complex signal 1650 are each divided by the amplitude value.
  • Rotation vector conversion unit 1882 converts unit vector 1810 into a rotation vector between adjacent frequencies (first rotation vector 1820).
  • the rotation amount (phase) of the rotation vector here is synonymous with the amount of phase change between unit vectors at adjacent frequencies.
  • the rotation vector 1820 can be calculated.
  • the rotation vector conversion unit 1883 checks the flatness (variation) along the frequency axis of the first rotation vector 1820 obtained by the rotation vector conversion unit 1882.
  • the amount of phase change along the frequency axis is constant, the variation of the rotation vector becomes small. Therefore, the amount of change in the first rotation vector 1820 is obtained along the frequency axis.
  • a rotation vector between adjacent frequencies is obtained. This is synonymous with differentiating the first rotation vector.
  • the sudden change determination unit 1809 recognizes the real part of the second rotation vector 1830 as the flatness. This is due to the following reason.
  • the second rotation vector 1830 is also a unit vector, its real part takes a value from ⁇ 1 to 1. As the phase changes linearly, the angle change amount of the first rotation vector is smaller (the variation in the rotation vector is smaller). The angle of the second rotation vector becomes smaller as the amount of change in the first rotation vector is smaller (the variation in the rotation vector is smaller). The smaller the angle of the second rotation vector, the larger the real part. Again, one flatness may be obtained for each frequency point, for each band, or for all frequencies.
  • the method for obtaining the flatness is not limited to the above.
  • the magnitude of the difference vector obtained by squaring and adding the real part and the imaginary part of the difference vector is defined as flatness. It may be used.
  • the angle of the second rotation vector can also be used as the flatness. The angle of the second rotation vector corresponds to the angle difference between the first rotation vectors of adjacent frequency components.
  • the sudden change determination unit 1809 determines a sudden change in the signal using the two parts of the real part of the second rotation vector 1830 and the amplitude flatness FM.
  • the use for the determination of the amplitude flatness is as already described regarding the operation of the sudden change determination unit 209.
  • the real part of the second rotation vector 1830 whether or not the real part exceeds a predetermined threshold value N (for example, 0.7 or 0.8) close to +1, or at any position between N and +1.
  • N for example, 0.7 or 0.8
  • the presence or degree of sudden change is determined depending on whether it exists.
  • signal sudden change (1) or signal sudden change (0) is output.
  • a value between 0 and 1 corresponding to the absolute value of the flatness may be output as the determination result 1840.
  • the flatness is compared with the first threshold value for each frequency component, and the number of frequency bins determined to be equal to or less than the first threshold value is counted. May be detected for each frame.
  • the sudden change of the signal can be detected by using the flatness of the phase change and the flatness of the amplitude in a balanced manner according to the situation. Further, if the determination is made for each band or for each frequency component, it is possible to perform more detailed signal sudden change detection processing. That is, signal sudden changes can be suppressed independently for each band or frequency component, and more accurate suppression can be performed.
  • FIG. 19 is a flowchart for explaining the flow of signal sudden change detection processing when the noise suppression program according to the present embodiment is executed.
  • the conversion unit 210 converts the input signal into the frequency domain, and generates a complex signal for each frequency component.
  • step S1505 the discrete frequency k is set to 1 and the count value I (k) is set to 0, and processing in the frequency space is started sequentially.
  • step S1907 the complex signal is converted into a unit vector at the set frequency.
  • step S1908 the unit vector of the adjacent frequency component is converted into a first rotation vector.
  • step S1909 the first rotation vector of the adjacent frequency component is converted to the second rotation vector.
  • step S1510 calculation unit 1203 calculates flatness FM (k) of amplitude A (k) using equation (46) described above.
  • the present embodiment it is possible to detect linearity from a rotation vector of a phase rotation vector using a complex signal and to detect an impact sound together with amplitude flatness.
  • the unit vector is used to determine the flatness in order to use the real part of the rotation vector, the present invention is not limited to this.
  • the magnitude of the angle of the second rotation vector may be compared with a threshold value instead of the real part of the second rotation vector, and it may be determined that there is a sudden signal change when the angle magnitude is larger than the threshold value.
  • the present invention is not limited to this. Absent. It can be used in various devices, systems and situations for the purpose of detecting impact sound. Furthermore, the detection target is not limited to an impact sound (an audio signal that rises suddenly and falls immediately). Even when the signal suddenly rises (or falls) and remains as it is, it can be detected as a sudden change portion.
  • a signal abrupt change unit called so-called attack employs an information compression method different from a normal one. It can also be applied to detection.
  • the analysis window length is changed and the preceding noise called pre-echo is suppressed, so detection is necessary.
  • a method of detecting using a change in amplitude or entropy it is possible to detect a sudden change with high accuracy and to effectively compress information.
  • a microphone 2001, a calculation unit 208, a sudden change determination unit 209, and a video recording unit 2002 are mounted on a vehicle 2000. If the video recording unit 2002 prohibits overwriting of a captured image by the camera using the detection of an impact sound as a trigger, a record of the accident situation can be left. At that time, overwriting preservation may be prohibited after a certain time delay from the detection of the impact sound. Unlike the case where the impact itself is used as a trigger, there is an advantage that the accident situation can be automatically recorded even when the impact is small or when another vehicle is in an accident.
  • an application example in which a calculation unit 208, a sudden change determination unit 209, and an alarm unit 2101 are connected to the electrocardiograph 2100 is also considered. It is possible to detect an abnormal heartbeat of an electrocardiogram more accurately and effectively. This is particularly effective when there is a lot of noise. Similarly, it can be applied to fetal echo monitor. In some cases, the heart sound cannot be correctly obtained due to noise interference, but in such a case, the present technology is effective. That is, it can be widely applied to detection of sudden changes in biological signals.
  • the signal processing device 2200 is a device for detecting an input signal sudden change. As illustrated in FIG. 22, the signal processing device 2200 includes a conversion unit 2201, a first calculation unit 2202, a second calculation unit 2203, and a signal sudden change determination unit 2204.
  • the conversion unit 2201 converts the input signal 2210 into a phase component signal 2220 and an amplitude component signal 2230 in the frequency domain.
  • the first calculation unit 2202 calculates the phase gradient 2250 based on the position of the rapid increase part in the time domain of the input signal 2210. It is known that the phase gradient in the frequency direction when an isolated pulse is Fourier-transformed is uniquely determined corresponding to the position of the isolated pulse. For example, when the frame length in the conversion unit is L samples and the isolated pulse position is n0, the phase gradient is ⁇ 2 ⁇ n0 / L. As an index for identifying the sudden increase portion, for example, the maximum value of the absolute amplitude value can be used. This indicator gives an accurate position when the actual signal is close to an isolated pulse (almost unimodal shape).
  • the maximum amplitude value does not give an accurate position.
  • an index using the maximum value of the absolute amplitude value and the second largest value of the absolute amplitude value is effective.
  • an intermediate value between both positions, a weighted average of both positions, or the like can be used.
  • an accurate position can be obtained by using the approximate center of the pulse.
  • Such an indicator has a center of gravity.
  • the second calculation unit 2202 calculates the gradient 2260 of the phase component signal 2220 in the frequency domain.
  • the sudden signal change determination unit 2204 determines a sudden change in the input signal based on the inclination calculated by the first calculation unit 2202 and the inclination calculated by the second calculation unit 2203.
  • a noise suppression apparatus as a seventh embodiment of the present invention will be described with reference to FIGS.
  • the noise suppression device of the present embodiment can be applied to noise suppression of, for example, a digital camera, a notebook computer, a mobile phone, a keyboard, a game machine controller, and a mobile phone push button. That is, a target signal such as voice, music, and environmental sound can be emphasized with respect to a signal (noise or interference signal) superimposed thereon.
  • the present invention is not limited to this, and can be applied to any signal processing apparatus that is required to detect a sudden signal change from an input signal.
  • a noise suppression device that detects and suppresses an impact sound will be described as an example of a sudden change in signal.
  • the noise suppression device according to the present embodiment appropriately suppresses the impact sound generated by the button operation in a mode in which an operation such as a button press is performed near the microphone, for example.
  • a time domain signal including an impact sound is converted into a frequency domain signal, and the slope of the phase component in the frequency space is calculated. Further, the slope of the phase in the frequency domain, that is, ⁇ 2 ⁇ n0 / N when the rapidly increasing portion of the time domain signal is regarded as an isolated pulse is obtained. Then, the presence of an impact sound is determined according to the degree of coincidence between the two types of phase gradients.
  • FIG. 23 is a block diagram showing the overall configuration of the noise suppression apparatus 2300.
  • a degradation signal (a signal in which a desired signal and noise are mixed) is supplied to the input terminal 2306 as a sample value series.
  • the degradation signal supplied to the input terminal 2306 is subjected to transformation such as Fourier transformation in the transformation unit 2301 and divided into a plurality of frequency components.
  • a plurality of frequency components are processed independently for each frequency.
  • the description will be continued focusing on a specific frequency component.
  • the amplitude spectrum (amplitude component) 2330 is supplied to the noise suppression unit 2305, and the phase spectrum (phase component) 2320 is supplied to the phase control unit 2302 and the calculation unit 2381.
  • the conversion unit 2301 supplies the time domain signal 2370 after the frame division and before the conversion such as the fast Fourier transform to the calculation unit 2382.
  • the conversion unit 2301 supplies the degraded signal amplitude spectrum 2330 to the noise suppression unit 2305.
  • the present invention is not limited to this, and the power spectrum corresponding to the square of the amplitude spectrum is used as the noise suppression unit. 2305 may be supplied.
  • the noise suppression unit 2305 estimates noise using the deteriorated signal amplitude spectrum 2330 supplied from the conversion unit 2301, and generates an estimated noise spectrum. Also, the noise suppression unit 2305 suppresses noise using the deteriorated signal amplitude spectrum 2330 supplied from the conversion unit 2301 and the generated estimated noise spectrum, and the enhanced signal amplitude spectrum as a noise suppression result is the amplitude control unit 2303. To communicate. Furthermore, the noise suppression unit 2305 receives the determination result from the sudden change determination unit 2309, and changes the degree of noise suppression according to the presence or absence of the sudden change of the signal. The noise suppression unit 2305 may detect the desired signal and protect the desired signal component for each frequency. On the other hand, when the signal sudden change exists and the desired signal component is not detected, the amplitude may be replaced with the estimated background sound.
  • the phase control unit 2302 rotates (shifts) the deteriorated signal phase spectrum 2320 supplied from the conversion unit 2301 and supplies it to the inverse conversion unit 2304 as the enhanced signal phase spectrum 2340. Further, the rotation amount (shift amount) of the phase is transmitted to the amplitude control unit 2303.
  • the amplitude control unit 2303 receives the amount of phase rotation (shift amount) from the phase control unit 2302, calculates the amplitude correction amount, uses the amplitude correction amount to correct the emphasized signal amplitude spectrum at each frequency, and corrects the corrected amplitude.
  • the spectrum 2350 is supplied to the inverse transform unit 2304.
  • the inverse conversion unit 2304 synthesizes the enhancement signal phase spectrum 2340 supplied from the phase control unit 2302 and the corrected amplitude spectrum 2350 supplied from the amplitude control unit 2303 to perform inverse conversion, and outputs the signal as an enhancement signal 2307. To supply.
  • the calculating unit 2381 calculates the slope (change) of the phase at each frequency by differentiating the phase component signal 2320 supplied from the converting unit 2301 with respect to the frequency.
  • the calculation unit 2382 receives the degraded signal sample 2370 divided into frames from the conversion unit 2301, calculates the absolute signal value of the frame, and calculates the slope of the phase in the frequency domain from the time indicating the rapid increase unit.
  • the sudden change determination unit 2309 compares the slopes of the phases provided from the calculation units 2381 and 2382, and determines how much a sudden change in the signal exists (possibility of existence) for each frequency point based on their similarity. To do.
  • an absolute difference value between the inclination obtained from the time domain signal and the inclination obtained from the frequency domain signal can be used, but is not limited thereto.
  • the distance between the value of the ratio of these two slopes and 1, the distance between the value obtained by normalizing the sum of them by twice the slope of either, and 1 may be used.
  • the possibility of existence based on the similarity can be obtained as follows, for example. First, a positive value is determined as a threshold value. When the difference absolute value is larger than this threshold value, the possibility of existence is set to zero. When the absolute difference value is equal to 0, the existence possibility is set to 1.
  • the general value of the possibility of existence is defined as a function of the absolute difference value. The simplest of such functions is a straight line.
  • a value proportional to the absolute difference value is determined.
  • the slope of the straight line and the y-intercept are determined so as to satisfy the boundary condition when the difference absolute value is equal to 0 and 1.
  • the function any linear or non-linear function, polynomial, or the like may be used.
  • FIG. 24 is a block diagram illustrating a configuration of the conversion unit 2301.
  • the conversion unit 2301 includes a frame division unit 2401, a windowing unit 2402, and a Fourier transform unit 2403.
  • the deteriorated signal samples are supplied to the frame dividing unit 301 and divided into frames for each K / 2 sample.
  • K is an even number.
  • the degraded signal sample 2370 divided into frames is supplied to a windowing processing unit 2402 and a calculation unit 2382, and the windowing processing unit 2402 performs multiplication with w (t) which is a window function.
  • a symmetric window function is used.
  • w (t) for example, a Hanning window represented by the following equation can be used.
  • various window functions such as a Hamming window and a triangular window are known.
  • the windowed output is supplied to the Fourier transform unit 2403 and converted into a degraded signal spectrum Yn (k).
  • the degraded signal spectrum Yn (k) is separated into phase and amplitude, the degraded signal phase spectrum arg Yn (k) is transmitted to the phase control unit 2302 and the calculation unit 2381, and the degraded signal amplitude spectrum
  • a power spectrum can be used instead of an amplitude spectrum.
  • FIG. 25 is a block diagram showing the configuration of the inverse transform unit 2304.
  • the inverse transform unit 2304 includes an inverse Fourier transform unit 2501, a windowing processing unit 2502, and a frame composition unit 2503.
  • the inverse Fourier transform unit 2501 multiplies the enhancement signal amplitude spectrum 2350 supplied from the amplitude control unit 2303 and the enhancement signal phase spectrum 2340 (arg Xn (k)) supplied from the phase control unit 2302 to obtain an enhancement signal ( Find the left side of the following formula.
  • the left side of the following expression is the output of the windowing processing unit 2502, and the frame This is transmitted to the synthesis unit 2503.
  • the obtained enhancement signal 2360 is transmitted from the frame synthesis unit 2503 to the output terminal 2307.
  • the transformation in the transform unit and the inverse transform unit has been described as Fourier transform, but other transforms such as Hadamard transform, Haar transform, and wavelet transform can be used instead of Fourier transform.
  • the Haar transform does not require multiplication and can reduce the area when the LSI is formed. Since the wavelet transform can change the time resolution depending on the frequency, an improvement in the noise suppression effect can be expected.
  • the noise suppression unit 2305 can perform actual suppression after integrating a plurality of frequency components obtained in the conversion unit 2301.
  • the number of frequency components after integration is smaller than the number of frequency components before integration.
  • a common suppression degree is obtained for the integrated frequency component obtained by integrating the frequency components, and the suppression degree is commonly used for individual frequency components belonging to the same integrated frequency component.
  • high sound quality can be achieved by integrating more frequency components from a low frequency region having a high ability to discriminate auditory characteristics toward a high frequency region having a low ability.
  • the number of frequency components to which noise suppression is applied is reduced, and the overall calculation amount can be reduced.
  • the noise suppression unit 2305 estimates noise using the degraded signal amplitude spectrum supplied from the conversion unit 2301, and generates an estimated noise spectrum. Then, a suppression coefficient is obtained using the deteriorated signal amplitude spectrum from the conversion unit 2301 and the generated estimated noise spectrum, is multiplied by the deteriorated signal amplitude spectrum, and is supplied to the amplitude control unit 2303 as an enhanced signal amplitude spectrum.
  • the sudden change determination result information on whether or not there is a sudden change in the signal
  • the smaller one of the deteriorated signal amplitude spectrum and the estimated noise spectrum is selected as the enhancement signal.
  • the amplitude spectrum is supplied to the amplitude controller 2303. At this time, the noise suppression unit 2305 may detect the desired signal and protect the desired signal component for each frequency.
  • noise suppression is performed according to the possibility of the sudden change of the signal.
  • the degree can also be changed.
  • the possibility of sudden changes in the signal is determined in frequency components, frequency bands (integrated with any number of consecutive frequency components) or in units of frames, and frequency components and frequency bands are used to suppress the sudden changes.
  • different signal processing can be performed for each frame.
  • Non-Patent Document 1 For noise estimation, various estimation methods such as those described in Non-Patent Document 1 and Non-Patent Document 2 can be used.
  • Non-Patent Document 1 discloses a method in which an estimated noise spectrum is an average value of degraded signal amplitude spectra of frames in which a desired signal is not generated. In this method, it is necessary to detect the presence of a desired signal. The section where the desired signal exists can be determined by the power of the enhancement signal.
  • the enhancement signal is a desired signal other than noise. Further, the level of the desired signal or noise does not change greatly between adjacent frames. For these reasons, the enhancement signal level in the past of one frame is used as an index for determining the noise interval. When the emphasized signal power of one frame in the past is below a certain value, the current frame is determined as a noise section.
  • the noise spectrum can be estimated by averaging the deteriorated signal amplitude spectrum of the frame determined as the noise interval.
  • Non-Patent Document 1 also discloses a method in which the estimated noise spectrum is an average value at the initial stage of estimation when the deteriorated signal amplitude spectrum is supplied. In this case, it is necessary to satisfy the condition that the desired signal is not included immediately after the estimation is started. When the condition is satisfied, the degradation signal amplitude spectrum at the initial stage of estimation can be set as the estimated noise spectrum.
  • Non-Patent Document 2 discloses a method for obtaining an estimated noise spectrum from a statistical minimum value of a degraded signal amplitude spectrum.
  • the minimum value of the degradation signal amplitude spectrum in a certain period of time is statistically maintained, and the noise spectrum is estimated from the minimum value. Since the minimum value of the degraded signal amplitude spectrum is similar to the spectrum shape of the noise spectrum, it can be used as an estimated value of the noise spectrum shape. However, the minimum value is smaller than the original noise level. For this reason, a value obtained by appropriately amplifying the minimum value is used as the estimated noise spectrum.
  • the noise suppression unit 2305 can perform various types of suppression, but typical examples include SS (Spectrum Subtraction) method and MMSE STSA (Minimum Mean-Square Error Short-Time Spectral Amplitude Estimator: And least square mean error short time amplitude spectrum estimation) method.
  • SS Specific Subtraction
  • MMSE STSA Minimum Mean-Square Error Short-Time Spectral Amplitude Estimator: And least square mean error short time amplitude spectrum estimation
  • the noise suppression unit 2305 receives the sudden change determination result (information on whether or not there is a sudden change in the signal) from the sudden change determination unit 2309, and determines the degree of noise suppression according to whether or not there is a sudden change in the signal. change. For example, signal processing can be performed to suppress the sudden change in the frequency component, frequency band, or frame unit where the signal suddenly changed.
  • the sudden change determination unit 2309 determines that there is a sudden change
  • the smaller one of the deteriorated signal amplitude spectrum and the estimated noise spectrum is supplied to the amplitude control unit 2303 as the enhanced signal amplitude spectrum. That is, when the deteriorated signal amplitude spectrum is smaller than the estimated noise spectrum, the deteriorated signal amplitude spectrum can be output as it is, and otherwise, the input signal can be replaced with the estimated noise spectrum and output.
  • an important deteriorated signal amplitude spectrum component can be detected, and the detected important deteriorated signal amplitude spectrum component can be excluded from replacement by the estimated noise spectrum.
  • the magnitude of the degradation signal amplitude spectrum can be used as an index of importance when detecting an important degradation signal amplitude spectrum component.
  • a component having a large amplitude has a high probability that it is a component of the target signal, and holding this leads to prevention of sound quality deterioration of the target signal.
  • the peak property of the degraded signal amplitude spectrum can be used as an index of importance. It is highly probable that a deteriorated signal amplitude having a peak, that is, a value larger than the surroundings along the frequency axis, is a component of the target signal, and maintaining this will prevent deterioration of the sound quality of the target signal. Connected. In particular, since a significant peak, that is, an amplitude value that is significantly larger than the surrounding amplitude values, has a high importance, the sound quality of the target signal can be further enhanced by reliably protecting it.
  • the detection of the peak is disclosed in, for example, the pure tone component detection method of Non-Patent Document 3 and Non-Patent Document 4.
  • the detected peak may be evaluated according to a predetermined condition, and peaks that do not satisfy the condition may be excluded. For example, a peak having a value smaller than the estimated noise is unlikely to be a target signal. In other words, with the estimated noise as a reference, only a sufficiently larger peak can be left as a peak, and the others can be excluded. Whether it is sufficiently large can be determined by comparing with a constant multiple of the estimated noise. In this way, by evaluating whether the detected peak satisfies a predetermined condition and then selecting the final peak component, the detection of an erroneous peak is reduced and the suppression effect of the sudden signal change portion is increased. be able to.
  • the signal supplied to the amplitude control unit 2303 can be changed according to the probability of sudden change.
  • the result of the replacement and the deterioration signal amplitude spectrum mixed according to the probability of sudden change are output as an enhanced signal amplitude spectrum.
  • the noise suppression unit 2305 may perform suppression in multiple stages such as a suppression degree of 0, a suppression degree of 1, and a suppression degree of 2, depending on the possibility of a sudden change in the signal.
  • the degree of suppression may be changed steplessly according to the determination result (for example, a numerical value of 0 to 1) of the sudden change determination unit.
  • FIG. 26 is a block diagram showing the configuration of the phase control unit 2302 and the amplitude control unit 2303.
  • the phase control unit 2302 includes a phase rotation unit 2601 and a rotation amount generation unit 2602
  • the amplitude control unit 2303 includes a correction amount calculation unit 2603 and an amplitude correction unit 2604.
  • the rotation amount generation unit 2602 generates a rotation amount of the deteriorated signal phase spectrum for the frequency component determined by the sudden change determination unit 2309 as “the sudden change of the signal”, and sends it to the phase rotation unit 2601 and the correction amount calculation unit 2603. Supply.
  • the rotation amount generation unit 2602 When the rotation amount is supplied from the rotation amount generation unit 2602, the phase rotation unit 2601 rotates (shifts) the deteriorated signal phase spectrum 2320 supplied from the conversion unit 2301 by the supplied rotation amount, and the enhanced signal phase spectrum. 2340 is supplied to the inverse transform unit 2304.
  • the correction amount calculation unit 2603 determines an amplitude correction coefficient based on the rotation amount supplied from the rotation amount generation unit 2602 and supplies it to the amplitude correction unit 2604.
  • the rotation amount generation unit 2602 generates a rotation amount using, for example, a random number.
  • a random number When the deterioration signal phase spectrum is rotated at each frequency by a random number, the shape of the deterioration signal phase spectrum 2320 changes. Due to this change in shape, it is possible to weaken the characteristics of the sudden signal change portion such as an impact sound.
  • the random number includes a uniform random number having a uniform occurrence probability, a normal random number having a normal distribution of occurrence probability, and the like.
  • Uniform random numbers can be generated by a linear congruential method or the like.
  • uniform random numbers generated by the linear congruential method are uniformly distributed in the range of 0 to (2 ⁇ M) -1.
  • M is an arbitrary integer
  • represents a power.
  • the phase rotation amount ⁇ needs to be distributed in the range of 0 to 2 ⁇ . Therefore, the generated uniform random number is converted.
  • the conversion is performed using the following formula.
  • R is a uniform random number
  • Rmax is the maximum value that the uniform random number can generate.
  • Rmax (2 ⁇ M) ⁇ 1.
  • R the value of R can be directly used as the rotation amount. Since it is the amount of rotation, 2 ⁇ represents exactly one rotation. When the phase is rotated by 2 ⁇ , it is the same as when the phase is not rotated. Therefore, the rotation amount of 2 ⁇ + ⁇ is the same as that when the rotation amount is ⁇ .
  • the rotation amount ⁇ may be obtained by the above equation.
  • the phase rotation unit 2601 receives the rotation amount from the rotation amount generation unit 2602 and rotates the deterioration signal phase spectrum. If the degradation signal phase spectrum is expressed by an angle, it can be rotated by adding the value of the rotation amount ⁇ to the angle. When the deteriorated signal phase spectrum is expressed by a complex normal vector, it can be rotated by obtaining a normal vector of the rotation amount ⁇ and multiplying the deteriorated signal phase spectrum.
  • the normal vector of the rotation amount ⁇ is obtained by the following equation.
  • is a rotation vector
  • j indicates sqrt ( ⁇ 1). Note that sqrt represents the square root.
  • the correction coefficient calculation method performed by the correction amount calculation unit 2603 is the same as the method described for the correction amount calculation unit 503 in FIG.
  • FIG. 27 is a diagram for describing the internal configuration of calculation units 2381 and 2382 and sudden change determination unit 2309.
  • the calculation unit 2382 includes a rapid increase unit detection unit 2701, a delay time calculation unit 2702, a phase conversion unit 2703, and an inclination calculation unit 2704.
  • the calculation unit 2381 includes an inclination calculation unit 2705.
  • the rapid increase part detection unit 2701 calculates the absolute value of the signal in the frame and detects the maximum value 2710 of the absolute value.
  • the delay time calculation unit 2702 outputs the relative position indicating the maximum value in the frame (the time from the start of the frame to the timing at which the maximum value exists) as n0.
  • the phase converter 2703 converts the delay time n02720 into a frequency domain phase. Specifically, the conversion is performed based on the following equation.
  • L is the frame length of the conversion unit 2301, and 0 ⁇ n0 ⁇ L ⁇ 1.
  • the inclination calculation unit 2705 differentiates the phase component signal input from the conversion unit 2301 to derive the phase inclination 2750 in the frequency domain.
  • Each of the inclination calculation units 2704 and 2705 may calculate the inclination by differentiation based on the phase frequency, or may calculate the inclination by another method.
  • the parallelism calculation unit 2706 compares the inclination 2740 provided from the inclination calculation unit 2704 and the inclination 2750 provided from the inclination calculation unit 2705 for each frequency, and calculates the similarity of the inclinations. That is, the parallelism of the straight line calculated by the calculation unit 2381 with respect to the straight line calculated by the calculation unit 2382 of the phase component signal in the frequency domain is calculated at each frequency. In the sudden change determination unit 2707, if such parallelism exceeds a certain value, it is determined that a sudden change in the signal exists at the frequency.
  • the determination result for each frequency may be corrected using the determination result for each frequency band or each frame. For example, when the determination result of a certain frequency band is “signal sudden change exists”, the determination result of all frequencies in the frequency band is forcibly set to “signal sudden change”. It is possible to reduce determination errors due to interference of signal components. On the other hand, when the determination result of a certain frequency band is "There is no signal sudden change”, by forcibly setting the determination result of all frequencies in that frequency band to "No signal sudden change”, It is also possible to reduce determination errors due to interference with other signal components.
  • each frequency is determined independently by correcting the ease of determination (threshold) in a direction in which it is easy to determine “existence” at each frequency in the band may be maintained.
  • the determination result is obtained for each frequency or each frequency band, a sudden change can be suppressed for each frequency or each frequency band, and a more accurate signal sudden change can be suppressed.
  • the sudden change determination unit 2309 outputs a signal sudden change (1) or no signal sudden change (0) as the determination result 2730.
  • the determination result 2730 is a value between 0 and 1 indicating the possibility of sudden change. It becomes. In that case, it is possible to obtain the likelihood (the possibility of the sudden change) that the signal sudden change is included.
  • the possibility of existence can be obtained as follows, for example. First, the gradient 2740 and the gradient 2750 are converted into an angle corresponding to the gradient using an arctangent function (arctangent). The angle range is -90 degrees to 90 degrees.
  • the absolute value of the difference between the two angles is 180 degrees. Therefore, a positive value is determined as a threshold value. When the difference between the two angles exceeds the threshold, the possibility of sudden signal change is set to zero. When the difference in angle is 0, the existence possibility is set to 1.
  • the general value of the possibility of existence is defined as a function of the angle difference. The simplest of such functions is a straight line. As the possibility of existence, a value proportional to the difference between the two angles is determined. The slope of the straight line and the y-intercept (a function value when the difference between the two angles is 0) are determined so as to satisfy the boundary condition when the angle difference is equal to 0 and 1. As the function, any linear or non-linear function, polynomial, or the like may be used.
  • FIG. 28 is a graph showing the phase and the amount of change.
  • the phase change amount changes in the frequency domain along the frequency axis as shown in the graph 2802.
  • a phase indicated as a straight line 2803 in the frequency domain can be calculated from the relative position of the rapidly increasing portion in the frame.
  • the presence of a sudden signal change is determined according to how much the phase component signal 2801 and the straight line 2803 are parallel to each other.
  • the range approximating the slope of the straight line 2803 is indicated by a range 2840, where the phase gradient is taken on the vertical axis and the frequency is taken on the horizontal axis. Therefore, when the overlapping portion of the range 2840 and the graph 2802 is larger than the predetermined threshold, the sudden change determination unit 2309 determines that there is a sudden change in the signal.
  • FIG. 29 is a diagram illustrating a hardware configuration when the noise suppression device 2300 according to the present embodiment is realized using software.
  • the noise suppression device 2300 includes a processor 2910, a ROM (Read Only Memory) 2920, a RAM (Random Access Memory) 2940, a storage 2950, an input / output interface 2960, an operation unit 2961, an input unit 2962, and an output unit 2963.
  • the noise suppression device 2300 may include a camera 2964.
  • the processor 2910 is a central processing unit, and controls the entire noise suppression apparatus 2300 by executing various programs.
  • ROM 2920 stores various parameters and the like in addition to the boot program that processor 2910 should execute first.
  • the RAM 2940 has an area for storing an input signal 2310, a phase component signal 2320, an amplitude component signal 2330, and an enhancement signal 2360 in addition to a program load area (not shown). Further, the RAM 2940 has an area for storing the amplitude maximum value timing 2710, the delay time 2720, the phase signal 2730, the phase gradients 2740, 2750, and the like.
  • the storage 2950 stores a noise suppression program 2951.
  • the noise suppression program 2951 includes a conversion module, a phase control module, an amplitude control module, an inverse conversion module, a noise suppression module, a phase inclination calculation module, and a sudden change determination module.
  • the processor 2910 executes each module included in the noise suppression program 2951, the conversion unit 2301, the phase control unit 2302, the amplitude control unit 2303, the inverse conversion unit 2304, the noise suppression unit 2305, and the calculation units 2381 and 2382 in FIG.
  • Each function of the sudden change determination unit 2309 can be realized.
  • the storage 2950 may store a noise database.
  • the enhancement signal which is an output related to the noise suppression program 2951 executed by the processor 2910, is output from the output unit 2963 via the input / output interface 2960. Thereby, for example, the operation sound of the operation unit 1461 input from the input unit 2962 can be suppressed.
  • An application method such as detecting that a signal sudden change is included in the input signal input from the input unit 2962 and starting shooting with the camera 2964 is also possible.
  • FIG. 30A is a flowchart for explaining a flow of signal sudden change determination processing by the noise suppression program 2951.
  • step S ⁇ b> 3001 the calculation unit 2382 starts the process of calculating the phase gradient from the maximum amplitude value in the time domain.
  • step S3002 the calculation unit 2381 starts phase inclination calculation processing in the frequency domain.
  • the threshold value N in the subsequent frame can be set large.
  • FIG. 30B is a flowchart for explaining the flow of the inclination calculation process performed by the calculation unit 2382.
  • the process proceeds to step S3023, and the frame division unit 2401 performs frame division.
  • the rapid increase portion detection unit 2701 detects the rapid increase portion of the low correlation signal.
  • the delay time calculation unit 2702 outputs the relative position in the frame of the rapid increase portion (time from the start of the frame to the timing when the rapid increase portion exists) as n0.
  • step S3029 the phase conversion unit 2703 converts the delay time n02720 into a frequency domain phase.
  • the gradient calculation unit 2704 differentiates the derived phase to derive a phase gradient in the frequency domain, and performs buffering in step S3033.
  • FIG. 30C is a flowchart for explaining the flow of the inclination calculation process performed by calculation unit 2381.
  • a signal is input in step S3051
  • the process proceeds to step S3053, and a phase component signal in the frequency domain is extracted by Fourier transform through frame division and window processing.
  • step S3055 when the frequency step k is set to 1, in step S3057, the phase P (k) is differentiated to calculate the slope ⁇ P (k), and in step S3059, the slope is buffered.
  • the phase gradient is obtained as a differential value, but another index such as the rotation amount of the unit vector may be obtained and used for the determination.
  • FIG. 31 is a diagram for explaining a functional configuration of the noise suppression device according to the present embodiment.
  • the noise suppression device according to the present embodiment is different from the seventh embodiment in that the conversion unit 3101 outputs a signal after the windowing process in the windowing processing unit 2402 to the calculation unit 2382. Since other configurations and operations are the same as those of the seventh embodiment, the same reference numerals are given to the same configurations and operations, and detailed descriptions thereof are omitted.
  • the parallelism can be obtained by using the slope obtained from the time domain signal after windowing, that is, the same signal as the signal used for Fourier transform.
  • the consistency with the phase gradient obtained using the frequency domain signal is increased, and a more accurate sudden change determination of the signal can be performed.
  • FIG. 32 is a diagram for describing a functional configuration of a noise suppression device 3200 according to the present embodiment.
  • the noise suppression device 3200 according to the present embodiment is different from the seventh embodiment in that an amplitude flatness calculation unit 3201 is additionally provided. Since other configurations and operations are the same as those of the second embodiment, the same configurations and operations are denoted by the same reference numerals, and detailed description thereof is omitted.
  • the amplitude flatness calculation unit 3201 calculates an amplitude change along the frequency axis and supplies the change to the sudden change determination unit 3209.
  • a frequency having a small change in amplitude between adjacent frequencies represents a sudden signal change.
  • one flatness may be obtained for each band or for all frequencies.
  • FM (Flatness Measure) representing flatness is obtained as in the following equation.
  • x (n) is the amplitude or power spectrum at the frequency n
  • N is the number of frequency components included in the flatness calculation section.
  • FM takes a value of 0.0 to 1.0. If completely flat, FM is 1.0.
  • Non-patent document 3 discloses the flatness.
  • Flatness can also be expressed using another index.
  • the average of x (n) is obtained for each band or for all frequencies, and the sum of squared differences between x (n) and the average value in each frequency component n is calculated for each band or for all frequencies. It can be flatness. Instead of all frequencies, one sum of squared difference values can be obtained in a single or a plurality of frequency bands, and this can be used as flatness. The flatness obtained in this way is 0.0 when the flatness is completely, and takes a larger value as the flatness decreases.
  • Smoothness may be used as another index of flatness. Smoothness can be expressed by the sum of absolute differences between adjacent samples along the frequency axis. Smoothness takes a large value for a waveform with many irregularities (non-smooth), and takes a small value for a waveform with few (smooth). This indicator is known as the total variation (TV: Total Variation).
  • the flatness along the frequency axis has been used as the flatness, but the flatness along the time axis can also be used. Since the amplitude and power suddenly increase in the signal sudden change portion, when this property is used, it can be determined that there is a signal sudden change when the flatness along the time axis is low. Specifically, when the difference in amplitude or power between the current frame and the immediately preceding frame is a certain value or more, it is determined that the flatness is low, that is, there is a sudden signal change. It is also possible to determine the difference in amplitude or power between adjacent frames for a plurality of frames from several frames in the past to the current frame, and define the result of linear or nonlinear combination of these as flatness.
  • the amplitude or power difference By using the information of the past frame, it becomes easy to detect a signal sudden change portion including a low frequency component, and the suppression performance thereof is improved.
  • this may be calculated for each frequency component, for each band, or for all frequencies.
  • the amplitude or power difference can be calculated for single or multiple bands. For example, by calculating the amplitude or power difference in a single band, particularly in a high frequency range, it is possible to reduce the influence of voice and other signals, and to detect a sudden signal change part more accurately. .
  • the two flatnesses described so far that is, the flatness along the frequency axis and the flatness along the time axis can be used singly or in combination.
  • Examples of combinations include detection of signal abrupt changes based on linear or nonlinear combination of two flatnesses, and combinations of detection results based on the respective flatnesses.
  • the flatness in the frequency direction is large and when the flatness in the time direction is small, it is determined that a sudden signal change has been detected. Therefore, it is necessary to devise methods such as combining them after reversing one of them.
  • the essential function of the amplitude flatness calculation unit 3203 is to obtain the possibility of sudden signal change using amplitude information, and may be replaced by other methods.
  • Techniques for detecting a sudden signal change using amplitude information are disclosed in Non-Patent Document 6, Non-Patent Document 7, Non-Patent Document 8, and the like.
  • the sudden change determination unit 3209 determines a sudden change in the signal using two indexes of the similarity (parallelism) of the inclination and the flatness of the amplitude. This is because, when the amplitude is flat along the frequency axis (the variation is small), it is considered that there is a high possibility of a signal sudden change portion. This is self-evident because the sudden change in signal is pulsed (the amplitude increases and decreases in a short time) and the Fourier transform of the impulse becomes a white signal (with the same amplitude and power at all frequencies). . For example, one of the following can be selected as the determination method.
  • amplitude or power When processing a specific signal, for example, when detecting / suppressing an impact sound with small noise and close to an impulse, information on amplitude or power may be more reliable than phase information. For example, when detecting the shooting sound of a pistol in a quiet environment, it may be detected using only the amplitude. On the other hand, when the amplitude or power of the noise changes greatly, for example, in the case of detecting a shooting sound at the security of an airport, the amplitude and phase are weighted in a quiet (low noise) situation and a high noise situation. It is effective to change. In this case, the weighting of the amplitude and phase may be changed according to the presence or absence of noise and the time zone.
  • the plane takeoff and landing time can be known. Therefore, when the plane arrives (the timing when there is a lot of noise), the phase weight should be increased and used to detect the firing sound. Can do. This is because the detection of the impact sound using the phase information is more effective than the detection using the amplitude when signals other than the firing sound (impact sound to be detected) are mixed.
  • the amplitude of the impact sound may not be flat depending on the type of signal. In that case, a sudden change in the signal can be detected with high accuracy by performing detection by increasing the weight of the phase flatness.
  • the calculation result of the amplitude flatness may be corrected using the obtained information so that the same result as when the amplitude is flat is obtained. it can. Specifically, the amplitude flatness is calculated after multiplying the amplitude spectrum 2330 by the amplitude of the impact sound or the inverse of the power spectrum shape by each frequency component.
  • the present embodiment it is possible to detect the sudden signal change portion using the amplitude flatness. As a result, a sudden signal change (impact sound) can be detected more accurately, and the sudden signal change (impact sound) can be appropriately suppressed as appropriate.
  • a signal abrupt change unit called so-called attack employs an information compression method different from a normal one. It can also be applied to detection.
  • the analysis window length is changed and the preceding noise called pre-echo is suppressed, so detection is necessary.
  • a method of detecting using a change in amplitude or entropy it is possible to detect a sudden change with high accuracy and to effectively compress information.
  • FIG. 33 an application example in which a microphone 3301, calculation units 2381 and 2382, a sudden change determination unit 2309, and a video recording unit 3302 are mounted on a vehicle 3300 is also conceivable.
  • the video recording unit 3302 prohibits overwriting of a captured image by the camera using the detection of an impact sound as a trigger, a record of the accident situation can be left. At that time, overwriting preservation may be prohibited after a certain time delay from the detection of the impact sound.
  • the impact itself is used as a trigger, there is an advantage that the accident situation can be automatically recorded even when the impact is small or when another vehicle is in an accident.
  • an application example in which the calculation units 2381 and 2382, the sudden change determination unit 2309, and the alarm unit 3401 are connected to the electrocardiograph 3400 is also considered. It is possible to detect an abnormal heartbeat of an electrocardiogram more accurately and effectively. This is particularly effective when there is a lot of noise. Similarly, it can be applied to fetal echo monitor. There are cases in which a heartbeat cannot be obtained correctly due to noise interference, but this technique is also effective in such a case. That is, it can be widely applied to detection of sudden changes in biological signals.
  • the signal processing device 3500 is a device for detecting an input signal sudden change. As illustrated in FIG. 35, the signal processing device 3500 includes a conversion unit 3501, a correlation removal unit 3502, and a signal sudden change detection unit 3504.
  • the conversion unit 3501 converts the input signal 3510 into a phase component signal 3520 and an amplitude component signal 3530 in the frequency domain.
  • the correlation removing unit 3502 removes a component having a time correlation included in the input signal 3510 and generates a low correlation signal 3550 having a time correlation smaller than that of the input signal 3510.
  • the correlation removal unit 3502 removes components having a large temporal correlation other than the sudden change component of the signal and emphasizes the sudden change component of the signal.
  • Correlation removal usually consists of two processes: prediction of the correlation component and output calculation by subtraction of the prediction signal from the input signal.
  • the prediction can be expressed by a linear combination of past signal samples, and as the weight coefficient of the linear combination, that is, the coefficient of the prediction filter, the Levinson-Durbin method, the covariance method, the least square method, and the like are known.
  • the prediction filter coefficient obtained in this way minimizes the prediction error.
  • the signal sudden change determination unit 3504 determines a sudden change included in the input signal 3510 based on the low correlation signal 3550 and the phase component signal 3520.
  • the sudden change of the input signal can be detected effectively.
  • a signal processing device 3600 as a twelfth embodiment of the present invention will be described with reference to FIG.
  • the signal processing device 3600 is a device for detecting an input signal sudden change.
  • the signal processing device 3600 includes a conversion unit 3601, a correlation removal unit 3602, a first calculation unit 3603, a second calculation unit 3605, and a signal sudden change determination unit 3609.
  • the conversion unit 3601 converts the input signal 3610 into a phase component signal 3620 and an amplitude component signal 3630 in the frequency domain.
  • the correlation removing unit 3602 removes components having time correlation included in the input signal 3610, generates a low correlation signal 3640 having a time correlation smaller than that of the input signal 3610, and supplies the low correlation signal 3640 to the first calculating unit 3603.
  • the first calculation unit 3603 calculates the phase gradient 3650 based on the position of the rapid increase part in the time domain of the low correlation signal 3640. It is known that the phase gradient in the frequency direction when an isolated pulse is Fourier-transformed is uniquely determined corresponding to the position of the isolated pulse.
  • the phase gradient is ⁇ 2 ⁇ n0 / N.
  • the maximum value of the absolute amplitude value can be used. This indicator gives an accurate position when the actual signal is close to an isolated pulse (almost unimodal shape).
  • the maximum amplitude value does not give an accurate position.
  • an index using the maximum value of the absolute amplitude value and the second largest value of the absolute amplitude value is effective. For example, an intermediate value between both positions, a weighted average of both positions, or the like can be used.
  • the second calculation unit 3605 calculates the gradient 3660 of the phase component signal 3620 in the frequency domain.
  • the sudden signal change determination unit 3609 determines an abrupt change in the input signal based on the slope calculated by the first calculator 3603 and the slope calculated by the second calculator 3605.
  • a noise suppression apparatus as a thirteenth embodiment of the present invention will be described with reference to FIGS. 37A to 45.
  • the noise suppression device of the present embodiment can be applied to noise suppression of, for example, a digital camera, a notebook computer, a mobile phone, a keyboard, a game machine controller, and a mobile phone push button. That is, a target signal such as voice, music, and environmental sound can be emphasized with respect to a signal (noise or interference signal) superimposed thereon.
  • the present invention is not limited to this, and can be applied to any signal processing apparatus that is required to detect a sudden signal change from an input signal.
  • a noise suppression device that detects and suppresses an impact sound will be described as an example of a sudden change in signal.
  • the noise suppression device according to the present embodiment appropriately suppresses the impact sound generated by the button operation in a mode in which an operation such as a button press is performed near the microphone, for example.
  • a time domain signal including an impact sound is converted into a frequency domain signal, and the slope of the phase component in the frequency space is calculated.
  • the slope of the phase in the frequency domain that is, ⁇ 2 ⁇ n0 / N is obtained when the rapidly increasing portion of the low correlation signal obtained by removing the correlation of the time domain signal is regarded as an isolated pulse.
  • n0 is the position of the rapid increase portion. Then, the presence of an impact sound is determined according to the degree of coincidence between the two types of phase gradients.
  • FIG. 37A is a block diagram showing the overall configuration of the noise suppression device 3700.
  • a degradation signal (a signal in which a desired signal and noise are mixed) is supplied to the input terminal 3706 as a sample value series.
  • the degradation signal supplied to the input terminal 3706 is subjected to transformation such as Fourier transformation in the transformation unit 3701 and is divided into a plurality of frequency components.
  • a plurality of frequency components are processed independently for each frequency.
  • the description will be continued focusing on a specific frequency component.
  • the amplitude spectrum (amplitude component) 3730 is supplied to the noise suppression unit 3705
  • the phase spectrum (phase component) 3720 is supplied to the phase control unit 3702 and the calculation unit 3781.
  • the deteriorated signal supplied to the input terminal 3706 is subjected to correlation component removal by the correlation removal unit 3712 to become a low correlation signal 3770 and is supplied to the calculation unit 3782.
  • the conversion unit 3701 supplies the degraded signal amplitude spectrum 3730 to the noise suppression unit 3705, but the present invention is not limited to this, and the power spectrum corresponding to the square of the amplitude spectrum is used as the noise suppression unit. 3705 may be supplied.
  • the noise suppression unit 3705 estimates noise using the deteriorated signal amplitude spectrum 3730 supplied from the conversion unit 3701 and generates an estimated noise spectrum. Also, the noise suppression unit 305 suppresses noise using the deteriorated signal amplitude spectrum 3730 supplied from the conversion unit 3701 and the generated estimated noise spectrum, and the enhanced signal amplitude spectrum as a noise suppression result is the amplitude control unit 3703. To communicate. Furthermore, the noise suppression unit 3705 receives the determination result from the sudden change determination unit 3709, and changes the degree of noise suppression according to the presence or absence of the signal sudden change. The noise suppression unit 3705 protects using target sound detection, and replaces the amplitude with the estimated background sound when an impact sound is detected.
  • the phase control unit 3702 rotates (shifts) the deteriorated signal phase spectrum 3720 supplied from the conversion unit 3701, and supplies it to the inverse conversion unit 3704 as the enhanced signal phase spectrum 3740. Further, the rotation amount (shift amount) of the phase is transmitted to the amplitude control unit 3703.
  • the amplitude control unit 3703 receives the phase rotation amount (shift amount) from the phase control unit 3702, calculates the amplitude correction amount, uses the amplitude correction amount to correct the emphasized signal amplitude spectrum at each frequency, and corrects the corrected amplitude.
  • the spectrum 3750 is supplied to the inverse transform unit 3704.
  • the inverse conversion unit 3704 synthesizes the enhancement signal phase spectrum 3740 supplied from the phase control unit 3702 and the corrected amplitude spectrum 3750 supplied from the amplitude control unit 3703, performs inverse conversion, and outputs the signal as an enhancement signal 3707. To supply.
  • the calculating unit 3781 calculates a phase change (gradient) at each frequency by differentiating the phase component signal 3720 supplied from the converting unit 3701 with respect to the frequency.
  • the calculation unit 3782 receives the low correlation signal 3770 divided into frames, calculates the absolute value of the signal, and calculates the slope of the phase in the frequency domain based on the position indicating the signal absolute value increasing portion.
  • the sudden change determination unit 3709 compares the phase gradients provided from the calculation units 3781 and 3782, and determines, for each frequency point, how much a sudden change in the signal exists (possibility of existence) for each frequency point. To do. Specifically, a rotation vector corresponding to the phase component signal is input from the calculation units 3781 and 3782, the rotation vector between the two rotation vectors is calculated, and the absolute value thereof is close to 0 (predetermined in advance). If the threshold value is 0.1 or less), it is determined that there is a sudden change in the signal.
  • the slope similarity can use the absolute difference between the slope obtained from the time domain signal and the slope obtained from the frequency domain signal, but is not limited to this.
  • the distance between the value of the ratio of the two slopes and 1 or the distance between the value obtained by normalizing the sum of them by twice the slope of either of them and 1 may be used.
  • the possibility of existence based on the similarity can be obtained as follows, for example. First, a positive value is determined as a threshold value. When the difference absolute value is larger than this threshold value, the possibility of existence is set to zero. When the absolute difference value is equal to 0, the existence possibility is set to 1.
  • the general value of the possibility of existence is defined as a function of the absolute difference value. The simplest of such functions is a straight line.
  • a value proportional to the absolute difference value is determined.
  • the slope of the straight line and the y-intercept are determined so as to satisfy the boundary condition when the difference absolute value is equal to 0 and 1.
  • the function any linear or non-linear function, polynomial, or the like may be used.
  • the correlation removal unit 3712 includes a prediction unit 3783, a subtracter 3784, and a frame division unit 3785.
  • the deteriorated signal sample 3710 is supplied to the prediction unit 3783, and the prediction unit 3783 predicts a correlated signal 3786 and supplies the signal 3786 to the subtracter 3784.
  • Known prediction methods include linear prediction using an adaptive filter and Levinson-Durbin method.
  • the subtractor 3784 subtracts the prediction signal 3786 supplied from the prediction unit 3783 from the degradation signal 3710 and supplies the difference as a low correlation signal 3787 to the frame division unit 3785.
  • the frame division unit 3785 performs frame division on the low correlation signal 3787 and outputs the result as a framed low correlation signal 3770.
  • FIG. 37C unlike FIG. 37B, it is also possible to perform prediction after first performing frame division.
  • the structure which performs prediction after frame division is shown.
  • FIG. 37C includes a frame dividing unit 3795, a predicting unit 3793, and a subtracter 3794.
  • the frame division unit 3795 performs frame division on the degraded signal 3710 and supplies the divided signal samples 3796 to the prediction unit 3793 and the subtracter 3794.
  • the prediction unit 3793 predicts a correlated signal included in the framed deterioration signal 3796 and supplies the signal to the subtracter 3794.
  • the subtracter 3794 subtracts the prediction signal 3797 supplied from the prediction unit 3793 from the framed deterioration signal 3796 and outputs the difference as a framed low correlation signal 3770.
  • FIG. 38A is a block diagram illustrating a configuration of the conversion unit 3701.
  • the conversion unit 3701 includes a frame division unit 3801, a windowing unit 3802, and a Fourier transform unit 3802.
  • the deteriorated signal samples are supplied to the frame dividing unit 3801 and divided into frames for every K / 2 samples.
  • K is an even number.
  • the degraded signal sample 3804 divided into frames is supplied to a windowing processing unit 3802, and is multiplied by w (t) which is a window function.
  • w (t) for example, a Hanning window represented by the following equation can be used.
  • various window functions such as a Hamming window and a triangular window are known.
  • the windowed output is supplied to a Fourier transform unit 3803 and converted into a degraded signal spectrum Yn (k).
  • the degraded signal spectrum Yn (k) is separated into phase and amplitude, the degraded signal phase spectrum arg Yn (k) is transmitted to the phase control unit 3702 and the calculation unit 3781, and the degraded signal amplitude spectrum
  • a power spectrum can be used instead of an amplitude spectrum.
  • FIG. 38B is a block diagram showing the configuration of the inverse transform unit 3704.
  • the inverse transform unit 3704 includes an inverse Fourier transform unit 3811, a windowing processing unit 3812, and a frame composition unit 3813.
  • the inverse Fourier transform unit 3811 multiplies the enhancement signal amplitude spectrum 3750 supplied from the amplitude control unit 3703 by the enhancement signal phase spectrum 3740 arg Xn (k) supplied from the phase control unit 3702 to obtain an enhancement signal (hereinafter, referred to as “enhanced signal”). Find the left side of the expression.
  • the obtained enhancement signal 3760 is transmitted from the frame synthesis unit 3813 to the output terminal 3707.
  • the transform in the transform unit and the inverse transform unit has been described as Fourier transform, but other transforms such as Hadamard transform, Haar transform, and wavelet transform can be used instead of Fourier transform.
  • the Haar transform does not require multiplication and can reduce the area when the LSI is formed. Since the wavelet transform can change the time resolution depending on the frequency, an improvement in the noise suppression effect can be expected.
  • the noise suppression unit 3705 can perform actual suppression. At that time, high sound quality can be achieved by integrating more frequency components from a low frequency region having a high ability to discriminate auditory characteristics toward a high frequency region having a low ability. As described above, when noise suppression is executed after integrating a plurality of frequency components, the number of frequency components to which noise suppression is applied is reduced, and the overall calculation amount can be reduced.
  • the noise suppression unit 3705 estimates noise using the deteriorated signal amplitude spectrum supplied from the conversion unit 3701 and generates an estimated noise spectrum. Then, a suppression coefficient is obtained using the degraded signal amplitude spectrum from the conversion unit 3701 and the generated estimated noise spectrum, is multiplied by the degraded signal amplitude spectrum, and is supplied to the amplitude control unit 3703 as an enhanced signal amplitude spectrum.
  • the degree of noise suppression according to the possibility that there is a sudden change of the signal in response to the information (probability that the sudden change of the signal exists, the possibility of existence) from the sudden change determination unit 3709 Can also be changed.
  • the possibility of a sudden change in the signal is determined by frequency component, frequency band (integrated with an arbitrary number of continuous frequency components) or frame unit, and the frequency component and frequency are suppressed in order to suppress the sudden change. Different signal processing can be performed for each band or frame.
  • Non-Patent Document 1 For noise estimation, various estimation methods such as those described in Non-Patent Document 1 and Non-Patent Document 2 can be used.
  • Non-Patent Document 1 discloses a method in which an estimated noise spectrum is an average value of a deteriorated signal amplitude spectrum of a frame in which a target sound is not generated. In this method, it is necessary to detect the generation of the target sound. The section in which the target sound is generated can be determined by the power of the enhancement signal.
  • the enhancement signal is the target sound other than noise. Also, the target sound and noise levels do not change greatly between adjacent frames. For these reasons, the enhancement signal level in the past of one frame is used as an index for determining the noise interval. When the emphasized signal power of one frame in the past is below a certain value, the current frame is determined as a noise section.
  • the noise spectrum can be estimated by averaging the deteriorated signal amplitude spectrum of the frame determined as the noise interval.
  • Non-Patent Document 1 also discloses a method in which the estimated noise spectrum is an average value at the initial stage of estimation when the deteriorated signal amplitude spectrum is supplied. In this case, it is necessary to satisfy the condition that the target sound is not included immediately after the estimation is started. When the condition is satisfied, the degradation signal amplitude spectrum at the initial stage of estimation can be set as the estimated noise spectrum.
  • Non-Patent Document 2 discloses a method for obtaining an estimated noise spectrum from a statistical minimum value of a degraded signal amplitude spectrum.
  • the minimum value of the degradation signal amplitude spectrum in a certain period of time is statistically maintained, and the noise spectrum is estimated from the minimum value. Since the minimum value of the degraded signal amplitude spectrum is similar to the spectrum shape of the noise spectrum, it can be used as an estimated value of the noise spectrum shape. However, the minimum value is smaller than the original noise level. For this reason, a value obtained by appropriately amplifying the minimum value is used as the estimated noise spectrum.
  • the noise suppression unit 3705 can perform various types of suppression, but typical examples include SS (Spectrum Subtraction) method and MMSE STSA (Minimum Mean-Square Error Short-Time Spectral Amplitude Estimator: And least square mean error short time amplitude spectrum estimation) method.
  • SS Specific Subtraction
  • MMSE STSA Minimum Mean-Square Error Short-Time Spectral Amplitude Estimator: And least square mean error short time amplitude spectrum estimation
  • the noise suppression unit 3705 receives the sudden change determination result (information on whether or not there is a sudden change in the signal) from the sudden change determination unit 3709, and determines the degree of noise suppression according to whether or not there is a sudden change in the signal. change. For example, signal processing can be performed to suppress the sudden change in the frequency component, frequency band, or frame unit where the signal suddenly changed.
  • the sudden change determination unit 3709 determines that there is a sudden change
  • the smaller one of the deteriorated signal amplitude spectrum and the estimated noise spectrum is supplied to the amplitude control unit 3703 as an enhanced signal amplitude spectrum. That is, when the deteriorated signal amplitude spectrum is smaller than the estimated noise spectrum, the deteriorated signal amplitude spectrum can be output as it is, and otherwise, the input signal can be replaced with the estimated noise spectrum and output.
  • an important deteriorated signal amplitude spectrum component can be detected, and the detected important deteriorated signal amplitude spectrum component can be excluded from replacement by the estimated noise spectrum.
  • the magnitude of the degradation signal amplitude spectrum can be used as an index of importance when detecting an important degradation signal amplitude spectrum component.
  • a component having a large amplitude has a high probability that it is a component of the target signal, and holding this leads to prevention of sound quality deterioration of the target signal.
  • the peak property of the degraded signal amplitude spectrum can be used as an index of importance. It is highly probable that a deteriorated signal amplitude having a peak, that is, a value larger than the surroundings along the frequency axis, is a component of the target signal, and maintaining this will prevent deterioration of the sound quality of the target signal. Connected. In particular, since a significant peak, that is, an amplitude value that is significantly larger than the surrounding amplitude values, has a high importance, the sound quality of the target signal can be further enhanced by reliably protecting it.
  • the detection of the peak is disclosed in, for example, the pure tone component detection method of Non-Patent Document 3 and Non-Patent Document 4.
  • the detected peak may be evaluated according to a predetermined condition, and peaks that do not satisfy the condition may be excluded. For example, a peak having a value smaller than the estimated noise is unlikely to be a target signal. In other words, with the estimated noise as a reference, only a sufficiently larger peak can be left as a peak, and the others can be excluded. Whether it is sufficiently large can be determined by comparing with a constant multiple of the estimated noise. In this way, by evaluating whether the detected peak satisfies a predetermined condition and then selecting the final peak component, the detection of an erroneous peak is reduced and the suppression effect of the sudden signal change portion is increased. be able to.
  • the signal supplied to the amplitude control unit 3703 can be changed according to the probability of sudden change.
  • the result of the replacement and the deterioration signal amplitude spectrum mixed according to the probability of sudden change are output as an enhanced signal amplitude spectrum.
  • the noise suppression unit 3705 may perform suppression in multiple stages, such as a suppression degree of 0, a suppression degree of 1, and a suppression degree of 2, depending on the possibility of a sudden change in the signal.
  • the degree of suppression may be changed steplessly according to the determination result (for example, a numerical value of 0 to 1) of the sudden change determination unit.
  • FIG. 39 is a block diagram showing the configuration of the phase control unit 3702 and the amplitude control unit 3703.
  • the phase control unit 3702 includes a phase rotation unit 3901 and a rotation amount generation unit 3902
  • the amplitude control unit 3703 includes a correction amount calculation unit 3903 and an amplitude correction unit 3904.
  • the rotation amount generation unit 3902 generates a rotation amount of the deteriorated signal phase spectrum for the frequency component determined by the sudden change determination unit 3709 to be “a sudden change in signal”, and sends it to the phase rotation unit 3901 and the correction amount calculation unit 3903. Supply.
  • the phase rotation unit 3901 rotates (shifts) the deteriorated signal phase spectrum 3720 supplied from the conversion unit 3701 by the supplied rotation amount, and the enhanced signal phase spectrum. This is supplied to the inverse conversion unit 3704 as 3740.
  • the correction amount calculation unit 3903 determines an amplitude correction coefficient based on the rotation amount supplied from the rotation amount generation unit 3902 and supplies it to the amplitude correction unit 3904.
  • the rotation amount generation unit 3902 generates a rotation amount using, for example, a random number.
  • a random number When the deterioration signal phase spectrum is rotated at each frequency by a random number, the shape of the deterioration signal phase spectrum 3720 changes. Due to this change in shape, it is possible to weaken the characteristics of the sudden signal change portion such as an impact sound.
  • the random number includes a uniform random number having a uniform occurrence probability, a normal random number having a normal distribution of occurrence probability, and the like.
  • Uniform random numbers can be generated by a linear congruential method or the like.
  • uniform random numbers generated by the linear congruential method are uniformly distributed in the range of 0 to (2 ⁇ M) -1.
  • M is an arbitrary integer
  • represents a power.
  • the phase rotation amount ⁇ needs to be distributed in the range of 0 to 2 ⁇ . Therefore, the generated uniform random number is converted.
  • the conversion is performed using the following formula.
  • R is a uniform random number
  • the value of R can be used as the rotation amount. Since it is the amount of rotation, 2 ⁇ represents exactly one rotation. When the phase is rotated by 2 ⁇ , it is the same as when the phase is not rotated. Therefore, the rotation amount of 2 ⁇ + ⁇ is the same as that when the rotation amount is ⁇ .
  • the rotation amount ⁇ may be obtained by the above equation.
  • the phase rotation unit 3901 receives the rotation amount from the rotation amount generation unit 3902 and rotates the deterioration signal phase spectrum. If the degradation signal phase spectrum is expressed by an angle, it can be rotated by adding the value of the rotation amount ⁇ to the angle. When the deteriorated signal phase spectrum is expressed by a complex normal vector, it can be rotated by obtaining a normal vector of the rotation amount ⁇ and multiplying the deteriorated signal phase spectrum.
  • the normal vector of the rotation amount ⁇ is obtained by the following equation.
  • is a rotation vector
  • j indicates sqrt ( ⁇ 1). Note that sqrt represents the square root.
  • correction coefficient calculation method by the correction amount calculation unit 3903 is the same as the method described for the correction amount calculation unit 503 in FIG.
  • FIG. 40 is a diagram for describing the internal configuration of calculation units 3781 and 3782 and sudden change determination unit 3709.
  • the calculation unit 3782 includes a rapid increase unit detection unit 4001, a delay time calculation unit 4002, a phase conversion unit 4003, and an inclination calculation unit 4004.
  • the calculation unit 3781 includes an inclination calculation unit 4005.
  • the rapid increase portion detection unit 4001 calculates the absolute value of the signal in the frame and detects the maximum value 4010 of the absolute value.
  • the delay time calculation unit 4002 outputs the relative position indicating the maximum value in the frame (time from the start of the frame to the timing when the maximum value exists) as n0.
  • the phase converter 4003 converts the delay time ⁇ 4020 into a frequency domain phase. Specifically, the conversion is performed based on the following equation.
  • L is the frame length of the conversion unit 3701, and 0 ⁇ n0 ⁇ L ⁇ 1.
  • the gradient calculating unit 4005 differentiates the phase component signal input from the converting unit 3701 to derive a phase gradient 4050 in the frequency domain.
  • Each of the inclination calculation units 4004 and 4005 may calculate the inclination by differentiation based on the phase frequency, or may calculate the inclination by another method.
  • the parallelism calculation unit 4006 compares the inclination 4040 provided from the inclination calculation unit 4004 and the inclination 4050 provided from the inclination calculation unit 4005 for each frequency, and calculates the similarity of the inclinations. That is, the parallelism of the straight line calculated by the calculation unit 3781 with respect to the straight line calculated by the calculation unit 3782 of the phase component signal in the frequency domain is calculated at each frequency.
  • the sudden change determination unit 4007 determines that a sudden change in the signal exists at the frequency if such parallelism exceeds a certain value.
  • the determination result for each frequency may be corrected using the determination result for each frequency band or each frame. For example, when the determination result of a certain frequency band is “signal sudden change exists”, the determination result of all frequencies in the frequency band is forcibly set to “signal sudden change”. It is possible to reduce determination errors due to interference of signal components. On the other hand, when the determination result of a certain frequency band is "There is no signal sudden change”, by forcibly setting the determination result of all frequencies in that frequency band to "No signal sudden change”, It is also possible to reduce determination errors due to interference with other signal components.
  • each frequency is determined independently by correcting the ease of determination (threshold) in a direction in which it is easy to determine “existence” at each frequency in the band may be maintained.
  • the determination result is obtained for each frequency or each frequency band, a sudden change can be suppressed for each frequency or each frequency band, and a more accurate signal sudden change can be suppressed.
  • the sudden change determination unit 3709 outputs a signal sudden change (1) or no signal sudden change (0) as the determination result 4030.
  • the determination result 4030 is a value between 0 and 1 indicating the possibility of sudden change. It becomes. In that case, it is possible to obtain the likelihood that the signal sudden change is included.
  • FIG. 41 is a graph showing the phase and the amount of change.
  • the phase change amount changes as shown in the graph 4102 along the frequency axis in the frequency domain.
  • phase indicated as the straight line 4103 in the frequency domain can be calculated from the relative position in the frame of the rapidly increasing portion.
  • the presence of a sudden signal change is determined according to how much the phase component signal 4101 and the straight line 4103 are parallel to each other.
  • the range that approximates the slope of the straight line 4103 is indicated by a range 4104, where the vertical axis represents the phase gradient and the horizontal axis represents the frequency. Therefore, when the overlapping portion 4105 between the range 4104 and the graph 4102 is larger than the predetermined threshold, the sudden change determination unit 4007 determines that a signal sudden change exists.
  • FIG. 42 is a diagram for describing a hardware configuration when the noise suppression device 3700 according to the present embodiment is realized using software.
  • the noise suppression device 3700 includes a processor 4210, a ROM (Read Only Memory) 4220, a RAM (Random Access Memory) 4240, a storage 4250, an input / output interface 4260, an operation unit 4261, an input unit 4262, and an output unit 4263.
  • the noise suppression device 3700 may include a camera 4264.
  • the processor 4210 is a central processing unit, and controls the entire noise suppression apparatus 3700 by executing various programs.
  • the ROM 4220 stores various parameters in addition to the boot program that the processor 4210 should execute first.
  • the RAM 4240 has an area for storing an input signal 310, a phase component signal 320, an amplitude component signal 330, and an enhancement signal 360 in addition to a program load area (not shown). Further, the RAM 4240 has an area for storing an amplitude maximum value timing 4010, a delay time 4020, a phase signal 4030, phase gradients 4040 and 4050, and the like.
  • the storage 4250 stores a noise suppression program 4251.
  • the noise suppression program 4251 includes a conversion module, a phase control module, an amplitude control module, an inverse conversion module, a noise suppression module, a phase inclination calculation module, and a sudden change determination module.
  • the processor 4210 executes each module included in the noise suppression program 4251, the conversion unit 301, the phase control unit 302, the amplitude control unit 303, the inverse conversion unit 304, the noise suppression unit 305, and the calculation units 381 and 382 in FIG. 3A.
  • Each function of the sudden change determination unit 309 can be realized.
  • the storage 4250 may store a noise database.
  • the enhancement signal which is an output related to the noise suppression program 4251 executed by the processor 4210, is output from the output unit 4263 via the input / output interface 4260. Thereby, for example, the operation sound of the operation unit 4261 input from the input unit 4262 can be suppressed.
  • an application method such as detecting that a signal sudden change is included in the input signal input from the input unit 4262 and starting shooting by the camera 4264 is also possible.
  • FIG. 43A is a flowchart for explaining the flow of signal sudden change determination processing by the noise suppression program 4251.
  • the correlation removal unit 312 and the calculation unit 382 start phase inclination calculation processing corresponding to the rapidly increasing portion of the low correlation signal.
  • the calculation unit 381 starts phase gradient calculation processing in the frequency domain.
  • the threshold value N in the subsequent frame can be set large.
  • FIG. 43B is a flowchart for explaining the flow of the inclination calculation processing performed by the correlation removing unit 3712 and the calculating unit 3782.
  • the process proceeds to step S4322, and after the correlation removing unit 3712 predicts and removes a time-correlated component included in the input signal 310, a low correlation signal is generated. Perform frame division.
  • the rapid increase portion detection unit 4001 detects the rapid increase portion of the low correlation signal.
  • the delay time calculation unit 4002 outputs the relative position in the frame of the rapid increase portion (the time from the start of the frame to the timing when the rapid increase portion is present) as n0.
  • step S4329 the phase conversion unit 4003 converts the delay time n04020 into a frequency domain phase.
  • the gradient calculation unit 4004 differentiates the derived phase to derive a phase gradient in the frequency domain, and performs buffering in step S4333.
  • FIG. 43C is a flowchart for explaining the flow of the inclination calculation process performed by calculation unit 3781.
  • a signal is input in step S4351, the process proceeds to step S4353, and a phase component signal in the frequency domain is extracted by Fourier transform through frame division and window processing.
  • step S4355 when the frequency step k is set to 1, in step S4357, the phase P (k) is differentiated to calculate the slope ⁇ P (k), and in step S4359, the slope is buffered.
  • the phase gradient at the signal sudden change part is estimated and compared using the low correlation signal from which the correlation has been removed. Therefore, in the situation where the input signal contains components with time correlation, the signal sudden change Detection accuracy can be greatly improved. For example, when there is a sudden change in signal in a situation where music is being played at a high volume, according to the method of this embodiment, the detection accuracy can be greatly improved. As a result, the sudden change of the signal can be detected more accurately, and the sudden change of the signal can be appropriately suppressed as appropriate.
  • the phase gradient is obtained as a differential value, but another index such as the rotation amount of the unit vector may be obtained and used for the determination.
  • FIG. 44 is a diagram for describing a functional configuration of a noise suppression device 4400 according to the present embodiment.
  • the noise suppression device 4400 according to this embodiment is different from the thirteenth embodiment in that a windowing unit 4486 is provided between the correlation removal unit 3712 and the calculation unit 3782. Since other configurations and operations are the same as those in the thirteenth embodiment, the same configurations and operations are denoted by the same reference numerals, and detailed description thereof is omitted.
  • the parallelism can be obtained by using the time domain signal after windowing, that is, the slope obtained from the same signal as the signal used for Fourier transform.
  • the consistency with the phase gradient obtained using the frequency domain signal is increased, and a more accurate sudden change determination of the signal can be performed.
  • FIG. 45 is a diagram for describing a functional configuration of a noise suppression device 4500 according to the present embodiment.
  • the noise suppression device 4500 according to the present embodiment is different from the thirteenth embodiment in that an amplitude flatness calculation unit 4501 is additionally provided. Since other configurations and operations are the same as those in the thirteenth embodiment, the same configurations and operations are denoted by the same reference numerals, and detailed description thereof is omitted.
  • the amplitude flatness calculation unit 4501 calculates an amplitude change along the frequency axis and supplies the change to the sudden change determination unit 4509.
  • a frequency having a small change in amplitude between adjacent frequencies represents a sudden signal change.
  • one flatness may be obtained for each band or for all frequencies.
  • FM (Flatness Measure) representing flatness is obtained as in the following equation.
  • x (n) is the amplitude or power spectrum at the frequency n
  • N is the number of frequency components included in the flatness calculation section.
  • FM takes a value of 0.0 to 1.0. If completely flat, FM is 1.0.
  • Non-patent document 3 discloses the flatness.
  • Flatness can also be expressed using another index.
  • the average of x (n) is obtained for each band or for all frequencies, and the sum of squared differences between x (n) and the average value in each frequency component n is calculated for each band or for all frequencies. It can be flatness. Instead of all frequencies, one sum of squared difference values can be obtained in a single or a plurality of frequency bands, and this can be used as flatness. The flatness obtained in this way is 0.0 when the flatness is completely, and takes a larger value as the flatness decreases.
  • Smoothness may be used as another index of flatness. Smoothness can be expressed by the sum of absolute differences between adjacent samples along the frequency axis. Smoothness takes a large value for a waveform with many irregularities (non-smooth), and takes a small value for a waveform with few (smooth). This indicator is known as the total variation (TV: Total Variation).
  • the flatness along the frequency axis has been used as the flatness, but the flatness along the time axis can also be used. Since the amplitude and power suddenly increase in the signal sudden change portion, when this property is used, it can be determined that there is a signal sudden change when the flatness along the time axis is low. Specifically, when the difference in amplitude or power between the current frame and the immediately preceding frame is a certain value or more, it is determined that the flatness is low, that is, there is a sudden signal change. It is also possible to determine the difference in amplitude or power between adjacent frames for a plurality of frames from several frames in the past to the current frame, and define the result of linear or nonlinear combination of these as flatness.
  • the amplitude or power difference By using the information of the past frame, it becomes easy to detect a signal sudden change portion including a low frequency component, and the suppression performance thereof is improved.
  • this may be calculated for each frequency component, for each band, or for all frequencies.
  • the amplitude or power difference can be calculated for single or multiple bands. For example, by calculating the amplitude or power difference in a single band, particularly in a high frequency range, it is possible to reduce the influence of voice and other signals, and to detect a sudden signal change part more accurately. .
  • the two flatnesses described so far that is, the flatness along the frequency axis and the flatness along the time axis can be used singly or in combination.
  • Examples of combinations include detection of signal abrupt changes based on linear or nonlinear combination of two flatnesses, and combinations of detection results based on the respective flatnesses.
  • the flatness in the frequency direction is large and when the flatness in the time direction is small, it is determined that a sudden signal change has been detected. Therefore, it is necessary to devise methods such as combining them after reversing one of them.
  • the sudden change determination unit 4509 determines a sudden change in a signal using two indexes of similarity (parallelism) of inclination and flatness of amplitude. This is because, when the amplitude is flat along the frequency axis (the variation is small), it is considered that there is a high possibility of a signal sudden change portion. This is self-evident because the sudden change in signal is pulsed (the amplitude increases and decreases in a short time) and the Fourier transform of the impulse becomes a white signal (with the same amplitude and power at all frequencies). . For example, one of the following can be selected as the determination method.
  • amplitude or power When processing a specific signal, for example, when detecting / suppressing an impact sound with small noise and close to an impulse, information on amplitude or power may be more reliable than phase information. For example, when detecting the shooting sound of a pistol in a quiet environment, it may be detected using only the amplitude. On the other hand, when the amplitude or power of the noise changes greatly, for example, in the case of detecting a shooting sound at an airport guard, the amplitude and phase are weighted in a quiet (low noise) situation and a high noise situation. It is effective to change. In this case, the weighting of the amplitude and phase may be changed according to the presence or absence of noise and the time zone.
  • the plane takeoff and landing time can be known. Therefore, when the plane arrives (the timing when there is a lot of noise), the phase weight should be increased and used to detect the firing sound. Can do. This is because the detection of the impact sound using the phase information is more effective than the detection using the amplitude when signals other than the firing sound (impact sound to be detected) are mixed. On the other hand, in a situation where the noise is small, it is possible to detect the impact sound more effectively by making a determination with emphasis on the absolute value of the frequency domain vector of the input degraded signal, that is, the amplitude value. Of course, the value of the power spectrum may be used here instead of the amplitude spectrum.
  • the amplitude of the impact sound may not be flat depending on the type of signal. In that case, a sudden change in the signal can be detected with high accuracy by performing detection by increasing the weight of the phase flatness.
  • the calculation result of the amplitude flatness may be corrected using the obtained information so that the same result as when the amplitude is flat is obtained. it can.
  • the amplitude flatness is calculated after multiplying the amplitude spectrum 3730 by the amplitude of the impact sound or the inverse of the power spectrum shape by each frequency component.
  • the present embodiment it is possible to detect the sudden signal change portion using the amplitude flatness. As a result, a sudden signal change (impact sound) can be detected more accurately, and the sudden signal change (impact sound) can be appropriately suppressed as appropriate.
  • a signal processing device 4600 as a sixteenth embodiment of the present invention will be described with reference to FIG.
  • the signal processing device 4600 is a device for detecting an input signal sudden change.
  • the signal processing device 4600 includes a conversion unit 4601, a linearity calculation unit 4602, and a signal sudden change determination unit 4604.
  • the conversion unit 4601 converts the input signal 4610 into a phase component signal 4620 and an amplitude component signal 4630 in the frequency domain.
  • Linearity calculation unit 4602 calculates linearity 4640 of phase component signal 4620.
  • the signal sudden change determination unit 4604 calculates the existence possibility (estimated existence probability) of the input signal sudden change based on the linearity 4640 calculated by the linearity calculation unit 4602.
  • a noise suppression apparatus as a seventeenth embodiment of the present invention will be described with reference to FIGS.
  • the noise suppression device of the present embodiment can be applied to noise suppression of, for example, a digital camera, a notebook computer, a mobile phone, a keyboard, a game machine controller, and a mobile phone push button. That is, a target signal (desired signal) such as voice, music, and environmental sound can be emphasized with respect to a signal (noise or interference signal) superimposed thereon.
  • the present invention is not limited to this, and can be applied to any signal processing apparatus that is required to determine a signal sudden change from an input signal.
  • a noise suppression device that detects and suppresses an impact sound will be described as an example of a sudden change in signal.
  • the noise suppression device according to the present embodiment appropriately suppresses the impact sound generated by the button operation in a mode in which an operation such as a button press is performed near the microphone, for example.
  • a time domain signal including an impact sound is converted into a frequency domain signal, and the linearity of the phase component with respect to the frequency space is calculated. Then, the presence possibility (estimated existence probability) of the impact sound is calculated according to the height of the linearity (inclination variation).
  • FIG. 47 is a block diagram showing the overall configuration of the noise suppression device 4700.
  • a degradation signal (a signal in which a desired signal and noise are mixed) is supplied to the input terminal 4706 as a sample value series.
  • the degradation signal supplied to the input terminal 4706 is subjected to transformation such as Fourier transformation in the transformation unit 4701 and is divided into a plurality of frequency components. A plurality of frequency components are processed independently for each frequency. Here, the description will be continued focusing on a specific frequency component.
  • the amplitude spectrum (amplitude component) 4730 is supplied to the noise suppression unit 4705, and the phase spectrum (phase component) 4720 is supplied to the phase control unit 4702 and the linearity calculation unit 4708.
  • the conversion unit 4701 supplies the degradation signal amplitude spectrum 4730 to the noise suppression unit 4705.
  • the present invention is not limited to this, and a power spectrum corresponding to the square thereof is supplied to the noise suppression unit 4705. You may supply.
  • the noise suppression unit 4705 estimates noise using the degraded signal amplitude spectrum 4730 supplied from the conversion unit 4701, and generates an estimated noise spectrum. Also, the noise suppression unit 4705 suppresses noise using the degraded signal amplitude spectrum 4730 supplied from the conversion unit 4701 and the generated estimated noise spectrum, and the enhanced signal amplitude spectrum as a noise suppression result is the amplitude control unit 4703. To communicate. Furthermore, the noise suppression unit 4705 receives the determination result from the sudden change determination unit 4709, and suppresses noise with different intensities depending on whether or not there is a sudden change in the signal. The noise suppression unit 4705 may detect the desired signal and protect the desired signal component for each frequency. On the other hand, when the signal sudden change exists and the desired signal component is not detected, the amplitude may be replaced with the estimated background sound.
  • the phase control unit 4702 rotates (shifts) the deteriorated signal phase spectrum 4720 supplied from the conversion unit 4701 and supplies it to the inverse conversion unit 4704 as the enhanced signal phase spectrum 4740.
  • the rotation amount (shift amount) of the phase is transmitted to the amplitude control unit 4703.
  • the amplitude control unit 4703 receives the phase rotation amount (shift amount) from the phase control unit 4702, calculates the amplitude correction amount, uses the amplitude correction amount to correct the emphasized signal amplitude spectrum at each frequency, and corrects the corrected amplitude.
  • the spectrum 4750 is supplied to the inverse transform unit 4704.
  • the inverse conversion unit 4704 synthesizes the enhancement signal phase spectrum 4740 supplied from the phase control unit 4702 and the corrected amplitude spectrum supplied from the amplitude control unit 4703, performs inverse conversion, and outputs the result to the output terminal 4707 as an enhancement signal. Supply.
  • the linearity calculation unit 4708 calculates the linearity in the frequency domain using the phase spectrum 4720 supplied from the conversion unit 4701.
  • the sudden change determination unit 4709 calculates the existence possibility (estimated existence probability) of the signal sudden change based on the linearity calculated by the linearity calculation unit 4708.
  • phase gradient in the frequency direction when an isolated pulse is Fourier-transformed is uniquely determined corresponding to the position of the isolated pulse. For example, when the frame length in the conversion unit is L samples and the isolated pulse position is n0 (0 ⁇ n0 ⁇ L ⁇ 1), the phase gradient is ⁇ 2 ⁇ n0 / L. This is because the k-th frequency component D (k) obtained by Fourier transform is given by the following equation for an isolated pulse of amplitude a.
  • FIG. 48 is a block diagram illustrating a configuration of the conversion unit 4701.
  • the converting unit 4701 includes a frame dividing unit 4801, a windowing unit 4802, and a Fourier transform unit 4803.
  • the deteriorated signal samples are supplied to the frame dividing unit 4801 and divided into frames for every K / 2 samples.
  • K is an even number.
  • the degraded signal sample divided into frames is supplied to a windowing processing unit 4802, and is multiplied by w (t) which is a window function.
  • w (t) for example, a Hanning window represented by the following equation can be used.
  • various window functions such as a Hamming window and a triangular window are known.
  • the windowed output is supplied to a Fourier transform unit 4803 and converted into a degraded signal spectrum Yn (k).
  • the deteriorated signal spectrum Yn (k) is separated into a phase and an amplitude, and the deteriorated signal phase spectrum arg Yn (k) is sent to the phase controller 4702 and the linearity calculator 4708, and the deteriorated signal amplitude spectrum
  • the noise suppression unit 4705 is supplied.
  • a power spectrum can be used instead of an amplitude spectrum.
  • FIG. 49 is a block diagram showing the configuration of the inverse transform unit 4704.
  • the inverse transform unit 4704 includes an inverse Fourier transform unit 4901, a windowing processing unit 4902, and a frame composition unit 4903.
  • the inverse Fourier transform unit 4901 multiplies the enhancement signal amplitude spectrum 4750 supplied from the amplitude control unit 4703 by the enhancement signal phase spectrum 4740 arg Xn (k) supplied from the phase control unit 4702 to obtain an enhancement signal (hereinafter, referred to as “enhanced signal”). Find the left side of the expression.
  • the obtained enhanced speech signal 4760 is transmitted from the frame synthesis unit 4903 to the output terminal 4707.
  • the transformation in the transform unit and the inverse transform unit has been described as Fourier transform, but other transforms such as Hadamard transform, Haar transform, and wavelet transform can be used instead of Fourier transform.
  • the Haar transform does not require multiplication and can reduce the area when the LSI is formed. Since the wavelet transform can change the time resolution depending on the frequency, an improvement in the noise suppression effect can be expected.
  • the noise suppression unit 4705 can perform actual suppression.
  • the number of frequency components after integration is smaller than the number of frequency components before integration.
  • a common suppression degree is obtained for the integrated frequency component obtained by integrating the frequency components, and the suppression degree is commonly used for individual frequency components belonging to the same integrated frequency component.
  • high sound quality can be achieved by integrating more frequency components from a low frequency region having a high ability to discriminate auditory characteristics toward a high frequency region having a low ability.
  • the number of frequency components to which noise suppression is applied is reduced, and the overall calculation amount can be reduced.
  • the noise suppression unit 4705 estimates noise using the deteriorated signal amplitude spectrum supplied from the conversion unit 4701, and generates an estimated noise spectrum. Then, a suppression coefficient is obtained using the deteriorated signal amplitude spectrum from the conversion unit 4701 and the generated estimated noise spectrum, is multiplied by the deteriorated signal amplitude spectrum, and is supplied to the amplitude control unit 4703 as an enhanced signal amplitude spectrum. In addition, in response to the possibility of sudden signal change (information about how much sudden signal change exists) from the sudden change determination unit 4709, a mixture of a degraded signal amplitude spectrum and an estimated noise spectrum is added according to the existence possibility. The signal is supplied to the amplitude control unit 4703 as an enhanced signal amplitude spectrum. At this time, the noise suppression unit 4705 may detect the desired signal and protect the desired signal component for each frequency.
  • Non-Patent Document 1 For noise estimation, various estimation methods such as those described in Non-Patent Document 1 and Non-Patent Document 2 can be used.
  • Non-Patent Document 1 discloses a method in which an estimated noise spectrum is an average value of degraded signal amplitude spectra of frames in which a desired signal is not generated. In this method, it is necessary to detect the presence of a desired signal. The section where the desired signal exists can be determined by the power of the enhancement signal.
  • the enhancement signal is a desired signal other than noise. Further, the level of the desired signal or noise does not change greatly between adjacent frames. For these reasons, the enhancement signal level in the past of one frame is used as an index for determining the noise interval. When the emphasized signal power of one frame in the past is below a certain value, the current frame is determined as a noise section.
  • the noise spectrum can be estimated by averaging the deteriorated signal amplitude spectrum of the frame determined as the noise interval.
  • Non-Patent Document 1 also discloses a method in which the estimated noise spectrum is an average value at the initial stage of estimation when the deteriorated signal amplitude spectrum is supplied. In this case, it is necessary to satisfy the condition that the desired signal is not included immediately after the estimation is started. When the condition is satisfied, the degradation signal amplitude spectrum at the initial stage of estimation can be set as the estimated noise spectrum.
  • Non-Patent Document 2 discloses a method for obtaining an estimated noise spectrum from a statistical minimum value of a degraded signal amplitude spectrum.
  • the minimum value of the degradation signal amplitude spectrum in a certain period of time is statistically maintained, and the noise spectrum is estimated from the minimum value. Since the minimum value of the degraded signal amplitude spectrum is similar to the spectrum shape of the noise spectrum, it can be used as an estimated value of the noise spectrum shape. However, the minimum value is smaller than the original noise level. For this reason, a value obtained by appropriately amplifying the minimum value is used as the estimated noise spectrum.
  • the noise suppression unit 4705 can perform various types of suppression, but typical examples include SS (Spectrum Subtraction) method and MMSE STSA (Minimum Mean-Square Error Short-Time Spectral Amplitude Estimator: And least square mean error short time amplitude spectrum estimation) method.
  • SS Specific Subtraction
  • MMSE STSA Minimum Mean-Square Error Short-Time Spectral Amplitude Estimator: And least square mean error short time amplitude spectrum estimation
  • the noise suppression unit 4705 changes the degree of noise suppression in accordance with the possibility of the sudden change received from the sudden change determination unit 4709 (information on how much a sudden change in the signal exists). For example, a mixture of the degraded signal amplitude spectrum and the estimated noise spectrum may be supplied to the amplitude control unit 4703 as an enhanced signal amplitude spectrum according to the possibility of existence. Specifically, the mixing ratio of the estimated noise spectrum is made higher (strong suppression is applied) in order to suppress the sudden change in units of frequency components, frequency bands, or frames in which there is a high possibility of sudden signal change.
  • the setting of the degree of suppression may be controlled steplessly according to the possibility of existence, or may be performed in multiple steps (in discrete steps) such as a suppression degree of 0, a suppression degree of 1, and a suppression degree of 2. Good.
  • the magnitude of the degradation signal amplitude spectrum can be used as an index of importance when detecting an important degradation signal amplitude spectrum component.
  • a component having a large amplitude has a high probability that it is a component of the target signal, and holding this leads to prevention of sound quality deterioration of the target signal.
  • the peak property of the degraded signal amplitude spectrum can be used as an index of importance. It is highly probable that a deteriorated signal amplitude having a peak, that is, a value larger than the surroundings along the frequency axis, is a component of the target signal, and maintaining this will prevent deterioration of the sound quality of the target signal. Connected. In particular, since a significant peak, that is, an amplitude value that is significantly larger than the surrounding amplitude values, has a high importance, the sound quality of the target signal can be further enhanced by reliably protecting it.
  • the detection of the peak is disclosed in, for example, the pure tone component detection method of Non-Patent Document 3 and Non-Patent Document 5.
  • the detected peak may be evaluated according to a predetermined condition, and peaks that do not satisfy the condition may be excluded. For example, a peak having a value smaller than the estimated noise is unlikely to be a target signal. In other words, with the estimated noise as a reference, only a sufficiently larger peak can be left as a peak, and the others can be excluded. Whether it is sufficiently large can be determined by comparing with a constant multiple of the estimated noise. In this way, by evaluating whether the detected peak satisfies a predetermined condition and then selecting the final peak component, the detection of an erroneous peak is reduced and the suppression effect of the sudden signal change portion is increased. be able to.
  • FIG. 50 is a block diagram showing the configuration of the phase control unit 4702 and the amplitude control unit 4703.
  • the phase control unit 4702 includes a phase rotation unit 5001 and a rotation amount generation unit 5002
  • the amplitude control unit 4703 includes a correction amount calculation unit 5003 and an amplitude correction unit 5004.
  • the rotation amount generation unit 5002 generates a rotation amount of the deteriorated signal phase spectrum for the frequency component determined by the sudden change determination unit 4709 to be “a sudden change in signal”, and supplies the rotation amount to the phase rotation unit 5001 and the correction amount calculation unit 5003. Supply.
  • the phase rotation unit 5001 rotates (shifts) the deteriorated signal phase spectrum 4720 supplied from the conversion unit 4701 by the supplied rotation amount, and the enhanced signal phase spectrum. 4740 is supplied to the inverse transform unit 4704.
  • the correction amount calculation unit 5003 determines an amplitude correction coefficient based on the rotation amount supplied from the rotation amount generation unit 5002 and supplies it to the amplitude correction unit 5004.
  • the rotation amount generation unit 5002 generates a rotation amount using, for example, a random number.
  • a random number When the deterioration signal phase spectrum is rotated at each frequency by a random number, the shape of the deterioration signal phase spectrum 4720 changes. Due to this change in shape, it is possible to weaken the characteristics of the sudden signal change portion such as an impact sound.
  • the random number includes a uniform random number having a uniform occurrence probability, a normal random number having a normal distribution of occurrence probability, and the like.
  • Uniform random numbers can be generated by a linear congruential method or the like.
  • uniform random numbers generated by the linear congruential method are uniformly distributed in the range of 0 to (2 ⁇ M) -1.
  • M is an arbitrary integer
  • represents a power.
  • the phase rotation amount ⁇ needs to be distributed in the range of 0 to 2 ⁇ . Therefore, the generated uniform random number is converted.
  • the conversion is performed using the following formula.
  • R is a uniform random number
  • the value of R can be used as the rotation amount. Since it is the amount of rotation, 2 ⁇ represents exactly one rotation. When the phase is rotated by 2 ⁇ , it is the same as when the phase is not rotated. Therefore, the rotation amount of 2 ⁇ + ⁇ is the same as that when the rotation amount is ⁇ .
  • the rotation amount ⁇ may be obtained by the above equation.
  • the phase rotation unit 5001 receives the rotation amount from the rotation amount generation unit 5002 and rotates the deterioration signal phase spectrum. If the degradation signal phase spectrum is expressed by an angle, it can be rotated by adding the value of the rotation amount ⁇ to the angle. When the deteriorated signal phase spectrum is expressed by a complex normal vector, it can be rotated by obtaining a normal vector of the rotation amount ⁇ and multiplying the deteriorated signal phase spectrum.
  • the normal vector of the rotation amount ⁇ is obtained by the following equation.
  • is a rotation vector
  • j indicates sqrt ( ⁇ 1). Note that sqrt represents the square root.
  • the correction coefficient calculation method performed by the correction amount calculation unit 5003 is the same as the method described for the correction amount calculation unit 503 in FIG.
  • FIG. 51 is a diagram for describing an internal configuration of the linearity calculation unit 4708 and the sudden change determination unit 4709.
  • the linearity calculation unit 4708 includes a change amount calculation unit 5101 that calculates the amount of change in phase in the frequency direction, and a flatness calculation unit 5102 that calculates the flatness of the amount of change in phase.
  • One flatness 5120 may be obtained for each frequency component, each band, or all frequencies. Further, flatness in a single band or a plurality of bands may be integrated and used instead of flatness in all frequencies.
  • the flatness error due to the phase component other than the signal sudden change component can be reduced by more global determination.
  • the sum in the frequency direction of the flatness at each frequency may be obtained as the flatness for each frame.
  • This correction can improve the reliability of flatness at each frequency.
  • the flatness for each frequency may be corrected using the flatness for each frequency band or each frame. For example, when the flatness of a certain frequency band indicates that “signal sudden change exists”, the flatness of all frequencies in the frequency band is forcibly modified to indicate “signal sudden change exists”. Thus, the flatness error due to interference with other signal components can be reduced.
  • the flatness of a certain frequency band indicates “no signal sudden change”
  • the flatness of all frequencies in the frequency band is forcibly corrected to indicate “no signal sudden change”.
  • an error in flatness due to interference with other signal components can be reduced.
  • the configuration itself may be maintained in which the flatness is uniformly corrected in a direction in which it is easy to determine “existence” at each frequency in the band, and the flatness unique to each frequency is obtained.
  • the differential value of the phase may be the amount of phase change, and the differential value may be the flatness 1220. In that case, if the secondary differential value of the phase is close to 0 (if it is below a predetermined value), the flatness will be high.
  • the change amount calculation unit 5101 calculates the change amount using the phase difference between adjacent frequencies, but the present invention is not limited to this.
  • the linearity (flatness of phase change) may be determined by differentiation based on the phase frequency. The smaller the variation of the plurality of differential results at the plurality of frequencies, the higher the linearity. Local linearity can be evaluated using local differential results. In particular, since differentiation between two adjacent frequency components can be approximated by a difference, in this case, it is determined that the linearity is higher as the variation of the plurality of differences is smaller. Flatness (Measure) can be used as an index of variation.
  • the sudden change determination unit 4709 uses the calculated flatness as the possibility that there is a sudden change in the signal. Furthermore, the result obtained by converting the flatness using a predetermined linear function, nonlinear function, polynomial, or the like may be output as a possibility 5130 that there is a sudden change in the signal. By detecting a sudden change in the signal as its “possibility of existence”, it is possible to achieve higher quality suppression than “existence itself”. This is because, when a determination error occurs in the determination of “existence itself”, that is, binary determination, the influence on suppression becomes fatal. Since there are only two options of “suppress” or “do not suppress”, applying suppression by a determination error when it should not suppress gives fatal distortion to the target signal. It will be perceived.
  • FIG. 52 is a graph showing the phase and the amount of change.
  • the phase change amount changes as shown in the graph 5202 along the frequency axis in the frequency domain.
  • the linearity of the phase is determined by deriving the flatness 5203 of this change.
  • the phase changes linearly at the sudden change part of the signal
  • the possibility of the sudden change of the signal is evaluated by calculating the linearity of the phase, that is, the flatness of the phase change in this way. Is possible. Then, by rotating the phase spectrum in a frame where there is a sudden change in the signal such as an impact sound, the sudden change can be suppressed or the influence thereof can be reduced, so that a high-quality enhanced signal can be obtained. .
  • FIG. 53 is a diagram for explaining a hardware configuration when the noise suppression device 4700 according to the present embodiment is realized using software.
  • the noise suppression device 4700 includes a processor 5310, a ROM (Read Only Memory) 5320, a RAM (Random Access Memory) 5340, a storage 5350, an input / output interface 5360, an operation unit 5361, an input unit 5362, and an output unit 5363.
  • the noise suppression device 4700 may include a camera 5364.
  • the processor 5310 is a central processing unit, and controls the entire noise suppression apparatus 4700 by executing various programs.
  • ROM 5320 stores various parameters and the like in addition to a boot program to be executed first by processor 5310.
  • the RAM 5340 has an area for storing an input signal 4710, a phase component signal 4720, an amplitude component signal 4730, an emphasis signal 4760, a phase change amount 5110, a flatness 5120, a sudden change determination result 5130, and the like in addition to a program load area (not shown). Have.
  • the storage 5350 stores a noise suppression program 5351.
  • the noise suppression program 5351 includes a conversion module, a phase control module, an amplitude control module, an inverse conversion module, a noise suppression module, a linearity calculation module, and a sudden change determination module.
  • the processor 5310 executes each module included in the noise suppression program 5351, the conversion unit 4701, the phase control unit 4702, the amplitude control unit 4703, the inverse conversion unit 4704, the noise suppression unit 4705, and the linearity calculation unit 4708 in FIG.
  • Each function of the sudden change determination unit 4709 can be realized.
  • the storage 5350 may store a noise database.
  • the enhancement signal which is the output of the noise suppression program 5351 executed by the processor 5310, is output from the output unit 5363 via the input / output interface 5360.
  • the operation sound of the operation unit 5361 input from the input unit 5362 can be suppressed.
  • an application method such as detecting that an impact sound is included in the input signal input from the input unit 5362 and starting shooting with the camera 5364 is also possible.
  • FIG. 54 is a flowchart for explaining the flow of processing by the noise suppression program 5351.
  • step S5401 when a signal is input from the input unit 5362, the process proceeds to step S5403.
  • step S5403 the conversion unit 4701 converts the input signal into the frequency domain and divides it into amplitude and phase.
  • step S5405 the discrete frequency k is set to 1 and the count value I is set to 0, and processing in the frequency space is started sequentially.
  • step S5407 the phase change at the set frequency is calculated.
  • step S5409 a change in phase change is calculated. The linearity of the phase is determined according to the magnitude of the phase change.
  • phase change based on how close the phase change is to 0, it is used as an index of the high linearity at the frequency k. Further, in order to calculate the possibility of sudden signal change in units of frames, when the change in phase change is less than a predetermined threshold N, I is incremented in step S5413.
  • step S5415 if the change in phase change is equal to or greater than the predetermined threshold N, it is determined that the phase change is not flat, that is, the phase linearity is low, and the process proceeds to step S5415 without incrementing I.
  • I frequency with high linearity
  • ⁇ .
  • the possibility of sudden signal change for each frequency is supplied to the noise suppression unit 4705 and the phase control unit 4702 (S5425).
  • a determination result indicating whether or not there is a sudden signal change for each frame may be supplied to the noise suppression unit 4705 and the phase control unit 4702.
  • FIG. 55 is a diagram for describing a functional configuration of a noise suppression device 5500 according to the present embodiment.
  • the conversion unit 5501 generates a complex signal 5550 and the linearity detection unit 5508 and the sudden change determination unit 5509 detect the complex signal 5550 based on the complex signal 5550, as compared with the seventeenth embodiment. And the point of making a judgment is different. Since other configurations and operations are the same as those in the seventeenth embodiment, the same configurations and operations are denoted by the same reference numerals, and detailed description thereof is omitted.
  • FIG. 56 is a diagram for describing an internal configuration of the linearity detection unit 5508 and the sudden change determination unit 4709.
  • the linearity detection unit 5508 includes a change amount calculation unit 5601 that calculates a phase change amount in the frequency direction and a flatness calculation unit 5102 that calculates a flatness of the phase change amount.
  • One flatness 5120 may be obtained for each frequency, for each band (a band obtained by dividing the frequency into an arbitrary width), or for all frequencies. Further, the differential value of the phase may be set as the phase change amount, and the differential value may be set as the flatness 5120.
  • the second-order differential value of the phase is close to 0 (less than a predetermined value)
  • the sudden change determination unit 4709 uses a frequency (one frequency component, a frequency band, or an entire band (that is, one frame)) corresponding to the flatness. Determined to contain impact sound. As the determination result 5130, a value between 0 and 1 corresponding to the absolute value of the flatness is output as the determination result 5130. Thereby, it is possible to obtain the likelihood that the impact sound is included.
  • phase linearity can be detected using a complex signal instead of a phase component signal.
  • FIG. 57 is a diagram for describing a functional configuration of a linearity detection unit 5708 included in the noise suppression device according to the present embodiment.
  • the linearity detection unit 5708 according to the present embodiment is different from the eighteenth embodiment in that a unit vector generation unit 5781, a rotation vector conversion unit 5782, and a rotation vector conversion unit 5783 are provided.
  • the sudden change determination unit 5709 determines whether or not there is a sudden change in signal from the rotation vector. Since other configurations and operations are the same as those in the eighteenth embodiment, the same configurations and operations are denoted by the same reference numerals, and detailed description thereof is omitted.
  • Unit vector generation unit 5781 uses complex signal 5550 to convert the input spectrum (complex vector) into a unit vector for each frequency. Specifically, the real part and the imaginary part of the complex signal 5550 are each divided by the amplitude value.
  • the rotation vector conversion unit 5782 converts the unit vector 5710 into a rotation vector between adjacent frequencies (first rotation vector 5720).
  • the amount of rotation of the rotation vector here is synonymous with the amount of phase change.
  • Multiplying the inner product of the conjugate A * of the reference vector and the rotated vector B is performed, and the rotation vector RotVec is obtained as follows.
  • RotVec A * ⁇ B Specifically, the real parts of the reference vector are added together, the imaginary parts are added up, and they are added, and one of the imaginary parts is subtracted. Then, rotation vector 5720 can be calculated.
  • the rotation vector conversion unit 5783 checks the flatness (variation) along the frequency axis of the first rotation vector 5720 obtained by the rotation vector conversion unit 5782. If the phase change amount in the frequency direction is constant, the variation in the rotation vector becomes small. Therefore, the change amount of the first rotation vector 5720 is obtained along the frequency axis. Specifically, for the first rotation vector 5720, a rotation vector between adjacent frequencies (second rotation vector 5730) is obtained. This is synonymous with the differentiation of the first rotation vector.
  • the sudden change determination unit 5709 recognizes the real part of the second rotation vector 5730 as the flatness.
  • the second rotation vector 5730 is also a unit vector, its real part takes a value from ⁇ 1 to 1.
  • the angle change amount of the first rotation vector is smaller (the variation in the rotation vector is smaller).
  • the smaller the amount of change in the first rotation vector the smaller the variation in the rotation vector, the larger the real part of the second rotation vector. That is, the angle of the second rotation vector becomes small.
  • one flatness may be obtained for each frequency, for each band (a band obtained by dividing the frequency into an arbitrary width), or for all frequencies.
  • the sudden change determination unit 5709 considers the real part of the second rotation vector 5730 as the possibility of sudden change, and determines the presence or degree of sudden change depending on whether a threshold value close to +1 (for example, 0.7 or 0.8) is exceeded. . As the determination result 5740, the presence possibility (1 to 0) of the impact sound is output. In this way, it is possible to obtain the likelihood that the impact sound is included.
  • FIG. 58 is a flowchart for explaining the flow of processing by the noise suppression program according to this embodiment.
  • step S5401 when an audio signal is input from the audio input unit 5362, the process proceeds to step S5803.
  • the conversion unit 5501 generates a complex signal from the input signal in the frequency domain.
  • step S5405 the discrete frequency k is set to 1 and processing in the frequency space is started sequentially.
  • step S5807 the complex signal is converted into a unit vector at the set frequency.
  • step S5808 the unit vector of the adjacent frequency component is converted into a first rotation vector.
  • step S5809 the first rotation vector of the adjacent frequency component is converted to the second rotation vector.
  • step S5811 the real part of the second rotation vector is regarded as the possibility of sudden signal change, and is compared with the threshold value N.
  • linearity can be detected from a rotation vector of a phase rotation vector using a complex signal.
  • the unit vector is used.
  • the present invention is not limited to this.
  • the magnitude of the angle of the second rotation vector may be compared with a threshold value instead of the real part of the second rotation vector, and it may be determined that there is a sudden signal change when the angle magnitude is larger than the threshold value.
  • the present invention is not limited to this. . It can be used in various devices, systems and situations for the purpose of detecting impact sound. Furthermore, the detection target is not limited to an impact sound (an audio signal that rises suddenly and falls immediately). Even when the signal suddenly rises (or falls) and remains as it is, it can be detected as a sudden change portion.
  • an impact sound an audio signal that rises suddenly and falls immediately. Even when the signal suddenly rises (or falls) and remains as it is, it can be detected as a sudden change portion.
  • a signal abrupt change unit called so-called attack employs an information compression method different from a normal one. It can also be applied to detection.
  • the analysis window length is changed and the preceding noise called pre-echo is suppressed, so detection is necessary.
  • a method of detecting using a change in amplitude or entropy it is possible to detect a sudden change with high accuracy and to effectively compress information.
  • FIG. 59 an application example in which a microphone 2001, a linearity calculation unit 4708, an abrupt change determination unit 4709, and a video recording unit 5902 are mounted on a vehicle 5900 is also conceivable.
  • the video recording unit 5902 prohibits overwriting of a captured image by the camera with the detection of an impact sound as a trigger, a record of the accident situation can be left. At that time, overwriting preservation may be prohibited after a certain time delay from the detection of the impact sound.
  • the impact itself is used as a trigger, there is an advantage that the accident situation can be automatically recorded even when the impact is small or when another vehicle is in an accident.
  • an application example in which a calculation unit 4708, a sudden change determination unit 4709, and an alarm unit 6001 are connected to the electrocardiograph 6000 is also considered. It is possible to detect an abnormal heartbeat of an electrocardiogram more accurately and effectively. This is particularly effective when there is a lot of noise. Similarly, it can be applied to fetal echo monitor. In some cases, the heart sound cannot be correctly obtained due to noise interference, but in such a case, the present technology is effective. That is, it can be widely applied to detection of sudden changes in biological signals.
  • the impact sound detection of the present invention may be used for abnormality detection of the hard disk drive 6100. As shown in FIG. You may utilize this invention for the detection of the firing sound and explosion sound in a situation.
  • the present invention may be applied to a system composed of a plurality of devices, or may be applied to a single device.
  • the present invention can also be applied to a case where an information processing program that implements the functions of the embodiments is supplied directly or remotely to a system or apparatus. Therefore, in order to realize the functions of the present invention on a computer, a program installed in the computer, a medium storing the program, and a WWW (World Wide Web) server that downloads the program are also included in the scope of the present invention. .
  • a non-transitory computer readable medium Are included in the scope of the present invention.
  • the determination unit performs determination of the existence possibility regarding the sudden change of the signal based on a value obtained by nonlinearly combining the change of the phase component signal and the change of the amplitude component signal, 4.
  • the signal processing device according to 2 or 3.
  • the calculation means calculates the flatness of the differential value of the phase component signal in the frequency domain, The determination unit determines that if the differential value has a high flatness and the amplitude component signal has a high flatness, the determination means determines that there is a high possibility of a sudden change in the input signal. 6.
  • the signal processing device according to any one of 5 above.
  • a magnitude of ⁇ n ⁇ 1) + jsin ( ⁇ n ⁇ n ⁇ 1) is obtained as the feature amount.
  • the converting means outputs a complex signal including a phase component signal and an amplitude component signal
  • the calculating means includes Normalization means for normalizing the complex signal at each frequency to a unit vector; First calculation means for calculating a first rotation vector from a ratio of the unit vectors at adjacent frequencies; Second calculation means for calculating a second rotation vector from the ratio of the first rotation vectors at adjacent frequencies; With The determination means includes The signal processing apparatus according to any one of appendices 1 to 8, wherein the possibility of existence relating to a sudden change in the input signal is determined based on a size of a real part of the second rotation vector.
  • the converting means outputs a complex signal including a phase component signal and an amplitude component signal
  • the calculating means includes Normalization means for normalizing the complex signal at each frequency to a unit vector; First calculation means for calculating a first rotation vector from a ratio of the unit vectors at adjacent frequencies; Second calculation means for calculating a second rotation vector from the ratio of the first rotation vectors at adjacent frequencies; With The determination means includes The signal processing device according to any one of appendices 1 to 8, wherein a sudden change in the input signal is detected based on a magnitude of an angle of the second rotation vector. (Appendix 11) 11.
  • the signal processing apparatus according to any one of appendices 1 to 10, further comprising amplitude control means for suppressing amplitude to a degree corresponding to the possibility of existence relating to the sudden change obtained by the determination means. . (Appendix 12)
  • the signal processing apparatus according to any one of appendices 1 to 11, further comprising phase control means for changing a phase of the input signal for a frame determined by the determination means to include the sudden change. .
  • a signal processing apparatus comprising: (Appendix 14) The determination means includes 14. The signal processing apparatus according to appendix 13, wherein the existence possibility related to the sudden change of the input signal is determined based on a similarity between the first phase inclination and the second phase inclination.
  • the first calculation means includes A rapidly increasing portion detecting means for detecting a position where the signal absolute value in the frame increases rapidly; A delay time calculating means for calculating a delay time from a frame start to a position where the sudden increase portion exists; Phase conversion means for converting the delay time into a frequency domain phase; 15.
  • the signal processing device according to appendix 13 or 14, characterized by comprising: (Appendix 16)
  • the converting means further includes a calculating means for calculating an amplitude component signal in a frequency domain of the input signal and calculating flatness of the amplitude component signal, 14.
  • the signal processing apparatus according to appendix 13, wherein the determination unit further determines the possibility of a sudden change in the input signal in consideration of flatness of the amplitude component signal.
  • the determination means may determine whether there is a sudden change in the signal based on values obtained by weighting the similarity between the first phase gradient and the second phase gradient and the flatness of the amplitude component signal, respectively. 17.
  • (Appendix 18) 18.
  • (Appendix 19) The signal processing device according to any one of appendices 13 to 18, further comprising phase control means for changing a phase of the input signal for a frame determined by the determination means to include the sudden change. .
  • a signal processing apparatus comprising: (Appendix 21) First calculation means for calculating a first phase gradient in the signal sudden change portion based on the position of the sudden increase portion of the low correlation signal; Second calculating means for calculating a second phase gradient of the phase component signal in the frequency domain; Further comprising The determination means includes The signal processing apparatus according to appendix 20, wherein the possibility of a sudden change in the input signal is determined based on the first phase gradient and the second phase gradient.
  • the determination means includes The signal processing apparatus according to appendix 21, wherein the presence possibility of a sudden change in the input signal is determined based on a similarity between the first phase inclination and the second phase inclination.
  • the first calculation means includes A rapidly increasing portion detecting means for detecting a position where the signal absolute value in the frame increases rapidly; A delay time calculating means for calculating a delay time from a frame start to a position where the sudden increase portion exists; Phase conversion means for converting the delay time into a frequency domain phase;
  • the converting means further includes a calculating means for calculating an amplitude component signal in a frequency domain of the input signal and calculating flatness of the amplitude component signal, The signal processing apparatus according to appendix 20, wherein the determination unit further determines the presence of a sudden change in the input signal in consideration of flatness of the amplitude component signal.
  • (Appendix 25) 25 The signal processing device according to any one of appendices 20 to 24, further comprising amplitude control means for suppressing amplitude to a degree corresponding to the possibility of the sudden change obtained by the determination means. . (Appendix 26) 26. The signal processing device according to any one of appendices 20 to 25, further comprising phase control means for changing a phase of the input signal for a frame determined by the determination means to include the sudden change. .
  • a signal processing apparatus comprising: (Appendix 28) 28. The signal processing apparatus according to appendix 27, wherein the linearity calculating unit calculates the linearity based on a change in the phase component signal in a frequency domain. (Appendix 29) The linearity calculating means calculates the flatness of the differential value of the phase component signal in the frequency domain, 29.
  • the linearity calculating means includes: For each frequency, calculate the phase component difference as the difference between the phase component and the phase component at the adjacent frequency, 30.
  • the linearity calculating means includes: Calculate the sum of the differences in adjacent frequencies of the phase component difference for each frame as the linearity of the frame; The determination means includes 31.
  • the signal processing apparatus wherein if the sum is equal to or greater than a threshold value, the phase component difference is corrected so that a difference in adjacent frequencies is increased.
  • Appendix 32 Convert the input signal into a phase component signal and an amplitude component signal in the frequency domain, Calculating feature quantities of the phase component signal and the amplitude component signal, and determining the possibility of existence of a sudden change in the input signal based on the calculated feature quantity; A signal processing method comprising each step.
  • (Appendix 33) Convert the input signal to a phase component signal in the frequency domain, Based on the position of the rapidly increasing portion of the input signal, the first phase gradient is calculated, Calculating a second phase slope of the phase component signal in the frequency domain; Determining the presence of a sudden change in the input signal based on the first phase slope and the second phase slope; A signal processing method comprising each step.
  • (Appendix 34) Convert the input signal to a phase component signal in the frequency domain, Removing a time-correlated component included in the input signal from the input signal to generate a low correlation signal; Based on the low correlation signal and the phase component signal, determine the possibility of the presence of a sudden change included in the input signal, A signal processing method comprising each step.
  • (Appendix 35) Convert the input signal to a phase component signal in the frequency domain, Calculate the linearity of the phase component signal in the frequency domain, Calculating the likelihood of a sudden change in the input signal based on the calculated linearity;
  • a signal processing method comprising each step.
  • (Appendix 36) Convert the input signal into a phase component signal and an amplitude component signal in the frequency domain, Calculating feature quantities of the phase component signal and the amplitude component signal, and determining the possibility of existence of a sudden change in the input signal based on the calculated feature quantity;
  • a signal processing program for causing a computer to execute each step.
  • (Appendix 37) Convert the input signal to a phase component signal in the frequency domain, Based on the position of the rapidly increasing portion of the input signal, the first phase gradient is calculated, Calculating a second phase slope of the phase component signal in the frequency domain; Determining the presence of a sudden change in the input signal based on the first phase slope and the second phase slope; A signal processing program for causing a computer to execute each step.
  • (Appendix 38) Convert the input signal to a phase component signal in the frequency domain, Removing a time-correlated component included in the input signal from the input signal to generate a low correlation signal; Based on the low correlation signal and the phase component signal, determine the possibility of the presence of a sudden change included in the input signal, A signal processing program for causing a computer to execute each step.
  • (Appendix 39) Convert the input signal to a phase component signal in the frequency domain, Calculate the linearity of the phase component signal in the frequency domain, Calculating the likelihood of a sudden change in the input signal based on the calculated linearity; A signal processing program for causing a computer to execute each step.

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Molecular Biology (AREA)
  • Public Health (AREA)
  • Physiology (AREA)
  • Veterinary Medicine (AREA)
  • Biophysics (AREA)
  • Pathology (AREA)
  • Biomedical Technology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Cardiology (AREA)
  • Psychiatry (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Quality & Reliability (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Noise Elimination (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

入力信号の急変を効果的に検出するための信号処理装置を提供する。この信号処理装置は、入力信号を、周波数領域における位相成分信号および振幅成分信号に変換する変換手段を備えている。また、この信号処理装置は、変換手段によって導かれた位相成分信号および振幅成分信号の特徴量を計算する計算手段を備えている。さらに、この信号処理装置は、計算手段によって計算された特徴量に基づいて入力信号の急変に関する存在可能性を判定する判定手段を備えている。

Description

信号処理装置、信号処理方法および信号処理プログラム
 本発明は、信号の変化を検出する技術に関する。
 上記技術分野において、特許文献1には、位相成分の時間方向の連続性を評価し、周波数ごとの振幅成分を平滑化する技術が開示されている(段落0135~0138)。特許文献2には、位相の時間方向変動量を計測することで、周波数急変を検出する記載がある。特許文献3には、段落0024に、「パルス性ノイズが重畳されたことに伴った複素平面上におけるI、Q信号の複素ベクトルの位相変化を常時監視することによって、強電界環境下でのパルス性ノイズを確実に検出する」と記載されている。この位相変化は、時間軸に沿ったものである。また、特許文献4の段落0031には、「位相直線化部25は、直線化により、極座標変換部24から入力された位相信号θのとびを直して、その結果の位相信号θ'を位相検出部26へ出力する」と記載がある。また、特許文献4の段落0051には、位相傾検出手段について記載があり、段落0040には、「図5には、位相検出部26の入出力信号(入力信号である位相θ'、出力信号である位相傾dθ')の一例を示してある」と記載されている。特許文献4の段落0031には、「位相直線化部25は、直線化により、極座標変換部24から入力された位相信号θのとびを直して、その結果の位相信号θ'を位相検出部26へ出力する」と記載がある。特許文献5には、振幅を用いた衝撃音の検出技術が開示されている。
特開2010-237703号公報 特開2011-254122号公報 特開2007-251908号公報 特開2011-199808号公報 WO2008/111462
M. Kato, A. Sugiyama, and M. Serizawa, "Noise suppression with high speech quality based on weighted noise estimation and MMSE STSA," IEICE Trans. Fundamentals (Japanese Edition), vol.J87-A, no.7, pp.851-860, July 2004. R. Martin, "Spectral subtraction based on minimum statistics," EUSPICO-94, pp.1182-1185, Sept. 1994 「ディジタル記録媒体のための動画信号および付随する音響信号の1.5 Mbit/s符号化-第3部 音響」、日本工業規格 JIS X 4323、99ページ、1996年11月。 A. D. Cheveigne and H. Kawahara, "YIN, a fundamental frequency estimator for speech and music," J. Acoustic Soc. Amer., vol. 111, no. 4, pp.1917-1930 J. L. Flanagan et al., "Speech Coding," IEEE Transactions on Communications, Vol. 27, no. 4, April 1979. A. Subramanya et al., "Automatic removal of typed keystrokes from speech signals," IEEE Signal Processing Letters, Vol. 14, No. 5, pp.363-366, May 2007. J. Murphy et al., "Joint Baysian removal of impulse and background noise," IEEE Proceedings of ICASSP, pp.261-264, May 2011. R. Talmon et al., "Transient noise reduction useing nonlocal diffusion filters," IEEE Transactions on Audio, Speech, and Language Processing, Vol. 19, No. 6, pp.1584-1599, Jun. 2011.
 しかしながら、上述の先行技術文献に記載の技術の中で、特許文献1および4は、入力信号の急変を検出する技術ではない。また、特許文献2では、「周波数」の急変を検出しようとするものであり、特許文献3では、AM信号の位相の時間変化を用いてパルス性ノイズを検出しようとするものである。特許文献5は、振幅のみを用いた衝撃音の検出技術であり、ロバスト性に不足があった。すなわち、これらの文献に記載の技術では、信号の急変を効果的に検出できなかった。
 本発明の目的は、上述の課題を解決する技術を提供することにある。
 上記目的を達成するため、本発明に係る装置は、
 入力信号を、周波数領域における位相成分信号および振幅成分信号に変換する変換手段と、
 前記位相成分信号および前記振幅成分信号の特徴量を計算する計算手段と、
 前記計算手段によって計算された前記特徴量に基づいて前記入力信号の急変に関する存在可能性を判定する判定手段と、
 を備えたことを特徴とする。
 上記目的を達成するため、本発明に係る他の装置は、
 入力信号を、周波数領域における位相成分信号に変換する変換手段と、
 前記入力信号の急増部の位置に基づいて、第1位相傾きを算出する第1算出手段と、
 周波数領域における前記位相成分信号の第2位相傾きを算出する第2算出手段と、
 前記第1位相傾きと前記第2位相傾きに基づいて前記入力信号の急変に関する存在可能性を判定する判定手段と、
 を備えたことを特徴とする。
 上記目的を達成するため、本発明に係るさらに他の装置は、
 入力信号を、周波数領域における位相成分信号に変換する変換手段と、
 前記入力信号に含まれる時間相関のある成分を前記入力信号から除いて低相関信号を生成する生成手段と、
 前記低相関信号と前記位相成分信号とに基づいて、前記入力信号に含まれる急変の存在可能性を判定する判定手段と、
 を備えたことを特徴とする。
 上記目的を達成するため、本発明に係るまたさらに他の装置は、
 入力信号を、周波数領域における位相成分信号に変換する変換手段と、
 周波数領域における前記位相成分信号の直線性を計算する直線性計算手段と、
 前記直線性計算手段によって計算された前記直線性に基づいて前記入力信号の急変の存在可能性を計算する判定手段と、
 を備えたことを特徴とする信号処理装置。
 上記目的を達成するため、本発明に係る方法は、
 入力信号を、周波数領域における位相成分信号および振幅成分信号に変換し、
 前記位相成分信号および前記振幅成分信号の特徴量を計算し
 計算された前記特徴量に基づいて前記入力信号の急変に関する存在可能性を判定する、
 各ステップを含むことを特徴とする。
 上記目的を達成するため、本発明に係る他の方法は、
 入力信号を、周波数領域における位相成分信号に変換し、
 前記入力信号の急増部の位置に基づいて、第1位相傾きを算出し、
 周波数領域における前記位相成分信号の第2位相傾きを算出し、
 前記第1位相傾きと前記第2位相傾きとに基づいて前記入力信号の急変の存在可能性を判定する、
 各ステップを含むことを特徴とする。
 上記目的を達成するため、本発明に係るさらに他の方法は、
 入力信号を、周波数領域における位相成分信号に変換し、
 前記入力信号に含まれる時間相関のある成分を前記入力信号から除いて低相関信号を生成し、
 前記低相関信号と前記位相成分信号とに基づいて、前記入力信号に含まれる急変の存在可能性を判定する、
 各ステップを含むことを特徴とする。
 上記目的を達成するため、本発明に係るまたさらに他の方法は、
 入力信号を、周波数領域における位相成分信号に変換し、
 周波数領域における前記位相成分信号の直線性を計算し、
 計算された前記直線性に基づいて前記入力信号の急変の存在可能性を計算する、
 各ステップを含むことを特徴とする。
 上記目的を達成するため、本発明に係るプログラムは、
 入力信号を、周波数領域における位相成分信号および振幅成分信号に変換し、
 前記位相成分信号および前記振幅成分信号の特徴量を計算し
 計算された前記特徴量に基づいて前記入力信号の急変に関する存在可能性を判定する、
 各ステップをコンピュータに実行させることを特徴とする。
 上記目的を達成するため、本発明に係る他のプログラムは、
 入力信号を、周波数領域における位相成分信号に変換し、
 前記入力信号の急増部の位置に基づいて、第1位相傾きを算出し、
 周波数領域における前記位相成分信号の第2位相傾きを算出し、
 前記第1位相傾きと前記第2位相傾きとに基づいて前記入力信号の急変の存在可能性を判定する、
 各ステップをコンピュータに実行させることを特徴とする。
 上記目的を達成するため、本発明に係るさらに他のプログラムは、
 入力信号を、周波数領域における位相成分信号に変換し、
 前記入力信号に含まれる時間相関のある成分を前記入力信号から除いて低相関信号を生成し、
 前記低相関信号と前記位相成分信号とに基づいて、前記入力信号に含まれる急変の存在可能性を判定する、
 各ステップをコンピュータに実行させることを特徴とする。
 上記目的を達成するため、本発明に係るまたさらに他のプログラムは、
 入力信号を、周波数領域における位相成分信号に変換し、
 周波数領域における前記位相成分信号の直線性を計算し、
 計算された前記直線性に基づいて前記入力信号の急変の存在可能性を計算する、
 各ステップをコンピュータに実行させることを特徴とする。
 本発明によれば、信号の急変を効果的に検出できる。
本発明の第1実施形態に係る信号処理装置の構成を示すブロック図である。 本発明の第2実施形態に係る雑音抑圧装置の構成を示すブロック図である。 本発明の第2実施形態に係る変換部の構成を示すブロック図である。 本発明の第2実施形態に係る逆変換部の構成を示すブロック図である。 本発明の第2実施形態に係る位相制御部および振幅制御部の構成を示すブロック図である。 本発明の第2実施形態に係る位相制御部の動作を説明する図である。 本発明の第2実施形態に係る位相制御部の動作を説明する図である。 本発明の第2実施形態に係る位相制御部の動作を説明する図である。 本発明の第2実施形態に係る位相制御部の動作を説明する図である。 本発明の第2実施形態に係る位相制御部の動作を説明する図である。 本発明の第2実施形態に係る位相制御部の動作を説明する図である。 本発明の第2実施形態に係る計算部および急変判定部の構成を説明する図である。 本発明の第2実施形態に係る計算部の処理を説明する図である。 本発明の第2実施形態に係る雑音抑圧装置のハードウェア構成を示すブロック図である。 本発明の第2実施形態に係る雑音抑圧装置の処理の流れを説明するフローチャートである。 本発明の第3実施形態に係る雑音抑圧装置の構成を示すブロック図である。 本発明の第3実施形態に係る位相制御部および振幅制御部の構成を示すブロック図である。 本発明の第4実施形態に係る位相制御部および振幅制御部の構成を示すブロック図である。 本発明の第4実施形態に係る雑音抑圧装置の処理の流れを説明するフローチャートである。 本発明の第5実施形態にかかる適用例を説明する図である。 本発明の第5実施形態にかかる適用例を説明する図である。 本発明の第6実施形態に係る信号処理装置の構成を示すブロック図である。 本発明の第7実施形態に係る雑音抑圧装置の構成を示すブロック図である。 本発明の第7実施形態に係る変換部の構成を示すブロック図である。 本発明の第7実施形態に係る逆変換部の構成を示すブロック図である。 本発明の第7実施形態に係る位相制御部および振幅制御部の構成を示すブロック図である。 本発明の第7実施形態に係る算出部および急変判定部の構成を説明する図である。 本発明の第7実施形態に係る算出部の処理を説明する図である。 本発明の第7実施形態に係る雑音抑圧装置のハードウェア構成を示すブロック図である。 本発明の第7実施形態に係る雑音抑圧装置の処理の流れを説明するフローチャートである。 本発明の第7実施形態に係る雑音抑圧装置の処理の流れを説明するフローチャートである。 本発明の第7実施形態に係る雑音抑圧装置の処理の流れを説明するフローチャートである。 本発明の第8実施形態に係る変換部の構成を示すブロック図である。 本発明の第9実施形態に係る雑音抑圧装置の構成を示すブロック図である。 本発明の第10実施形態にかかる適用例を説明する図である。 本発明の第10実施形態にかかる適用例を説明する図である。 本発明の第11実施形態に係る信号処理装置の構成を示すブロック図である。 本発明の第12実施形態に係る雑音抑圧装置の構成を示すブロック図である。 本発明の第13実施形態に係る雑音抑圧装置の構成を示すブロック図である。 本発明の第13実施形態に係る相関除去部の構成の一例を示すブロック図である。 本発明の第13実施形態に係る相関除去部の構成の他の例を示すブロック図である。 本発明の第13実施形態に係る変換部の構成を示すブロック図である。 本発明の第13実施形態に係る逆変換部の構成を示すブロック図である。 本発明の第13実施形態に係る位相制御部および振幅制御部の構成を示すブロック図である。 本発明の第13実施形態に係る算出部および急変判定部の構成を説明する図である。 本発明の第13実施形態に係る算出部の処理を説明する図である。 本発明の第13実施形態に係る雑音抑圧装置のハードウェア構成を示すブロック図である。 本発明の第13実施形態に係る雑音抑圧装置の処理の流れを説明するフローチャートである。 本発明の第13実施形態に係る雑音抑圧装置の処理の流れを説明するフローチャートである。 本発明の第13実施形態に係る雑音抑圧装置の処理の流れを説明するフローチャートである。 本発明の第14実施形態に係る雑音抑圧装置の構成を示すブロック図である。 本発明の第15実施形態に係る雑音抑圧装置の構成を示すブロック図である。 本発明の第16実施形態に係る信号処理装置の構成を示すブロック図である。 本発明の第17実施形態に係る雑音抑圧装置の構成を示すブロック図である。 本発明の第17実施形態に係る変換部の構成を示すブロック図である。 本発明の第17実施形態に係る逆変換部の構成を示すブロック図である。 本発明の第17実施形態に係る位相制御部および振幅制御部の構成を示すブロック図である。 本発明の第17実施形態に係る直線性計算部および急変判定部の構成を説明する図である。 本発明の第17実施形態に係る直線性計算部の処理を説明する図である。 本発明の第17実施形態に係る雑音抑圧装置のハードウェア構成を示すブロック図である。 本発明の第17実施形態に係る雑音抑圧装置の処理の流れを説明するフローチャートである。 本発明の第18実施形態に係る雑音抑圧装置の構成を示すブロック図である。 本発明の第18実施形態に係る位相制御部および振幅制御部の構成を示すブロック図である。 本発明の第19実施形態に係る位相制御部および振幅制御部の構成を示すブロック図である。 本発明の第19実施形態に係る雑音抑圧装置の処理の流れを説明するフローチャートである。 本発明の第20実施形態にかかる適用例を説明する図である。 本発明の第20実施形態にかかる適用例を説明する図である。 本発明の第21実施形態にかかる適用例を説明する図である。 本発明の第21実施形態にかかる適用例を説明する図である。
 以下に、図面を参照して、本発明の実施の形態について例示的に詳しく説明する。ただし、以下の実施の形態に記載されている構成要素はあくまで例示であり、本発明の技術範囲をそれらのみに限定する趣旨のものではない。なお、以下の説明中における「音声信号」とは、音声その他の音響に従って生ずる直接的の電気的変化であって、音声その他の音響を伝送するためのものをいい、音声に限定されない。
 [第1実施形態]
 本発明の第1実施形態としての信号処理装置100について、図1を用いて説明する。信号処理装置100は、入力信号急変を検出するための装置である。
 図1に示すように、信号処理装置100は、変換部101と計算部102と信号急変判定部103とを含む。変換部101は、入力信号110を、周波数領域における位相成分信号120および振幅成分信号130に変換する。計算部102は、位相成分信号120および振幅成分信号130の変化を計算する。信号急変判定部103は、計算された変化に基づいて入力信号の急変を判定する。
 以上の構成により、周波数領域における位相成分信号と振幅成分信号との変化に応じて、入力信号の急変を効果的に検出することができる。
 [第2実施形態]
 《全体構成》
 本発明の第2実施形態としての雑音抑圧装置について図2乃至図11を用いて説明する。本実施形態の雑音抑圧装置は、例えばデジタルカメラ、ノートパソコン、携帯電話、キーボード、ゲーム機のコントローラ、携帯電話の押しボタンなどの雑音抑圧に適用できる。すなわち、音声、音楽、環境音などの目的とする信号を、これらに重畳された信号(ノイズまたは妨害信号)に対して強調することができる。ただし、本発明はこれに限定されるものではなく、入力信号からの信号急変検出を要求されるあらゆる信号処理装置に適用可能である。なお、本実施形態では、信号の急変の一例として、衝撃音を検出して抑圧する雑音抑圧装置について説明する。本実施形態としての雑音抑圧装置は、例えば、マイクの近くでボタン押下などの操作がなされるような形態において、かかるボタン操作により発生する衝撃音を適切に抑圧する。簡単に説明すると、衝撃音を含む時間領域信号を周波数領域信号に変換し、周波数空間における位相成分および振幅成分の変化を算出する。そして、それらの変化の組合せに応じて、衝撃音の存在を判定する。
 図2は、雑音抑圧装置200の全体構成を示すブロック図である。入力端子206には、劣化信号(所望信号と雑音の混在する信号)が、サンプル値系列として供給される。入力端子206に供給された劣化信号は、変換部201においてフーリエ変換などの変換を施されて複数の周波数成分に分割される。複数の周波数成分は周波数ごとに独立して処理される。ここでは、特定の周波数成分に注目して説明を続ける。周波数成分のうち振幅スペクトル(振幅成分)230は雑音抑圧部205および計算部208へ供給され、位相スペクトル(位相成分)220は位相制御部202および計算部208に供給される。なお、ここでは変換部201が雑音抑圧部205に劣化信号振幅スペクトル230を供給しているが、本発明はこれに限定されるものではなく、振幅スペクトルの二乗に相当するパワースペクトルを雑音抑圧部205に供給してもよい。
 雑音抑圧部205は、変換部201から供給される劣化信号振幅スペクトル230を用いて、雑音を推定し、推定雑音スペクトルを生成する。また、雑音抑圧部205は、変換部201から供給された劣化信号振幅スペクトル230と、生成した推定雑音スペクトルとを用いて雑音を抑圧し、雑音抑圧結果としての強調信号振幅スペクトルを振幅制御部203に伝達する。さらに雑音抑圧部205は、急変判定部209から判定結果を入力し、信号の急変の有無またはその程度に応じて、雑音の抑圧の程度を変更する。雑音抑圧部205は目的音検出を用いて目的音を保護する一方、信号急変検出時は振幅を推定背景音に置換してもよい。
 位相制御部202は、変換部201から供給された劣化信号位相スペクトル220を回転(シフト)させ、強調信号位相スペクトル240として逆変換部204へ供給する。また、位相の回転量(シフト量)を、振幅制御部203へ伝達する。振幅制御部203は、位相制御部202から位相の回転量(シフト量)を受け取って振幅補正量を算出し、その振幅補正量を用いて、強調信号振幅スペクトルを各周波数で補正し、補正振幅スペクトル250を逆変換部204へ供給する。逆変換部204は、位相制御部202から供給された強調信号位相スペクトル240と、振幅制御部203から供給された補正振幅スペクトル250とを合成して逆変換を行い、強調信号として、出力端子207に供給する。
 計算部208は、変換部201から供給された位相成分信号220と振幅成分信号230とを用いて、その周波数領域でのそれぞれの変化を計算する。急変判定部209は、計算部208が計算した変化に基づいて、信号の急変がどの程度存在するか(存在可能性)を周波数点ごとに判定する。
 《変換部の構成》
 図3は、変換部201の構成を示すブロック図である。図3に示すように、変換部201はフレーム分割部301、窓がけ処理部(windowing unit)302、およびフーリエ変換部303を含む。劣化信号サンプルは、フレーム分割部301に供給され、K/2サンプルごとのフレームに分割される。ここで、Kは偶数とする。フレームに分割された劣化信号サンプルは、窓がけ処理部302に供給され、窓関数(window function)であるw(t)との乗算が行なわれる。第nフレームの入力信号yn(t) (t=0, 1, ..., K/2-1) に対するw(t)で窓がけ(windowing)された信号は、次式(1)で与えられる。
Figure JPOXMLDOC01-appb-M000001
 また、連続する2フレームの一部を重ね合わせ(オーバラップ)して窓がけしてもよい。オーバラップ長としてフレーム長の50%を仮定すれば、t=0, 1, ..., K/2-1 に対して、以下の式(2)で得られる左辺が、窓がけ処理部302の出力となる。
Figure JPOXMLDOC01-appb-M000002
 実数信号に対しては、左右対称窓関数が用いられる。また、窓関数は、変換部201の出力を逆変換部204に直接供給したときの入力信号と出力信号が計算誤差を除いて一致するように設計される。これは、w2(t)+w2 (t+K/2)=1 となることを意味する。
 以後、連続する2フレームの50%をオーバラップして窓がけする場合を例として説明を続ける。w(t)としては、例えば、次式(3)に示すハニング窓を用いることができる。
Figure JPOXMLDOC01-appb-M000003
 このほかにも、ハミング窓、三角窓など、様々な窓関数が知られている。窓がけされた出力はフーリエ変換部303に供給され、劣化信号スペクトルYn(k)に変換される。劣化信号スペクトルYn(k)は位相と振幅に分離され、劣化信号位相スペクトル arg Yn(k)は、位相制御部202と計算部208に、劣化信号振幅スペクトル|Yn(k)|は、雑音抑圧部205と計算部208に供給される。既に説明したように、振幅スペクトルの代わりにパワースペクトルを利用することもできる。
 《逆変換部の構成》
 図4は、逆変換部204の構成を示すブロック図である。図4に示すように、逆変換部204は逆フーリエ変換部401、窓がけ処理部402およびフレーム合成部403を含む。逆フーリエ変換部401は、振幅制御部203から供給された強調信号振幅スペクトル250と位相制御部202から供給された強調信号位相スペクトル240 (arg Xn(k))とを乗算して、強調信号(以下の式(4)の左辺)を求める。
Figure JPOXMLDOC01-appb-M000004
 得られた強調信号に逆フーリエ変換を施し、1フレームがKサンプルを含む時間領域サンプル値系列xn(t) (t=0, 1, ..., K-1)として、窓がけ処理部402に供給され、窓関数w(t)との乗算が行なわれる。第nフレームの入力信号xn(t) (t=0, 1, ..., K/2-1)に対してw(t)で窓がけされた信号は、次式(5)の左辺で与えられる。
Figure JPOXMLDOC01-appb-M000005
 また、連続する2フレームの一部を重ね合わせ(オーバラップ)して窓がけしてもよい。フレーム長の50%をオーバラップ長として仮定すれば、t=0, 1, ..., K/2-1 に対して、以下の式の左辺が、窓がけ処理部402の出力となり、フレーム合成部403に伝達される。
Figure JPOXMLDOC01-appb-M000006
 フレーム合成部403は、窓がけ処理部402からの隣接する2フレームの出力を、K/2サンプルずつ取り出して重ね合わせ、以下の式(7)によって、t=0, 1, ..., K-1における出力信号(式(7)の左辺)を得る。得られた強調音声信号260は、フレーム合成部403から出力端子207に伝達される。
Figure JPOXMLDOC01-appb-M000007
 なお、図3と図4において変換部と逆変換部における変換をフーリエ変換として説明したが、フーリエ変換に代えて、アダマール変換、ハール変換、ウェーブレット変換など、他の変換を用いることもできる。ハール変換は、乗算が不要となり、LSI化したときの面積を小さくすることができる。ウェーブレット変換は、周波数によって時間解像度を異なったものに変更できるために、雑音抑圧効果の向上が期待できる。
 また、変換部201において得られる周波数成分を複数統合してから、雑音抑圧部205で実際の抑圧を行うこともできる。その際、聴覚特性の弁別能力が高い低周波領域から、能力が低い高周波領域に向かって、よりたくさんの周波数成分を統合することによって、高い音質を達成することができる。このように、複数の周波数成分を統合してから雑音抑圧を実行すると、雑音抑圧を適用する周波数成分の数が少なくなり、全体の演算量を削減することができる。
 《雑音抑圧部の構成》
 雑音抑圧部205は、変換部201から供給される劣化信号振幅スペクトルを用いて雑音を推定し、推定雑音スペクトルを生成する。そして、変換部201からの劣化信号振幅スペクトルと生成した推定雑音スペクトルとを用いて抑圧係数を求め、劣化信号振幅スペクトルに乗じ、強調信号振幅スペクトルとして、振幅制御部203へ供給する。
また、急変判定部209から、急変がどの程度存在するかの情報(信号の急変が存在する確からしさ、存在可能性)を受けて、信号の急変が存在する可能性に応じて、雑音抑圧の程度を変更することもできる。さらに、信号の急変が存在する可能性を周波数成分、周波数帯域(任意の数の連続する周波数成分を統合したもの)、あるいはフレーム単位で判定し、その急変を抑圧すべく、前記周波数成分、周波数帯域、あるいはフレーム単位で異なった信号処理を施すことができる。
 雑音の推定には、非特許文献1や非特許文献2に記載の方法など、様々な推定方法が利用できる。
 例えば、非特許文献1には、推定雑音スペクトルを、目的音が発生していないフレームの劣化信号振幅スペクトルの平均値とする方法が開示されている。この方法では目的音の発生を検出する必要がある。目的音の発生している区間は、強調信号のパワーで判断することができる。
 理想的な動作状態として、強調信号は雑音以外の目的音となっている。また、目的音や雑音のレベルは、隣接フレーム間で大きく変化しない。これらのことから、1フレーム過去の強調信号レベルを雑音区間判定の指標とする。1フレーム過去の強調信号パワーが一定値以下の時には、現フレームを雑音区間と判定する。雑音スペクトルは、雑音区間と判定されたフレームの劣化信号振幅スペクトルを平均化することで推定できる。
 また、非特許文献1には、推定雑音スペクトルを、劣化信号振幅スペクトルが供給され始めた推定初期の平均値とする方法も開示されている。この場合、推定が開始された直後には目的音が含まれないという条件を満たす必要がある。条件が満たされる場合、推定初期の劣化信号振幅スペクトルを推定雑音スペクトルとすることができる。
 さらに、非特許文献2には、推定雑音スペクトルを、統計的な劣化信号振幅スペクトルの最小値から求める方法が開示されている。この方法では、統計的に一定時間における劣化信号振幅スペクトルの最小値を保持し、その最小値から雑音スペクトルを推定する。劣化信号振幅スペクトルの最小値は、雑音スペクトルのスペクトル形状と似ているため、雑音スペクトル形状の推定値として用いることができる。しかし、最小値では、本来の雑音レベルより小さくなる。そのため、最小値を適切に増幅させたものを推定雑音スペクトルとして用いる。
 雑音抑圧部205においては、様々な抑圧を行うことが可能であるが、代表的なものとして、SS(Spectrum Subtraction:スペクトル減算)法とMMSE STSA(Minimum Mean-Square Error Short-Time Spectral Amplitude Estimator:最小二乗平均誤差短時間振幅スペクトル推定)法とが挙げられる。SS法の場合は、変換部201から供給された劣化信号振幅スペクトルから推定雑音スペクトルを減算する。MMSE STSA法の場合は、変換部201から供給された劣化信号振幅スペクトルと生成した推定雑音スペクトルとを用いて、抑圧係数を計算し、この抑圧係数を劣化信号振幅スペクトルに乗算する。この抑圧係数は、強調信号の平均二乗パワーを最小化するように決定される。
 また、雑音抑圧部205は、急変判定部209から急変判定結果(信号の急変が存在するか否かの情報)を入力し、信号の急変の有無またはその程度に応じて、雑音抑圧の程度を変更する。例えば、信号急変のあった周波数成分、周波数帯域、あるいはフレーム単位で、その急変を抑圧すべく信号処理を施すことができる。
 急変判定部209で急変と判定されたときには、劣化信号振幅スペクトルと推定雑音スペクトルのうち小さい方を、強調信号振幅スペクトルとして、振幅制御部203へ供給する。すなわち、劣化信号振幅スペクトルが推定雑音スペクトルより小さいときには劣化信号振幅スペクトルをそのまま出力し、それ以外のときには入力信号を推定雑音スペクトルで置き換えて出力することもできる。
 さらに、この置き換えに先立って、重要な劣化信号振幅スペクトル成分を検出して、検出された重要な劣化信号振幅スペクトル成分を推定雑音スペクトルによる置き換えの対象から除外することもできる。重要な劣化信号振幅スペクトル成分を検出する際の重要度の指標としては、劣化信号振幅スペクトルの大きさを用いることができる。振幅が大きな成分は目的とする信号の成分である確率が高く、これを保持することは目的とする信号の音質劣化を防止することにつながる。
 また、重要度の指標として、劣化信号振幅スペクトルのピーク性を用いることもできる。ピーク、すなわち周波数軸に沿って周辺よりも大きな値を有する劣化信号振幅は、目的とする信号の成分である確率が高く、これを保持することは目的とする信号の音質劣化を防止することにつながる。特に、顕著なピーク、すなわち周辺の振幅値よりも著しく大きな振幅値はその重要度が高いので、確実に保護することで目的とする信号の音質をさらに高めることができる。
 ピークの検出は、例えば、非特許文献3の純音成分検出方法や、非特許文献4に、その方法が開示されている。さらに、検出されたピークを所定の条件に従って評価し、条件を満たさないピークは除外してもよい。例えば、前記推定雑音よりも小さな値をとるピークは、目的とする信号である可能性は低い。すなわち、推定雑音を基準として、それよりも十分に大きいものだけをピークとして残し、それ以外を除外することができる。十分に大きいかどうかは推定雑音の定数倍と比較することで、判定できる。このように、検出されたピークが所定の条件を満たすかどうかを評価してから最終的なピーク成分を選択することによって、誤ったピークの検出を低減し、信号急変部の抑圧効果を高くすることができる。
 また、急変存在の確からしさに応じて、振幅制御部203へ供給する信号を変化させることもできる。前記置き換えを行った結果と劣化信号振幅スペクトルを、急変存在の確からしさに対応して混合したものを、強調信号振幅スペクトルとして出力する。急変存在の確からしさが高いほど、前記置き換えを行った結果に大きな重みをつけて、前記混合処理を実行する。
 雑音抑圧部205は、信号の急変の存在可能性に応じて、抑圧度0、抑圧度1、抑圧度2というように多段で抑圧を行なってもよい。あるいは急変判定部の判定結果(例えば0~1の数値)に応じて無段階に抑圧の程度を変えてもよい。
 《位相制御部および振幅制御部の構成》
 図5は位相制御部202および振幅制御部203の構成を示すブロック図である。図5に示すように、位相制御部202は位相回転部501と回転量生成部502とを含み、振幅制御部203は、補正量算出部503と振幅補正部504とを含む。
 回転量生成部502は、急変判定部209から「信号の急変が存在する」と判定された周波数成分について、劣化信号位相スペクトルの回転量を生成し、位相回転部501と補正量算出部503に供給する。位相回転部501では、回転量生成部502から回転量が供給されると、変換部201から供給された劣化信号位相スペクトル220を、供給された回転量だけ回転(シフト)させ、強調信号位相スペクトル240として逆変換部204へ供給する。
 補正量算出部503では、回転量生成部502から供給される回転量に基づいて、振幅の補正係数を決定し、振幅補正部504に供給する。
 回転量生成部502は、例えば乱数によって回転量を生成する。乱数により、劣化信号位相スペクトルを各周波数で回転させると、劣化信号位相スペクトル220の形状が変化する。この形状の変化により、衝撃音などの信号急変部の特徴を弱めることができる。
 乱数には、その発生確率が一様な一様乱数や、発生確率が正規分布を示す正規乱数などがあるが、まず、一様乱数による回転量の生成法を説明する。一様乱数は線形合同法などで発生させることができる。例えば、線形合同法で発生させた一様乱数は、0~(2^M)-1の範囲に一様に分布する。ここで、Mは任意の整数であり、^はべき乗を表している。位相の回転量φは、0~2πの範囲に分布させる必要がある。そこで、発生させた一様乱数を変換する。変換は、以下の式(8)で行う。ここで、Rは一様乱数であり、Rmaxはその一様乱数が発生しうる最大の値である。前述した線形合同法で発生させる場合には、Rmax=(2^M)-1となる。
Figure JPOXMLDOC01-appb-M000008
 計算の簡単化のために、Rの値をそのまま回転量とすることもできる。回転量であるので2πはちょうど一回転を表す。位相を2π回転させた場合は回転させていない場合と同一である。よって、2π+αという回転量は、回転量がαの場合と同じになる。ここでは、線形合同法により一様乱数を発生させた場合を説明したが、それ以外の方法で一様乱数を発生させた場合でも、式(8)により回転量φを求めればよい。急変判定部209の判定結果に応じて、いつどのくらい乱数化を行なうのかを決定してもよい。
 位相回転部501は、回転量生成部502から回転量を受け取り、劣化信号位相スペクトルを回転させる。もし、劣化信号位相スペクトルが角度で表現されている場合には、その角度に回転量φの値を加算することで回転させることができる。劣化信号位相スペクトルが複素数の正規ベクトルで表現されている場合には、回転量φの正規ベクトルを求め、劣化信号位相スペクトルに乗算することで回転させることができる。
 回転量φの正規ベクトルは、式(9)で求められる。ここで、Φは回転ベクトルであり、jはsqrt(-1)を示す。なお、sqrtは二乗根を表している。
Figure JPOXMLDOC01-appb-M000009
 補正量算出部503による、補正係数算出方法について説明する。まず、位相の回転により出力レベルの低下が生じることを、図6および図7を用いて説明する。図6および図7は、劣化信号が図2に示すブロック図で処理された場合の信号を示している。図6と図7の違いは位相回転の有無である。図6は位相回転を行わない場合の信号を、図7は位相回転をフレーム3から行った場合の信号を示している。
 まず、位相を回転しない場合の信号について図6を用いて説明する。図6の最上部に描かれているのは、劣化信号である。劣化信号はフレーム分割部301においてフレーム分割される。点線で区切られた、上から2番目の信号が、フレーム分割後の信号である。ここでは、連続した4フレーム分の信号を図示した。また、フレームのオーバラップ率は50%としている。
 フレームに分割された信号は窓掛け処理部302によって窓掛けが行われる。点線で区切られた、上から3番目の信号が窓掛け処理後の信号である。図6では位相回転による影響を明確に示すため、矩形窓による重み付けをしている。
 次に、フーリエ変換部303によって、周波数領域の信号に変換されるが、図6では周波数領域での信号は省略した。位相回転の点線より下部は、逆変換部204の逆フーリエ変換部401により、時間領域へ変換された信号を図示している。点線で区切られた、上から4番目の信号が位相回転後の信号である。ただし、図6では位相回転を行っていないため、窓掛け処理後の信号から変化していない。
 逆変換部204の逆フーリエ変換部401から出力された強調信号に対して、窓掛け処理を再度実施する。図6では、矩形窓による重み付けを実施した場合を示している。窓掛け処理された信号は、フレーム合成部403において合成される。この時、フレーム間の時間を揃える必要がある。フレームのオーバラップ率が50%であるので、ちょうど半分ずつフレームが重なる。位相の回転を実施していない場合、図6のように入力信号と出力信号は一致する。
 一方、位相を回転する場合の信号について図7を用いて説明する。図7に示したのは位相回転をフレーム3から実施した場合の信号である。最上部に描かれているのは、図6と同じ劣化信号である。フレーム分割後および窓掛け処理後の信号も図6と同様である。
 図7では、フレーム3から一定の位相回転を実施した場合を描いている。位相回転処理の点線下部に示した右向き三角形の区間に注目する。位相回転処理により、フレーム3および4の信号が時間方向にシフトしている。位相回転を施した信号を再度窓掛け処理し、フレーム合成する。このとき、フレーム2とフレーム3が重なるiiの区間で、フレーム2とフレーム3の信号に違いが生じる。これにより、フレーム合成後の出力信号レベルがiiの区間において小さくなる。つまり、位相の回転を実施する場合、図7のiiの区間で出力信号レベルが低下する。
 この位相回転による出力信号レベルの低下は、時間領域における加算を周波数領域の加算に置き換え、周波数領域のベクトル合成でも説明できる。
 図8に、フレーム分割および窓掛け処理後の連続した2フレームの劣化信号を、x1[n]およびx2[m]として示す。なお、オーバラップ率は50%としている。ここで、nはx1の離散時間を、mはx2の離散時間を表しており、オーバラップ率が50%の場合には、以下の式(10)が成立する。
Figure JPOXMLDOC01-appb-M000010
 また、x1とx2の関係は、以下の式(11)のようになる。
Figure JPOXMLDOC01-appb-M000011
 まず、時間領域信号から周波数領域信号への変換および逆変換の式を示す。周波数領域信号X[k]は、時間領域信号x[n]のフーリエ変換によって、以下の式(12)のように表現される。ここで、kは離散周波数を表し、Lはフレーム長である。
Figure JPOXMLDOC01-appb-M000012
 また、周波数領域信号X[k]を逆変換により、時間領域信号x[n]に戻すと、以下の式(13)のように表現される。
Figure JPOXMLDOC01-appb-M000013

 これに基づいて、時間領域信号x1[n],x2[m]を、周波数領域信号X1[k],X2[k] に変換すると、以下の式(14)、式(15)のように表現される。
Figure JPOXMLDOC01-appb-M000014

Figure JPOXMLDOC01-appb-M000015
 周波数領域信号X1[k],X2[k]を、逆変換によってそれぞれ時間領域信号x1[n],x2[m]に戻すと、式(13)より、以下の式(16)、式(17)のように表現される。
Figure JPOXMLDOC01-appb-M000016

Figure JPOXMLDOC01-appb-M000017

 逆変換部は、フーリエ変換により周波数領域信号を時間領域信号に変換する。その後、フレーム合成部により、前フレームと現フレームの強調信号をオーバラップ加算する。例えば、図示した例のオーバラップ率50%では、離散時間m=L/2~L-1の区間で隣接フレームの加算が行われる。この加算区間m=L/2~L-1を考える。
 時間領域の加算に、式(16)および式(17)を代入すると、以下の式(18)のように表現される。
Figure JPOXMLDOC01-appb-M000018

 さらに、式(18)中の周波数領域信号X1[k],X2[k]に式(14),式(15)を代入すると、以下の式(19)のように表現される。
Figure JPOXMLDOC01-appb-M000019

 さらに、式(19)を展開すると、以下の式(20)のように表現される。
Figure JPOXMLDOC01-appb-M000020

 ここで、式(20)の各項に含まれる総和演算を考える。任意の整数gを導入し、以下の式(21)が成立する。
Figure JPOXMLDOC01-appb-M000021
 デルタ関数δ[g]のフーリエ逆変換式は、式(22)で示される。
Figure JPOXMLDOC01-appb-M000022
ここで、デルタ関数δ[g]は、以下の式(23)で示される。
Figure JPOXMLDOC01-appb-M000023

 式(22)より、式(21)は、以下の式(24)に変形できる。
Figure JPOXMLDOC01-appb-M000024

 式(24)の関係から、式(20)は、以下の式(25)で表わされる。
Figure JPOXMLDOC01-appb-M000025

 よって、式(20)は、以下の式(26)となる。
Figure JPOXMLDOC01-appb-M000026
 さて、ここで周波数領域信号X2[k]に対し、位相回転を行った場合を考える。このときの時間領域信号は、図9のようになる。
 X2[k]の位相スペクトルを、φ[k]回転させたとき、その逆変換は以下の式(27)となる。
Figure JPOXMLDOC01-appb-I000027

 これを、式(18)に代入すると、以下の式(28)が成立する。
Figure JPOXMLDOC01-appb-M000028
これを展開すると、以下の式(29)が成立する。
Figure JPOXMLDOC01-appb-M000029
 ここで、オーバラップ率50%と仮定し、オーバラップ区間のn=L/2~L-1について考える。オーバラップ区間では、式(11)より、以下の式(30)のように展開できる。
Figure JPOXMLDOC01-appb-M000030

 ここで、それぞれの項にある括弧内の
Figure JPOXMLDOC01-appb-M000031
の項は、ベクトル合成であるから、特定の周波数kに注目すると、図10のように描ける。もし、位相回転が行われていないとき、つまりφ[k]=0の場合は、図11のようになる。
 式(31)の絶対値を求めると、以下の式(32)となる。
Figure JPOXMLDOC01-appb-M000032

 よって、式(31)の絶対値が最大になる条件は、φ[k]=0の場合であり、その値は2である。つまり、位相回転が行われると、出力信号の大きさが小さくなることがわかる。この出力信号レベルの低下量を補正するように、補正量算出部503において強調信号振幅スペクトルの振幅補正量を決定する。
 ここでは、位相回転量が一様乱数によって決定されると仮定し、補正量の算出方法を具体的に説明する。ここでは、問題簡単化のため、位相の回転による大きさの変動に着目し、それぞれの周波数成分が単位ベクトルに正規化されているものとする。
 まず、位相回転を行わない場合を考える。連続するフレーム間で位相が同じ場合の合成ベクトルは、図11に示されるSのようになり、そのベクトルの大きさ|S|は、以下の式(33)で表わされる。
Figure JPOXMLDOC01-appb-M000033
 一方、一様乱数により位相回転を行う場合、連続するフレーム間位相差φは、-πから+πまでの範囲に一様に分布する。この連続するフレーム間で位相が異なる場合の合成ベクトルは、図10に示されるベクトルS′のようになる。そのベクトルの大きさ|S′|は、以下の式(34)で表わされる。
Figure JPOXMLDOC01-appb-M000034
 さて、ここで、期待値E(|S′|^2)を求めると、以下の式(35)のようになる。
Figure JPOXMLDOC01-appb-M000035

 ここで、φが-πから+πまで一様分布することから、以下の式(36)のようになる。
Figure JPOXMLDOC01-appb-M000036
 このため、|S'|^2の期待値は、以下の式(37)で表わされる。
Figure JPOXMLDOC01-appb-M000037
 さて、位相の回転をしない場合の、期待値E(|S|^2)は、式(33)より以下の式(38)で表わされる。
Figure JPOXMLDOC01-appb-M000038

 式(37)と式(38)の比を取ると、以下の式(39)が成立する。
Figure JPOXMLDOC01-appb-M000039
 つまり、位相を一様乱数で回転させる場合、出力信号のパワー平均値は入力と比較して、1/2だけ小さくなる。振幅補正部504では振幅値に対し補正を行うので、補正量算出部503は補正係数をsqrt(2)とし、振幅補正部504に伝達する。
 以上、一様乱数による回転量生成の場合を例に挙げて説明したが、正規乱数などでもその分散と平均値が決まれば、補正係数を一意に定めることができる。正規乱数を使う場合の補正係数の導出を以下に説明する。
 正規乱数の場合φの発生確率が正規分布により決定される。そのため、正規乱数による位相回転を実施した場合のパワー期待値を求めるには、φの発生確率に基づいて、重み付けを行う必要がある。
 具体的には、φの発生確率に基づいた、重み関数f(φ)を導入する。その重み関数f(φ)により、cos(φ)を重みづけする。さらに、重み付け関数f(φ)の積分値で正規化することにより、パワー期待値を求めることができる。
 正規乱数による位相回転を行った場合の出力パワー期待値E(S"^2)は、一様乱数の出力パワー期待値である式(35)に、重み付け関数f(φ)およびその積分値を導入し、以下の式(40)のように表現できる。
Figure JPOXMLDOC01-appb-M000040

 重み関数f(φ)は、正規分布により表現できるので、以下の式(41)が成立する。
Figure JPOXMLDOC01-appb-M000041

 ここで、σは分散をμは平均を表している。
 例えば、平均値μ=0,分散σ=1の標準正規分布では、以下の式(42)となるので、となるので、これを式(40)に代入すると、式(43)のようになる。
Figure JPOXMLDOC01-appb-M000042

Figure JPOXMLDOC01-appb-M000043

 ここで、式(43)の右辺、第2項を数値計算すると、式(44)が成立するので、位相の回転をしない場合の、E(|S^2|)との比は、式(45)で表わされる。
Figure JPOXMLDOC01-appb-M000045
 補正量算出部503は、位相を標準正規分布の正規乱数で回転させる場合、振幅補正部504に補正係数をsqrt(1/0.805)として、伝達する。位相回転はフレーム内の全ての周波数に対して行ってもよいが、信号の急変を検出した一部の周波数に対して行っても構わない。振幅補正は位相回転を行った周波数、つまり信号急変を検出した周波数に対して行う。よって、位相回転を行わない周波数の補正係数は、1.0とする。位相回転を行った周波数の補正係数のみ、上記で導出した値とする。
 このように振幅制御部203では、位相制御部202から伝達された位相の回転量を用いて振幅補正係数を算出し、雑音抑圧部205から供給された強調信号振幅スペクトルに乗じ、逆変換部204に供給する。これにより、劣化信号位相スペクトルを回転させ、強調信号位相スペクトルを得た場合の出力レベル低下を解消することができる。
 なお、算出した振幅補正量が無視できる(補正係数が1.0に近い)とき、補正量算出と振幅補正の演算量を削減したいときなど、必要と認めるときには、振幅補正自体を省略することも可能である。そのときには、位相回転部501における位相回転だけを実施する。
 また、これまでは乱数を用いて位相を回転する例について説明したが、厳密な意味での乱数を用いない構成でも同様な効果を得ることができる。入力された劣化信号の位相特性に存在する特有のパターンをなくする、あるいは弱くすることが位相回転の目的であるので、その目的を達成することができる数列は何でも位相回転に利用することができる。例えば、フレーム長の半分(振幅およびパワースペクトルが独立な周波数成分の数)より周期が長く、一周期内で相関の小さい数列の利用は有効である。
 《計算部および急変判定部の構成》
 図12は、計算部208および急変判定部209の内部構成について説明するための図である。図12に示すように、計算部208は、周波数方向に位相の変化量を算出する変化量算出部1201と、位相の変化量の平坦度を算出する平坦度算出部1202と、周波数方向に振幅の平坦度を算出する振幅平坦度算出部1203を含んでいる。
 変化量算出部1201は、位相成分信号220(p(k) 、kは周波数)を入力して、隣接する周波数の位相差Δp(k)=p(k)-p(k-1)を位相の変化量1210(位相の傾き)として求める。
 平坦度算出部1202は、変化量算出部1201で得られた位相変化量Δp(k)=p(k)-p(k-1)の、周波数軸に沿った平坦度(バラツキ)を調べる。隣接する周波数の位相変化量の差分Δ2p(k)=Δp(k)-Δp(k-1)を平坦度1220とする。位相変化量が平坦であれば差分は0になる。周波数成分ごと、帯域ごと、全周波数のいずれかに対して、一つの平坦度1220を求めてもよい。また、単一あるいは複数の帯域における平坦度を統合して、全周波数における平坦度の代わりに用いてもよい。
 位相の周波数方向の変化量が、信号の急変が存在するときに平坦になる理由は次の通りである。変換部201のフレーム内に孤立パルスが存在すると仮定する。孤立パルスをフーリエ変換したときの周波数方向の位相の傾きは、孤立パルスの位置に対応して一意に求まることが知られている。例えば、変換部におけるフレーム長がLサンプルで孤立パルス位置がn0(0≦n0≦L―1)であるとき、位相の傾きは-2πn0/Lとなる。これは、振幅aの孤立パルスに関して、フーリエ変換によって得られるk番目の周波数成分D(k)が、次式で与えられるためである。D(k)=a・exp(-jθ(k))θ(k)=-2π・k・n0/L
 位相θ(k)は、明らかにk、すなわち周波数に比例している。このため、位相の微分に相当する周波数方向変化量Δθ(k)=-2π・n0/Lとなり、これは定数である。すなわち、周波数方向の位相の変化量は、一定値(平坦)となる。
 ここで、周波数ごとではなく周波数帯域(サブバンド)またはフレームごとに判定すると、より大局的な判定によって、信号急変成分以外の位相成分による判定誤りを低減することができる。さらに、周波数帯域ごとまたはフレームごとの判定結果を用いて、周波数ごとの判定結果を修正してもよい。例えば、ある周波数帯域の判定結果が「信号急変が存在する」であるときに、その周波数帯域内の全周波数の判定結果を強制的に「信号急変が存在する」に設定することで、他の信号成分の妨害による判定誤りを低減することができる。その反対に、ある周波数帯域の判定結果が「信号急変が存在しない」であるときに、その周波数帯域内の全周波数の判定結果を強制的に「信号急変が存在しない」に設定することで、他の信号成分の妨害による判定誤りを低減することもできる。あるいは、前記帯域内の各周波数で、判定の容易さ(閾値)を「存在」と判定しやすい方向へ修正して、各周波数独自に判定を行うという構成自体は維持してもよい。周波数ごとまたは周波数帯域ごとに判定結果を求めると、周波数ごとまたは周波数帯域ごとに急変を抑圧することができ、より精度のより精度の高い抑圧を行なうことが可能となる。
 さらに、位相の微分値を位相変化量としてさらにその微分値を平坦度1220としてもよい。その場合、位相の二次微分値が0に近ければ(所定値以下であれば)平坦と判定できる。帯域ごとあるいは周波数成分ごとに判定すると、よりきめ細かな信号急変の判定処理を行なうことができる。つまり、信号急変を帯域ごとあるいは周波数成分ごとに独立して抑圧することもでき、より精度の高い信号急変の抑圧を行なうことが可能となる。
 ここでは変化量算出部1201は、隣接周波数間の位相の差分を用いて変化量を算出したが、本発明はこれに限定されるものではない。位相の周波数による微分で直線性(位相変化の平坦度)を判定してもよい。複数の周波数における複数の微分結果のバラツキが小さいほど直線性が高い。局所的な直線性は、局所的な微分結果を用いて評価することができる。特に、隣接する2周波数成分間の微分は差分で近似できるので、その場合は複数の差分のバラツキが小さいほど直線性が高いと判断する。バラツキの指標として、平坦度を用いることができる。
 振幅平坦度算出部1203は、周波数軸に沿った振幅変化1225を算出して、急変判定部209に供給する。隣接する周波数間で振幅の変化が小さい周波数が信号急変を表す。振幅変化は、帯域ごと、あるいは全周波数のいずれかに対して、一つの平坦度1225を求めてもよい。具体的には、以下の式(46)のように、平坦度を表わすFM(Flatness Measure)を求める。x(n)は周波数nにおける振幅またはパワースペクトル、Nは平坦度算出区間に含まれる周波数成分の数である。
Figure JPOXMLDOC01-appb-M000046

 FMは0.0から1.0の値をとる。完全に平坦な場合、FMは1.0である。平坦度については、非特許文献3に開示がある。
 平坦度はまた、別の指標を用いて表すこともできる。例えば、帯域ごと、あるいは全周波数のいずれかに対してx(n)の平均を求め、各周波数成分nにおけるx(n)とその平均値との差分二乗値総和を帯域ごと、あるいは全周波数の平坦度とすることができる。全周波数の代わりに、単一あるいは複数の周波数帯域において前記差分二乗値総和を一つ求め、これを平坦度とすることもできる。このようにして求めた平坦度は、完全に平坦な場合に0.0、平坦度が低下するに従って大きな値をとる。
 別の平坦度の指標として、滑らかさを用いてもよい。滑らかさは、周波数軸に沿った隣接サンプル間の差分絶対値総和で表現することができる。凹凸の多い(滑らかでない)波形で滑らかさは大きな値を、少ない(滑らかな)波形で小さな値をとる。この指標は、全変動量(TV: Total Variation)として知られている。
 これまで、平坦度として周波数軸に沿った平坦度を用いてきたが、時間軸に沿った平坦度を利用することもできる。信号急変部では急激に振幅およびパワーが増加するので、この性質を用いると、時間軸に沿った平坦度が低いときに、信号急変が存在すると判定することができる。具体的には、現フレームと直前フレームの振幅またはパワーの差が一定値以上となるときに、平坦度が低い、すなわち信号急変が存在すると判定する。また、数フレーム過去のフレームから現在のフレームまでの複数フレームに対して隣接フレーム間の振幅またはパワーの差を求め、これらを線形または非線形結合した結果を平坦度として定義することもできる。過去のフレームの情報を用いることで、低域成分を含むなまった信号急変部を検出しやすくなり、その抑圧性能が向上する。なお、隣接フレームの振幅またはパワー差を計算する際には、これを周波数成分ごと、帯域ごと、あるいは全周波数のいずれかに対して計算してもよい。さらに、単一または複数の帯域に対して前記振幅またはパワー差を計算することもできる。例えば、単一の帯域、特に高周波域で前記振幅またはパワー差を計算することによって、音声やその他の信号の影響を低減することができ、より正確に信号急変部を検出することが可能となる。
 これまで説明した2つの平坦度、すなわち周波数軸に沿った平坦度と時間軸に沿った平坦度は、それぞれを単独で用いることもできるし、両方を組み合わせて用いることもできる。組合せの例としては、2つの平坦度の線形または非線形結合に基づく信号急変部の検出や、それぞれの平坦度に基づいた検出結果の組合せなどがある。周波数方向の平坦度は大きいときに、時間方向の平坦度は小さいときに信号急変の検出と判定するので、組合せの際にどちらかを逆数にしてから組み合わせるなどの工夫が必要となる。
 急変判定部209は、位相変化量の平坦度と振幅平坦度の2つの指標を用いて、信号の急変を判定する。振幅が周波数軸に沿って平坦である(バラツキが小さい)とき、信号急変部である可能性が高いと考えられるからである。これは、信号急変がパルス性(短時間に振幅が増加して、減少する)であることと、インパルスのフーリエ変換が白色信号(全周波数で振幅およびパワーが等しい)となることから自明である。判定の方法としては例えば以下のいずれかを選択することができる。
 (1)位相変化量の平坦度と振幅平坦度が共にそれぞれの条件を満たす場合(例えば位相の二次微分値がN=0.1以下で、振幅平坦度FMがМ=0.8以上の場合)、信号の急変があると判定
 (2)平行度と振幅平坦度を単独で用いたときの判定結果の論理和。信号急変の存在可能性を算出するときは、平行度による存在可能性と振幅平坦度による存在可能性のうち、大きい方(または小さい方)に基づく判定
 (3)位相変化量の平坦度と振幅平坦度の両方の平均が条件を満たす場合(例えば位相の二次微分値PXと、振幅平坦度FMと1.0との差分値QX=(1.0-FM)との平均AV1=(PX+QX)/2が0.1以下)に、信号の急変があると判定
 (4)位相変化量の平坦度と振幅平坦度とに対して重み付けを行ないつつ両方を合わせた複合的な条件を満たす場合(例えば位相の二次微分値PXと、振幅平坦度FMと1.0との差分値QX=(1.0-FM)との重み付け平均AV2=(0.8×PX+0.2×QX)が0.1以下)に、信号の急変があると判定
 (5)位相変化量の平坦度と振幅平坦度とを、線形または非線形関数を用いて組み合わせ、組み合わせた結果が一定値より大きいときに信号の急変があると判定。時間方向の振幅平坦度が含まれるときには、その逆数を代わりに用いる。
 (6)位相変化量の平坦度と振幅平坦度との中でいずれか大きい方(理想値に近い方)のみを用いて、その大きい方が条件を満たす場合(例えば位相の二次微分値PXと、振幅平坦度FMと1.0との差分値QXと、いずれか大きい方を閾値とを比較する)信号の急変があると判定。時間方向の振幅平坦度が含まれるときには、その逆数を代わりに用いる。
 (7)事前に検出しようとする急変信号の振幅またはパワースペクトルに関する情報が得られて、振幅またはパワースペクトルが平坦であれば、位相平坦度の重みを小さくする。
 (8)事前に検出しようとする急変信号の振幅またはパワースペクトルに関する情報が得られて、振幅またはパワースペクトルの最小値よりも入力された劣化信号の振幅またはパワースペクトルが小さいときは、信号急変を検出するための閾値を一時的に大きく変更して、検出されにくくする。
 特定の信号を処理する場合、例えばノイズが小さくてインパルスに近い衝撃音を検出・抑圧する場合、振幅またはパワーに関する情報の方が位相情報よりも信頼できるときがある。例えば、静かな環境でピストルの発砲音を検出する際には、振幅のみを用いて検出してもよい。一方、ノイズの振幅またはパワーが大きく変化する場合、例えば、空港の警備での発砲音の検出の場合、静かな(ノイズが小さい)状況と、ノイズが大きい状況とで、振幅と位相の重み付けを変えることが効果的である。この場合、振幅と位相の重み付けを、ノイズの有無や時間帯に応じて変化させてもよい。例えば、管制塔からフライトスケジュールの最新情報を入手することができれば、飛行機の離着陸時刻が分かるため、飛行機が来るタイミング(ノイズが多いタイミング)では位相の重み付けを大きくして発砲音の検出に用いることができる。発砲音(検出対象の衝撃音)以外の信号が混在するときには、位相情報を用いた衝撃音の検出が振幅を用いた検出よりも効果的だからである。一方、ノイズが小さい状況では、入力された劣化信号の周波数領域ベクトルの絶対値、つまり振幅値を重視して判定する方が効果的に衝撃音を検出できる。もちろんここでも振幅スペクトルの代わりにパワースペクトルの値を用いてもよい。また、信号の種類によって、衝撃音の振幅が平坦でない場合がある。その場合は、位相平坦度の重みを大きくして検出を行なうことにより高精度で信号の急変を検出できる。さらに、衝撃音の振幅またはパワースペクトルに関する情報が事前に得られるときには、得られた情報を用いて振幅が平坦なときと同じ結果が得られるように、振幅平坦度の計算結果を補正することもできる。具体的には、振幅スペクトル230を衝撃音の振幅またはパワースペクトル形状の逆数を各周波数成分で乗じた後に、振幅平坦度を算出する。
 急変判定部209は判定結果1230として、信号急変あり(1)または信号急変無し(0)を出力する。ただし、平坦度の絶対値と対応させた、0と1の間の値を判定結果1230として出力してもよい。その場合、信号急変が存在する尤もらしさ(存在可能性)を得ることが可能となる。存在可能性は、例えば、次のようにして求めることができる。まず、正の値を閾値として定める。閾値が正の値になるのは、前記位相平坦度と振幅平坦度の双方とも、より大きな正の値が信号急変の存在可能性の高さを表すからである。また、両者の最小値は0である。次に、両指標を組み合わせて得られた値(組み合わせ指標)が閾値を超えるとき、信号急変の存在可能性を1とする。また、組み合わせ指標が0になるとき、存在可能性を0とする。存在可能性の一般値は、組み合わせ指標の関数として定義する。このような関数の最も簡単なものは、直線である。存在可能性として、組み合わせ指標に比例した値が定められる。直線の傾きとy切片(前記組み合わせ指標が0のときの関数値)は、前述の組み合わせ指標が0および1に等しいときの境界条件を満足するように定める。関数としては、任意の線形または非線形関数や多項式などを用いてもよい。
 図13は、位相およびその変化量をグラフに示したものである。周波数領域において、周波数軸に沿って、グラフ1301のように位相が変化する場合、その位相変化量は、周波数領域において、周波数軸に沿って、グラフ1302に示すように変化する。この変化が平坦な周波数1303を導き出すことにより、位相の直線性を判別する。
 信号の急変部では位相が直線的に変化することが分かっているため、このように位相の直線性を求めてその平坦度を判定することにより、信号の急変の存在またはその程度を判定することが可能となる。そして、衝撃音など信号の急変が存在する周波数成分、周波数帯域または全周波数において、位相スペクトルを回転操作することや振幅スペクトルを抑圧することにより、その急変を抑圧したり、その影響を弱くしたりすることができるため、高品質な強調信号を得ることができる。
 図14は、本実施形態にかかる雑音抑圧装置200をソフトウェアを用いて実現する場合のハードウェア構成について説明する図である。
 雑音抑圧装置200は、プロセッサ1410、ROM(Read Only Memory)1420、RAM(Random Access Memory)1440、ストレージ1450、入出力インタフェース1460、操作部1461、入力部1462、および出力部1463を備えている。雑音抑圧装置200は、カメラ1464を備えていてもよい。プロセッサ1410は中央処理部であって、様々なプログラムを実行することにより雑音抑圧装置200全体を制御する。
 ROM1420は、プロセッサ1410が最初に実行すべきブートプログラムの他、各種パラメータ等を記憶している。RAM1440は、不図示のプログラムロード領域の他に、入力信号210、位相成分信号220、振幅成分信号230、強調信号260、位相変化量1210、位相変化平坦度1220、振幅平坦度1225および急変判定結果1230等を記憶する領域を有している。
 また、ストレージ1450は、雑音抑圧プログラム1451を格納している。雑音抑圧プログラム1451は、変換モジュール、位相制御モジュール、振幅制御モジュール、逆変換モジュール、雑音抑圧モジュール、位相直線性計算モジュール、振幅平坦度判定モジュール、および急変判定モジュールを含んでいる。雑音抑圧プログラム1451に含まれる各モジュールをプロセッサ1410が実行することにより、図2の変換部201、位相制御部202、振幅制御部203、逆変換部204、雑音抑圧部205、計算部208、急変判定部209の各機能を実現できる。なお、ストレージ1450はノイズデータベースを格納してもよい。
 プロセッサ1410が実行した雑音抑圧プログラム1451の出力である強調信号は、入出力インタフェース1460を介して出力部1463から出力される。これにより、例えば、入力部1462から入力した操作部1461の操作音などを抑圧することができる。また、入力部1462から入力した入力信号に信号急変が含まれたことを検出してカメラ1464による撮影を開始するなどといった適用法も可能である。
 図15は、上記雑音抑圧プログラム1451による信号急変判定処理の流れを説明するためのフローチャートである。まず、ステップS1501において、入力部1462から信号を入力すると、ステップS1503に進む。ステップS1503では、変換部210が入力信号を周波数領域に変換して、振幅・位相に分割する。次に、ステップS1505では、計算部208が離散周波数kを1に、カウント値I(k)を0に設定して、順次周波数空間での処理を開始する。ステップS1507に進むと、計算部208が、設定された周波数での位相の変化(微分値または差分値)を算出する。さらにステップS1509では、計算部208が位相変化の変化(微分値または差分値)を算出する。さらにステップS1510では、計算部208が上述した式(46)を用いて、振幅A(k)の平坦度FM(k)を算出する。次にステップS1511では、急変判定部209が位相変化の平坦度の絶対値および振幅の平坦度をそれぞれ閾値N、Мと比較する。具体的には位相変化の変化の絶対値が所定の閾値Nを越えず、かつ、振幅の平坦度FMが閾値М以上の場合、ステップS1513に進んで、その周波数kにおいて信号の急変が存在すると判定し、フラグを立てる(I(k)=1とする)。一方、位相変化と振幅の変化が条件に合致しなかった場合、ステップS1514においてI(k)=0とする。以上のステップS1507~S1514を、k=F(Fはフレーム全体の周波数成分数)になるまで繰り返す。最終的には、ステップS1517において、I(k)=1となったkの周波数で信号急変ありと判定し、判定結果を、雑音抑圧部205および位相制御部202に供給する。以上のステップS1501~S1514の処理は全フレームに対して繰り返し行なわれる。なお、ステップS1517に変えて、フレーム内でI(k)を積算し、I(k)の積算値が所定の閾値を超えた場合に、急変判定部209は信号急変を含むフレームと判定してもよい。また、この際、急変判定結果を次の周波数帯域に積算してもよい。
 また、ハングオーバーの作用として、続くフレームにおける閾値Nを大きく、またМを小さく設定することができる。このように続くフレームの閾値を設定することによって、信号急変(衝撃音)の検出を容易にし、検出漏れを低減することができる。続くフレームにおける閾値NとМの設定は、いずれか一方に対して、または双方を同時に行うことができる。
 以上の処理により、信号急変(衝撃音)をより正確に検出することができ、適宜、その信号急変(衝撃音)を適切に抑圧することが可能となる。
 [第3実施形態]
 次に本発明の第3実施形態に係る雑音抑圧装置について、図16を用いて説明する。図16は、本実施形態に係る雑音抑圧装置1600の機能構成を説明するための図である。本実施形態に係る雑音抑圧装置1600は、上記第2実施形態と比べると、変換部1601が複素信号1650を生成し、計算部1608および急変判定部1609がその複素信号1650に基づいて位相直線性の計算および信号急変の判定を行なう点で異なる。その他の構成および動作は、第2実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
 図17は、計算部1608および急変判定部209の内部構成について説明するための図である。図17に示すように、計算部1608は、周波数方向に位相の変化量を算出する変化量算出部1701と、位相の変化量の平坦度を算出する平坦度算出部1202を含んでいる。変化量算出部1701は、複素信号1650(q(k)、kは周波数)を入力して、隣接する周波数の位相差Δp(k)=p(k)-p(k-1)を、位相の変化量1210(位相の傾き)として求める。
 平坦度算出部1202は、変化量算出部1201で得られた位相変化量Δp(k)=p(k)-p(k-1)の、周波数軸に沿った平坦度(バラツキ)を調べる。隣接する周波数の位相変化量の差Δ2p(k)=Δp(k)-Δp(k-1)を平坦度1220とする。位相変化量が平坦であれば差分は0になる。周波数成分ごと、帯域ごと、全周波数のいずれかに対して、一つの平坦度1220を求めてもよい。また、単一あるいは複数の帯域における平坦度を統合して、全周波数における平坦度の代わりに用いてもよい。
 さらに、位相の微分値を位相変化量としてさらにその微分値を平坦度1220としてもよい。その場合、位相の二次微分値が0に近ければ(所定値以下であれば)平坦と判定できる。帯域ごとあるいは周波数成分ごとに判定すると、よりきめ細かな信号急変の検出処理を行なうことができる。つまり、信号急変を帯域ごとあるいは周波数成分ごとに独立して抑圧することもでき、より精度の高い抑圧を行なうことが可能となる。
 急変判定部209は、算出された平坦度の絶対値が一定以下の場合、その平坦度に対応する周波数(一つの周波数成分、周波数帯域、または、全周波数(つまり一つのフレーム))は信号急変を含むと判定する。判定結果1230として、信号急変あり(1)または信号急変無し(0)を出力する。ただし、平坦度の絶対値と対応させた、0と1の間の値を判定結果1230として出力してもよい。その場合、信号急変が存在する尤もらしさ(可能性)を得ることが可能となる。
 以上説明したとおり本実施形態によれば、位相成分信号の代わりに複素信号を用いて位相の直線性を検出することができる。
 [第4実施形態]
 次に本発明の第4実施形態に係る雑音抑圧装置について、図18を用いて説明する。本実施形態に係る雑音抑圧装置1800は、上記第3実施形態と比べると、計算部1608に代えて計算部1808を有する点で異なる。図18は、本実施形態に係る雑音抑圧装置に含まれる計算部1808の機能構成を説明するための図である。本実施形態に係る計算部1808は、上記第3実施形態と比べると、単位ベクトル生成部1881と回転ベクトル生成部1882と1883とを備えている点で異なる。また、急変判定部1809が、回転ベクトルに基づいて、信号の急変の有無またはその程度を判定する点でも異なる。その他の構成および動作は、第3実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
 単位ベクトル生成部1881は、複素信号1650を用いて、入力スペクトル(複素ベクトル)を周波数成分ごとに単位ベクトル化する。具体的には、複素信号1650の実数部と虚数部をそれぞれ振幅値で除算する。
 回転ベクトル変換部1882は、単位ベクトル1810を、隣接周波数間の回転ベクトル(第1回転ベクトル1820)に変換する。ここでの回転ベクトルの回転量(位相)は隣接周波数における単位ベクトル間の位相変化量と同義となる。基準ベクトルの共役A*と回転後のベクトルBとの内積をとる乗算を行ない、以下のように回転ベクトルRotVecを求める。RotVec = A*・B
 具体的には、基準ベクトルの実部同士の積と虚部同士の積の和が回転ベクトルの実部、基準ベクトルの実部と虚部の積二つの差が回転ベクトルの虚部とすることで、回転ベクトル1820を算出できる。
 さらに、回転ベクトル変換部1883は、回転ベクトル変換部1882によって得られた第1回転ベクトル1820の、周波数軸に沿った平坦度(バラツキ)を調べる。周波数軸に沿った位相変化量が一定であると、回転ベクトルのバラツキが小さくなる。そのため、第1回転ベクトル1820の変化量を周波数軸に沿って求める。具体的には、第1回転ベクトル1820について、隣接周波数間の回転ベクトル(第2回転ベクトル1830)を求める。これは第1回転ベクトルを微分したことと同義である。そして、急変判定部1809は、第2回転ベクトル1830の実部を平坦度として認識する。これは、次の理由による。
 第2回転ベクトル1830も単位ベクトルなので、その実部は-1から1の値をとる。位相が直線的に変化するほど、第1回転ベクトルの角度変化量が小さい(回転ベクトルのバラツキが小さい)。そして、第1回転ベクトルの変化量が小さい(回転ベクトルのバラツキが小さい)ほど、第2回転ベクトルの角度が小さくなる。第2回転ベクトルの角度が小さいほど、その実部が大きくなる。ここでも、周波数点ごと、帯域ごと、全周波数のいずれかについて、一つの平坦度を求めてもよい。
 なお、平坦度の求め方としては、上述したものに限られない。例えば、隣接する周波数成分ごとに前記第1回転ベクトルの差ベクトルを算出した上で、差ベクトルの実部、虚部をそれぞれ二乗して加算することで得られる差ベクトルの大きさを平坦度として用いてもよい。また、第2回転ベクトルの角度を平坦度として用いることもできる。第2回転ベクトルの角度は、隣接する周波数成分の第1回転ベクトルの角度差に相当する。
 急変判定部1809は、第2回転ベクトル1830の実部、および、振幅平坦度FMの2つの指標を用いて、信号の急変を判定する。振幅平坦度の判定への利用に関しては、すでに急変判定部209の動作に関して説明した通りである。第2回転ベクトル1830の実部に関しては、実部があらかじめ定められた+1に近い閾値N(例えば0.7や0.8)を越えているか否か、またはNと+1の間のどの位置に存在しているかに応じて、急変の存在またはその程度を判定する。そして、判定結果1840として、信号急変あり(1)または信号急変無し(0)を出力する。ただし、平坦度の絶対値と対応させた、0と1の間の値を判定結果1840として出力してもよい。その場合、信号急変が存在する尤もらしさ(可能性)を得ることが可能となる。例えば、平坦度を、周波数成分ごとに第1閾値と比較し、第1閾値以下と判定された周波数bin数をカウントして、そのカウント値が第2閾値以上であれば、そのフレームに急変部が存在するものとして、フレームごとに検出してもよい。
 なお、ここでも、第2実施形態で説明したのと同様に、位相変化の平坦度と振幅の平坦度とを状況に応じてバランスよく用いて、信号の急変を検出することができる。また、帯域ごとあるいは周波数成分ごとに判定すると、よりきめ細かな信号急変の検出処理を行なうことができる。つまり、信号急変を帯域ごとあるいは周波数成分ごとに独立して抑圧することもでき、より精度の高い抑圧を行なうことが可能となる。
 図19は、本実施形態にかかる雑音抑圧プログラムを実行した場合の信号急変検出処理の流れを説明するためのフローチャートである。まず、ステップS1501において、入力部1462から音声信号を入力すると、ステップS1903に進む。ステップS1903では、変換部210が入力信号を周波数領域に変換して、周波数成分ごとの複素信号を生成する。次に、ステップS1505では、離散周波数kを1に、カウント値I(k)を0に設定して、順次周波数空間での処理を開始する。ステップS1907に進むと、設定された周波数で複素信号を単位ベクトル化する。次に、ステップS1908では、隣接する周波数成分の単位ベクトルから第1回転ベクトルに変換する。さらにステップS1909では隣接する周波数成分の第1回転ベクトルから第2回転ベクトルに変換する。さらにステップS1510では、計算部1203が上述した式(46)を用いて、振幅A(k)の平坦度FM(k)を算出する。ステップS1911では、第2回転ベクトルの実部を閾値Nと比較し、振幅平坦度を閾値Мと比較する。その結果、実部が閾値Nを越え、かつ振幅平坦度が閾値Мを越えた場合、ステップS1513に進んでI(k)=1とする。一方、実部が所定の閾値N以下または振幅平坦度が閾値М以下の場合、ステップS1514においてI(k)=0とする。以上のステップS1907~S1514を、k=F(Fはフレーム全体の周波数成分数)になるまで繰り返す。最終的には、ステップS1517において、I(k)=1となったkの周波数で信号急変ありと判定し、判定結果を、雑音抑圧部205および位相制御部202に供給する。
 以上説明したとおり本実施形態によれば、複素信号を用いて位相の回転ベクトルの回転ベクトルから直線性を検出し、振幅平坦度と合わせて衝撃音を検出することができる。なお、平坦度の判定で回転ベクトルの実部を使うために単位ベクトル化したが、本発明はこれに限定されるものではない。また、第2回転ベクトルの実部に代えて第2回転ベクトルの角度の大きさを閾値と比較し、角度の大きさが閾値より大きい場合に信号急変ありと判定してもよい。
 [第5実施形態]
 なお、上記第1乃至第4実施形態では、信号急変部を抑圧することを目的とした雑音抑圧装置に信号急変検出方法を適用した場合について説明したが、本発明はこれに限定されるものではない。衝撃音の検出を目的とした様々な装置、システムおよび状況で利用することができる。さらに検出対象は衝撃音(急激に立ち上がってすぐにたち下がる音声信号)に限定されない。信号が急激に立ち上がって(またはたち下がって)そのままとなる場合であっても、急変部として検出できる。
 例えば、現在のオーディオ符号化方式(例えばMPEG AACの符号化部)において、いわゆるアタックと呼ばれる信号急変部では、通常とは異なった情報圧縮方式が採用されているが、その際の信号急変部の検出にも適用することができる。信号急変部では、分析窓長を変更して、プリエコーと呼ばれる先行雑音の抑圧を行うので、検出が必要となる。振幅やエントロピーの変化などを用いて検出する方法に比べて精度良く急変を検出し、効果的に情報圧縮を行なうことができる。
 また、図20に示すように、車両2000にマイク2001と計算部208と急変判定部209と映像記録部2002とを搭載する適用例も考えられる。映像記録部2002が衝撃音の検出をトリガーにしてカメラによる撮影画像の上書き保存禁止を行なえば、事故状況の記録を残すことができる。その際に、衝撃音検出から一定時間の遅延の後に、上書き保存禁止を行ってもよい。衝撃そのものをトリガーにした場合と異なり、衝撃が小さい場合や、他の車両が事故にあった場合にも事故状況の自動記録を行なえるという利点がある。
 また、図21に示すように、心電計2100に計算部208と急変判定部209とアラーム部2101とを接続する適用例も考える。心電図の異常心拍の検出をより正確かつ効果的に行なうことができる。特に雑音の多い場合に有効である。同様に、胎児のエコーのモニターにも適用できる。雑音による妨害で正しく心音がとれない場合があるが、そのようなときに本技術は有効である。すなわち、生体信号の急変検出に広く適用できる。
 [第6実施形態]
 本発明の第6実施形態としての信号処理装置2200について、図22を用いて説明する。信号処理装置2200は、入力信号急変を検出するための装置である。図22に示すように、信号処理装置2200は、変換部2201と第1算出部2202と第2算出部2203と信号急変判定部2204とを含む。
 変換部2201は、入力信号2210を、周波数領域における位相成分信号2220および振幅成分信号2230に変換する。第1算出部2202は、入力信号2210の時間領域における急増部の位置に基づいて、位相の傾き2250を算出する。孤立パルスをフーリエ変換したときの周波数方向の位相の傾きは、孤立パルスの位置に対応して一意に求まることが知られている。例えば、変換部におけるフレーム長がLサンプルで孤立パルス位置がn0であるとき、位相の傾きは-2πn0/Lとなる。急増部を同定するための指標としては、例えば振幅絶対値の最大値を用いることができる。この指標は、実際の信号が孤立パルスに近いとき(ほぼ単峰性形状)には正確な位置を与える。一方、双峰性の形状を有するパルスのときは、振幅最大値は正確な位置を与えない。このような場合は、振幅絶対値の最大値と振幅絶対値の2番目に大きな値を用いた指標が有効である。例えば、両者の位置の中間値や両者の位置の重みづけ平均などを用いることができる。パルスがより時間軸に沿って広がっているときには、パルスのおおよその中心部を利用することで正確な位置を求めることができる。そのような指標には重心がある。第2算出部2202は、周波数領域における位相成分信号2220の傾き2260を算出する。信号急変判定部2204は、第1算出部2202によって算出された傾きと第2算出部2203によって算出された傾きに基づいて入力信号の急変を判定する。
 以上の構成により、周波数領域における位相成分信号の傾きと時間領域信号の急増部の位置から求めた位相の傾きとの一致程度を用いて、入力信号の急変を効果的に検出することができる。
 [第7実施形態]
 《全体構成》
 本発明の第7実施形態としての雑音抑圧装置について図23乃至図30を用いて説明する。本実施形態の雑音抑圧装置は、例えばデジタルカメラ、ノートパソコン、携帯電話、キーボード、ゲーム機のコントローラ、携帯電話の押しボタンなどの雑音抑圧に適用できる。すなわち、音声、音楽、環境音などの目的とする信号を、これらに重畳された信号(ノイズまたは妨害信号)に対して強調することができる。ただし、本発明はこれに限定されるものではなく、入力信号からの信号急変検出を要求されるあらゆる信号処理装置に適用可能である。なお、本実施形態では、信号の急変の一例として、衝撃音を検出して抑圧する雑音抑圧装置について説明する。本実施形態としての雑音抑圧装置は、例えば、マイクの近くでボタン押下などの操作がなされるような形態において、かかるボタン操作により発生する衝撃音を適切に抑圧する。簡単に説明すると、衝撃音を含む時間領域信号を周波数領域信号に変換し、周波数空間における位相成分の傾きを算出する。また、時間領域信号の急増部を孤立パルスとみなしたときの周波数領域の位相の傾き、すなわち-2πn0/Nを求める。そして、それら2種類の位相の傾きの一致程度に応じて、衝撃音の存在を判定する。
 図23は、雑音抑圧装置2300の全体構成を示すブロック図である。入力端子2306には、劣化信号(所望信号と雑音の混在する信号)が、サンプル値系列として供給される。入力端子2306に供給された劣化信号は、変換部2301においてフーリエ変換などの変換を施されて複数の周波数成分に分割される。複数の周波数成分は周波数ごとに独立して処理される。ここでは、特定の周波数成分に注目して説明を続ける。周波数成分のうち振幅スペクトル(振幅成分)2330は雑音抑圧部2305へ供給され、位相スペクトル(位相成分)2320は位相制御部2302および算出部2381に供給される。さらに、変換部2301は、フレーム分割後であって高速フーリエ変換などの変換を施す前の時間領域信号2370を算出部2382に供給する。なお、ここでは変換部2301が雑音抑圧部2305に劣化信号振幅スペクトル2330を供給しているが、本発明はこれに限定されるものではなく、振幅スペクトルの二乗に相当するパワースペクトルを雑音抑圧部2305に供給してもよい。
 雑音抑圧部2305は、変換部2301から供給される劣化信号振幅スペクトル2330を用いて、雑音を推定し、推定雑音スペクトルを生成する。また、雑音抑圧部2305は、変換部2301から供給された劣化信号振幅スペクトル2330と、生成した推定雑音スペクトルとを用いて雑音を抑圧し、雑音抑圧結果としての強調信号振幅スペクトルを振幅制御部2303に伝達する。さらに雑音抑圧部2305は、急変判定部2309から判定結果を入力し、信号の急変の有無またはその程度に応じて、雑音の抑圧の程度を変更する。雑音抑圧部2305は、所望信号の検出を行って所望信号成分を周波数ごとに保護する一方、信号急変が存在し、所望信号成分が検出されないときには、振幅を推定背景音に置換してもよい。
 位相制御部2302は、変換部2301から供給された劣化信号位相スペクトル2320を回転(シフト)させ、強調信号位相スペクトル2340として逆変換部2304へ供給する。また、位相の回転量(シフト量)を、振幅制御部2303へ伝達する。振幅制御部2303は、位相制御部2302から位相の回転量(シフト量)を受け取って振幅補正量を算出し、その振幅補正量を用いて、強調信号振幅スペクトルを各周波数で補正し、補正振幅スペクトル2350を逆変換部2304へ供給する。逆変換部2304は、位相制御部2302から供給された強調信号位相スペクトル2340と、振幅制御部2303から供給された補正振幅スペクトル2350とを合成して逆変換を行い、強調信号として、出力端子2307に供給する。
 算出部2381は、変換部2301から供給された位相成分信号2320を周波数で微分することにより、各周波数での位相の傾き(変化)を算出する。一方、算出部2382は、フレームに分割された劣化信号サンプル2370を変換部2301から入力して、フレームの信号絶対値を算出し、急増部を示す時間から、周波数領域の位相の傾きを算出する。急変判定部2309は、算出部2381、2382から提供された位相の傾きを比較し、それらの類似度に基づいて、信号の急変がどの程度存在するか(存在可能性)を周波数点ごとに判定する。
 ここで、傾きの類似度は、時間領域信号から求めた傾きと周波数領域信号から求めた傾きの差分絶対値を用いることができるが、これに限定されない。これら2つの傾きの比の値と1との距離や、両者の和をどちらかの傾きの2倍で正規化した値と1との距離などを用いてもよい。類似度に基づく存在可能性は、例えば、次のようにして求めることができる。まず、正の値を閾値として定める。差分絶対値がこの閾値よりも大きいとき、存在可能性を0とする。また、差分絶対値が0に等しいとき、存在可能性を1とする。存在可能性の一般値は、差分絶対値の関数として定義する。このような関数の最も簡単なものは、直線である。存在可能性として、差分絶対値に比例した値が定められる。直線の傾きとy切片(前記差分絶対値がゼロのときの関数値)は、前述の差分絶対値が0および1に等しいときの境界条件を満足するように定める。関数としては、任意の線形または非線形関数や多項式などを用いてもよい。
 《変換部の構成》
 図24は、変換部2301の構成を示すブロック図である。図24に示すように、変換部2301はフレーム分割部2401、窓がけ処理部(windowing unit)2402、およびフーリエ変換部2403を含む。劣化信号サンプルは、フレーム分割部301に供給され、K/2サンプルごとのフレームに分割される。ここで、Kは偶数とする。フレームに分割された劣化信号サンプル2370は、窓がけ処理部2402と算出部2382に供給され、窓がけ処理部2402では窓関数(window function)であるw(t)との乗算が行なわれる。第nフレームの入力信号yn(t) (t=0, 1, ..., K/2-1) に対するw(t)で窓がけ(windowing)された信号は、次式で与えられる。
Figure JPOXMLDOC01-appb-M000047

 また、連続する2フレームの一部を重ね合わせ(オーバラップ)して窓がけしてもよい。オーバラップ長としてフレーム長の50%を仮定すれば、t=0, 1, ..., K/2-1 に対して、以下の式で得られる左辺が、窓がけ処理部2402の出力となる。
Figure JPOXMLDOC01-appb-M000048

 実数信号に対しては、左右対称窓関数が用いられる。また、窓関数は、変換部2301の出力を逆変換部2304に直接供給したときの入力信号と出力信号が計算誤差を除いて一致するように設計される。これは、w2(t)+w2 (t+K/2)=1 となることを意味する。
 以後、連続する2フレームの50%をオーバラップして窓がけする場合を例として説明を続ける。w(t)としては、例えば、次式に示すハニング窓を用いることができる。
Figure JPOXMLDOC01-appb-M000049

 このほかにも、ハミング窓、三角窓など、様々な窓関数が知られている。窓がけされた出力はフーリエ変換部2403に供給され、劣化信号スペクトルYn(k)に変換される。劣化信号スペクトルYn(k)は位相と振幅に分離され、劣化信号位相スペクトル arg Yn(k)は、位相制御部2302と算出部2381に、劣化信号振幅スペクトル|Yn(k)|は、雑音抑圧部2305と算出部2382に供給される。既に説明したように、振幅スペクトルの代わりにパワースペクトルを利用することもできる。
 《逆変換部の構成》
 図25は、逆変換部2304の構成を示すブロック図である。図25に示すように、逆変換部2304は逆フーリエ変換部2501、窓がけ処理部2502およびフレーム合成部2503を含む。逆フーリエ変換部2501は、振幅制御部2303から供給された強調信号振幅スペクトル2350と位相制御部2302から供給された強調信号位相スペクトル2340(arg Xn(k))とを乗算して、強調信号(以下の式の左辺)を求める。
Figure JPOXMLDOC01-appb-M000050

 得られた強調信号に逆フーリエ変換を施し、1フレームがKサンプルを含む時間領域サンプル値系列xn(t) (t=0, 1, ..., K-1)として、窓がけ処理部2502に供給され、窓関数w(t)との乗算が行なわれる。第nフレームの入力信号xn(t) (t=0, 1, ..., K/2-1)に対してw(t)で窓がけされた信号は、次式の左辺で与えられる。
Figure JPOXMLDOC01-appb-M000051

 また、連続する2フレームの一部を重ね合わせ(オーバラップ)して窓がけしてもよい。フレーム長の50%をオーバラップ長として仮定すれば、t=0, 1, ..., K/2-1 に対して、以下の式の左辺が、窓がけ処理部2502の出力となり、フレーム合成部2503に伝達される。
Figure JPOXMLDOC01-appb-M000052

 フレーム合成部2503は、窓がけ処理部2502からの隣接する2フレームの出力を、K/2サンプルずつ取り出して重ね合わせ、以下の式によって、t=0, 1, ..., K-1における出力信号(左辺)を得る。得られた強調信号2360は、フレーム合成部2503から出力端子2307に伝達される。
Figure JPOXMLDOC01-appb-M000053

 なお、図24と図25において変換部と逆変換部における変換をフーリエ変換として説明したが、フーリエ変換に代えて、アダマール変換、ハール変換、ウェーブレット変換など、他の変換を用いることもできる。ハール変換は、乗算が不要となり、LSI化したときの面積を小さくすることができる。ウェーブレット変換は、周波数によって時間解像度を異なったものに変更できるために、雑音抑圧効果の向上が期待できる。
 また、変換部2301において得られる周波数成分を複数統合してから、雑音抑圧部2305で実際の抑圧を行うこともできる。統合後の周波数成分の数は、統合前の周波数成分の数よりも小さくなる。具体的には、周波数成分の統合によって得られる統合周波数成分に対して共通の抑圧度を求め、その抑圧度を同一統合周波数成分に属する個別の周波数成分に対して共通に用いる。その際、聴覚特性の弁別能力が高い低周波領域から、能力が低い高周波領域に向かって、よりたくさんの周波数成分を統合することによって、高い音質を達成することができる。このように、複数の周波数成分を統合してから雑音抑圧を実行すると、雑音抑圧を適用する周波数成分の数が少なくなり、全体の演算量を削減することができる。
 《雑音抑圧部の構成》
 図23に戻ると、雑音抑圧部2305は、変換部2301から供給される劣化信号振幅スペクトルを用いて雑音を推定し、推定雑音スペクトルを生成する。そして、変換部2301からの劣化信号振幅スペクトルと生成した推定雑音スペクトルとを用いて抑圧係数を求め、劣化信号振幅スペクトルに乗じ、強調信号振幅スペクトルとして、振幅制御部2303へ供給する。また、急変判定部2309から急変判定結果(信号の急変が存在するか否かの情報)を受けて、急変と判定されたときには、劣化信号振幅スペクトルと推定雑音スペクトルのうち小さい方を、強調信号振幅スペクトルとして、振幅制御部2303へ供給する。このとき、雑音抑圧部2305は、所望信号の検出を行って所望信号成分を周波数ごとに保護してもよい。
 また、急変判定部2309から、急変がどの程度存在するかの情報(信号の急変が存在する確からしさ、存在可能性)を受けて、信号の急変が存在する可能性に応じて、雑音抑圧の程度を変更することもできる。さらに、信号の急変が存在する可能性を周波数成分、周波数帯域(任意の数の連続する周波数成分を統合したもの)、あるいはフレーム単位で判定し、その急変を抑圧すべく、周波数成分、周波数帯域、あるいはフレーム単位で異なった信号処理を施すことができる。
 雑音の推定には、非特許文献1や非特許文献2に記載の方法など、様々な推定方法が利用できる。
 例えば、非特許文献1には、推定雑音スペクトルを、所望信号が発生していないフレームの劣化信号振幅スペクトルの平均値とする方法が開示されている。この方法では所望信号の存在を検出する必要がある。所望信号の存在する区間は、強調信号のパワーで判断することができる。
 理想的な動作状態として、強調信号は雑音以外の所望信号となっている。また、所望信号や雑音のレベルは、隣接フレーム間で大きく変化しない。これらのことから、1フレーム過去の強調信号レベルを雑音区間判定の指標とする。1フレーム過去の強調信号パワーが一定値以下の時には、現フレームを雑音区間と判定する。雑音スペクトルは、雑音区間と判定されたフレームの劣化信号振幅スペクトルを平均化することで推定できる。
 また、非特許文献1には、推定雑音スペクトルを、劣化信号振幅スペクトルが供給され始めた推定初期の平均値とする方法も開示されている。この場合、推定が開始された直後には所望信号が含まれないという条件を満たす必要がある。条件が満たされる場合、推定初期の劣化信号振幅スペクトルを推定雑音スペクトルとすることができる。
 さらに、非特許文献2には、推定雑音スペクトルを、統計的な劣化信号振幅スペクトルの最小値から求める方法が開示されている。この方法では、統計的に一定時間における劣化信号振幅スペクトルの最小値を保持し、その最小値から雑音スペクトルを推定する。劣化信号振幅スペクトルの最小値は、雑音スペクトルのスペクトル形状と似ているため、雑音スペクトル形状の推定値として用いることができる。しかし、最小値では、本来の雑音レベルより小さくなる。そのため、最小値を適切に増幅させたものを推定雑音スペクトルとして用いる。
 雑音抑圧部2305においては、様々な抑圧を行うことが可能であるが、代表的なものとして、SS(Spectrum Subtraction:スペクトル減算)法とMMSE STSA(Minimum Mean-Square Error Short-Time Spectral Amplitude Estimator:最小二乗平均誤差短時間振幅スペクトル推定)法とが挙げられる。SS法の場合は、変換部2301から供給された劣化信号振幅スペクトルから推定雑音スペクトルを減算する。MMSE STSA法の場合は、変換部2301から供給された劣化信号振幅スペクトルと生成した推定雑音スペクトルとを用いて、抑圧係数を計算し、この抑圧係数を劣化信号振幅スペクトルに乗算する。この抑圧係数は、強調信号の平均二乗パワーを最小化するように決定される。
 また、雑音抑圧部2305は、急変判定部2309から急変判定結果(信号の急変が存在するか否かの情報)を入力し、信号の急変の有無またはその程度に応じて、雑音抑圧の程度を変更する。例えば、信号急変のあった周波数成分、周波数帯域、あるいはフレーム単位で、その急変を抑圧すべく信号処理を施すことができる。
 急変判定部2309で急変と判定されたときには、劣化信号振幅スペクトルと推定雑音スペクトルのうち小さい方を、強調信号振幅スペクトルとして、振幅制御部2303へ供給する。すなわち、劣化信号振幅スペクトルが推定雑音スペクトルより小さいときには劣化信号振幅スペクトルをそのまま出力し、それ以外のときには入力信号を推定雑音スペクトルで置き換えて出力することもできる。
 さらに、この置き換えに先立って、重要な劣化信号振幅スペクトル成分を検出して、検出された重要な劣化信号振幅スペクトル成分を推定雑音スペクトルによる置き換えの対象から除外することもできる。重要な劣化信号振幅スペクトル成分を検出する際の重要度の指標としては、劣化信号振幅スペクトルの大きさを用いることができる。振幅が大きな成分は目的とする信号の成分である確率が高く、これを保持することは目的とする信号の音質劣化を防止することにつながる。
 また、重要度の指標として、劣化信号振幅スペクトルのピーク性を用いることもできる。ピーク、すなわち周波数軸に沿って周辺よりも大きな値を有する劣化信号振幅は、目的とする信号の成分である確率が高く、これを保持することは目的とする信号の音質劣化を防止することにつながる。特に、顕著なピーク、すなわち周辺の振幅値よりも著しく大きな振幅値はその重要度が高いので、確実に保護することで目的とする信号の音質をさらに高めることができる。
 ピークの検出は、例えば、非特許文献3の純音成分検出方法や、非特許文献4に、その方法が開示されている。さらに、検出されたピークを所定の条件に従って評価し、条件を満たさないピークは除外してもよい。例えば、推定雑音よりも小さな値をとるピークは、目的とする信号である可能性は低い。すなわち、推定雑音を基準として、それよりも十分に大きいものだけをピークとして残し、それ以外を除外することができる。十分に大きいかどうかは推定雑音の定数倍と比較することで、判定できる。このように、検出されたピークが所定の条件を満たすかどうかを評価してから最終的なピーク成分を選択することによって、誤ったピークの検出を低減し、信号急変部の抑圧効果を高くすることができる。
 また、急変存在の確からしさに応じて、振幅制御部2303へ供給する信号を変化させることもできる。その置き換えを行った結果と劣化信号振幅スペクトルを、急変存在の確からしさに対応して混合したものを、強調信号振幅スペクトルとして出力する。急変存在の確からしさが高いほど、その置き換えを行った結果に大きな重みをつけて、混合処理を実行する。
 雑音抑圧部2305は、信号の急変の存在可能性に応じて、抑圧度0、抑圧度1、抑圧度2というように多段で抑圧を行なってもよい。あるいは急変判定部の判定結果(例えば0~1の数値)に応じて無段階に抑圧の程度を変えてもよい。
 《位相制御部および振幅制御部の構成》
 図26は位相制御部2302および振幅制御部2303の構成を示すブロック図である。図26に示すように、位相制御部2302は位相回転部2601と回転量生成部2602とを含み、振幅制御部2303は、補正量算出部2603と振幅補正部2604とを含む。
 回転量生成部2602は、急変判定部2309から「信号の急変が存在する」と判定された周波数成分について、劣化信号位相スペクトルの回転量を生成し、位相回転部2601と補正量算出部2603に供給する。位相回転部2601では、回転量生成部2602から回転量が供給されると、変換部2301から供給された劣化信号位相スペクトル2320を、供給された回転量だけ回転(シフト)させ、強調信号位相スペクトル2340として逆変換部2304へ供給する。
 補正量算出部2603では、回転量生成部2602から供給される回転量に基づいて、振幅の補正係数を決定し、振幅補正部2604に供給する。
 回転量生成部2602は、例えば乱数によって回転量を生成する。乱数により、劣化信号位相スペクトルを各周波数で回転させると、劣化信号位相スペクトル2320の形状が変化する。この形状の変化により、衝撃音などの信号急変部の特徴を弱めることができる。
 乱数には、その発生確率が一様な一様乱数や、発生確率が正規分布を示す正規乱数などがあるが、まず、一様乱数による回転量の生成法を説明する。一様乱数は線形合同法などで発生させることができる。例えば、線形合同法で発生させた一様乱数は、0~(2^M)-1の範囲に一様に分布する。ここで、Mは任意の整数であり、^はべき乗を表している。位相の回転量φは、0~2πの範囲に分布させる必要がある。そこで、発生させた一様乱数を変換する。変換は、以下の式で行う。ここで、Rは一様乱数であり、Rmaxはその一様乱数が発生しうる最大の値である。前述した線形合同法で発生させる場合には、Rmax=(2^M)-1となる。
Figure JPOXMLDOC01-appb-M000054

 計算の簡単化のために、Rの値をそのまま回転量とすることもできる。回転量であるので2πはちょうど一回転を表す。位相を2π回転させた場合は回転させていない場合と同一である。よって、2π+αという回転量は、回転量がαの場合と同じになる。ここでは、線形合同法により一様乱数を発生させた場合を説明したが、それ以外の方法で一様乱数を発生させた場合でも、上式により回転量φを求めればよい。急変判定部2309の判定結果に応じて、いつどのくらい乱数化を行なうのかを決定してもよい。
 位相回転部2601は、回転量生成部2602から回転量を受け取り、劣化信号位相スペクトルを回転させる。もし、劣化信号位相スペクトルが角度で表現されている場合には、その角度に回転量φの値を加算することで回転させることができる。劣化信号位相スペクトルが複素数の正規ベクトルで表現されている場合には、回転量φの正規ベクトルを求め、劣化信号位相スペクトルに乗算することで回転させることができる。
 回転量φの正規ベクトルは、以下の式で求められる。ここで、Φは回転ベクトルであり、jはsqrt(-1)を示す。なお、sqrtは二乗根を表している。
Figure JPOXMLDOC01-appb-M000055

 補正量算出部2603による補正係数算出方法は、図5の補正量算出部503について説明した方法と同様であるため、ここでは説明を省略する。
 《算出部および急変判定部の構成》
 図27は、算出部2381、2382および急変判定部2309の内部構成について説明するための図である。図27に示すように、算出部2382は、急増部検出部2701、遅延時間算出部2702、位相変換部2703および傾き算出部2704を備える。一方、算出部2381は、傾き算出部2705を備える。
 急増部検出部2701は、フレーム内の信号の絶対値を算出し、その絶対値の最大値2710を検出する。遅延時間算出部2702は、フレーム内の最大値を示す相対位置(フレーム開始から最大値の存在するタイミングまでの時間)をn0として出力する。
 次に、位相変換部2703は、遅延時間n02720を周波数領域の位相に変換する。具体的には以下の式に基づいて変換する。ここで、Lは変換部2301のフレーム長、0≦n0≦L―1である。入力が振幅aの孤立パルスであることを仮定すると、フーリエ変換によって得られるk番目の周波数成分D(k)は、次式で与えられる。 D(k)=a・exp(-jθ(k))θ(k)=-2π・k・n0/L
 傾き算出部2704は、このように導き出した位相2730を微分して、周波数領域での位相の傾き2740を以下のように導き出す。傾き2740=-2π・n0/L
 一方、傾き算出部2705は、変換部2301から入力した位相成分信号を微分して、周波数領域での位相の傾き2750を導き出す。傾き算出部2704、2705はそれぞれ、位相の周波数による微分によって傾きを算出してもよいし、他の方法で傾きを算出してもよい。
 平行度算出部2706は、傾き算出部2704から提供された傾き2740と傾き算出部2705から提供された傾き2750とを、周波数ごとに比較してその傾きの類似度を算出する。つまり、周波数領域における位相成分信号の、算出部2382が算出した直線に対する算出部2381が算出した直線の平行度を各周波数で算出する。急変判定部2707では、そのような平行度が一定値を越えていれば、信号の急変がその周波数に存在すると判定する。
 ここで、周波数ごとではなく周波数帯域(サブバンド)またはフレームごとに判定すると、より大局的な判定によって、信号急変成分以外の位相成分による判定誤りを低減することができる。さらに、周波数帯域ごとまたはフレームごとの判定結果を用いて、周波数ごとの判定結果を修正してもよい。例えば、ある周波数帯域の判定結果が「信号急変が存在する」であるときに、その周波数帯域内の全周波数の判定結果を強制的に「信号急変が存在する」に設定することで、他の信号成分の妨害による判定誤りを低減することができる。その反対に、ある周波数帯域の判定結果が「信号急変が存在しない」であるときに、その周波数帯域内の全周波数の判定結果を強制的に「信号急変が存在しない」に設定することで、他の信号成分の妨害による判定誤りを低減することもできる。あるいは、前記帯域内の各周波数で、判定の容易さ(閾値)を「存在」と判定しやすい方向へ修正して、各周波数独自に判定を行うという構成自体は維持してもよい。周波数ごとまたは周波数帯域ごとに判定結果を求めると、周波数ごとまたは周波数帯域ごとに急変を抑圧することができ、より精度の高い信号急変の抑圧を行なうことが可能となる。
 急変判定部2309は判定結果2730として、信号急変あり(1)または信号急変無し(0)を出力する。ただし、急変判定部2707が平行度と対応させた、0と1の間の値を急変の存在可能性として出力するときには、判定結果2730は急変の存在可能性を表す0と1の間の値となる。その場合、信号急変が含まれている尤もらしさ(急変の存在可能性)を得ることが可能となる。存在可能性は、例えば、次のようにして求めることができる。まず、逆正接関数(arctangent)を用いて、傾き2740と傾き2750を傾きに対応した角度に変換する。角度の範囲は、-90度から90度とする。これら2角度の差の絶対値が0に近いほど、信号急変の存在可能性が高い。また、2角度の差の絶対値は、180度がその最大値となる。そこで、正の値を閾値として定める。2角度の差が閾値を超えるとき、信号急変の存在可能性を0とする。また、角度の差が0になるとき、存在可能性を1とする。存在可能性の一般値は、角度の差の関数として定義する。このような関数の最も簡単なものは、直線である。存在可能性として、2角度の差に比例した値が定められる。直線の傾きとy切片(2角度の差が0のときの関数値)は、角度の差が0および1に等しいときの境界条件を満足するように定める。関数としては、任意の線形または非線形関数や多項式などを用いてもよい。
 図28は、位相およびその変化量をグラフに示したものである。周波数領域において、周波数軸に沿って、グラフ2801のように位相が変化する場合、その位相変化量は、周波数領域において、周波数軸に沿って、グラフ2802に示すように変化する。
 一方、急増部のフレーム内相対位置から、周波数領域で直線2803として示される位相を算出できる。
 本実施形態では、位相成分信号2801と直線2803とが平行になる部分がどの程度あるかに応じて、信号急変の存在を判定する。
 位相の傾きを縦軸にとり、周波数を横軸にとると、直線2803の傾きに近似する範囲は、範囲2840で示される。したがって、範囲2840とグラフ2802との重なる部分が所定の閾値よりも大きい場合に、急変判定部2309は、信号の急変が存在すると判定する。
 図29は、本実施形態にかかる雑音抑圧装置2300をソフトウェアを用いて実現する場合のハードウェア構成について説明する図である。
 雑音抑圧装置2300は、プロセッサ2910、ROM(Read Only Memory)2920、RAM(Random Access Memory)2940、ストレージ2950、入出力インタフェース2960、操作部2961、入力部2962、および出力部2963を備えている。雑音抑圧装置2300は、カメラ2964を備えていてもよい。プロセッサ2910は中央処理部であって、様々なプログラムを実行することにより雑音抑圧装置2300全体を制御する。
 ROM2920は、プロセッサ2910が最初に実行すべきブートプログラムの他、各種パラメータ等を記憶している。RAM2940は、不図示のプログラムロード領域の他に、入力信号2310、位相成分信号2320、振幅成分信号2330、強調信号2360を記憶する領域を有している。さらに、RAM2940は、振幅最大値タイミング2710、遅延時間2720、位相信号2730および位相の傾き2740、2750等を記憶する領域を有している。
 また、ストレージ2950は、雑音抑圧プログラム2951を格納している。雑音抑圧プログラム2951は、変換モジュール、位相制御モジュール、振幅制御モジュール、逆変換モジュール、雑音抑圧モジュール、位相傾き算出モジュール、および急変判定モジュールを含んでいる。雑音抑圧プログラム2951に含まれる各モジュールをプロセッサ2910が実行することにより、図23の変換部2301、位相制御部2302、振幅制御部2303、逆変換部2304、雑音抑圧部2305、算出部2381、2382、急変判定部2309の各機能を実現できる。なお、ストレージ2950はノイズデータベースを格納してもよい。
 プロセッサ2910が実行した雑音抑圧プログラム2951に関する出力である強調信号は、入出力インタフェース2960を介して出力部2963から出力される。これにより、例えば、入力部2962から入力した操作部1461の操作音などを抑圧することができる。また、入力部2962から入力した入力信号に信号急変が含まれたことを検出してカメラ2964による撮影を開始するなどといった適用法も可能である。
 図30Aは、上記雑音抑圧プログラム2951による信号急変判定処理の流れを説明するためのフローチャートである。ステップS3001では、算出部2382において、時間領域での振幅最大値からの位相の傾き算出処理を開始させる。ステップS3002では、算出部2381において、周波数領域での位相の傾き算出処理を開始させる。
 次にステップS3005において、ステップS3001とステップS3003の両方で傾きを算出するまで待機し、両方のやり方で傾きが算出できれば、ステップS3007に進み、算出した傾きを周波数ごとに比較する。ステップS3009において、傾きの差分絶対値が所定の閾値N以下か否かを判定し、N以下であれば、ステップS3011に進み、その周波数kについて、フラグを立てる(I(k)=1とする)。一方、N以下でない場合、ステップS3014においてI(k)=0とする。ステップS3015ではk=F(Fはフレーム全体の周波数成分数)を判定し、k=Fでなければ、ステップS3017に進み、k=k+1としてステップS3007に戻り、フレーム全体にわたって周波数ごとに傾き比較を行なう。最終的には、ステップS3019において、I(k)=1となったkの周波数で信号の急変ありと判定し、判定結果を、雑音抑圧部2305および位相制御部2302に供給する。なお、ステップS3019に変えて、フレーム内でI(k)を積算し、I(k)の積算値が所定の閾値を超えた場合に、急変判定部2309は信号の急変を含むフレームと判定してもよい。また、この際、急変判定結果を次の周波数帯域にハングオーバして積算してもよい。
 また、ハングオーバの作用として、続くフレームにおける閾値Nを大きく設定することができる。このように続くフレームの閾値を設定することによって、信号急変(例えば衝撃音)の検出を容易にし、検出漏れを低減することができる。
 図30Bは、算出部2382が行なう傾き算出処理の流れを説明するためのフローチャートである。まず、ステップS3021で信号を入力すると、ステップS3023に進んでフレーム分割部2401がフレーム分割を行なう。次にステップS3025では、急増部検出部2701が、低相関信号の急増部を検出する。ステップS3027では、遅延時間算出部2702が急増部のフレーム内相対位置(フレーム開始から急増部の存在するタイミングまでの時間)をn0として出力する。
 次に、ステップS3029において位相変換部2703は、遅延時間n02720を周波数領域の位相に変換する。ステップS3031において、傾き算出部2704は、導き出した位相を微分して、周波数領域での位相の傾きを導き出し、ステップS3033でバッファリングする。
 図30Cは、算出部2381が行なう傾き算出処理の流れを説明するためのフローチャートである。ステップS3051で信号を入力するとステップS3053に進み、フレーム分割、窓処理を経てフーリエ変換により、周波数領域での位相成分信号を抽出する。次にステップS3055で、周波数のステップkを1に設定すると、ステップS3057では、位相P(k)を微分して傾きΔP(k)を算出し、ステップS3059において、その傾きをバッファリングする。ステップS3061では、k=F(Fはフレーム全体の周波数成分数)を判定し、k=Fでなければ、ステップS3063に進み、k=k+1としてステップS3057に戻り、フレーム全体にわたって周波数ごとに傾き算出を行なう。
 以上の処理により、信号の急変をより正確に検出することができ、適宜、その急変部を適切に抑圧することが可能となる。なお、本実施形態では位相の傾きを微分値で求めたが、単位ベクトルの回転量など別の指標を求めて、判定に用いてもよい。
 [第8実施形態]
 次に本発明の第8実施形態に係る雑音抑圧装置について、図31を用いて説明する。図31は、本実施形態に係る雑音抑圧装置の機能構成を説明するための図である。本実施形態に係る雑音抑圧装置は、上記第7実施形態と比べると、変換部3101において、窓がけ処理部2402における窓がけ処理後の信号を、算出部2382に出力する点で異なる。その他の構成および動作は、第7実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
 本実施形態によれば、窓がけ後の時間領域信号、すなわちフーリエ変換に用いる信号と同じ信号から求めた傾きを用いて平行度を求めることができる。これにより、周波数領域信号を用いて求めた位相の傾きとの整合性が高くなり、より正確な信号の急変判定を行うことができる。
 [第9実施形態]
 次に本発明の第9実施形態に係る雑音抑圧装置3200について、図32を用いて説明する。図32は、本実施形態に係る雑音抑圧装置3200の機能構成を説明するための図である。本実施形態に係る雑音抑圧装置3200は、上記第7実施形態と比べると、振幅平坦度算出部3201を追加的に備えている点で異なる。その他の構成および動作は、第2実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
 振幅平坦度算出部3201は、周波数軸に沿った振幅変化を算出して、急変判定部3209に供給する。隣接する周波数間で振幅の変化が小さい周波数が信号急変を表す。振幅変化は、帯域ごと、あるいは全周波数のいずれかに対して、一つの平坦度を求めてもよい。具体的には、以下の式のように、平坦度を表わすFM(Flatness Measure)を求める。x(n)は周波数nにおける振幅またはパワースペクトル、Nは平坦度算出区間に含まれる周波数成分の数である。
Figure JPOXMLDOC01-appb-M000056

 FMは0.0から1.0の値をとる。完全に平坦な場合、FMは1.0である。平坦度については、非特許文献3に開示がある。
 平坦度はまた、別の指標を用いて表すこともできる。例えば、帯域ごと、あるいは全周波数のいずれかに対してx(n)の平均を求め、各周波数成分nにおけるx(n)とその平均値との差分二乗値総和を帯域ごと、あるいは全周波数の平坦度とすることができる。全周波数の代わりに、単一あるいは複数の周波数帯域において前記差分二乗値総和を一つ求め、これを平坦度とすることもできる。このようにして求めた平坦度は、完全に平坦な場合に0.0、平坦度が低下するに従って大きな値をとる。
 別の平坦度の指標として、滑らかさを用いてもよい。滑らかさは、周波数軸に沿った隣接サンプル間の差分絶対値総和で表現することができる。凹凸の多い(滑らかでない)波形で滑らかさは大きな値を、少ない(滑らかな)波形で小さな値をとる。この指標は、全変動量(TV: Total Variation)として知られている。
 これまで、平坦度として周波数軸に沿った平坦度を用いてきたが、時間軸に沿った平坦度を利用することもできる。信号急変部では急激に振幅およびパワーが増加するので、この性質を用いると、時間軸に沿った平坦度が低いときに、信号急変が存在すると判定することができる。具体的には、現フレームと直前フレームの振幅またはパワーの差が一定値以上となるときに、平坦度が低い、すなわち信号急変が存在すると判定する。また、数フレーム過去のフレームから現在のフレームまでの複数フレームに対して隣接フレーム間の振幅またはパワーの差を求め、これらを線形または非線形結合した結果を平坦度として定義することもできる。過去のフレームの情報を用いることで、低域成分を含むなまった信号急変部を検出しやすくなり、その抑圧性能が向上する。なお、隣接フレームの振幅またはパワー差を計算する際には、これを周波数成分ごと、帯域ごと、あるいは全周波数のいずれかに対して計算してもよい。さらに、単一または複数の帯域に対して前記振幅またはパワー差を計算することもできる。例えば、単一の帯域、特に高周波域で前記振幅またはパワー差を計算することによって、音声やその他の信号の影響を低減することができ、より正確に信号急変部を検出することが可能となる。
 これまで説明した2つの平坦度、すなわち周波数軸に沿った平坦度と時間軸に沿った平坦度は、それぞれを単独で用いることもできるし、両方を組み合わせて用いることもできる。組合せの例としては、2つの平坦度の線形または非線形結合に基づく信号急変部の検出や、それぞれの平坦度に基づいた検出結果の組合せなどがある。周波数方向の平坦度は大きいときに、時間方向の平坦度は小さいときに信号急変の検出と判定するので、組合せの際にどちらかを逆数にしてから組み合わせるなどの工夫が必要となる。
 振幅平坦度算出部3203の本質的な機能は、振幅の情報を用いて、信号急変の存在可能性を求めることであるから、その他の方法で代替してもよい。振幅情報を用いて信号急変を検出する技術は、非特許文献6、非特許文献7、非特許文献8などに開示されている。
 急変判定部3209は、傾きの類似度(平行度)と振幅平坦度の2つの指標を用いて、信号の急変を判定する。振幅が周波数軸に沿って平坦である(バラツキが小さい)とき、信号急変部である可能性が高いと考えられるからである。これは、信号急変がパルス性(短時間に振幅が増加して、減少する)であることと、インパルスのフーリエ変換が白色信号(全周波数で振幅およびパワーが等しい)となることから自明である。判定の方法としては例えば以下のいずれかを選択することができる。
 (1)平行度と振幅平坦度が共にそれぞれの条件を満たす場合(例えば傾きの差分値がN=0.1以下で、振幅平坦度FMがМ=0.8以上の場合)、信号の急変があると判定
 (1.5)平行度と振幅平坦度を単独で用いたときの判定結果の論理和。信号急変の存在可能性を算出するときは、平行度による存在可能性と振幅平坦度による存在可能性のうち、大きい方(または小さい方)に基づく判定
 (2)平行度と振幅平坦度の両方の平均が条件を満たす場合(例えば傾きの差分値PXと、振幅平坦度FMと1.0との差分値QX=(1.0-FM)との平均AV1=(PX+QX)/2が0.1以下)に、信号の急変があると判定
 (3)傾きの差分値と振幅平坦度とに対して重み付けを行ないつつ両方を合わせた複合的な条件を満たす場合(例えば傾きの差分値PXと、振幅平坦度FMと1.0との差分値QX=(1.0-FM)との重み付け平均AV2=(0.8×PX+0.2×QX)が0.1以下)に、信号の急変があると判定
 (4)傾きの差分値と振幅平坦度とを、線形または非線形関数を用いて組み合わせ、組み合わせた結果が一定値より大きいときに信号の急変があると判定。時間方向の振幅平坦度が含まれるときには、その逆数を代わりに用いる。
 (5)傾きの差分値と振幅平坦度との中でいずれか理想値により近い方(差分値は小さい方、平坦度は大きい方)のみを用いて、その理想値により近い方が条件を満たす場合に信号の急変があると判定。時間方向の振幅平坦度が含まれるときには、その逆数を代わりに用いる。
 (6)事前に検出しようとする急変信号の振幅またはパワースペクトルに関する情報が得られて、振幅またはパワースペクトルが平坦であれば、傾きの差分値の重みを小さくする。
 (7)事前に検出しようとする急変信号の振幅またはパワースペクトルに関する情報が得られて、振幅またはパワースペクトルの最小値よりも入力された劣化信号の振幅またはパワースペクトルが小さいときは、信号急変を検出するための閾値を一時的に大きく変更して、検出されにくくする。
 特定の信号を処理する場合、例えばノイズが小さくてインパルスに近い衝撃音を検出・抑圧する場合、振幅またはパワーに関する情報の方が位相情報よりも信頼できるときがある。例えば、静かな環境でピストルの発砲音を検出する際には、振幅のみを用いて検出してもよい。一方、ノイズの振幅またはパワーが大きく変化する場合、例えば、空港の警備での発砲音の検出の場合、静かな(ノイズが小さい)状況と、ノイズが大きい状況とで、振幅と位相の重み付けを変えることが効果的である。この場合、振幅と位相の重み付けを、ノイズの有無や時間帯に応じて変化させてもよい。例えば、管制塔からフライトスケジュールの最新情報を入手することができれば、飛行機の離着陸時刻が分かるため、飛行機が来るタイミング(ノイズが多いタイミング)では位相の重み付けを大きくして発砲音の検出に用いることができる。発砲音(検出対象の衝撃音)以外の信号が混在するときには、位相情報を用いた衝撃音の検出が振幅を用いた検出よりも効果的だからである。
 一方、ノイズが小さい状況では、入力された劣化信号の周波数領域ベクトルの絶対値、つまり振幅値を重視して判定する方が効果的に衝撃音を検出できる。もちろんここでも振幅スペクトルの代わりにパワースペクトルの値を用いてもよい。また、信号の種類によって、衝撃音の振幅が平坦でない場合がある。その場合は、位相平坦度の重みを大きくして検出を行なうことにより高精度で信号の急変を検出できる。さらに、衝撃音の振幅またはパワースペクトルに関する情報が事前に得られるときには、得られた情報を用いて振幅が平坦なときと同じ結果が得られるように、振幅平坦度の計算結果を補正することもできる。具体的には、振幅スペクトル2330を衝撃音の振幅またはパワースペクトル形状の逆数を各周波数成分で乗じた後に、振幅平坦度を算出する。
 以上説明したとおり本実施形態によれば、振幅平坦度を併せて用いて信号急変部を検出することができる。これにより、信号急変(衝撃音)をより正確に検出することができ、適宜、その信号急変(衝撃音)を適切に抑圧することが可能となる。
 [第10実施形態]
 なお、上記第6乃至第9実施形態では、信号急変部を抑圧することを目的とした雑音抑圧装置に信号急変検出方法を適用した場合について説明したが、本発明はこれに限定されるものではない。衝撃音(急激に立ち上がってすぐにたち下がる信号)の検出を目的とした様々な装置、システムおよび状況で利用することができる。また、信号が急激に立ち上がって(またはたち下がって)そのままとなる場合であっても、急変部として検出できる。
 例えば、現在のオーディオ符号化方式(例えばMPEG AACの符号化部)において、いわゆるアタックと呼ばれる信号急変部では、通常とは異なった情報圧縮方式が採用されているが、その際の信号急変部の検出にも適用することができる。信号急変部では、分析窓長を変更して、プリエコーと呼ばれる先行雑音の抑圧を行うので、検出が必要となる。振幅やエントロピーの変化などを用いて検出する方法に比べて精度良く急変を検出し、効果的に情報圧縮を行なうことができる。
 また、図33に示すように車両3300にマイク3301と算出部2381、2382と急変判定部2309と映像記録部3302とを搭載する適用例も考えられる。映像記録部3302が衝撃音の検出をトリガーにしてカメラによる撮影画像の上書き保存禁止を行なえば、事故状況の記録を残すことができる。その際に、衝撃音検出から一定時間の遅延の後に、上書き保存禁止を行ってもよい。衝撃そのものをトリガーにした場合と異なり、衝撃が小さい場合や、他の車両が事故にあった場合にも事故状況の自動記録を行なえるという利点がある。
 また、図34に示すように、心電計3400に算出部2381、2382と急変判定部2309とアラーム部3401とを接続する適用例も考える。心電図の異常心拍の検出をより正確かつ効果的に行なうことができる。特に雑音の多い場合に有効である。同様に、胎児のエコーのモニターにも適用できる。雑音による妨害で正しく心音がとれない場合があるが、そのようなときにも本技術は有効である。すなわち生体信号の急変検出に広く適用できる。
 [第11実施形態]
 本発明の第11実施形態としての信号処理装置3500について、図35を用いて説明する。信号処理装置3500は、入力信号急変を検出するための装置である。図35に示すように、信号処理装置3500は、変換部3501と相関除去部3502と信号急変検出部3504とを含む。
 変換部3501は、入力信号3510を、周波数領域における位相成分信号3520および振幅成分信号3530に変換する。
 相関除去部3502は、入力信号3510に含まれる、時間相関のある成分を除去して、入力信号3510よりも時間相関の小さい低相関信号3550を生成する。
 信号の急変を構成する成分は、過去の信号に基づいて予測することができず、時間相関が小さい。一方、相関除去部3502では、信号の急変成分以外の時間相関が大きい成分を除去して、信号の急変成分を強調する。
 相関除去は、通常、相関成分の予測と予測信号の入力信号からの減算による出力計算の2つの処理から構成される。予測は、過去の信号サンプルの線形結合で表すことができ、線形結合の重み係数、すなわち予測フィルタの係数は、レビンゾン-ダービン法、共分散法、最小二乗法などが知られている。このようにして求めた予測フィルタ係数は、予測誤差を最小化するものとなっている。
 信号急変判定部3504は、低相関信号3550と位相成分信号3520とに基づいて、入力信号3510に含まれる急変を判定する。
 以上の構成により、信号の急変成分に対応した低相関信号と位相成分信号とを用いるため、入力信号の急変を効果的に検出することができる。
 [第12実施形態]
 本発明の第12実施形態としての信号処理装置3600について、図36を用いて説明する。信号処理装置3600は、入力信号急変を検出するための装置である。図36に示すように、信号処理装置3600は、変換部3601と相関除去部3602と第1算出部3603と第2算出部3605と信号急変判定部3609とを含む。
 変換部3601は、入力信号3610を、周波数領域における位相成分信号3620および振幅成分信号3630に変換する。相関除去部3602は、入力信号3610に含まれる、時間相関のある成分を除去して、入力信号3610よりも時間相関の小さい低相関信号3640を生成し、第1算出部3603に供給する。第1算出部3603は、低相関信号3640の時間領域における急増部の位置に基づいて、位相の傾き3650を算出する。孤立パルスをフーリエ変換したときの周波数方向の位相の傾きは、孤立パルスの位置に対応して一意に求まることが知られている。例えば、変換部におけるフレーム長がNサンプルで孤立パルス位置がn0であるとき、位相の傾きは-2πn0/Nとなる。急増部を同定するための指標としては、例えば振幅絶対値の最大値を用いることができる。この指標は、実際の信号が孤立パルスに近いとき(ほぼ単峰性形状)には正確な位置を与える。一方、双峰性の形状を有するパルスのときは、振幅最大値は正確な位置を与えない。このような場合は、振幅絶対値の最大値と振幅絶対値の2番目に大きな値を用いた指標が有効である。例えば、両者の位置の中間値や両者の位置の重みづけ平均などを用いることができる。パルスがより時間軸に沿って広がっているときには、パルスのおおよその中心部を利用することで正確な位置を求めることができる。そのような指標には重心がある。第2算出部3605は、周波数領域における位相成分信号3620の傾き3660を算出する。信号急変判定部3609は、第1算出部3603によって算出された傾きと第2算出部3605によって算出された傾きに基づいて入力信号の急変を判定する。
 以上の構成により、周波数領域における位相成分信号の傾きと信号の急変成分に対応した低相関信号の急増部から求めた位相の傾きとの一致程度を用いて、入力信号の急変を効果的に検出することができる。
 [第13実施形態]
 《全体構成》
 本発明の第13実施形態としての雑音抑圧装置について図37A乃至図45を用いて説明する。本実施形態の雑音抑圧装置は、例えばデジタルカメラ、ノートパソコン、携帯電話、キーボード、ゲーム機のコントローラ、携帯電話の押しボタンなどの雑音抑圧に適用できる。すなわち、音声、音楽、環境音などの目的とする信号を、これらに重畳された信号(ノイズまたは妨害信号)に対して強調することができる。ただし、本発明はこれに限定されるものではなく、入力信号からの信号急変検出を要求されるあらゆる信号処理装置に適用可能である。なお、本実施形態では、信号の急変の一例として、衝撃音を検出して抑圧する雑音抑圧装置について説明する。本実施形態としての雑音抑圧装置は、例えば、マイクの近くでボタン押下などの操作がなされるような形態において、かかるボタン操作により発生する衝撃音を適切に抑圧する。簡単に説明すると、衝撃音を含む時間領域信号を周波数領域信号に変換し、周波数空間における位相成分の傾きを算出する。また、時間領域信号の相関を除去して得られる低相関信号の急増部を孤立パルスとみなしたときの周波数領域の位相の傾き、すなわち-2πn0/Nを求める。n0は急増部の位置である。そして、それら2種類の位相の傾きの一致程度に応じて、衝撃音の存在を判定する。
 図37Aは、雑音抑圧装置3700の全体構成を示すブロック図である。入力端子3706には、劣化信号(所望信号と雑音の混在する信号)が、サンプル値系列として供給される。入力端子3706に供給された劣化信号は、変換部3701においてフーリエ変換などの変換を施されて複数の周波数成分に分割される。複数の周波数成分は周波数ごとに独立して処理される。ここでは、特定の周波数成分に注目して説明を続ける。周波数成分のうち振幅スペクトル(振幅成分)3730は雑音抑圧部3705へ供給され、位相スペクトル(位相成分)3720は位相制御部3702および算出部3781に供給される。さらに、入力端子3706に供給された劣化信号は、相関除去部3712で相関成分を除去されて低相関信号3770となり、算出部3782に供給される。なお、ここでは変換部3701が雑音抑圧部3705に劣化信号振幅スペクトル3730を供給しているが、本発明はこれに限定されるものではなく、振幅スペクトルの二乗に相当するパワースペクトルを雑音抑圧部3705に供給してもよい。
 雑音抑圧部3705は、変換部3701から供給される劣化信号振幅スペクトル3730を用いて、雑音を推定し、推定雑音スペクトルを生成する。また、雑音抑圧部305は、変換部3701から供給された劣化信号振幅スペクトル3730と、生成した推定雑音スペクトルとを用いて雑音を抑圧し、雑音抑圧結果としての強調信号振幅スペクトルを振幅制御部3703に伝達する。さらに雑音抑圧部3705は、急変判定部3709から判定結果を入力し、信号の急変の有無またはその程度に応じて、雑音の抑圧の程度を変更する。雑音抑圧部3705は目的音検出を用いて保護をする一方、衝撃音検出時は振幅を推定背景音に置換する。
 位相制御部3702は、変換部3701から供給された劣化信号位相スペクトル3720を回転(シフト)させ、強調信号位相スペクトル3740として逆変換部3704へ供給する。また、位相の回転量(シフト量)を、振幅制御部3703へ伝達する。振幅制御部3703は、位相制御部3702から位相の回転量(シフト量)を受け取って振幅補正量を算出し、その振幅補正量を用いて、強調信号振幅スペクトルを各周波数で補正し、補正振幅スペクトル3750を逆変換部3704へ供給する。逆変換部3704は、位相制御部3702から供給された強調信号位相スペクトル3740と、振幅制御部3703から供給された補正振幅スペクトル3750とを合成して逆変換を行い、強調信号として、出力端子3707に供給する。
 算出部3781は、変換部3701から供給された位相成分信号3720を周波数で微分することにより、各周波数での位相の変化(傾き)を算出する。一方、算出部3782は、フレームに分割された低相関信号3770を入力して信号絶対値を算出し、信号絶対値の急増部を示す位置に基づいて、周波数領域の位相の傾きを算出する。
 急変判定部3709は、算出部3781、3782から提供された位相の傾きを比較し、それらの類似度に基づいて、信号の急変がどの程度存在するか(存在可能性)を周波数点ごとに判定する。具体的には、算出部3781、3782から、位相成分信号に対応する回転ベクトルを入力し、それら2つの回転ベクトル同士の回転ベクトルを算出して、その絶対値が0に近い場合(あらかじめ定められた閾値0.1以下の場合)に、信号の急変が存在したと判定する。
 傾きの類似度は、時間領域信号から求めた傾きと周波数領域信号から求めた傾きの差分絶対値を用いることができるが、これに限定されない。2つの傾きの比の値と1との距離や、両者の和をどちらかの傾きの2倍で正規化した値と1との距離などを用いてもよい。類似度に基づく存在可能性は、例えば、次のようにして求めることができる。まず、正の値を閾値として定める。差分絶対値がこの閾値よりも大きいとき、存在可能性を0とする。また、差分絶対値が0に等しいとき、存在可能性を1とする。存在可能性の一般値は、差分絶対値の関数として定義する。このような関数の最も簡単なものは、直線である。存在可能性として、差分絶対値に比例した値が定められる。直線の傾きとy切片(前記差分絶対値がゼロのときの関数値)は、前述の差分絶対値が0および1に等しいときの境界条件を満足するように定める。関数としては、任意の線形または非線形関数や多項式などを用いてもよい。
 《相関除去部の構成》
 図37B、図37Cは、相関除去部3712の構成を示すブロック図である。図37Bに示すように、相関除去部3712は予測部3783、減算器3784、フレーム分割部3785を含む。劣化信号サンプル3710は予測部3783に供給され、予測部3783は相関のある信号3786を予測して減算器3784に供給する。予測の方法としては、適応フィルタを用いた線形予測やレビンソン・ダービン法などが知られている。減算器3784は、予測部3783から供給された予測信号3786を劣化信号3710から減算して、その差を低相関信号3787としてフレーム分割部3785に供給する。フレーム分割部3785は、低相関信号3787に対してフレーム分割を施し、フレーム化された低相関信号3770として出力する。
 図37Cは、図37Bとは異なり、まずフレーム分割を行ってから、予測を行うこともできる。フレーム分割の後で予測を行う構成を示す。図37Cは、フレーム分割部3795、予測部3793、減算器3794を含む。フレーム分割部3795は、劣化信号3710に対してフレーム分割を施し、分割された信号サンプル3796を予測部3793と減算器3794に供給する。予測部3793は、フレーム化された劣化信号3796に含まれる相関のある信号を予測して、減算器3794に供給する。減算器3794は、予測部3793から供給された予測信号3797をフレーム化された劣化信号3796から減算して、その差をフレーム化された低相関信号3770として出力する。
 《変換部の構成》
 図38Aは、変換部3701の構成を示すブロック図である。図38Aに示すように、変換部3701はフレーム分割部3801、窓がけ処理部(windowing unit)3802、およびフーリエ変換部3802を含む。劣化信号サンプルは、フレーム分割部3801に供給され、K/2サンプルごとのフレームに分割される。ここで、Kは偶数とする。フレームに分割された劣化信号サンプル3804は、窓がけ処理部3802に供給され、窓関数(window function)であるw(t)との乗算が行なわれる。第nフレームの入力信号yn(t) (t=0, 1, ..., K/2-1) に対するw(t)で窓がけ(windowing)された信号は、次式で与えられる。
Figure JPOXMLDOC01-appb-M000057

 また、連続する2フレームの一部を重ね合わせ(オーバラップ)して窓がけしてもよい。オーバラップ長としてフレーム長の50%を仮定すれば、t=0, 1, ..., K/2-1 に対して、以下の式で得られる左辺が、窓がけ処理部3802の出力となる。

 実数信号に対しては、左右対称窓関数が用いられる。また、窓関数は、変換部3701の出力を逆変換部3704に直接供給したときの入力信号と出力信号が計算誤差を除いて一致するように設計される。これは、w2 (t)+w2 (t+K/2)=1 となることを意味する。
 以後、連続する2フレームの50%をオーバラップして窓がけする場合を例として説明を続ける。w(t)としては、例えば、次式に示すハニング窓を用いることができる。
Figure JPOXMLDOC01-appb-M000059

 このほかにも、ハミング窓、三角窓など、様々な窓関数が知られている。窓がけされた出力はフーリエ変換部3803に供給され、劣化信号スペクトルYn(k)に変換される。劣化信号スペクトルYn(k)は位相と振幅に分離され、劣化信号位相スペクトル arg Yn(k)は、位相制御部3702と算出部3781に、劣化信号振幅スペクトル|Yn(k)|は、雑音抑圧部3705に供給される。既に説明したように、振幅スペクトルの代わりにパワースペクトルを利用することもできる。
 《逆変換部の構成》
 図38Bは、逆変換部3704の構成を示すブロック図である。図38Bに示すように、逆変換部3704は逆フーリエ変換部3811、窓がけ処理部3812およびフレーム合成部3813を含む。逆フーリエ変換部3811は、振幅制御部3703から供給された強調信号振幅スペクトル3750と位相制御部3702から供給された強調信号位相スペクトル3740 arg Xn(k)とを乗算して、強調信号(以下の式の左辺)を求める。
Figure JPOXMLDOC01-appb-M000060
 得られた強調信号に逆フーリエ変換を施し、1フレームがKサンプルを含む時間領域サンプル値系列xn(t) (t=0, 1, ..., K-1)として、窓がけ処理部3812に供給され、窓関数w(t)との乗算が行なわれる。第nフレームの入力信号xn(t) (t=0, 1, ..., K/2-1)に対してw(t)で窓がけされた信号は、次式の左辺で与えられる。
Figure JPOXMLDOC01-appb-M000061
 また、連続する2フレームの一部を重ね合わせ(オーバラップ)して窓がけしてもよい。フレーム長の50%をオーバラップ長として仮定すれば、t=0, 1, ..., K/2-1 に対して、以下の式の左辺が、窓がけ処理部3812の出力となり、フレーム合成部3813に伝達される。
Figure JPOXMLDOC01-appb-M000062
 フレーム合成部3813は、窓がけ処理部3812からの隣接する2フレームの出力を、K/2サンプルずつ取り出して重ね合わせ、以下の式によって、t=0, 1, ..., K-1における出力信号(式の左辺)を得る。得られた強調信号3760は、フレーム合成部3813から出力端子3707に伝達される。
Figure JPOXMLDOC01-appb-M000063
 なお、図38Aと図38Bにおいて変換部と逆変換部における変換をフーリエ変換として説明したが、フーリエ変換に代えて、アダマール変換、ハール変換、ウェーブレット変換など、他の変換を用いることもできる。ハール変換は、乗算が不要となり、LSI化したときの面積を小さくすることができる。ウェーブレット変換は、周波数によって時間解像度を異なったものに変更できるために、雑音抑圧効果の向上が期待できる。
 また、変換部3701において得られる周波数成分を複数統合してから、雑音抑圧部3705で実際の抑圧を行うこともできる。その際、聴覚特性の弁別能力が高い低周波領域から、能力が低い高周波領域に向かって、よりたくさんの周波数成分を統合することによって、高い音質を達成することができる。このように、複数の周波数成分を統合してから雑音抑圧を実行すると、雑音抑圧を適用する周波数成分の数が少なくなり、全体の演算量を削減することができる。
 《雑音抑圧部の構成》
 雑音抑圧部3705は、変換部3701から供給される劣化信号振幅スペクトルを用いて雑音を推定し、推定雑音スペクトルを生成する。そして、変換部3701からの劣化信号振幅スペクトルと生成した推定雑音スペクトルとを用いて抑圧係数を求め、劣化信号振幅スペクトルに乗じ、強調信号振幅スペクトルとして、振幅制御部3703へ供給する。
 また、急変判定部3709から急変がどの程度存在するかの情報(信号の急変が存在する確からしさ、存在可能性)を受けて、信号の急変が存在する可能性に応じて、雑音抑圧の程度を変更することもできる。さらに、信号の急変が存在する可能性を周波数成分、周波数帯域(任意の数の連続する周波数成分を統合したもの)、あるいはフレーム単位で判定し、その急変を抑圧すべく、前記周波数成分、周波数帯域、あるいはフレーム単位で異なった信号処理を施すことができる。
 雑音の推定には、非特許文献1や非特許文献2に記載の方法など、様々な推定方法が利用できる。
 例えば、非特許文献1には、推定雑音スペクトルを、目的音が発生していないフレームの劣化信号振幅スペクトルの平均値とする方法が開示されている。この方法では目的音の発生を検出する必要がある。目的音の発生している区間は、強調信号のパワーで判断することができる。
 理想的な動作状態として、強調信号は雑音以外の目的音となっている。また、目的音や雑音のレベルは、隣接フレーム間で大きく変化しない。これらのことから、1フレーム過去の強調信号レベルを雑音区間判定の指標とする。1フレーム過去の強調信号パワーが一定値以下の時には、現フレームを雑音区間と判定する。雑音スペクトルは、雑音区間と判定されたフレームの劣化信号振幅スペクトルを平均化することで推定できる。
 また、非特許文献1には、推定雑音スペクトルを、劣化信号振幅スペクトルが供給され始めた推定初期の平均値とする方法も開示されている。この場合、推定が開始された直後には目的音が含まれないという条件を満たす必要がある。条件が満たされる場合、推定初期の劣化信号振幅スペクトルを推定雑音スペクトルとすることができる。
 さらに、非特許文献2には、推定雑音スペクトルを、統計的な劣化信号振幅スペクトルの最小値から求める方法が開示されている。この方法では、統計的に一定時間における劣化信号振幅スペクトルの最小値を保持し、その最小値から雑音スペクトルを推定する。劣化信号振幅スペクトルの最小値は、雑音スペクトルのスペクトル形状と似ているため、雑音スペクトル形状の推定値として用いることができる。しかし、最小値では、本来の雑音レベルより小さくなる。そのため、最小値を適切に増幅させたものを推定雑音スペクトルとして用いる。
 雑音抑圧部3705においては、様々な抑圧を行うことが可能であるが、代表的なものとして、SS(Spectrum Subtraction:スペクトル減算)法とMMSE STSA(Minimum Mean-Square Error Short-Time Spectral Amplitude Estimator:最小二乗平均誤差短時間振幅スペクトル推定)法とが挙げられる。SS法の場合は、変換部3701から供給された劣化信号振幅スペクトルから推定雑音スペクトルを減算する。MMSE STSA法の場合は、変換部3701から供給された劣化信号振幅スペクトルと生成した推定雑音スペクトルとを用いて、抑圧係数を計算し、この抑圧係数を劣化信号振幅スペクトルに乗算する。この抑圧係数は、強調信号の平均二乗パワーを最小化するように決定される。
 また、雑音抑圧部3705は、急変判定部3709から急変判定結果(信号の急変が存在するか否かの情報)を入力し、信号の急変の有無またはその程度に応じて、雑音抑圧の程度を変更する。例えば、信号急変のあった周波数成分、周波数帯域、あるいはフレーム単位で、その急変を抑圧すべく信号処理を施すことができる。
 急変判定部3709で急変と判定されたときには、劣化信号振幅スペクトルと推定雑音スペクトルのうち小さい方を、強調信号振幅スペクトルとして、振幅制御部3703へ供給する。すなわち、劣化信号振幅スペクトルが推定雑音スペクトルより小さいときには劣化信号振幅スペクトルをそのまま出力し、それ以外のときには入力信号を推定雑音スペクトルで置き換えて出力することもできる。
 さらに、この置き換えに先立って、重要な劣化信号振幅スペクトル成分を検出して、検出された重要な劣化信号振幅スペクトル成分を推定雑音スペクトルによる置き換えの対象から除外することもできる。重要な劣化信号振幅スペクトル成分を検出する際の重要度の指標としては、劣化信号振幅スペクトルの大きさを用いることができる。振幅が大きな成分は目的とする信号の成分である確率が高く、これを保持することは目的とする信号の音質劣化を防止することにつながる。
 また、重要度の指標として、劣化信号振幅スペクトルのピーク性を用いることもできる。ピーク、すなわち周波数軸に沿って周辺よりも大きな値を有する劣化信号振幅は、目的とする信号の成分である確率が高く、これを保持することは目的とする信号の音質劣化を防止することにつながる。特に、顕著なピーク、すなわち周辺の振幅値よりも著しく大きな振幅値はその重要度が高いので、確実に保護することで目的とする信号の音質をさらに高めることができる。
 ピークの検出は、例えば、非特許文献3の純音成分検出方法や、非特許文献4に、その方法が開示されている。さらに、検出されたピークを所定の条件に従って評価し、条件を満たさないピークは除外してもよい。例えば、前記推定雑音よりも小さな値をとるピークは、目的とする信号である可能性は低い。すなわち、推定雑音を基準として、それよりも十分に大きいものだけをピークとして残し、それ以外を除外することができる。十分に大きいかどうかは推定雑音の定数倍と比較することで、判定できる。このように、検出されたピークが所定の条件を満たすかどうかを評価してから最終的なピーク成分を選択することによって、誤ったピークの検出を低減し、信号急変部の抑圧効果を高くすることができる。
 また、急変存在の確からしさに応じて、振幅制御部3703へ供給する信号を変化させることもできる。その置き換えを行った結果と劣化信号振幅スペクトルを、急変存在の確からしさに対応して混合したものを、強調信号振幅スペクトルとして出力する。急変存在の確からしさが高いほど、置き換えを行った結果に大きな重みをつけて、混合処理を実行する。
 つまり、雑音抑圧部3705は、信号の急変の存在可能性に応じて、抑圧度0、抑圧度1、抑圧度2というように多段で抑圧を行なってもよい。あるいは急変判定部の判定結果(例えば0~1の数値)に応じて無段階に抑圧の程度を変えてもよい。
 《位相制御部および振幅制御部の構成》
 図39は位相制御部3702および振幅制御部3703の構成を示すブロック図である。図39に示すように、位相制御部3702は位相回転部3901と回転量生成部3902とを含み、振幅制御部3703は、補正量算出部3903と振幅補正部3904とを含む。
 回転量生成部3902は、急変判定部3709から「信号の急変が存在する」と判定された周波数成分について、劣化信号位相スペクトルの回転量を生成し、位相回転部3901と補正量算出部3903に供給する。位相回転部3901では、回転量生成部3902から回転量が供給されると、変換部3701から供給された劣化信号位相スペクトル3720を、供給された回転量だけ回転(シフト)させ、強調信号位相スペクトル3740として逆変換部3704へ供給する。
 補正量算出部3903では、回転量生成部3902から供給される回転量に基づいて、振幅の補正係数を決定し、振幅補正部3904に供給する。
 回転量生成部3902は、例えば乱数によって回転量を生成する。乱数により、劣化信号位相スペクトルを各周波数で回転させると、劣化信号位相スペクトル3720の形状が変化する。この形状の変化により、衝撃音などの信号急変部の特徴を弱めることができる。
 乱数には、その発生確率が一様な一様乱数や、発生確率が正規分布を示す正規乱数などがあるが、まず、一様乱数による回転量の生成法を説明する。一様乱数は線形合同法などで発生させることができる。例えば、線形合同法で発生させた一様乱数は、0~(2^M)-1の範囲に一様に分布する。ここで、Mは任意の整数であり、^はべき乗を表している。位相の回転量φは、0~2πの範囲に分布させる必要がある。そこで、発生させた一様乱数を変換する。変換は、以下の式で行う。ここで、Rは一様乱数であり、Rmaxはその一様乱数が発生しうる最大の値である。前述した線形合同法で発生させる場合には、Rmax=(2^M)-1となる。
Figure JPOXMLDOC01-appb-M000064
 計算の簡単化のために、Rの値をそのまま回転量とすることもできる。回転量であるので2πはちょうど一回転を表す。位相を2π回転させた場合は回転させていない場合と同一である。よって、2π+αという回転量は、回転量がαの場合と同じになる。ここでは、線形合同法により一様乱数を発生させた場合を説明したが、それ以外の方法で一様乱数を発生させた場合でも、上式により回転量φを求めればよい。急変判定部3709の判定結果に応じて、いつどのくらい乱数化を行なうのかを決定してもよい。
 位相回転部3901は、回転量生成部3902から回転量を受け取り、劣化信号位相スペクトルを回転させる。もし、劣化信号位相スペクトルが角度で表現されている場合には、その角度に回転量φの値を加算することで回転させることができる。劣化信号位相スペクトルが複素数の正規ベクトルで表現されている場合には、回転量φの正規ベクトルを求め、劣化信号位相スペクトルに乗算することで回転させることができる。
 回転量φの正規ベクトルは、以下の式で求められる。ここで、Φは回転ベクトルであり、jはsqrt(-1)を示す。なお、sqrtは二乗根を表している。
Figure JPOXMLDOC01-appb-M000065
 補正量算出部3903による、補正係数算出方法は、図5の補正量算出部503について説明した方法と同様であるため、ここでは説明を省略する。
 《算出部および急変判定部の構成》
 図40は、算出部3781、3782および急変判定部3709の内部構成について説明するための図である。図40に示すように、算出部3782は、急増部検出部4001、遅延時間算出部4002、位相変換部4003および傾き算出部4004を備える。一方、算出部3781は、傾き算出部4005を備える。
 急増部検出部4001は、フレーム内の信号の絶対値を算出し、その絶対値の最大値4010を検出する。遅延時間算出部4002は、フレーム内の最大値を示す相対位置(フレーム開始から最大値の存在するタイミングまでの時間)をn0として出力する。
 次に、位相変換部4003は、遅延時間τ4020を周波数領域の位相に変換する。具体的には以下の式に基づいて変換する。ここで、Lは変換部3701のフレーム長、0≦n0≦L―1である。入力が振幅aの孤立パルスであることを仮定すると、フーリエ変換によって得られるk番目の周波数成分D(k)は、次式で与えられる。
 D(k)=a・exp(- jθ(k))θ(k)=-2π・k・n0/L
 傾き算出部4004は、このように導き出した位相4030を微分して、周波数領域での位相の傾き4040を以下のように導き出す。傾き4040=-2π・n0/L
 一方、傾き算出部4005は、変換部3701から入力した位相成分信号を微分して、周波数領域での位相の傾き4050を導き出す。傾き算出部4004、4005はそれぞれ、位相の周波数による微分によって傾きを算出してもよいし、他の方法で傾きを算出してもよい。
 平行度算出部4006は、傾き算出部4004から提供された傾き4040と傾き算出部4005から提供された傾き4050とを、周波数ごとに比較してその傾きの類似度を算出する。つまり、周波数領域における位相成分信号の、算出部3782が算出した直線に対する算出部3781が算出した直線の平行度を各周波数で算出する。急変判定部4007では、そのような平行度が一定値を越えていれば、信号の急変がその周波数に存在すると判定する。
 ここで、周波数ごとではなく周波数帯域(サブバンド)またはフレームごとに判定すると、より大局的な判定によって、信号急変成分以外の位相成分による判定誤りを低減することができる。さらに、周波数帯域ごとまたはフレームごとの判定結果を用いて、周波数ごとの判定結果を修正してもよい。例えば、ある周波数帯域の判定結果が「信号急変が存在する」であるときに、その周波数帯域内の全周波数の判定結果を強制的に「信号急変が存在する」に設定することで、他の信号成分の妨害による判定誤りを低減することができる。その反対に、ある周波数帯域の判定結果が「信号急変が存在しない」であるときに、その周波数帯域内の全周波数の判定結果を強制的に「信号急変が存在しない」に設定することで、他の信号成分の妨害による判定誤りを低減することもできる。あるいは、前記帯域内の各周波数で、判定の容易さ(閾値)を「存在」と判定しやすい方向へ修正して、各周波数独自に判定を行うという構成自体は維持してもよい。周波数ごとまたは周波数帯域ごとに判定結果を求めると、周波数ごとまたは周波数帯域ごとに急変を抑圧することができ、より精度の高い信号急変の抑圧を行なうことが可能となる。
 急変判定部3709は判定結果4030として、信号急変あり(1)または信号急変無し(0)を出力する。ただし、急変判定部4007が平行度と対応させた、0と1の間の値を急変の存在可能性として出力するときには、判定結果4030は急変の存在可能性を表す0と1の間の値となる。その場合、信号急変が含まれている尤もらしさを得ることが可能となる。
 図41は、位相およびその変化量をグラフに示したものである。周波数領域において、周波数軸に沿って、グラフ4101のように位相が変化する場合、その位相変化量は、周波数領域において、周波数軸に沿って、グラフ4102に示すように変化する。
 一方、急増部のフレーム内相対位置から、周波数領域で直線4103として示される位相を算出できる。
 本実施形態では、位相成分信号4101と直線4103とが平行になる部分がどの程度あるかに応じて、信号急変の存在を判定する。
 位相の傾きを縦軸にとり、周波数を横軸にとると、直線4103の傾きに近似する範囲は、範囲4104で示される。したがって、範囲4104とグラフ4102との重なる部分4105が所定の閾値よりも大きい場合に、急変判定部4007は、信号急変が存在すると判定する。
 図42は、本実施形態にかかる雑音抑圧装置3700をソフトウェアを用いて実現する場合のハードウェア構成について説明する図である。
 雑音抑圧装置3700は、プロセッサ4210、ROM(Read Only Memory)4220、RAM(Random Access Memory)4240、ストレージ4250、入出力インタフェース4260、操作部4261、入力部4262、および出力部4263を備えている。雑音抑圧装置3700は、カメラ4264を備えていてもよい。プロセッサ4210は中央処理部であって、様々なプログラムを実行することにより雑音抑圧装置3700全体を制御する。
 ROM4220は、プロセッサ4210が最初に実行すべきブートプログラムの他、各種パラメータ等を記憶している。RAM4240は、不図示のプログラムロード領域の他に、入力信号310、位相成分信号320、振幅成分信号330、強調信号360を記憶する領域を有している。さらに、RAM4240は、振幅最大値タイミング4010、遅延時間4020、位相信号4030および位相の傾き4040、4050等を記憶する領域を有している。
 また、ストレージ4250は、雑音抑圧プログラム4251を格納している。雑音抑圧プログラム4251は、変換モジュール、位相制御モジュール、振幅制御モジュール、逆変換モジュール、雑音抑圧モジュール、位相傾き算出モジュール、および急変判定モジュールを含んでいる。雑音抑圧プログラム4251に含まれる各モジュールをプロセッサ4210が実行することにより、図3Aの変換部301、位相制御部302、振幅制御部303、逆変換部304、雑音抑圧部305、算出部381、382、急変判定部309の各機能を実現できる。なお、ストレージ4250はノイズデータベースを格納してもよい。
 プロセッサ4210が実行した雑音抑圧プログラム4251に関する出力である強調信号は、入出力インタフェース4260を介して出力部4263から出力される。これにより、例えば、入力部4262から入力した操作部4261の操作音などを抑圧することができる。また、入力部4262から入力した入力信号に信号急変が含まれたことを検出してカメラ4264による撮影を開始するなどといった適用法も可能である。
 図43Aは、上記雑音抑圧プログラム4251による信号急変判定処理の流れを説明するためのフローチャートである。ステップS4301では、相関除去部312、および算出部382において、低相関信号の急増部に対応した位相の傾き算出処理を開始させる。ステップS4303では、算出部381において、周波数領域での位相の傾き算出処理を開始させる。
 次にステップS4305において、ステップS4301とステップS4303の両方で傾きを算出するまで待機し、両方のやり方で傾きが算出できれば、ステップS4307に進み、算出した傾きを周波数ごとに比較する。ステップS4309において、傾きの差分絶対値が所定の閾値N以下か否かを判定し、N以下であれば、ステップS4311に進み、その周波数kについて、フラグを立てる(I(k)=1とする)。一方、N以下でない場合、ステップS4313においてI(k)=0とする。ステップS4315ではk=F(Fはフレーム全体の周波数成分数)を判定し、k=Fでなければ、ステップS4317に進み、k=k+1としてステップS4307に戻り、フレーム全体にわたって周波数ごとに傾き比較を行なう。最終的には、ステップS4319において、I(k)=1となったkの周波数で信号の急変ありと判定し、判定結果を、雑音抑圧部3705および位相制御部302に供給する。なお、ステップS4319に変えて、フレーム内でI(k)を積算し、I(k)の積算値が所定の閾値を超えた場合に、急変判定部3709は信号の急変を含むフレームと判定してもよい。また、この際、急変判定結果を次の周波数帯域にハングオーバして積算してもよい。
 また、ハングオーバーの作用として、続くフレームにおける閾値Nを大きく、設定することができる。このように続くフレームの閾値を設定することによって、信号急変(衝撃音)の検出を容易にし、検出漏れを低減することができる。
 図43Bは、相関除去部3712、および算出部3782が行なう傾き算出処理の流れを説明するためのフローチャートである。まず、ステップS4321で信号を入力すると、ステップS4322に進んで、相関除去部3712が、入力信号310に含まれている時間相関のある成分を予測してこれを取り除き、低相関信号を生成した後にフレーム分割を行なう。ステップS4325では、急増部検出部4001が、低相関信号の急増部を検出する。ステップS4327では、遅延時間算出部4002が急増部のフレーム内相対位置(フレーム開始から急増部の存在するタイミングまでの時間)をn0として出力する。
 次に、ステップS4329において位相変換部4003は、遅延時間n04020を周波数領域の位相に変換する。ステップS4331において、傾き算出部4004は、導き出した位相を微分して、周波数領域での位相の傾きを導き出し、ステップS4333でバッファリングする。
 図43Cは、算出部3781が行なう傾き算出処理の流れを説明するためのフローチャートである。ステップS4351で信号を入力するとステップS4353に進み、フレーム分割、窓処理を経てフーリエ変換により、周波数領域での位相成分信号を抽出する。次にステップS4355で、周波数のステップkを1に設定すると、ステップS4357では、位相P(k)を微分して傾きΔP(k)を算出し、ステップS4359において、その傾きをバッファリングする。ステップS4361では、k=F(Fはフレーム全体の周波数成分数)を判定し、k=Fでなければ、ステップS4363に進み、k=k+1としてステップS4357に戻り、フレーム全体にわたって周波数ごとに傾き算出を行なう。
 以上の処理により、相関を除去した低相関信号を用いて信号急変部での位相の傾きを推定して比較するので、入力信号に時間相関のある成分が含まれている状況において、信号の急変の検出精度を大幅に向上させることができる。例えば、音楽が大音量で鳴っている状況で、信号の急変がある場合、本実施形態の方法によれば、その検出精度を大幅に向上させることができる。結果的に、信号の急変をより正確に検出することができ、適宜、その信号急変を適切に抑圧することが可能となる。なお、本実施形態では位相の傾きを微分値で求めたが、単位ベクトルの回転量など別の指標を求めて、判定に用いてもよい。
 [第14実施形態]
 次に本発明の第14実施形態に係る雑音抑圧装置について、図44を用いて説明する。図44は、本実施形態に係る雑音抑圧装置4400の機能構成を説明するための図である。本実施形態に係る雑音抑圧装置4400は、上記第13実施形態と比べると、相関除去部3712と算出部3782との間に窓かけ部4486を設けた点が異なる。その他の構成および動作は、第13実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
 以上説明したとおり本実施形態によれば、窓がけ後の時間領域信号、すなわちフーリエ変換に用いる信号と同じ信号から求めた傾きを用いて平行度を求めることができる。これにより、周波数領域信号を用いて求めた位相の傾きとの整合性が高くなり、より正確な信号の急変判定を行うことができる。
 [第15実施形態]
 次に本発明の第15実施形態に係る雑音抑圧装置4500について、図45を用いて説明する。図45は、本実施形態に係る雑音抑圧装置4500の機能構成を説明するための図である。本実施形態に係る雑音抑圧装置4500は、上記第13実施形態と比べると、振幅平坦度算出部4501を追加的に備えている点で異なる。その他の構成および動作は、第13実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
 振幅平坦度算出部4501は、周波数軸に沿った振幅変化を算出して、急変判定部4509に供給する。隣接する周波数間で振幅の変化が小さい周波数が信号急変を表す。振幅変化は、帯域ごと、あるいは全周波数のいずれかに対して、一つの平坦度を求めてもよい。具体的には、以下の式のように、平坦度を表わすFM(Flatness Measure)を求める。x(n)は周波数nにおける振幅またはパワースペクトル、Nは平坦度算出区間に含まれる周波数成分の数である。
Figure JPOXMLDOC01-appb-M000066

 FMは0.0から1.0の値をとる。完全に平坦な場合、FMは1.0である。平坦度については、非特許文献3に開示がある。
 平坦度はまた、別の指標を用いて表すこともできる。例えば、帯域ごと、あるいは全周波数のいずれかに対してx(n)の平均を求め、各周波数成分nにおけるx(n)とその平均値との差分二乗値総和を帯域ごと、あるいは全周波数の平坦度とすることができる。全周波数の代わりに、単一あるいは複数の周波数帯域において前記差分二乗値総和を一つ求め、これを平坦度とすることもできる。このようにして求めた平坦度は、完全に平坦な場合に0.0、平坦度が低下するに従って大きな値をとる。
 別の平坦度の指標として、滑らかさを用いてもよい。滑らかさは、周波数軸に沿った隣接サンプル間の差分絶対値総和で表現することができる。凹凸の多い(滑らかでない)波形で滑らかさは大きな値を、少ない(滑らかな)波形で小さな値をとる。この指標は、全変動量(TV: Total Variation)として知られている。
 これまで、平坦度として周波数軸に沿った平坦度を用いてきたが、時間軸に沿った平坦度を利用することもできる。信号急変部では急激に振幅およびパワーが増加するので、この性質を用いると、時間軸に沿った平坦度が低いときに、信号急変が存在すると判定することができる。具体的には、現フレームと直前フレームの振幅またはパワーの差が一定値以上となるときに、平坦度が低い、すなわち信号急変が存在すると判定する。また、数フレーム過去のフレームから現在のフレームまでの複数フレームに対して隣接フレーム間の振幅またはパワーの差を求め、これらを線形または非線形結合した結果を平坦度として定義することもできる。過去のフレームの情報を用いることで、低域成分を含むなまった信号急変部を検出しやすくなり、その抑圧性能が向上する。なお、隣接フレームの振幅またはパワー差を計算する際には、これを周波数成分ごと、帯域ごと、あるいは全周波数のいずれかに対して計算してもよい。さらに、単一または複数の帯域に対して前記振幅またはパワー差を計算することもできる。例えば、単一の帯域、特に高周波域で前記振幅またはパワー差を計算することによって、音声やその他の信号の影響を低減することができ、より正確に信号急変部を検出することが可能となる。
 これまで説明した2つの平坦度、すなわち周波数軸に沿った平坦度と時間軸に沿った平坦度は、それぞれを単独で用いることもできるし、両方を組み合わせて用いることもできる。組合せの例としては、2つの平坦度の線形または非線形結合に基づく信号急変部の検出や、それぞれの平坦度に基づいた検出結果の組合せなどがある。周波数方向の平坦度は大きいときに、時間方向の平坦度は小さいときに信号急変の検出と判定するので、組合せの際にどちらかを逆数にしてから組み合わせるなどの工夫が必要となる。
 急変判定部4509は、傾きの類似度(平行度)と振幅平坦度の2つの指標を用いて、信号の急変を判定する。振幅が周波数軸に沿って平坦である(バラツキが小さい)とき、信号急変部である可能性が高いと考えられるからである。これは、信号急変がパルス性(短時間に振幅が増加して、減少する)であることと、インパルスのフーリエ変換が白色信号(全周波数で振幅およびパワーが等しい)となることから自明である。判定の方法としては例えば以下のいずれかを選択することができる。
 (1)平行度と振幅平坦度が共にそれぞれの条件を満たす場合(例えば傾きの差分値がN=0.1以下で、振幅平坦度FMがМ=0.8以上の場合)、信号の急変があると判定。
 (2)平行度と振幅平坦度を単独で用いたときの判定結果の論理和。信号急変の存在可能性を算出するときは、平行度による存在可能性と振幅平坦度による存在可能性のうち、大きい方(または小さい方)に基づく判定。
 (3)平行度と振幅平坦度の両方の平均が条件を満たす場合(例えば傾きの差分値PXと、振幅平坦度FMと1.0との差分値QX=(1.0-FM)との平均AV1=(PX+QX)/2が0.1以下)に、信号の急変があると判定。
 (4)傾きの差分値と振幅平坦度とに対して重み付けを行ないつつ両方を合わせた複合的な条件を満たす場合(例えば傾きの差分値PXと、振幅平坦度FMと1.0との差分値QX=(1.0-FM)との重み付け平均AV2=(0.8×PX+0.2×QX)が0.1以下)に、信号の急変があると判定。
 (5)傾きの差分値と振幅平坦度とを、線形または非線形関数を用いて組み合わせ、組み合わせた結果が一定値より大きいときに信号の急変があると判定。時間方向の振幅平坦度が含まれるときには、その逆数を代わりに用いる。
 (6)傾きの差分値と振幅平坦度との中でいずれか理想値により近い方(差分値は小さい方、平坦度は大きい方)のみを用いて、その理想値により近い方が条件を満たす場合に信号の急変があると判定。時間方向の振幅平坦度が含まれるときには、その逆数を代わりに用いる。
 (7)事前に検出しようとする急変信号の振幅またはパワースペクトルに関する情報が得られて、振幅またはパワースペクトルが平坦であれば、傾きの差分値の重みを小さくする。
 (8)事前に検出しようとする急変信号の振幅またはパワースペクトルに関する情報が得られて、振幅またはパワースペクトルの最小値よりも入力された劣化信号の振幅またはパワースペクトルが小さいときは、信号急変を検出するための閾値を一時的に大きく変更して、検出されにくくする。
 特定の信号を処理する場合、例えばノイズが小さくてインパルスに近い衝撃音を検出・抑圧する場合、振幅またはパワーに関する情報の方が位相情報よりも信頼できるときがある。例えば、静かな環境でピストルの発砲音を検出する際には、振幅のみを用いて検出してもよい。一方、ノイズの振幅またはパワーが大きく変化する場合、例えば、空港の警備での発砲音の検出の場合、静かな(ノイズが小さい)状況と、ノイズが大きい状況とで、振幅と位相の重み付けを変えることが効果的である。この場合、振幅と位相の重み付けを、ノイズの有無や時間帯に応じて変化させてもよい。例えば、管制塔からフライトスケジュールの最新情報を入手することができれば、飛行機の離着陸時刻が分かるため、飛行機が来るタイミング(ノイズが多いタイミング)では位相の重み付けを大きくして発砲音の検出に用いることができる。発砲音(検出対象の衝撃音)以外の信号が混在するときには、位相情報を用いた衝撃音の検出が振幅を用いた検出よりも効果的だからである。一方、ノイズが小さい状況では、入力された劣化信号の周波数領域ベクトルの絶対値、つまり振幅値を重視して判定する方が効果的に衝撃音を検出できる。もちろんここでも振幅スペクトルの代わりにパワースペクトルの値を用いてもよい。また、信号の種類によって、衝撃音の振幅が平坦でない場合がある。その場合は、位相平坦度の重みを大きくして検出を行なうことにより高精度で信号の急変を検出できる。さらに、衝撃音の振幅またはパワースペクトルに関する情報が事前に得られるときには、得られた情報を用いて振幅が平坦なときと同じ結果が得られるように、振幅平坦度の計算結果を補正することもできる。具体的には、振幅スペクトル3730を衝撃音の振幅またはパワースペクトル形状の逆数を各周波数成分で乗じた後に、振幅平坦度を算出する。
 以上説明したとおり本実施形態によれば、振幅平坦度を併せて用いて信号急変部を検出することができる。これにより、信号急変(衝撃音)をより正確に検出することができ、適宜、その信号急変(衝撃音)を適切に抑圧することが可能となる。
 [第16実施形態]
 本発明の第16実施形態としての信号処理装置4600について、図46を用いて説明する。信号処理装置4600は、入力信号急変を検出するための装置である。
 図46に示すように、信号処理装置4600は、変換部4601と直線性計算部4602と信号急変判定部4604とを含む。変換部4601は、入力信号4610を、周波数領域における位相成分信号4620および振幅成分信号4630に変換する。直線性計算部4602は、位相成分信号4620の直線性4640を計算する。また、信号急変判定部4604は、直線性計算部4602によって計算された直線性4640に基づいて入力信号急変の存在可能性(推定された存在確率)を計算する。
 以上の構成により、周波数領域における位相成分信号がどの程度直線的であるかに応じて、入力信号の急変を精度良く検出することができる。
 [第17実施形態]
 《全体構成》
 本発明の第17実施形態としての雑音抑圧装置について図47乃至図54を用いて説明する。本実施形態の雑音抑圧装置は、例えばデジタルカメラ、ノートパソコン、携帯電話、キーボード、ゲーム機のコントローラ、携帯電話の押しボタンなどの雑音抑圧に適用できる。すなわち、音声、音楽、環境音などの目的とする信号(所望信号)を、これらに重畳された信号(ノイズまたは妨害信号)に対して強調することができる。ただし、本発明はこれに限定されるものではなく、入力信号からの信号急変判定を要求されるあらゆる信号処理装置に適用可能である。なお、本実施形態では、信号の急変の一例として、衝撃音を検出して抑圧する雑音抑圧装置について説明する。本実施形態としての雑音抑圧装置は、例えば、マイクの近くでボタン押下などの操作がなされるような形態において、かかるボタン操作により発生する衝撃音を適切に抑圧する。簡単に説明すると、衝撃音を含む時間領域信号を周波数領域信号に変換し、周波数空間に対する位相成分の直線性を計算する。そして、直線性の高さ(傾きのバラツキ)に応じて、衝撃音の存在可能性(推定された存在確率)を計算する。
 図47は、雑音抑圧装置4700の全体構成を示すブロック図である。入力端子4706には、劣化信号(所望信号と雑音の混在する信号)が、サンプル値系列として供給される。入力端子4706に供給された劣化信号は、変換部4701においてフーリエ変換などの変換を施されて複数の周波数成分に分割される。複数の周波数成分は周波数ごとに独立して処理される。ここでは、特定の周波数成分に注目して説明を続ける。周波数成分のうち振幅スペクトル(振幅成分)4730は雑音抑圧部4705へ供給され、位相スペクトル(位相成分)4720は位相制御部4702および直線性計算部4708に供給される。なお、ここでは変換部4701が雑音抑圧部4705に劣化信号振幅スペクトル4730を供給しているが、本発明はこれに限定されるものではなく、その二乗に相当するパワースペクトルを雑音抑圧部4705に供給してもよい。
 雑音抑圧部4705は、変換部4701から供給される劣化信号振幅スペクトル4730を用いて、雑音を推定し、推定雑音スペクトルを生成する。また、雑音抑圧部4705は、変換部4701から供給された劣化信号振幅スペクトル4730と、生成した推定雑音スペクトルとを用いて雑音を抑圧し、雑音抑圧結果としての強調信号振幅スペクトルを振幅制御部4703に伝達する。さらに雑音抑圧部4705は、急変判定部4709から判定結果を入力し、信号の急変の有無またはその程度に応じて、異なった強度で雑音を抑圧する。雑音抑圧部4705は、所望信号の検出を行って所望信号成分を周波数ごとに保護する一方、信号急変が存在し、所望信号成分が検出されないときには、振幅を推定背景音に置換してもよい。
 位相制御部4702は、変換部4701から供給された劣化信号位相スペクトル4720を回転(シフト)させ、強調信号位相スペクトル4740として逆変換部4704へ供給する。また、位相の回転量(シフト量)を、振幅制御部4703へ伝達する。振幅制御部4703は、位相制御部4702から位相の回転量(シフト量)を受け取って振幅補正量を算出し、その振幅補正量を用いて、強調信号振幅スペクトルを各周波数で補正し、補正振幅スペクトル4750を逆変換部4704へ供給する。逆変換部4704は、位相制御部4702から供給された強調信号位相スペクトル4740と、振幅制御部4703から供給された補正振幅スペクトルとを合成して逆変換を行い、強調信号として、出力端子4707に供給する。
 直線性計算部4708は、変換部4701から供給された位相スペクトル4720を用いて、その周波数領域での直線性を計算する。急変判定部4709は、直線性計算部4708が計算した直線性に基づいて、信号急変の存在可能性(推定された存在確率)を計算する。
 衝撃音(信号の急変)が存在するときに、位相の直線を用いてその存在可能性を推定できる理由は次の通りである。変換部4701のフレーム内に孤立パルスが存在すると仮定する。孤立パルスをフーリエ変換したときの周波数方向の位相の傾きは、孤立パルスの位置に対応して一意に求まることが知られている。例えば、変換部におけるフレーム長がLサンプルで孤立パルス位置がn0(0≦n0≦L―1)であるとき、位相の傾きは-2πn0/Lとなる。これは、振幅aの孤立パルスに関して、フーリエ変換によって得られるk番目の周波数成分D(k)が、次式で与えられるためである。
 D(k)=a・exp(jθ(k))θ(k)=-2π・k・n0/L
 位相θ(k)は、明らかにk、すなわち周波数に比例しており、右下がりの直線となっている。
 《変換部の構成》
 図48は、変換部4701の構成を示すブロック図である。図48に示すように、変換部4701はフレーム分割部4801、窓がけ処理部(windowing unit)4802、およびフーリエ変換部4803を含む。劣化信号サンプルは、フレーム分割部4801に供給され、K/2サンプルごとのフレームに分割される。ここで、Kは偶数とする。フレームに分割された劣化信号サンプルは、窓がけ処理部4802に供給され、窓関数(window function)であるw(t)との乗算が行なわれる。第nフレームの入力信号yn(t) (t=0, 1, ..., K/2-1) に対するw(t)で窓がけ(windowing)された信号は、次式で与えられる。
Figure JPOXMLDOC01-appb-M000067

 また、連続する2フレームの一部を重ね合わせ(オーバラップ)して窓がけしてもよい。オーバラップ長としてフレーム長の50%を仮定すれば、t=0, 1, ..., K/2-1 に対して、以下の式で得られる左辺が、窓がけ処理部4802の出力となる。
Figure JPOXMLDOC01-appb-M000068

 実数信号に対しては、左右対称窓関数が用いられる。また、窓関数は、変換部4701の出力を逆変換部4704に直接供給したときの入力信号と出力信号が計算誤差を除いて一致するように設計される。これは、w2(t)+w2(t+K/2)=1 となることを意味する。
 以後、連続する2フレームの50%をオーバラップして窓がけする場合を例として説明を続ける。w(t)としては、例えば、次式に示すハニング窓を用いることができる。
Figure JPOXMLDOC01-appb-M000069

 このほかにも、ハミング窓、三角窓など、様々な窓関数が知られている。窓がけされた出力はフーリエ変換部4803に供給され、劣化信号スペクトルYn(k)に変換される。劣化信号スペクトルYn(k)は位相と振幅に分離され、劣化信号位相スペクトル arg Yn(k)は、位相制御部4702と直線性計算部4708に、劣化信号振幅スペクトル|Yn(k)|は、雑音抑圧部4705に供給される。既に説明したように、振幅スペクトルの代わりにパワースペクトルを利用することもできる。
 《逆変換部の構成》
 図49は、逆変換部4704の構成を示すブロック図である。図49に示すように、逆変換部4704は逆フーリエ変換部4901、窓がけ処理部4902およびフレーム合成部4903を含む。逆フーリエ変換部4901は、振幅制御部4703から供給された強調信号振幅スペクトル4750と位相制御部4702から供給された強調信号位相スペクトル4740 arg Xn(k)とを乗算して、強調信号(以下の式の左辺)を求める。
Figure JPOXMLDOC01-appb-M000070

 得られた強調信号に逆フーリエ変換を施し、1フレームがKサンプルを含む時間領域サンプル値系列xn(t) (t=0, 1, ..., K-1)として、窓がけ処理部4902に供給され、窓関数w(t)との乗算が行なわれる。第nフレームの入力信号xn(t) (t=0, 1, ..., K/2-1)に対してw(t)で窓がけされた信号は、次式の左辺で与えられる。
Figure JPOXMLDOC01-appb-M000071
 また、連続する2フレームの一部を重ね合わせ(オーバラップ)して窓がけしてもよい。フレーム長の50%をオーバラップ長として仮定すれば、t=0, 1, ..., K/2-1 に対して、以下の式の左辺が、窓がけ処理部4902の出力となり、フレーム合成部4903に伝達される。
Figure JPOXMLDOC01-appb-M000072
 フレーム合成部4903は、窓がけ処理部4902からの隣接する2フレームの出力を、K/2サンプルずつ取り出して重ね合わせ、以下の式によって、t=0, 1, ..., K-1における出力信号(式の左辺)を得る。得られた強調音声信号4760は、フレーム合成部4903から出力端子4707に伝達される。
Figure JPOXMLDOC01-appb-M000073

 なお、図48と図49において変換部と逆変換部における変換をフーリエ変換として説明したが、フーリエ変換に代えて、アダマール変換、ハール変換、ウェーブレット変換など、他の変換を用いることもできる。ハール変換は、乗算が不要となり、LSI化したときの面積を小さくすることができる。ウェーブレット変換は、周波数によって時間解像度を異なったものに変更できるために、雑音抑圧効果の向上が期待できる。
 また、変換部4701において得られる周波数成分を複数統合してから、雑音抑圧部4705で実際の抑圧を行うこともできる。統合後の周波数成分の数は、統合前の周波数成分の数よりも小さくなる。具体的には、周波数成分の統合によって得られる統合周波数成分に対して共通の抑圧度を求め、その抑圧度を同一統合周波数成分に属する個別の周波数成分に対して共通に用いる。その際、聴覚特性の弁別能力が高い低周波領域から、能力が低い高周波領域に向かって、よりたくさんの周波数成分を統合することによって、高い音質を達成することができる。このように、複数の周波数成分を統合してから雑音抑圧を実行すると、雑音抑圧を適用する周波数成分の数が少なくなり、全体の演算量を削減することができる。
 《雑音抑圧部の構成》
 雑音抑圧部4705は、変換部4701から供給される劣化信号振幅スペクトルを用いて雑音を推定し、推定雑音スペクトルを生成する。そして、変換部4701からの劣化信号振幅スペクトルと生成した推定雑音スペクトルとを用いて抑圧係数を求め、劣化信号振幅スペクトルに乗じ、強調信号振幅スペクトルとして、振幅制御部4703へ供給する。また、急変判定部4709から信号急変の存在可能性(信号の急変がどの程度存在するかの情報)を受けて、存在可能性に応じて、劣化信号振幅スペクトルと推定雑音スペクトルを混合したものを、強調信号振幅スペクトルとして、振幅制御部4703へ供給する。このとき、雑音抑圧部4705は、所望信号の検出を行って所望信号成分を周波数ごとに保護してもよい。
 雑音の推定には、非特許文献1や非特許文献2に記載の方法など、様々な推定方法が利用できる。
 例えば、非特許文献1には、推定雑音スペクトルを、所望信号が発生していないフレームの劣化信号振幅スペクトルの平均値とする方法が開示されている。この方法では所望信号の存在を検出する必要がある。所望信号の存在する区間は、強調信号のパワーで判断することができる。
 理想的な動作状態として、強調信号は雑音以外の所望信号となっている。また、所望信号や雑音のレベルは、隣接フレーム間で大きく変化しない。これらのことから、1フレーム過去の強調信号レベルを雑音区間判定の指標とする。1フレーム過去の強調信号パワーが一定値以下の時には、現フレームを雑音区間と判定する。雑音スペクトルは、雑音区間と判定されたフレームの劣化信号振幅スペクトルを平均化することで推定できる。
 また、非特許文献1には、推定雑音スペクトルを、劣化信号振幅スペクトルが供給され始めた推定初期の平均値とする方法も開示されている。この場合、推定が開始された直後には所望信号が含まれないという条件を満たす必要がある。条件が満たされる場合、推定初期の劣化信号振幅スペクトルを推定雑音スペクトルとすることができる。
 さらに、非特許文献2には、推定雑音スペクトルを、統計的な劣化信号振幅スペクトルの最小値から求める方法が開示されている。この方法では、統計的に一定時間における劣化信号振幅スペクトルの最小値を保持し、その最小値から雑音スペクトルを推定する。劣化信号振幅スペクトルの最小値は、雑音スペクトルのスペクトル形状と似ているため、雑音スペクトル形状の推定値として用いることができる。しかし、最小値では、本来の雑音レベルより小さくなる。そのため、最小値を適切に増幅させたものを推定雑音スペクトルとして用いる。
 雑音抑圧部4705においては、様々な抑圧を行うことが可能であるが、代表的なものとして、SS(Spectrum Subtraction:スペクトル減算)法とMMSE STSA(Minimum Mean-Square Error Short-Time Spectral Amplitude Estimator:最小二乗平均誤差短時間振幅スペクトル推定)法とが挙げられる。SS法の場合は、変換部4701から供給された劣化信号振幅スペクトルから推定雑音スペクトルを減算する。MMSE STSA法の場合は、変換部4701から供給された劣化信号振幅スペクトルと生成した推定雑音スペクトルとを用いて、抑圧係数を計算し、この抑圧係数を劣化信号振幅スペクトルに乗算する。この抑圧係数は、強調信号の平均二乗パワーを最小化するように決定される。
 また、雑音抑圧部4705は、急変判定部4709から受けた急変の存在可能性(信号の急変がどの程度存在するかの情報)に応じて、雑音抑圧の程度を変更する。例えば、存在可能性に応じて、劣化信号振幅スペクトルと推定雑音スペクトルを混合したものを、強調信号振幅スペクトルとして、振幅制御部4703へ供給してもよい。具体的には、信号急変の存在可能性の高い周波数成分、周波数帯域、あるいはフレーム単位で、その急変を抑圧すべく、より推定雑音スペクトルの混合割合を高く(強力な抑圧を適用)する。抑圧程度の設定は、存在可能性に応じて無段階に制御してもよいし、抑圧度0、抑圧度1、抑圧度2というように多段で(離散的な段階で)抑圧を行なってもよい。
 さらに、この置き換えに先立って、重要な劣化信号振幅スペクトル成分を検出して、検出された重要な劣化信号振幅スペクトル成分を推定雑音スペクトルによる置き換えの対象から除外したり、劣化信号振幅スペクトルの混合割合を高くしたりすることもできる。重要な劣化信号振幅スペクトル成分を検出する際の重要度の指標としては、劣化信号振幅スペクトルの大きさを用いることができる。振幅が大きな成分は目的とする信号の成分である確率が高く、これを保持することは目的とする信号の音質劣化を防止することにつながる。
 また、重要度の指標として、劣化信号振幅スペクトルのピーク性を用いることもできる。ピーク、すなわち周波数軸に沿って周辺よりも大きな値を有する劣化信号振幅は、目的とする信号の成分である確率が高く、これを保持することは目的とする信号の音質劣化を防止することにつながる。特に、顕著なピーク、すなわち周辺の振幅値よりも著しく大きな振幅値はその重要度が高いので、確実に保護することで目的とする信号の音質をさらに高めることができる。
 ピークの検出は、例えば、非特許文献3の純音成分検出方法や、非特許文献5に、その方法が開示されている。さらに、検出されたピークを所定の条件に従って評価し、条件を満たさないピークは除外してもよい。例えば、前記推定雑音よりも小さな値をとるピークは、目的とする信号である可能性は低い。すなわち、推定雑音を基準として、それよりも十分に大きいものだけをピークとして残し、それ以外を除外することができる。十分に大きいかどうかは推定雑音の定数倍と比較することで、判定できる。このように、検出されたピークが所定の条件を満たすかどうかを評価してから最終的なピーク成分を選択することによって、誤ったピークの検出を低減し、信号急変部の抑圧効果を高くすることができる。
 《位相制御部および振幅制御部の構成》
 図50は位相制御部4702および振幅制御部4703の構成を示すブロック図である。図50に示すように、位相制御部4702は位相回転部5001と回転量生成部5002とを含み、振幅制御部4703は、補正量算出部5003と振幅補正部5004とを含む。
 回転量生成部5002は、急変判定部4709から「信号の急変が存在する」と判定された周波数成分について、劣化信号位相スペクトルの回転量を生成し、位相回転部5001と補正量算出部5003に供給する。位相回転部5001では、回転量生成部5002から回転量が供給されると、変換部4701から供給された劣化信号位相スペクトル4720を、供給された回転量だけ回転(シフト)させ、強調信号位相スペクトル4740として逆変換部4704へ供給する。
 補正量算出部5003では、回転量生成部5002から供給される回転量に基づいて、振幅の補正係数を決定し、振幅補正部5004に供給する。
 回転量生成部5002は、例えば乱数によって回転量を生成する。乱数により、劣化信号位相スペクトルを各周波数で回転させると、劣化信号位相スペクトル4720の形状が変化する。この形状の変化により、衝撃音などの信号急変部の特徴を弱めることができる。
 乱数には、その発生確率が一様な一様乱数や、発生確率が正規分布を示す正規乱数などがあるが、まず、一様乱数による回転量の生成法を説明する。一様乱数は線形合同法などで発生させることができる。例えば、線形合同法で発生させた一様乱数は、0~(2^M)-1の範囲に一様に分布する。ここで、Mは任意の整数であり、^はべき乗を表している。位相の回転量φは、0~2πの範囲に分布させる必要がある。そこで、発生させた一様乱数を変換する。変換は、以下の式で行う。ここで、Rは一様乱数であり、Rmaxはその一様乱数が発生しうる最大の値である。前述した線形合同法で発生させる場合には、Rmax=(2^M)-1となる。
Figure JPOXMLDOC01-appb-M000074
 計算の簡単化のために、Rの値をそのまま回転量とすることもできる。回転量であるので2πはちょうど一回転を表す。位相を2π回転させた場合は回転させていない場合と同一である。よって、2π+αという回転量は、回転量がαの場合と同じになる。ここでは、線形合同法により一様乱数を発生させた場合を説明したが、それ以外の方法で一様乱数を発生させた場合でも、上式により回転量φを求めればよい。急変判定部4709の判定結果に応じて、いつどのくらい乱数化を行なうのかを決定してもよい。
 位相回転部5001は、回転量生成部5002から回転量を受け取り、劣化信号位相スペクトルを回転させる。もし、劣化信号位相スペクトルが角度で表現されている場合には、その角度に回転量φの値を加算することで回転させることができる。劣化信号位相スペクトルが複素数の正規ベクトルで表現されている場合には、回転量φの正規ベクトルを求め、劣化信号位相スペクトルに乗算することで回転させることができる。
 回転量φの正規ベクトルは、以下の式で求められる。ここで、Φは回転ベクトルであり、jはsqrt(-1)を示す。なお、sqrtは二乗根を表している。
Figure JPOXMLDOC01-appb-M000075

 補正量算出部5003による補正係数算出方法は、図5の補正量算出部503について説明した方法と同様であるため、ここでは説明を省略する。
 《直線性計算部および急変判定部の構成》
 図51は、直線性計算部4708および急変判定部4709の内部構成について説明するための図である。図51に示すように、直線性計算部4708は、周波数方向に位相の変化量を算出する変化量算出部5101と、位相の変化量の平坦度を算出する平坦度算出部5102を含んでいる。変化量算出部5101は、位相成分信号4720(p(k)、kは周波数)を入力して、隣接する周波数の位相差Δp(k)=p(k)-p(k-1)を位相の変化量5110(位相の傾き)として求める。
 平坦度算出部5102は、変化量算出部5101で得られた位相変化量Δp(k)=p(k)-p(k-1)の、周波数軸に沿った平坦度(バラツキ)を調べる。隣接する周波数の位相変化量の差Δ2p(k)=Δp(k)-Δp(k-1)を平坦度5120とする。位相変化量が平坦であれば差分は0になる。周波数成分ごと、帯域ごと、全周波数のいずれかに対して、一つの平坦度5120を求めてもよい。また、単一あるいは複数の帯域における平坦度を統合して、全周波数における平坦度の代わりに用いてもよい。
 ここで、周波数ごとではなく周波数帯域(サブバンド)またはフレームごとに平坦度を求めると、より大局的な判定によって、信号急変成分以外の位相成分による平坦度の誤差を低減することができる。例えば、フレームごとの平坦度として、各周波数における平坦度の周波数方向総和を求めてもよい。この修正によって、各周波数における平坦度の信頼性を高めることができる。さらに、周波数帯域ごとまたはフレームごとの平坦度を用いて、周波数ごとの平坦度を修正してもよい。例えば、ある周波数帯域の平坦度が「信号急変が存在する」ことを表すときに、その周波数帯域内の全周波数の平坦度を強制的に「信号急変が存在する」を表すように修正することで、他の信号成分の妨害による平坦度の誤差を低減することができる。その反対に、ある周波数帯域の平坦度が「信号急変が存在しない」を表すときに、その周波数帯域内の全周波数の平坦度を強制的に「信号急変が存在しない」を表すように修正することで、他の信号成分の妨害による平坦度の誤差を低減することもできる。あるいは、前記帯域内の各周波数で、平坦度を「存在」と判定しやすい方向へ一律に修正して、各周波数独自の平坦度を求めるという構成自体は維持してもよい。周波数ごとまたは周波数帯域ごとに平坦度を求めると、周波数ごとまたは周波数帯域ごとに急変の抑圧程度を変更することができ、より精度の高い抑圧を行なうことが可能となる。
 さらに、位相の微分値を位相変化量としてさらにその微分値を平坦度1220としてもよい。その場合、位相の二次微分値が0に近ければ(所定値以下であれば)平坦度が高いことになる。
 ここでは変化量算出部5101は、隣接周波数間の位相の差分を用いて変化量を算出したが、本発明はこれに限定されるものではない。位相の周波数による微分で直線性(位相変化の平坦度)を判定してもよい。複数の周波数における複数の微分結果のバラツキが小さいほど直線性が高い。局所的な直線性は、局所的な微分結果を用いて評価することができる。特に、隣接する2周波数成分間の微分は差分で近似できるので、その場合は複数の差分のバラツキが小さいほど直線性が高いと判断する。バラツキの指標として、平坦度(Flatness Measure)を用いることができる。
 急変判定部4709は、算出された平坦度を信号の急変が存在する可能性とする。さらに、平坦度を所定の線形関数、非線形関数、多項式などを用いて変換した結果を、信号の急変が存在する可能性5130として出力してもよい。信号の急変をその「存在可能性」として検出することによって、「存在そのもの」よりも高品質な抑圧を達成できる。これは、「存在そのもの」の判定、すなわち2値判定で判定誤りを生じた場合、抑圧に与える影響が致命的になるためである。「抑圧する」、または「抑圧しない」の2つだけの選択肢なので、抑圧するべきでないときに判定誤りによって抑圧を適用することで、致命的な歪を目的とする信号に与えることになり、これが知覚されることになる。反対に、抑圧するべきときに抑圧を適用しないと、信号の急変がそのまま残り、知覚される。反対に、「存在可能性」、すなわち連続的な値を用いて判定を行い、その判定結果に応じた程度の抑圧を行うことによって、どちらの判定誤りの影響をも小さくすることができる。
 図52は、位相およびその変化量をグラフに示したものである。周波数領域において、周波数軸に沿って、グラフ5201のように位相が変化する場合、その位相変化量は、周波数領域において、周波数軸に沿って、グラフ5202に示すように変化する。この変化の平坦度5203を導き出すことにより、位相の直線性を判別する。
 信号の急変部では位相が直線的に変化することが分かっているため、このように位相の直線性、すなわち位相変化の平坦度を算出することにより、信号の急変の存在可能性を評価することが可能となる。そして、衝撃音など信号の急変が存在するフレームにおいて、位相スペクトルを回転操作することにより、その急変を抑圧したり、その影響を低減することができるため、高品質な強調信号を得ることができる。
 図53は、本実施形態にかかる雑音抑圧装置4700をソフトウェアを用いて実現する場合のハードウェア構成について説明する図である。
 雑音抑圧装置4700は、プロセッサ5310、ROM(Read Only Memory)5320、RAM(Random Access Memory)5340、ストレージ5350、入出力インタフェース5360、操作部5361、入力部5362、および出力部5363を備えている。雑音抑圧装置4700は、カメラ5364を備えていてもよい。プロセッサ5310は中央処理部であって、様々なプログラムを実行することにより雑音抑圧装置4700全体を制御する。
 ROM5320は、プロセッサ5310が最初に実行すべきブートプログラムの他、各種パラメータ等を記憶している。RAM5340は、不図示のプログラムロード領域の他に、入力信号4710、位相成分信号4720、振幅成分信号4730、強調信号4760、位相変化量5110、平坦度5120および急変判定結果5130等を記憶する領域を有している。
 また、ストレージ5350は、雑音抑圧プログラム5351を格納している。雑音抑圧プログラム5351は、変換モジュール、位相制御モジュール、振幅制御モジュール、逆変換モジュール、雑音抑圧モジュール、直線性計算モジュール、急変判定モジュールを含んでいる。雑音抑圧プログラム5351に含まれる各モジュールをプロセッサ5310が実行することにより、図47の変換部4701、位相制御部4702、振幅制御部4703、逆変換部4704、雑音抑圧部4705、直線性計算部4708、急変判定部4709の各機能を実現できる。なお、ストレージ5350はノイズデータベースを格納してもよい。
 プロセッサ5310が実行した雑音抑圧プログラム5351の出力である強調信号は、入出力インタフェース5360を介して出力部5363から出力される。これにより、例えば、入力部5362から入力した操作部5361の操作音などを抑圧することができる。また、入力部5362から入力した入力信号に衝撃音が含まれたことを検出してカメラ5364による撮影を開始するなどといった適用法も可能である。
 図54は、上記雑音抑圧プログラム5351による処理の流れを説明するためのフローチャートである。まず、ステップS5401において、入力部5362から信号を入力すると、ステップS5403に進む。ステップS5403では、変換部4701が入力信号を周波数領域に変換して、振幅・位相に分割する。次に、ステップS5405では、離散周波数kを1に、カウント値Iを0に設定して、順次周波数空間での処理を開始する。ステップS5407に進むと、設定された周波数での位相の変化を算出する。さらにステップS5409では、位相変化の変化を算出する。位相変化の変化の大きさに応じて、位相の直線性を判断する。具体的には位相変化の変化がどれだけ0に近いかに基づいて、周波数kにおける直線性の高さの指標とする。さらにフレーム単位で信号急変の存在可能性を算出するために、位相変化の変化が所定の閾値N未満のとき、ステップS5413においてIをインクリメントする。
 一方、位相変化の変化が所定の閾値N以上の場合、位相変化が平坦ではない、すなわち位相の直線性が低いと判断して、IをインクリメントせずにステップS5415に進む。以上のステップS5407~S5413を、k=F(Fはフレーム全体の周波数成分数)になるまで繰り返す。最終的には、ステップS5417において、I(直線性の高い周波数)を所定の閾値Мと比較する。IがM以上の場合に衝撃音(信号急変)ありのフレームと判定し(S5421)、それ以外を衝撃音(信号急変)なしと判定する(S5423)。周波数ごとの信号急変存在可能性を、雑音抑圧部4705および位相制御部4702に供給する(S5425)。合わせて、フレームごとの信号急変存在の有無である判定結果を雑音抑圧部4705および位相制御部4702に供給してもよい。
 以上の処理により、衝撃音に代表される信号の急変をより正確に検出することができ、適宜、その衝撃音(信号の急変)を適切に抑圧することが可能となる。
 [第18実施形態]
 次に本発明の第18実施形態に係る雑音抑圧装置について、図55を用いて説明する。図55は、本実施形態に係る雑音抑圧装置5500の機能構成を説明するための図である。本実施形態に係る雑音抑圧装置5500は、上記第17実施形態と比べると、変換部5501が複素信号5550を生成し、直線性検出部5508および急変判定部5509がその複素信号5550に基づいて検出および判定を行なう点で異なる。その他の構成および動作は、第17実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
 図56は、直線性検出部5508および急変判定部4709の内部構成について説明するための図である。図56に示すように、直線性検出部5508は、周波数方向に位相の変化量を算出する変化量算出部5601と、位相の変化量の平坦度を算出する平坦度算出部5102を含んでいる。変化量算出部5601は、複素信号5550(q(k)(kは周波数))を入力して、隣接する周波数の位相差Δp(k)=p(k)-p(k-1)を、位相の変化量5110(位相の傾き)として求める。
 平坦度算出部5102は、変化量算出部5101で得られた位相変化量Δp(k)=p(k)-p(k-1)の、周波数軸に沿った平坦度(バラツキ)を調べる。隣接する周波数の位相変化量の差Δ2p(k)=Δp(k)-Δp(k-1)を平坦度5120とする。位相変化量が平坦であれば差分は0になる。周波数毎、帯域毎(周波数を任意の幅に区切った帯域)、全周波数のいずれかに対して、一つの平坦度5120を求めてもよい。また、位相の微分値を位相変化量としてさらにその微分値を平坦度5120としてもよい。その場合、位相の二次微分値が0に近ければ(所定値以下であれば)平坦と判定できる。帯域ごとに判定すると、よりきめ細かな処理を行なうことができる。つまり、衝撃音を帯域ごとに分けて消すこともでき、より精度のよい衝撃音抑圧を行なうことが可能となる。
 急変判定部4709は、例えば、算出された平坦度の絶対値が一定以下の場合、その平坦度に対応する周波数(一つの周波数成分、周波数帯域、または、全帯域(つまり一つのフレーム))は衝撃音を含むと判定する。判定結果5130としては、平坦度の絶対値と対応させた、0と1の間の値を判定結果5130として出力する。これにより、衝撃音が含まれている尤もらしさを得ることが可能となる。
 以上説明したとおり本実施形態では、位相成分信号の代わりに複素信号を用いて位相の直線性を検出することができる。
 [第19実施形態]
 次に本発明の第19実施形態に係る雑音抑圧装置について、図57を用いて説明する。図57は、本実施形態に係る雑音抑圧装置に含まれる直線性検出部5708の機能構成を説明するための図である。本実施形態に係る直線性検出部5708は、上記第18実施形態と比べると、単位ベクトル生成部5781と回転ベクトル変換部5782と回転ベクトル変換部5783とを備えている点で異なる。また、急変判定部5709が、回転ベクトルから、信号の急変の有無またはその程度を判定する点でも異なる。その他の構成および動作は、第18実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
 単位ベクトル生成部5781は、複素信号5550を用いて、入力スペクトル(複素ベクトル)を周波数ごとに単位ベクトル化する。具体的には、複素信号5550の実数部と虚数部をそれぞれ振幅値で除算する。
 回転ベクトル変換部5782は、単位ベクトル5710を、隣接周波数間の回転ベクトル(第1回転ベクトル5720)に変換する。ここでの回転ベクトルの回転量は位相変化量と同義となる。基準ベクトルの共役A*と回転後のベクトルBとの内積をとる乗算を行ない、以下のように回転ベクトルRotVecを求める。RotVec = A*・B
 具体的には、基準ベクトルの実部同士を積算して、虚部同士を積算して、それらを足して、虚部は一方を引き算する。そうすると回転ベクトル5720が算出できる。
 さらに、回転ベクトル変換部5783は、回転ベクトル変換部5782により得られる第1回転ベクトル5720の、周波数軸に沿った平坦度(バラツキ)を調べる。周波数方向の位相変化量が一定であると回転ベクトルのバラツキが小さくなる。そのため第1回転ベクトル5720の変化量を周波数軸に沿って求める。具体的には、第1回転ベクトル5720について、隣接周波数間の回転ベクトル(第2回転ベクトル5730)を求める。これは第1回転ベクトルを微分したのと同義である。
 そこで、急変判定部5709は、第2回転ベクトル5730の実部を平坦度として認識する。
 第2回転ベクトル5730も単位ベクトルなので、その実部は-1から1の値をとる。位相が直線的に変化するほど、第1回転ベクトルの角度変化量が小さい(回転ベクトルのバラツキが小さい)。そして、第1回転ベクトルの変化量が小さい(回転ベクトルのバラツキが小さい)ほど、第2回転ベクトルの実部が大きくなる。すなわち、第2回転ベクトルの角度が小さくなる。ここでも、周波数毎、帯域毎(周波数を任意の幅に区切った帯域)、全周波数のいずれかについて、一つの平坦度を求めてもよい。
 急変判定部5709は、第2回転ベクトル5730の実部を急変の存在可能性とみなして、+1に近い閾値(例えば0.7や0.8)を越えているか否かによって急変の存在またはその程度を判定する。判定結果5740として、衝撃音の存在可能性(1~0)を出力する。このように、衝撃音が含まれている尤もらしさを得ることが可能となる。
 図58は、本実施形態にかかる雑音抑圧プログラムによる処理の流れを説明するためのフローチャートである。まず、ステップS5401において、音声入力部5362から音声信号を入力すると、ステップS5803に進む。ステップS5803では、変換部5501が周波数領域で入力信号から複素信号を生成する。次に、ステップS5405では、離散周波数kを1に設定して、順次周波数空間での処理を開始する。ステップS5807に進むと、設定された周波数で複素信号を単位ベクトル化する。次に、ステップS5808では、隣接する周波数成分の単位ベクトルから第1回転ベクトルに変換する。さらにステップS5809では隣接する周波数成分の第1回転ベクトルから第2回転ベクトルに変換する。ステップS5811では、第2回転ベクトルの実部を、信号急変の存在可能性と見なして、閾値Nと比較する。実部が所定の閾値Nを越えた場合、位相は平坦に変化すると判断され、直線性が高いと判断して、ステップS5413においてI(k)=1とする。一方、実部が所定の閾値N以下の場合、位相変化は平坦ではない判断され、直線性が低いと判断して、ステップS5414においてI(k)=0とする。以上のステップS5407~S5414を、k=F(Fはフレーム全体の周波数ステップ数)になるまで繰り返す。最終的には、ステップS5417において、I(k)=1となったkの周波数で信号急変ありと判定し、判定結果を、雑音抑圧部4705および位相制御部4702に供給する。
 以上説明したとおり本実施形態では、複素信号を用いて位相の回転ベクトルの回転ベクトルから直線性を検出できる。なおここで、平坦度の判定で、回転ベクトルの実部を使うためには単位ベクトル化したが、本発明はこれに限定されるものではない。また、第2回転ベクトルの実部に代えて第2回転ベクトルの角度の大きさを閾値と比較し、角度の大きさが閾値より大きい場合に信号急変ありと判定してもよい。
 [第20実施形態]
 なお、上記第12乃至19実施形態では、信号急変部を抑圧することを目的とした雑音抑圧装置に信号急変検出方法を適用した場合について説明したが、本発明はこれに限定されるものではない。衝撃音の検出を目的とした様々な装置、システムおよび状況で利用することができる。さらに検出対象は衝撃音(急激に立ち上がってすぐにたち下がる音声信号)に限定されない。信号が急激に立ち上がって(またはたち下がって)そのままとなる場合であっても、急変部として検出できる。
 例えば、現在のオーディオ符号化方式(例えばMPEG AACの符号化部)において、いわゆるアタックと呼ばれる信号急変部では、通常とは異なった情報圧縮方式が採用されているが、その際の信号急変部の検出にも適用することができる。信号急変部では、分析窓長を変更して、プリエコーと呼ばれる先行雑音の抑圧を行うので、検出が必要となる。振幅やエントロピーの変化などを用いて検出する方法に比べて精度良く急変を検出し、効果的に情報圧縮を行なうことができる。
 また、図59に示すように、車両5900にマイク2001と直線性計算部4708と急変判定部4709と映像記録部5902とを搭載する適用例も考えられる。映像記録部5902が衝撃音の検出をトリガーにしてカメラによる撮影画像の上書き保存禁止を行なえば、事故状況の記録を残すことができる。その際に、衝撃音検出から一定時間の遅延の後に、上書き保存禁止を行ってもよい。衝撃そのものをトリガーにした場合と異なり、衝撃が小さい場合や、他の車両が事故にあった場合にも事故状況の自動記録を行なえるという利点がある。
 また、図60に示すように、心電計6000に計算部4708と急変判定部4709とアラーム部6001とを接続する適用例も考える。心電図の異常心拍の検出をより正確かつ効果的に行なうことができる。特に雑音の多い場合に有効である。同様に、胎児のエコーのモニターにも適用できる。雑音による妨害で正しく心音がとれない場合があるが、そのようなときに本技術は有効である。すなわち、生体信号の急変検出に広く適用できる。
 [第21実施形態]
 同様に図61に示すように、上記実施形態では、ハードディスクドライブ6100の異常検知のために本発明の衝撃音検出を利用してもよいし、図62に示すように、例えば空港など騒音が大きい状況での発砲音や爆発音の検出に、本願発明を利用してもよい。
 [他の実施形態]
 以上、実施形態を参照して本発明を説明したが、本発明は上記実施形態に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解し得る様々な変更をすることができる。また、それぞれの実施形態に含まれる別々の特徴を如何様に組み合わせたシステムまたは装置も、本発明の範疇に含まれる。
 また、本発明は、複数の機器から構成されるシステムに適用されてもよいし、単体の装置に適用されてもよい。さらに、本発明は、実施形態の機能を実現する情報処理プログラムが、システムあるいは装置に直接あるいは遠隔から供給される場合にも適用可能である。したがって、本発明の機能をコンピュータで実現するために、コンピュータにインストールされるプログラム、あるいはそのプログラムを格納した媒体、そのプログラムをダウンロードさせるWWW(World Wide Web)サーバも、本発明の範疇に含まれる。特に、少なくとも、非一時的コンピュータ可読媒体(non-transitory computer readable medium)
は本発明の範疇に含まれる。
 なお、上記の各実施形態においては、以下に示すような信号処理装置、信号処理方法および信号処理プログラムの特徴的構成が示されている(以下のように限定されるわけではない)。
 (付記1)
 入力信号を、周波数領域における位相成分信号および振幅成分信号に変換する変換手段と、
 前記位相成分信号および前記振幅成分信号の特徴量を計算する計算手段と、
 前記計算手段によって計算された前記特徴量に基づいて前記入力信号の急変に関する存在可能性を判定する判定手段と、
 を備えたことを特徴とする信号処理装置。
(付記2)
 前記計算手段は、前記位相成分信号の変化の平坦度を前記特徴量として算出することを特徴とする付記1に記載の信号処理装置。
(付記3)
 前記計算手段は、前記振幅成分信号の平坦度を前記特徴量として算出することを特徴とする付記1または2に記載の信号処理装置。
(付記4)
 前記判定手段は、前記位相成分信号の変化と前記振幅成分信号の変化とをそれぞれ重み付け加算して得た値に基づいて前記信号の急変に関する存在可能性の判定を行なうことを特徴とする付記1、2または3に記載の信号処理装置。
(付記5)
 前記判定手段は、前記位相成分信号の変化と前記振幅成分信号の変化とを平均して得た値に基づいて前記信号の急変に関する存在可能性の判定を行なうことを特徴とする付記1、2または3に記載の信号処理装置。
(付記6)
 前記判定手段は、前記位相成分信号の変化と前記振幅成分信号の変化とを非線形結合して得た値に基づいて前記信号の急変に関する存在可能性の判定を行なうことを特徴とする付記1、2または3に記載の信号処理装置。
(付記7)
 前記計算手段は、周波数領域における前記位相成分信号の微分値の平坦度を計算し、
 前記判定手段は、前記微分値の前記平坦度が高く、かつ、前記振幅成分信号の平坦度が高ければ、前記入力信号の急変に関する存在可能性が高いと判定することを特徴とする付記1乃至5のいずれか1項に記載の信号処理装置。
(付記8)
 前記計算手段は、前記位相成分信号から、各周波数の位相変化(φn=θn-θn-1)を求め、該位相変化の差(φn-φn-1)を回転角とする回転ベクトルcos(φn-φn-1)+jsin(φn-φn-1)の大きさを前記特徴量として求めることを特徴とする付記1乃至7のいずれか1項に記載の信号処理装置。
(付記9)
 前記変換手段は、位相成分信号および振幅成分信号を含む複素信号を出力し、
 前記計算手段は、
 各周波数における前記複素信号を単位ベクトルに正規化する正規化手段と、
 隣接周波数における前記単位ベクトルの比から第1回転ベクトルを算出する第1算出手段と、
 隣接周波数における前記第1回転ベクトルの比から第2回転ベクトルを算出する第2算出手段と、
 を備え、
 前記判定手段は、
 前記第2回転ベクトルの実部の大きさに基づいて、前記入力信号の急変に関する存在可能性を判定することを特徴とする付記1乃至8のいずれか1項に記載の信号処理装置。
(付記10)
 前記変換手段は、位相成分信号および振幅成分信号を含む複素信号を出力し、
 前記計算手段は、
 各周波数における前記複素信号を単位ベクトルに正規化する正規化手段と、
 隣接周波数における前記単位ベクトルの比から第1回転ベクトルを算出する第1算出手段と、
 隣接周波数における前記第1回転ベクトルの比から第2回転ベクトルを算出する第2算出手段と、
 を備え、
 前記判定手段は、
 前記第2回転ベクトルの角度の大きさに基づいて、前記入力信号の急変を検出することを特徴とする付記1乃至8のいずれか1項に記載の信号処理装置。
(付記11)
 前記判定手段で求めた前記急変に関する存在可能性に対応した程度で、振幅の抑圧を行なう振幅制御手段をさらに備えたことを特徴とする付記1乃至10のいずれか1項に記載の信号処理装置。
(付記12)
 前記判定手段で前記急変を含むと判定されたフレームについて、前記入力信号の位相を変化させる位相制御手段をさらに備えたことを特徴とする付記1乃至11のいずれか1項に記載の信号処理装置。
(付記13)
 入力信号を、周波数領域における位相成分信号に変換する変換手段と、
 前記入力信号の急増部の位置に基づいて、第1位相傾きを算出する第1算出手段と、
 周波数領域における前記位相成分信号の第2位相傾きを算出する第2算出手段と、
 前記第1位相傾きと前記第2位相傾きに基づいて前記入力信号の急変に関する存在可能性を判定する判定手段と、
 を備えたことを特徴とする信号処理装置。
(付記14)
 前記判定手段は、
 前記第1位相傾きと前記第2位相傾きとの類似度に基づいて、前記入力信号の急変に関する存在可能性を判定することを特徴とする付記13に記載の信号処理装置。
(付記15)
 前記第1算出手段は、
 フレーム内の信号絶対値が急増する位置を検出する急増部検出手段と、
 フレーム開始から前記急増部の存在する位置までの遅延時間を算出する遅延時間算出手段と、
 前記遅延時間を、周波数領域の位相に変換する位相変換手段と、
 を含むことを特徴とする付記13または14に記載の信号処理装置。
(付記16)
 前記変換手段はさらに前記入力信号の周波数領域における振幅成分信号を算出し、前記振幅成分信号の平坦度を算出する算出手段をさらに備え、
 前記判定手段は、さらに前記振幅成分信号の平坦度を考慮して前記入力信号の急変の存在可能性を判定することを特徴とする付記13に記載の信号処理装置。
(付記17)
 前記判定手段は、前記第1位相傾きと前記第2位相傾きとの類似度、および前記振幅成分信号の平坦度を、それぞれ重み付けして得た値に基づいて前記信号の急変の存在可能性の判定を行なうことを特徴とする付記13乃至16のいずれか1項に記載の信号処理装置。
(付記18)
 前記判定手段で求めた前記急変の存在可能性に対応した程度で、振幅の抑圧を行なう振幅制御手段をさらに備えたことを特徴とする付記13乃至17のいずれか1項に記載の信号処理装置。
(付記19)
 前記判定手段で前記急変を含むと判定されたフレームについて、前記入力信号の位相を変化させる位相制御手段をさらに備えたことを特徴とする付記13乃至18のいずれか1項に記載の信号処理装置。
(付記20)
 入力信号を、周波数領域における位相成分信号に変換する変換手段と、
 前記入力信号に含まれる時間相関のある成分を前記入力信号から除いて低相関信号を生成する生成手段と、
 前記低相関信号と前記位相成分信号とに基づいて、前記入力信号に含まれる急変の存在可能性を判定する判定手段と、
 を備えたことを特徴とする信号処理装置。
(付記21)
 前記低相関信号の急増部の位置に基づいて、信号急変部における第1相傾きを算出する第1算出手段と、
 周波数領域における前記位相成分信号の第2位相傾きを算出する第2算出手段と、
 をさらに有し、
 前記判定手段は、
 前記第1位相傾きと前記第2位相傾きとに基づいて前記入力信号の急変の存在可能性を判定することを特徴とする付記20に記載の信号処理装置。
(付記22)
 前記判定手段は、
 前記第1位相傾きと前記第2位相傾きとの類似度に基づいて、前記入力信号の急変の存在可能性を判定することを特徴とする付記21に記載の信号処理装置。
(付記23)
 前記第1算出手段は、
 フレーム内の信号絶対値が急増する位置を検出する急増部検出手段と、
 フレーム開始から前記急増部の存在する位置までの遅延時間を算出する遅延時間算出手段と、
 前記遅延時間を、周波数領域の位相に変換する位相変換手段と、
 を含むことを特徴とする付記21または22に記載の信号処理装置。
(付記24)
 前記変換手段はさらに前記入力信号の周波数領域における振幅成分信号を算出し、前記振幅成分信号の平坦度を算出する算出手段をさらに備え、
 前記判定手段は、さらに前記振幅成分信号の平坦度を考慮して前記入力信号の急変の存在可能性を判定することを特徴とする付記20に記載の信号処理装置。
(付記25)
 前記判定手段で求めた前記急変の存在可能性に対応した程度で、振幅の抑圧を行なう振幅制御手段をさらに備えたことを特徴とする付記20乃至24のいずれか1項に記載の信号処理装置。
(付記26)
 前記判定手段で前記急変を含むと判定されたフレームについて、前記入力信号の位相を変化させる位相制御手段をさらに備えたことを特徴とする付記20乃至25のいずれか1項に記載の信号処理装置。
(付記27)
 入力信号を、周波数領域における位相成分信号に変換する変換手段と、
 周波数領域における前記位相成分信号の直線性を計算する直線性計算手段と、
 前記直線性計算手段によって計算された前記直線性に基づいて前記入力信号の急変の存在可能性を計算する判定手段と、
 を備えたことを特徴とする信号処理装置。
(付記28)
 前記直線性計算手段は、周波数領域における前記位相成分信号の変化に基づいて、前記直線性を計算することを特徴とする付記27に記載の信号処理装置。
(付記29)
 前記直線性計算手段は、周波数領域における前記位相成分信号の微分値の平坦度を計算し、
 前記判定手段は、前記微分値の平坦度が高ければ、前記入力信号の急変の存在可能性が高いと判定することを特徴とする付記27または28に記載の信号処理装置。
(付記30)
 前記直線性計算手段は、
 周波数ごとに位相成分と隣接周波数における位相成分の差として位相成分差を算出し、
 前記位相成分差の隣接周波数における差に基づいて、前記直線性を計算することを特徴とする付記27、28または29記載の信号処理装置。
(付記31)
 前記直線性計算手段は、
 前記位相成分差の隣接周波数における差をフレームごとに加算した総和を前記フレームの直線性として計算し、
 前記判定手段は、
 前記総和が閾値以上なら、前記位相成分差の隣接周波数における差が大きくなるように修正することを特徴とする付記30に記載の信号処理装置。
(付記32)
 入力信号を、周波数領域における位相成分信号および振幅成分信号に変換し、
 前記位相成分信号および前記振幅成分信号の特徴量を計算し
 計算された前記特徴量に基づいて前記入力信号の急変に関する存在可能性を判定する、
 各ステップを含むことを特徴とする信号処理方法。
(付記33)
 入力信号を、周波数領域における位相成分信号に変換し、
 前記入力信号の急増部の位置に基づいて、第1位相傾きを算出し、
 周波数領域における前記位相成分信号の第2位相傾きを算出し、
 前記第1位相傾きと前記第2位相傾きとに基づいて前記入力信号の急変の存在可能性を判定する、
 各ステップを含むことを特徴とする信号処理方法。
(付記34)
 入力信号を、周波数領域における位相成分信号に変換し、
 前記入力信号に含まれる時間相関のある成分を前記入力信号から除いて低相関信号を生成し、
 前記低相関信号と前記位相成分信号とに基づいて、前記入力信号に含まれる急変の存在可能性を判定する、
 各ステップを含むことを特徴とする信号処理方法。
(付記35)
 入力信号を、周波数領域における位相成分信号に変換し、
 周波数領域における前記位相成分信号の直線性を計算し、
 計算された前記直線性に基づいて前記入力信号の急変の存在可能性を計算する、
 各ステップを含むことを特徴とする信号処理方法。
(付記36)
 入力信号を、周波数領域における位相成分信号および振幅成分信号に変換し、
 前記位相成分信号および前記振幅成分信号の特徴量を計算し
 計算された前記特徴量に基づいて前記入力信号の急変に関する存在可能性を判定する、
 各ステップをコンピュータに実行させることを特徴とする信号処理プログラム。
(付記37)
 入力信号を、周波数領域における位相成分信号に変換し、
 前記入力信号の急増部の位置に基づいて、第1位相傾きを算出し、
 周波数領域における前記位相成分信号の第2位相傾きを算出し、
 前記第1位相傾きと前記第2位相傾きとに基づいて前記入力信号の急変の存在可能性を判定する、
 各ステップをコンピュータに実行させることを特徴とする信号処理プログラム。
(付記38)
 入力信号を、周波数領域における位相成分信号に変換し、
 前記入力信号に含まれる時間相関のある成分を前記入力信号から除いて低相関信号を生成し、
 前記低相関信号と前記位相成分信号とに基づいて、前記入力信号に含まれる急変の存在可能性を判定する、
 各ステップをコンピュータに実行させることを特徴とする信号処理プログラム。
(付記39)
 入力信号を、周波数領域における位相成分信号に変換し、
 周波数領域における前記位相成分信号の直線性を計算し、
 計算された前記直線性に基づいて前記入力信号の急変の存在可能性を計算する、
 各ステップをコンピュータに実行させることを特徴とする信号処理プログラム。
 この出願は、2013年3月5日に出願された日本国特許出願 特願2013-042448号、特願2013-042449号、特願2013-042450号、特願2013-042451号、を基礎とする優先権を主張し、その開示の全てをここに取り込む。

Claims (39)

  1.  入力信号を、周波数領域における位相成分信号および振幅成分信号に変換する変換手段と、
     前記位相成分信号および前記振幅成分信号の特徴量を計算する計算手段と、
     前記計算手段によって計算された前記特徴量に基づいて前記入力信号の急変に関する存在可能性を判定する判定手段と、
     を備えたことを特徴とする信号処理装置。
  2.  前記計算手段は、前記位相成分信号の変化の平坦度を前記特徴量として算出することを特徴とする請求項1に記載の信号処理装置。
  3.  前記計算手段は、前記振幅成分信号の平坦度を前記特徴量として算出することを特徴とする請求項1または2に記載の信号処理装置。
  4.  前記判定手段は、前記位相成分信号の変化と前記振幅成分信号の変化とをそれぞれ重み付け加算して得た値に基づいて前記信号の急変に関する存在可能性の判定を行なうことを特徴とする請求項1、2または3に記載の信号処理装置。
  5.  前記判定手段は、前記位相成分信号の変化と前記振幅成分信号の変化とを平均して得た値に基づいて前記信号の急変に関する存在可能性の判定を行なうことを特徴とする請求項1、2または3に記載の信号処理装置。
  6.  前記判定手段は、前記位相成分信号の変化と前記振幅成分信号の変化とを非線形結合して得た値に基づいて前記信号の急変に関する存在可能性の判定を行なうことを特徴とする請求項1、2または3に記載の信号処理装置。
  7.  前記計算手段は、周波数領域における前記位相成分信号の微分値の平坦度を計算し、
     前記判定手段は、前記微分値の前記平坦度が高く、かつ、前記振幅成分信号の平坦度が高ければ、前記入力信号の急変に関する存在可能性が高いと判定することを特徴とする請求項1乃至5のいずれか1項に記載の信号処理装置。
  8.  前記計算手段は、前記位相成分信号から、各周波数の位相変化(φn=θn-θn-1)を求め、該位相変化の差(φn-φn-1)を回転角とする回転ベクトルcos(φn-φn-1)+jsin(φn-φn-1)の大きさを前記特徴量として求めることを特徴とする請求項1乃至7のいずれか1項に記載の信号処理装置。
  9.  前記変換手段は、位相成分信号および振幅成分信号を含む複素信号を出力し、
     前記計算手段は、
     各周波数における前記複素信号を単位ベクトルに正規化する正規化手段と、
     隣接周波数における前記単位ベクトルの比から第1回転ベクトルを算出する第1算出手段と、
     隣接周波数における前記第1回転ベクトルの比から第2回転ベクトルを算出する第2算出手段と、
     を備え、
     前記判定手段は、
     前記第2回転ベクトルの実部の大きさに基づいて、前記入力信号の急変に関する存在可能性を判定することを特徴とする請求項1乃至8のいずれか1項に記載の信号処理装置。
  10.  前記変換手段は、位相成分信号および振幅成分信号を含む複素信号を出力し、
     前記計算手段は、
     各周波数における前記複素信号を単位ベクトルに正規化する正規化手段と、
     隣接周波数における前記単位ベクトルの比から第1回転ベクトルを算出する第1算出手段と、
     隣接周波数における前記第1回転ベクトルの比から第2回転ベクトルを算出する第2算出手段と、
     を備え、
     前記判定手段は、
     前記第2回転ベクトルの角度の大きさに基づいて、前記入力信号の急変を検出することを特徴とする請求項1乃至8のいずれか1項に記載の信号処理装置。
  11.  前記判定手段で求めた前記急変に関する存在可能性に対応した程度で、振幅の抑圧を行なう振幅制御手段をさらに備えたことを特徴とする請求項1乃至10のいずれか1項に記載の信号処理装置。
  12.  前記判定手段で前記急変を含むと判定されたフレームについて、前記入力信号の位相を変化させる位相制御手段をさらに備えたことを特徴とする請求項1乃至11のいずれか1項に記載の信号処理装置。
  13.  入力信号を、周波数領域における位相成分信号に変換する変換手段と、
     前記入力信号の急増部の位置に基づいて、第1位相傾きを算出する第1算出手段と、
     周波数領域における前記位相成分信号の第2位相傾きを算出する第2算出手段と、
     前記第1位相傾きと前記第2位相傾きに基づいて前記入力信号の急変に関する存在可能性を判定する判定手段と、
     を備えたことを特徴とする信号処理装置。
  14.  前記判定手段は、
     前記第1位相傾きと前記第2位相傾きとの類似度に基づいて、前記入力信号の急変に関する存在可能性を判定することを特徴とする請求項13に記載の信号処理装置。
  15.  前記第1算出手段は、
     フレーム内の信号絶対値が急増する位置を検出する急増部検出手段と、
     フレーム開始から前記急増部の存在する位置までの遅延時間を算出する遅延時間算出手段と、
     前記遅延時間を、周波数領域の位相に変換する位相変換手段と、
     を含むことを特徴とする請求項13または14に記載の信号処理装置。
  16.  前記変換手段はさらに前記入力信号の周波数領域における振幅成分信号を算出し、前記振幅成分信号の平坦度を算出する算出手段をさらに備え、
     前記判定手段は、さらに前記振幅成分信号の平坦度を考慮して前記入力信号の急変の存在可能性を判定することを特徴とする請求項13に記載の信号処理装置。
  17.  前記判定手段は、前記第1位相傾きと前記第2位相傾きとの類似度、および前記振幅成分信号の平坦度を、それぞれ重み付けして得た値に基づいて前記信号の急変の存在可能性の判定を行なうことを特徴とする請求項13乃至16のいずれか1項に記載の信号処理装置。
  18.  前記判定手段で求めた前記急変の存在可能性に対応した程度で、振幅の抑圧を行なう振幅制御手段をさらに備えたことを特徴とする請求項13乃至17のいずれか1項に記載の信号処理装置。
  19.  前記判定手段で前記急変を含むと判定されたフレームについて、前記入力信号の位相を変化させる位相制御手段をさらに備えたことを特徴とする請求項13乃至18のいずれか1項に記載の信号処理装置。
  20.  入力信号を、周波数領域における位相成分信号に変換する変換手段と、
     前記入力信号に含まれる時間相関のある成分を前記入力信号から除いて低相関信号を生成する生成手段と、
     前記低相関信号と前記位相成分信号とに基づいて、前記入力信号に含まれる急変の存在可能性を判定する判定手段と、
     を備えたことを特徴とする信号処理装置。
  21.  前記低相関信号の急増部の位置に基づいて、信号急変部における第1相傾きを算出する第1算出手段と、
     周波数領域における前記位相成分信号の第2位相傾きを算出する第2算出手段と、
     をさらに有し、
     前記判定手段は、
     前記第1位相傾きと前記第2位相傾きとに基づいて前記入力信号の急変の存在可能性を判定することを特徴とする請求項20に記載の信号処理装置。
  22.  前記判定手段は、
     前記第1位相傾きと前記第2位相傾きとの類似度に基づいて、前記入力信号の急変の存在可能性を判定することを特徴とする請求項21に記載の信号処理装置。
  23.  前記第1算出手段は、
     フレーム内の信号絶対値が急増する位置を検出する急増部検出手段と、
     フレーム開始から前記急増部の存在する位置までの遅延時間を算出する遅延時間算出手段と、
     前記遅延時間を、周波数領域の位相に変換する位相変換手段と、
     を含むことを特徴とする請求項21または22に記載の信号処理装置。
  24.  前記変換手段はさらに前記入力信号の周波数領域における振幅成分信号を算出し、前記振幅成分信号の平坦度を算出する算出手段をさらに備え、
     前記判定手段は、さらに前記振幅成分信号の平坦度を考慮して前記入力信号の急変の存在可能性を判定することを特徴とする請求項20に記載の信号処理装置。
  25.  前記判定手段で求めた前記急変の存在可能性に対応した程度で、振幅の抑圧を行なう振幅制御手段をさらに備えたことを特徴とする請求項20乃至24のいずれか1項に記載の信号処理装置。
  26.  前記判定手段で前記急変を含むと判定されたフレームについて、前記入力信号の位相を変化させる位相制御手段をさらに備えたことを特徴とする請求項20乃至25のいずれか1項に記載の信号処理装置。
  27.  入力信号を、周波数領域における位相成分信号に変換する変換手段と、
     周波数領域における前記位相成分信号の直線性を計算する直線性計算手段と、
     前記直線性計算手段によって計算された前記直線性に基づいて前記入力信号の急変の存在可能性を計算する判定手段と、
     を備えたことを特徴とする信号処理装置。
  28.  前記直線性計算手段は、周波数領域における前記位相成分信号の変化に基づいて、前記直線性を計算することを特徴とする請求項27に記載の信号処理装置。
  29.  前記直線性計算手段は、周波数領域における前記位相成分信号の微分値の平坦度を計算し、
     前記判定手段は、前記微分値の平坦度が高ければ、前記入力信号の急変の存在可能性が高いと判定することを特徴とする請求項27または28に記載の信号処理装置。
  30.  前記直線性計算手段は、
     周波数ごとに位相成分と隣接周波数における位相成分の差として位相成分差を算出し、
     前記位相成分差の隣接周波数における差に基づいて、前記直線性を計算することを特徴とする請求項27、28または29記載の信号処理装置。
  31.  前記直線性計算手段は、
     前記位相成分差の隣接周波数における差をフレームごとに加算した総和を前記フレームの直線性として計算し、
     前記判定手段は、
     前記総和が閾値以上なら、前記位相成分差の隣接周波数における差が大きくなるように修正することを特徴とする請求項30に記載の信号処理装置。
  32.  入力信号を、周波数領域における位相成分信号および振幅成分信号に変換し、
     前記位相成分信号および前記振幅成分信号の特徴量を計算し
     計算された前記特徴量に基づいて前記入力信号の急変に関する存在可能性を判定する、
     各ステップを含むことを特徴とする信号処理方法。
  33.  入力信号を、周波数領域における位相成分信号に変換し、
     前記入力信号の急増部の位置に基づいて、第1位相傾きを算出し、
     周波数領域における前記位相成分信号の第2位相傾きを算出し、
     前記第1位相傾きと前記第2位相傾きとに基づいて前記入力信号の急変の存在可能性を判定する、
     各ステップを含むことを特徴とする信号処理方法。
  34.  入力信号を、周波数領域における位相成分信号に変換し、
     前記入力信号に含まれる時間相関のある成分を前記入力信号から除いて低相関信号を生成し、
     前記低相関信号と前記位相成分信号とに基づいて、前記入力信号に含まれる急変の存在可能性を判定する、
     各ステップを含むことを特徴とする信号処理方法。
  35.  入力信号を、周波数領域における位相成分信号に変換し、
     周波数領域における前記位相成分信号の直線性を計算し、
     計算された前記直線性に基づいて前記入力信号の急変の存在可能性を計算する、
     各ステップを含むことを特徴とする信号処理方法。
  36.  入力信号を、周波数領域における位相成分信号および振幅成分信号に変換し、
     前記位相成分信号および前記振幅成分信号の特徴量を計算し
     計算された前記特徴量に基づいて前記入力信号の急変に関する存在可能性を判定する、
     各ステップをコンピュータに実行させることを特徴とする信号処理プログラム。
  37.  入力信号を、周波数領域における位相成分信号に変換し、
     前記入力信号の急増部の位置に基づいて、第1位相傾きを算出し、
     周波数領域における前記位相成分信号の第2位相傾きを算出し、
     前記第1位相傾きと前記第2位相傾きとに基づいて前記入力信号の急変の存在可能性を判定する、
     各ステップをコンピュータに実行させることを特徴とする信号処理プログラム。
  38.  入力信号を、周波数領域における位相成分信号に変換し、
     前記入力信号に含まれる時間相関のある成分を前記入力信号から除いて低相関信号を生成し、
     前記低相関信号と前記位相成分信号とに基づいて、前記入力信号に含まれる急変の存在可能性を判定する、
     各ステップをコンピュータに実行させることを特徴とする信号処理プログラム。
  39.  入力信号を、周波数領域における位相成分信号に変換し、
     周波数領域における前記位相成分信号の直線性を計算し、
     計算された前記直線性に基づいて前記入力信号の急変の存在可能性を計算する、
     各ステップをコンピュータに実行させることを特徴とする信号処理プログラム。
PCT/JP2014/054634 2013-03-05 2014-02-26 信号処理装置、信号処理方法および信号処理プログラム WO2014136629A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
US14/773,273 US9715885B2 (en) 2013-03-05 2014-02-26 Signal processing apparatus, signal processing method, and signal processing program
JP2015504258A JP6528679B2 (ja) 2013-03-05 2014-02-26 信号処理装置、信号処理方法および信号処理プログラム

Applications Claiming Priority (8)

Application Number Priority Date Filing Date Title
JP2013-042448 2013-03-05
JP2013-042450 2013-03-05
JP2013042450 2013-03-05
JP2013-042449 2013-03-05
JP2013042448 2013-03-05
JP2013-042451 2013-03-05
JP2013042451 2013-03-05
JP2013042449 2013-03-05

Publications (1)

Publication Number Publication Date
WO2014136629A1 true WO2014136629A1 (ja) 2014-09-12

Family

ID=51491149

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2014/054634 WO2014136629A1 (ja) 2013-03-05 2014-02-26 信号処理装置、信号処理方法および信号処理プログラム

Country Status (4)

Country Link
US (1) US9715885B2 (ja)
JP (1) JP6528679B2 (ja)
TW (3) TWI581256B (ja)
WO (1) WO2014136629A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016176329A1 (en) * 2015-04-28 2016-11-03 Dolby Laboratories Licensing Corporation Impulsive noise suppression
JP2023003843A (ja) * 2021-06-24 2023-01-17 学校法人東京工芸大学 検査装置、方法、及びプログラム

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014123011A (ja) * 2012-12-21 2014-07-03 Sony Corp 雑音検出装置および方法、並びに、プログラム
US9715885B2 (en) * 2013-03-05 2017-07-25 Nec Corporation Signal processing apparatus, signal processing method, and signal processing program
JP6785446B2 (ja) * 2016-04-14 2020-11-18 パナソニックIpマネジメント株式会社 生体信号計測システム
AU2017372454B2 (en) * 2016-12-06 2020-07-16 Nippon Telegraph And Telephone Corporation Signal feature extraction apparatus, signal feature extraction method, and program
AU2017201760B2 (en) * 2017-03-15 2023-03-09 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding video data
EP3675718B1 (en) * 2017-08-31 2023-12-13 The Regents of the University of California Multisensor cardiac stroke volume monitoring system and analytics
CN111050633A (zh) 2017-08-31 2020-04-21 加利福尼亚大学董事会 多传感器心脏功能监测和分析系统
JP7152112B2 (ja) * 2018-08-24 2022-10-12 日本電気株式会社 信号処理装置、信号処理方法および信号処理プログラム
US11284856B2 (en) * 2019-12-31 2022-03-29 Industrial Technology Research Institute Method for detecting vascular obstruction and system using the same

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH036600A (ja) * 1989-06-02 1991-01-14 Matsushita Electric Ind Co Ltd 音声符号化装置
JPH0854897A (ja) * 1994-08-10 1996-02-27 Nippon Telegr & Teleph Corp <Ntt> 音信号立ち上がり検出方法
JP2006163417A (ja) * 2004-12-08 2006-06-22 Herman Becker Automotive Systems-Wavemakers Inc 雨ノイズを抑制するためのシステム
JP2011514987A (ja) * 2008-03-10 2011-05-12 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 瞬間的事象を有する音声信号の操作装置および操作方法

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2135408T3 (es) * 1991-05-29 1999-11-01 Pacific Microsonics Inc Sistema mejorado de codificacion/decodificacion de señales.
IL135630A0 (en) 1997-12-08 2001-05-20 Mitsubishi Electric Corp Method and apparatus for processing sound signal
US6420989B1 (en) * 2001-01-22 2002-07-16 Credence Systems Corporation Programmable non-uniform clock signal generator
DE10224161B4 (de) * 2002-05-31 2012-07-12 Globalfoundries Inc. Restphasenfehlerkorrektur
KR100580643B1 (ko) * 2004-02-10 2006-05-16 삼성전자주식회사 충격음 감지 장치, 방법 그리고 이를 이용한 충격음 식별장치 및 방법
JP2006042025A (ja) * 2004-07-28 2006-02-09 Casio Comput Co Ltd Ofdm信号復調回路及びofdm信号復調方法
AU2006232364B2 (en) 2005-04-01 2010-11-25 Qualcomm Incorporated Systems, methods, and apparatus for wideband speech coding
TWI317933B (en) 2005-04-22 2009-12-01 Qualcomm Inc Methods, data storage medium,apparatus of signal processing,and cellular telephone including the same
JP2007251908A (ja) 2006-02-15 2007-09-27 Sanyo Electric Co Ltd ノイズ検出回路及びそれを用いたam受信機
JPWO2008041392A1 (ja) * 2006-10-02 2010-02-04 三井松島産業株式会社 坑内無線システム
WO2008111462A1 (ja) 2007-03-06 2008-09-18 Nec Corporation 雑音抑圧の方法、装置、及びプログラム
JP2011254122A (ja) 2009-03-23 2011-12-15 Nec Corp 回路、制御システム、制御方法及びプログラム
JP5310494B2 (ja) * 2009-11-09 2013-10-09 日本電気株式会社 信号処理方法、情報処理装置、及び信号処理プログラム
KR20110090232A (ko) * 2010-02-03 2011-08-10 엘에스산전 주식회사 위상변위기를 이용한 벡터 모듈레이터
JP2011199808A (ja) 2010-03-24 2011-10-06 Hitachi Kokusai Electric Inc 受信装置の等化部
EP2767978B1 (en) * 2010-05-25 2017-03-15 Nec Corporation Noise suppression in a deteriorated audio signal
EP2645368B1 (en) * 2010-11-24 2019-05-08 Nec Corporation Signal processing device, signal processing method and signal processing program
JP6070953B2 (ja) * 2011-02-26 2017-02-01 日本電気株式会社 信号処理装置、信号処理方法、及び記憶媒体
US8791854B2 (en) * 2011-10-10 2014-07-29 Infineon Technologies Ag Automotive radar transmitter architecture
JPWO2014136628A1 (ja) * 2013-03-05 2017-02-09 日本電気株式会社 信号処理装置、信号処理方法および信号処理プログラム
US9715885B2 (en) * 2013-03-05 2017-07-25 Nec Corporation Signal processing apparatus, signal processing method, and signal processing program
JP6406258B2 (ja) * 2013-08-30 2018-10-17 日本電気株式会社 信号処理装置、信号処理方法および信号処理プログラム
WO2015029545A1 (ja) * 2013-08-30 2015-03-05 日本電気株式会社 信号処理装置、信号処理方法および信号処理プログラム
WO2015049921A1 (ja) * 2013-10-04 2015-04-09 日本電気株式会社 信号処理装置、メディア装置、信号処理方法および信号処理プログラム
US9667219B2 (en) * 2015-04-22 2017-05-30 The Regents Of The University Of California Phase noise measurement and filtering circuit

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH036600A (ja) * 1989-06-02 1991-01-14 Matsushita Electric Ind Co Ltd 音声符号化装置
JPH0854897A (ja) * 1994-08-10 1996-02-27 Nippon Telegr & Teleph Corp <Ntt> 音信号立ち上がり検出方法
JP2006163417A (ja) * 2004-12-08 2006-06-22 Herman Becker Automotive Systems-Wavemakers Inc 雨ノイズを抑制するためのシステム
JP2011514987A (ja) * 2008-03-10 2011-05-12 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 瞬間的事象を有する音声信号の操作装置および操作方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016176329A1 (en) * 2015-04-28 2016-11-03 Dolby Laboratories Licensing Corporation Impulsive noise suppression
US10319391B2 (en) 2015-04-28 2019-06-11 Dolby Laboratories Licensing Corporation Impulsive noise suppression
JP2023003843A (ja) * 2021-06-24 2023-01-17 学校法人東京工芸大学 検査装置、方法、及びプログラム
JP7355972B2 (ja) 2021-06-24 2023-10-04 学校法人東京工芸大学 検査装置、方法、及びプログラム

Also Published As

Publication number Publication date
TW201642252A (zh) 2016-12-01
TWI587293B (zh) 2017-06-11
US20160019914A1 (en) 2016-01-21
JP6528679B2 (ja) 2019-06-12
TW201642253A (zh) 2016-12-01
TW201503115A (zh) 2015-01-16
US9715885B2 (en) 2017-07-25
TWI585753B (zh) 2017-06-01
TWI581256B (zh) 2017-05-01
JPWO2014136629A1 (ja) 2017-02-09

Similar Documents

Publication Publication Date Title
WO2014136629A1 (ja) 信号処理装置、信号処理方法および信号処理プログラム
JP6406258B2 (ja) 信号処理装置、信号処理方法および信号処理プログラム
JP5791092B2 (ja) 雑音抑圧の方法、装置、及びプログラム
JP6406257B2 (ja) 信号処理装置、信号処理方法および信号処理プログラム
JP5310494B2 (ja) 信号処理方法、情報処理装置、及び信号処理プログラム
WO2014136628A1 (ja) 信号処理装置、信号処理方法および信号処理プログラム
JP6064600B2 (ja) 信号処理装置、信号処理方法、及び信号処理プログラム
JP5788873B2 (ja) 信号処理方法、情報処理装置、及び信号処理プログラム
WO2014084000A1 (ja) 信号処理装置、信号処理方法、および信号処理プログラム
JP5413575B2 (ja) 雑音抑圧の方法、装置、及びプログラム
JP6119604B2 (ja) 信号処理装置、信号処理方法、および信号処理プログラム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 14760696

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2015504258

Country of ref document: JP

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 14773273

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 14760696

Country of ref document: EP

Kind code of ref document: A1