WO2007086380A1 - 高音質化装置及び方法、並びにコンピュータプログラム - Google Patents

高音質化装置及び方法、並びにコンピュータプログラム Download PDF

Info

Publication number
WO2007086380A1
WO2007086380A1 PCT/JP2007/051001 JP2007051001W WO2007086380A1 WO 2007086380 A1 WO2007086380 A1 WO 2007086380A1 JP 2007051001 W JP2007051001 W JP 2007051001W WO 2007086380 A1 WO2007086380 A1 WO 2007086380A1
Authority
WO
WIPO (PCT)
Prior art keywords
sound
signal
generated
effect
sound signal
Prior art date
Application number
PCT/JP2007/051001
Other languages
English (en)
French (fr)
Inventor
Makoto Shirahama
Original Assignee
Pioneer Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pioneer Corporation filed Critical Pioneer Corporation
Priority to US12/162,229 priority Critical patent/US20090048695A1/en
Priority to JP2007555948A priority patent/JP4371246B2/ja
Publication of WO2007086380A1 publication Critical patent/WO2007086380A1/ja

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K15/00Acoustics not otherwise provided for
    • G10K15/08Arrangements for producing a reverberation or echo sound
    • G10K15/12Arrangements for producing a reverberation or echo sound using electronic time-delay networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/02Means for controlling the tone frequencies, e.g. attack or decay; Means for producing special musical effects, e.g. vibratos or glissandos
    • G10H1/06Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour
    • G10H1/12Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour by filtering complex waveforms
    • G10H1/125Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour by filtering complex waveforms using a digital filter
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2250/00Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
    • G10H2250/041Delay lines applied to musical processing

Definitions

  • the present invention relates to a speech signal such as a speech quality enhancement device that improves the degraded sound quality due to compression coding in a speech signal input in a state of being decoded after compression coding.
  • the present invention relates to a sound quality improving device and method for improving sound quality, and a computer program for causing a computer to function as such a sound quality improving device.
  • Patent Document 1 Japanese Patent Application No. 2003-522910
  • the frequency interpolating device described above is intended to improve the sound quality by supplementing the lost frequency component to the last, and there is a possibility that the feeling of rising and the feeling of inflection cannot be improved.
  • the added level when the generated frequency component is added to the input signal is, for example, the analysis of an enormous physical quantity of the signal spectrum over a long period of time. As a result, the scale of the analysis or the scale of the apparatus itself increases, and it may be difficult to mount the apparatus at a low cost.
  • the present invention has been made in view of the above-mentioned problems, for example, and in a processed audio signal that has been subjected to some processing, it is possible to improve the sound quality deteriorated due to the processing. It is an object of the present invention to provide a small-scale, high-quality sound quality improvement device and method, and a computer program that causes a computer to function as such a high quality sound quality improvement device.
  • the sound quality improving apparatus delays a processed sound signal obtained by performing a predetermined type of processing on the original sound signal by delaying the sound signal by a predetermined time. Generating a backward sound signal by delaying the processed sound signal by a time shorter than the predetermined time, and generating a front sound signal by delaying the processed sound signal by a time longer than the predetermined time. And a sound effect generating means for generating a sound effect signal indicating a sound effect for the basic sound indicated by the basic sound signal based on at least the generated backward sound signal and the generated forward sound signal. And synthesizing means for synthesizing the generated sound effect signal with the basic sound signal.
  • the basic sound signal is generated by delaying the processed audio signal input from the decoder or the like by a predetermined time, for example, by a delay unit including a delay circuit.
  • the “processed audio signal” is a signal obtained by performing some processing on the original audio signal.
  • at least a part of the decoding process is performed after compression encoding. It is a signal applied.
  • a high-compression audio data such as MP3 or WMA is a PCM (Pulse Code Modulation: PCM) signal that is decoded (in other words, decompressed or decoded).
  • Normal CD Compact Disc: CD
  • the original audio signal such as compression-encoded data that is the source of such a processed audio signal, has a greater or lesser degradation of the signal during processing, and is typically minimal during compression encoding. Since the original component is deleted based on the signal and time masking curve deleted as below the audible limit curve, the sound quality is degraded compared to the original sound source, and therefore some kind of sound quality improvement measures are required. is there. [0010] In parallel with or before or after the generation of the basic sound signal as described above, the processed sound signal is delayed by a delay means by a time shorter than the predetermined time, thereby generating a rear sound signal.
  • the “short time” may include a case where it is not less than 0, that is, it is not delayed at all as long as it is shorter than the predetermined time. Furthermore, it may include a case where the sound is advanced relative to the basic sound signal or advanced on the time axis.
  • the forward sound signal is generated by delaying the processed audio signal by a time longer than the predetermined time by the delay means.
  • Each of the rear sound signal and the front sound signal is generated as at least one signal, and when a plurality of rear sound signals are generated, their delay times are different from each other. When signals are generated, their delay times are different from each other.
  • the rear sound signal is a signal delayed by 0.6 ms and a signal delayed by 1 ms relative to the basic sound signal
  • the front sound signal is a signal advanced by 0.15 ms and a signal delayed by 0.8 ms. The signal may be advanced.
  • a sound effect signal indicating a sound effect for the basic sound indicated by the basic sound signal is generated by the sound effect generating means based on at least the rear sound signal and the front sound signal generated as described above.
  • “at least based on the generated rear sound signal and generated front sound signal” may be based only on these two types of signals, and in addition to these, “based on the basic sound signal. "In the case of"
  • the sound effect signal generated in this way is synthesized with the basic sound signal by, for example, synthesizing means including a synthesizing circuit, thereby adding the sound effect to the basic sound.
  • synthesizing means including a synthesizing circuit
  • the basic sound signals for example, the rising feeling that would have been attributed to the sound that was deleted during compression based on the time masking effect curve. This will improve the feeling of inflection.
  • a delay circuit and a synthesis circuit can be used as the delay means and the synthesis means, so that the scale of the device itself can be minimized.
  • the predetermined time described above is required for an actual sound quality improvement device by obtaining the relationship between the time lag from the basic sound signal and the effect in advance by experimental, empirical, simulation, or the like. It may be determined in advance by type or by solid so that performance and specifications are satisfied. Furthermore, such a predetermined time may be configured to be changeable during use or inspection of the device.
  • the difference between the delay time of the rear sound signal and the predetermined time of the delay time of the front sound signal is preferably a very small force. Depending on whether it should be generated, it is of a property that is set individually and concretely, and even if it is large or small, a corresponding effect can be obtained. In other words, “backward” or “forward” in the “rear sound signal” or “front sound signal” according to the present invention has no quantitative meaning in terms of time.
  • FFT Fast Fourier Transform
  • the sound effect generating means is a medium to low frequency band for the basic sound based on the generated rear sound signal and the generated front sound signal.
  • a mid-low range sound effect signal indicating a sound effect is generated as a part of the sound effect signal, and a mid-high range effect on the basic sound is generated based on the generated rear sound signal and the generated front sound signal.
  • a mid-high range sound effect signal indicating sound is generated as another part of the sound effect signal.
  • the mid-low range sound effect signal indicating the mid-low range effect sound (for example, the frequency range of 300 Hz or less, but not limited to this) to the basic sound is generated. And generated as a part of the sound effect signal based on the generated front sound signal.
  • the mid-high range sound effect signal indicating the mid-high range for example, the frequency range of 4 kHz or more but not limited to this
  • the output can be improved. For example, depending on the characteristics of the input music signal, natural effects can be added by fluctuations in mid- and high-frequency sounds. For example, the sound quality of vocal-centered music can be improved.
  • the sound effect generating means includes the generated basic sound signal in addition to the generated rear sound signal and the generated front sound signal. Based on the above, the sound effect signal is generated.
  • the sound effect signal is generated based on the generated basic sound signal in addition to the generated rear sound signal and the generated front sound signal. Therefore, the balance of all frequency bands of the sound effect signal is relatively improved.
  • the sound effect generating means is a medium to low frequency sound effect on the basic sound based on the generated rear sound signal and the generated front sound signal.
  • a mid-low range sound effect signal indicating a mid-high range sound effect for the basic sound is generated based on the generated basic sound signal. It may be generated as another part of the sound effect signal.
  • the mid-low range sound effect signal is generated as a part of the sound effect signal based on the generated rear sound signal and the generated front sound signal.
  • a mid-high range sound effect signal is generated as a part of the sound effect signal based on the generated basic sound signal. Accordingly, the balance of the mid-high range is relatively improved, and it is possible to suitably improve and output the sound quality that has deteriorated in the processed audio signal that has been input as a whole.
  • the signal level of the generated mid-low range sound effect signal is amplified with a variable amplification factor, and the generated high-frequency effect sound signal is amplified.
  • An amplification unit that amplifies the level with a variable amplification factor and an amplification factor control unit that changes the variable amplification factor may be further provided.
  • the signal level of the generated mid-low range sound effect signal and the generated signal level of the mid-high range sound effect are each amplified by the gain control means with a variable gain. Therefore, the quality of the original audio signal lost due to the predetermined type of processing can be recovered more or less. Specifically, the sense of volume and density in the mid-high range and mid-low range are compensated. Will be.
  • the amplification factor control means may include a microcomputer that controls the amplification means so as to change the variable amplification factor.
  • the amplification means is controlled by the microcomputer so as to change the variable amplification factor.
  • the microcomputer recognizes the bit rate of these signals, and the variable amplification factor is changed according to the bit rate.
  • the microcomputer recognizes the input function of the product on which the sound quality improving device is mounted, and the variable gain is changed according to the input function. Therefore, it is possible to create a more appropriate sound effect signal for reproducing the original sound signal.
  • the gain control means further detects the sound pressure of the sound effect and sets the variable gain according to the detected sound pressure.
  • a sound pressure detection circuit for controlling the amplification means may be provided so as to change.
  • the sound pressure of the sound effect is detected by the sound pressure detection circuit including, for example, an integration circuit, and the variable amplification factor is changed in accordance with the detected sound pressure.
  • the sound pressure of the sound effect may be detected not only directly but also indirectly from other physical quantities. For example, if the sound pressure of the detected sound effect is too large compared to the basic sound, the variable amplification factor is relatively reduced. In this way, the sound effect suitably corrected according to the sound pressure of the sound effect is synthesized with the basic sound.
  • the amplification factor control means further detects the sound pressure of the basic sound and sets the variable amplification factor according to the detected sound pressure.
  • a sound pressure detection circuit for controlling the amplification means may be provided so as to change.
  • the sound pressure of the basic sound is detected instead of the sound effect by the sound pressure detection circuit.
  • the sound pressure of the basic sound may be detected by being divided into a plurality of frequency bands, or may be detected as a synthesized sound pressure of the entire frequency band without being divided.
  • the variable amplification factor is changed according to the detected sound pressure. Therefore, sound effects with a relatively good balance over all frequencies, not just the mid-low range or mid-high range, are synthesized with the basic tone.
  • the sound effect generating means may be a medium to low frequency band for the basic sound based on the generated rear sound signal and the generated front sound signal.
  • a mid-low range sound effect signal indicating a sound effect is generated as a part of the sound effect signal, and a high frequency sound effect signal indicating a high frequency effect sound with respect to the basic sound based on the generated basic sound signal As another part of the sound effect signal.
  • a mid-low range sound effect signal indicating a mid-low range sound effect for the basic sound is generated, and as another part of the sound effect signal, A high-frequency sound signal indicating a high-frequency sound effect for the basic sound is generated. Therefore, it is possible to compensate for the high frequency component lost from the original audio signal as a result of the predetermined type of processing. For example, it can compensate for high frequency components of 16 kHz or more that are lost when converted to 128 kbps MP3.
  • the sound effect generating means as means for generating the high-frequency effect sound signal, generates a high frequency generating circuit for generating n (n is a natural number of 2 or more) harmonics of the basic sound signal. You may have.
  • an n-th overtone of the basic sound signal is generated as the high-frequency effect sound signal.
  • a second harmonic (so-called second harmonic) of the fundamental sound signal is generated. Therefore, it is possible to more naturally compensate for the high frequency component lost from the original audio signal as a result of the predetermined type of processing.
  • the delay time of the processed sound signal is delayed by a time different from the predetermined time, and other delay means for generating a delayed sound signal;
  • the generated mid-low range sound effect signal and the generated mid-high range sound effect signal are combined with the basic sound signal.
  • the other delay means has a time different from the predetermined time related to the mid-low range sound effect signal (preferably near the basic sound signal and the predetermined time related to the mid-low range sound effect signal).
  • the delayed sound signal is generated by delaying the processed sound signal by a time shorter than the time). This way Based on the delayed sound signal generated in this way, the mid-high range sound effect signal is generated by another sound effect generating means.
  • the sound effect generating means generates a mid-low range sound effect signal. Then, the generated mid-low range sound effect signal and the generated mid-high range sound effect signal are combined with the basic sound signal by the combining means.
  • the degree of delay between the mid-high range sound effect signal and the mid-low range sound effect signal can be set differently. For example, peaks and dips that can occur in the frequency characteristics of mid-high range sound effects (especially high frequencies) can be reduced as much as possible.
  • the sound effect generating means performs a filtering process separately on the generated rear sound signal and the generated front sound signal. You may give as part of the process which produces
  • the filtering process (in the filtering process referred to here) is performed on the generated rear sound signal and the generated front sound signal. Includes low pass processing, high pass processing, and band pass processing). In other words, the frequency band to be cut differs depending on how much the generated rear sound signal and front sound signal are delayed from the basic signal, and the sound quality of the sound effect can be set more finely. .
  • the delay means delays the processed sound signal by a plurality of different times shorter than the predetermined time to thereby generate a plurality of the rear sound signals.
  • a filtering process may be separately performed as a part of the process of generating the sound effect signal with respect to the plurality of generated front sound signals.
  • the plurality of rear sound signals are transmitted by the delay means only for a plurality of different times (for example, 0.99ms, 0.997ms-) shorter than a predetermined time (for example, 1.00ms). Generated by delaying the processed audio signal. At the same time or in succession, by delaying the processed audio signal by a plurality of different times (for example, 1.02 ms, 1.04 ms''') longer than the predetermined time, Generated.
  • a plurality of different times for example, 1.02 ms, 1.04 ms'''
  • the number of the back sound signal and the front sound signal is large in terms of sound quality setting, but for example, if there are two each, it is practically effective enough.
  • the sound effect generation means separately performs a filtering process on the plurality of rear sound signals thus generated and the plurality of front sound signals generated to generate the sound effect signal, thereby further improving the sound quality of the sound effect. Detailed setting is possible.
  • the sound effect generating means performs filtering processing on the generated rear sound signal and the generated front sound signal together with the effect. You may perform as part of the process which produces
  • the filtering process (in the filtering process referred to here) is performed on the generated rear sound signal and the generated front sound signal. Includes low pass processing, high pass processing, and band pass processing). As a result, it is possible to avoid complication of the apparatus while improving the quality of the processed audio signal.
  • the delay means delays the processed sound signal by a plurality of different times shorter than the predetermined time to thereby generate a plurality of the rear sound signals.
  • filtering processing may be collectively performed on the generated plurality of forward sound signals as part of the processing for generating the sound effect signal.
  • the sound effect generating means collectively performs the filtering process on the generated plurality of rear sound signals and the generated plurality of front sound signals, the quality of the processed sound signal is improved. While improving to a greater or lesser extent, complexity of the apparatus can be avoided.
  • Each aspect of the delay unit described above may further include a pre-processing unit that performs a process of lowering a signal level on the processed audio signal before the delay unit.
  • the signal level of the processed audio signal is increased or decreased by the preprocessing unit in the preceding stage of the delay unit, so that the DSP head norlem force S is increased. Secured.
  • the sound quality improvement method of the present invention generates a basic sound signal by delaying a processed sound signal obtained by performing a predetermined type of processing on the original sound signal for a predetermined time.
  • the sound quality improvement method of the present invention as in the case of the sound quality improvement device of the present invention described above, the sound quality deteriorated in the processed sound signal can be suitably improved and output.
  • the sound quality improvement method of the present invention can also adopt various aspects similar to the various aspects of the above-described sound quality improvement apparatus of the present invention.
  • the computer program of the present invention generates a basic sound signal by delaying a processed sound signal obtained by performing a predetermined type of processing on the original sound signal by a predetermined time.
  • sound effect generating means for generating a sound effect signal indicating a sound effect for the basic sound indicated by the basic sound signal based on at least the generated rear sound signal and the generated front sound signal;
  • the generated sound effect signal is made to function as a synthesizing unit that synthesizes the basic sound signal.
  • the computer program of the present invention is read from a recording medium such as a CD-ROM or DVD-ROM storing the computer program and executed by a computer, or the computer program Can be executed after downloading via the communication means, the above-described sound quality improvement device of the present invention can be realized. It is relatively easy to build. As a result, as in the case of the above-described sound quality improvement apparatus of the present invention, the sound quality deteriorated in the processed audio signal can be suitably improved and output.
  • a computer program product in a computer-readable medium is executed by a computer provided in the above-described high sound quality improvement device (including various aspects thereof) of the present invention.
  • Possible program instructions are clearly embodied, and the computer is caused to function as at least part of the delay means, the sound effect generation means, and the synthesis means.
  • the computer program product of the present invention if the computer program product is read into a computer from a recording medium such as a ROM, CD-ROM, DVD-ROM, or hard disk storing the computer program product, or
  • a recording medium such as a ROM, CD-ROM, DVD-ROM, or hard disk storing the computer program product
  • the computer program product which is a transmission wave
  • the computer program product which is a transmission wave
  • the computer program product may be configured with computer-readable code (or computer-readable instructions) that functions as the above-described sound quality improving apparatus of the present invention.
  • the delay means, the sound effect generating means, and the synthesizing means are provided.
  • the delay step, the effect Since the sound generating step and the synthesizing step are provided, it is possible to improve the sound quality deteriorated due to the processing in the processed sound signal subjected to some processing.
  • the computer program of the present invention since the computer functions as a delay unit, a sound effect generating unit, and a synthesizing unit, the above-described sound quality improving apparatus of the present invention can be constructed relatively easily.
  • FIG. 1 is a block diagram conceptually showing the basic structure of an audio quality enhancing apparatus in an example.
  • FIG. 2 is a block diagram conceptually showing the structure of the sound quality enhancing apparatus in the first example.
  • FIG. 3 is a block diagram conceptually showing the structure of an audio quality improvement device in a comparative example.
  • FIG. 4 is a characteristic diagram showing a difference in frequency characteristics between the sound enhancement device according to the first example and the sound enhancement device according to the comparative example.
  • FIG. 5 is a block diagram conceptually showing the structure of a sound quality enhancing apparatus in a second example.
  • FIG. 6 is a block diagram conceptually showing the structure of an audio quality enhancing apparatus in a third example.
  • FIG. 7 is a block diagram conceptually showing the structure of the sound quality enhancing apparatus in the fourth example.
  • FIG. 8 is a block diagram conceptually showing the structure of an audio quality enhancing apparatus in a fifth example.
  • FIG. 9 is a block diagram conceptually showing the structure of an audio quality enhancing apparatus in the sixth example.
  • FIG. 10 is a block diagram conceptually showing the structure of an audio quality enhancing apparatus in the seventh example.
  • FIG. 11 is a block diagram conceptually showing the structure of the sound quality enhancing apparatus in the eighth example.
  • FIG. 1 is a block diagram conceptually showing the basic structure of the sound quality enhancing apparatus in the example.
  • the sound quality enhancing apparatus includes, as a basic configuration, an amplifier circuit 1 as an example of “preprocessing means” according to the present invention and “delay means” according to the present invention.
  • a delay circuit 2 as an example, an amplifier circuit 3 and a synthesis circuit 4 as examples of a “sound effect generation means” according to the present invention, and a synthesis circuit 7 as an example of a “synthesis means” according to the present invention;
  • the sound quality deteriorated in the input compressed audio signal is preferably improved and output.
  • the voice quality improvement apparatus of the present embodiment decodes high-compression voice data such as MP3 and WMA.
  • the PCM signal which is an example of the “processed audio signal” according to the present invention, which has been decompressed or decoded
  • the sound quality deteriorated due to the compression encoding in the PCM signal is improved. It is a device that outputs.
  • Amplifying circuit 1 includes an amplifying element such as a transistor, for example, and relatively lowers the signal level of a PCM signal obtained by decoding high-compression audio data such as MP3 and WMA. Composed. As a result, the headroom for the processing (specifically, DSP processing) of the sound quality enhancing apparatus according to the present embodiment is secured, and clipping is avoided.
  • the delay circuit 2 includes a delay circuit, for example, and is a “delayed sound signal according to the present invention that is delayed in time from the compressed audio signal transmitted by the electrically connected amplifier circuit 1.
  • a delay circuit for example, and is a “delayed sound signal according to the present invention that is delayed in time from the compressed audio signal transmitted by the electrically connected amplifier circuit 1.
  • a signal delayed by a predetermined rear time (for example, n (m) —n (0) [ms]) with respect to the basic sound signal can be considered as a rear sound signal.
  • a predetermined forward time and the predetermined backward time are set to be different, the dip generated when the synthesis circuit 4 combines a plurality of delay signals can be reduced as much as possible.
  • the amplifier circuit 3 is electrically connected to the delay circuit 2, and can appropriately adjust the level of each of the plurality of delay signals generated as described above (that is, the rear sound signal and the front sound signal). Configured as follows.
  • the synthesis circuit 4 is electrically connected to each amplification circuit 3 and is configured to synthesize a rear sound signal and a front sound signal whose levels are adjusted.
  • the synthesizing circuit 7 is electrically connected to the synthesizing circuit 4 and the delay circuit 2, and synthesizes the rear sound signal and the front sound signal synthesized as described above with the basic sound signal, thereby generating an output signal. Configured to generate.
  • the sound quality deteriorated in the input compressed sound signal can be suitably improved and output.
  • FIG. 2 is a block diagram conceptually showing the structure of the sound quality enhancing apparatus in the example.
  • FIG. 2 the same components as those in FIG. 1 are denoted by the same reference numerals, and detailed description thereof will be omitted as appropriate.
  • the sound quality enhancing device is the “effect” according to the present invention.
  • ⁇ sound generation means '' it includes a mid-low range BP filter 51B and a mid-high range BP filter 52B, an amplifier circuit 61, and an amplifier circuit 62.
  • the sound quality deteriorated in the input compressed audio signal is as follows: The output is preferably improved.
  • the mid-low band BP finoleta 51B includes, for example, a band-pass filter, and is electrically connected to the synthesis circuit 4, for example, 10 Hz of the synthesized signal obtained by synthesizing the rear sound signal and the front sound signal. It is configured to generate a mid-low range sound effect signal by passing signals up to 300Hz.
  • the mid-high range BP filter 52B includes, for example, an IIR type band-pass filter, and is electrically connected to the delay circuit 2 to pass a signal from 4 kHz to 12 kHz out of the basic sound signal, thereby causing a mid-high range effect. A sound signal is generated.
  • the amplifier circuit 61 is electrically connected to the mid-low range BP filter 51B, and is configured to appropriately adjust the signal level of the mid-low range sound effect signal.
  • the amplifier circuit 62 is electrically connected to the mid-high range BP filter 52B, and is configured to adjust the signal level of the mid-high range sound effect signal as appropriate.
  • FIG. 3 is a block diagram conceptually showing the configuration of the sound enhancement device according to the comparative example
  • FIG. 4 shows the sound enhancement device according to the first example and the sound enhancement according to the comparison example. It is a characteristic figure which shows the difference in the frequency characteristic with a sound quality improvement apparatus.
  • the frequency characteristic of the output signal obtained by the sound quality improvement device according to the comparative example shown in FIG. 3 is a force that is flat in the entire frequency region as shown by the broken line in FIG. 4 (processing OFF).
  • the frequency characteristics of the output signal obtained by the sound enhancement device according to the present embodiment are relatively high in the middle and low range as shown by the solid line in FIG.
  • the feeling of volume will increase relatively.
  • the sound effect added to the basic sound signal is a sound signal generated by adding not only the front sound signal but also the rear sound signal, it is possible to improve the rise and inflection of the musical sound in the synthesized signal. Compressed audio signal input
  • the sound quality deteriorated in can be suitably improved and output becomes possible.
  • FIG. 5 is a block diagram conceptually showing the structure of the sound quality enhancing apparatus in the example.
  • the same components as those in FIGS. 1 and 2 are denoted by the same reference numerals, and detailed description thereof is omitted as appropriate.
  • the sound quality enhancing apparatus is provided with an LP filter 51L and an HP filter 52H as an example of the "sound effect generating means" according to the present invention, and is input.
  • the sound quality deteriorated in the compressed audio signal is preferably improved and output as follows.
  • the LP finoleta 51L includes, for example, a low-pass filter, and is electrically connected to the synthesis circuit 4 and passes, for example, signals up to 300 Hz out of a synthesized signal obtained by synthesizing the rear sound signal and the front sound signal. To generate a mid-low range sound effect signal.
  • the HP filter 52H includes, for example, a high-pass filter, and is electrically connected to the synthesis circuit 4.
  • the HP filter 52H passes a signal exceeding 4 kHz out of a synthesized signal obtained by synthesizing the rear sound signal and the front sound signal. And generating a mid-high range sound effect signal.
  • the sound quality deteriorated in the input compressed sound signal can be suitably improved and output.
  • peaks and dips occur in the high frequency signal due to frequency characteristics, but depending on the characteristics of the input compressed audio signal, natural effects may be added due to fluctuations in the sound related to the mid-high frequency effect sound signal. Sound quality improvement is expected.
  • FIG. 6 is a block diagram conceptually showing the structure of the sound quality enhancing apparatus in the example.
  • the same components as those in FIG. 2 are denoted by the same reference numerals, and detailed description thereof will be omitted as appropriate.
  • the sound quality improvement device is the variable amplification circuit 61V and the variable amplification circuit 62V as an example of the “amplification means” according to the present invention, and the “amplification means” according to the present invention.
  • a microcomputer 6M as an example of “amplification rate control means” is provided, and the sound quality deteriorated in the input compressed audio signal is preferably improved and output as follows.
  • variable amplifying circuit 6 IV is electrically connected to the mid-low range BP filter 51B and is configured to appropriately adjust the level of the mid-low range sound effect signal.
  • variable amplifier circuit 62V is electrically connected to the mid-high range BP filter 52B, and is configured to appropriately adjust the level of the mid-high range effect sound signal.
  • the microcomputer 6M includes, for example, a CPU (Central Processing Unit: CPU), and is electrically connected to the variable amplification circuit 61V and the variable amplification circuit 62V, and recognizes, for example, an input compressed audio signal.
  • CPU Central Processing Unit
  • the sound quality deteriorated in the input compressed sound signal can be suitably improved and output.
  • the variable amplifier circuit 61V and the variable amplifier circuit 62V are controlled by the microcomputer 6M, it is possible to create an appropriate sound effect according to the input compressed audio signal.
  • FIG. 7 is a block diagram conceptually showing the structure of the sound quality enhancing apparatus in the example.
  • the same components as those in FIG. 6 are denoted by the same reference numerals, and detailed description thereof will be omitted as appropriate.
  • the sound enhancement apparatus includes, in particular, a sound pressure detection circuit 61SP and a sound pressure detection circuit 62SP as examples of the “sound pressure detection circuit” according to the present invention.
  • the sound quality deteriorated in the compressed audio signal applied is suitably improved and output as follows.
  • the sound pressure detection circuit 61SP includes, for example, an integration circuit, and is electrically connected to the BP filter 51B and the variable amplification circuit 61V, respectively, and detects and detects the sound pressure level of the mid-low range sound effect signal.
  • the variable amplification circuit 61V is adjusted in a feed-forward manner based on the set level. For example, if the detected level is relatively low, The level of the mid-low range sound effect signal is adjusted so as to increase.
  • the sound pressure detection circuit 61SP also includes, for example, an integration circuit, and is electrically connected to the BP filter 52B and the variable amplification circuit 62V, respectively. adjust.
  • the sound quality deteriorated in the input compressed sound signal can be suitably improved and output.
  • the degree of synthesis to the basic sound signal according to the sound pressure level of the generated mid-low range sound effect signal and mid-high range sound effect signal it is more appropriate for the input compressed sound signal It is possible to create a sound effect signal.
  • FIG. 8 is a block diagram conceptually showing the structure of the sound quality enhancing apparatus in the example.
  • the same components as those in FIG. 7 are denoted by the same reference numerals, and detailed description thereof will be omitted as appropriate.
  • the sound enhancement device particularly includes a sound pressure detection circuit 6SP, and suitably improves the sound quality deteriorated in the input compressed sound signal as follows. Output.
  • the sound pressure detection circuit 6SP includes, for example, an integration circuit, and is electrically connected to the delay circuit 2, detects the sound pressure level of the basic sound signal, and variably amplifies based on the detected level.
  • the circuit 61V and the variable amplifier circuit 62V are configured to be adjusted.
  • the sound quality deteriorated in the input compressed sound signal can be suitably improved and output.
  • FIG. 9 is a block diagram conceptually showing the configuration of the sound quality enhancing apparatus according to the present embodiment.
  • FIG. 9 the same components as those in FIG. 2 are denoted by the same reference numerals, and detailed description thereof will be omitted as appropriate.
  • the sound enhancement apparatus particularly includes a harmonic generation circuit 52A as an example of the “sound effect generation means” according to the present invention.
  • the deteriorated sound quality is preferably improved and output as follows.
  • the harmonic generation circuit 52A is electrically connected to the delay circuit 2, and performs harmonic generation processing for generating n harmonics (n is a natural number of 2 or more) of the basic sound signal in the basic sound signal. It is configured to generate a mid-high range sound effect signal.
  • the sound quality deteriorated in the input compressed sound signal can be suitably improved and output.
  • the harmonic generation circuit 52A compensates for the high-frequency component cut during compression of the input compressed audio signal (for example, 128kHz MP3 is cut at 16kHz or higher). This makes it possible to synthesize a more natural mid-high range sound effect signal.
  • FIG. 10 is a block diagram conceptually showing the structure of the sound quality improving apparatus in the example.
  • the same components as those in FIG. 5 are denoted by the same reference numerals, and detailed description thereof will be omitted as appropriate.
  • the sound enhancement device particularly includes a middle / high frequency delay circuit 2 'as an example of "another delay means” according to the present invention and an “other” according to the present invention.
  • a middle / high frequency delay circuit 2 ' as an example of "another delay means” according to the present invention and an “other” according to the present invention.
  • ⁇ Effects of sound generation '' it is equipped with a mid-high range amplifier circuit 3 ', a mid-high range synthesis circuit 4', and an HP filter 52H, and the degraded sound quality of the input compressed audio signal is suitable as follows To improve the output.
  • the mid-high range delay circuit 2 includes, for example, a delay circuit as in the delay circuit 2, and is a delay delayed in time from the compressed audio signal transmitted by the electrically connected amplifier circuit 1. It is configured to generate a plurality of signals. Specifically, n (0,) [ms] ⁇ ! 1 (3,) [ms] (where n (0 ') ⁇ ! ⁇ (3') is a predetermined real number and a value in the vicinity of n (2)) is configured to generate multiple delayed signals.
  • the delay time (ie n (0 ') to n (3') each time interval used to generate the mid-high frequency effect sound signal ) Is preferably shorter than the delay time (that is, each time interval from n (0) to n (4)) used to generate the mid-low range sound effect signal.
  • the mid-high frequency amplifying circuit 3 ' is electrically connected to the mid-high frequency delay circuit 2' in the same manner as the amplifying circuit 3, and a plurality of the high-frequency amplifying circuits 3 'generated by the mid-high frequency delay circuit 2' as described above.
  • the level of each of the delay signals ie, the rear sound signal and the front sound signal.
  • the mid-high range synthesis circuit 4 ' is electrically connected to each of the mid-high range amplification circuits 3' so as to synthesize the rear sound signal and the front sound signal whose levels are adjusted. Configured.
  • the HP filter 52H is configured to generate a mid-high range sound effect signal, for example, by performing high-pass filtering on the rear sound signal and the front sound signal together. .
  • the sound quality deteriorated in the input compressed sound signal can be suitably improved and output.
  • the delay signal differs between the generation of the mid-low range sound effect signal and the generation of the mid-high range sound effect signal (specifically, the delay signal related to the delay circuit 2 and the delay signal related to the mid-high range delay circuit 2 ') Therefore, the peaks and dips that appear in the frequency characteristics of the mid-high range sound effect signal (especially the high range) will be reduced as much as possible.
  • FIG. 11 is a block diagram conceptually showing the structure of the sound quality enhancing apparatus in the example.
  • the same components as those in FIG. 2 are denoted by the same reference numerals, and detailed description thereof will be omitted as appropriate.
  • the sound quality enhancing apparatus is provided with an LP finoreta 5L, and is input by separately performing filtering on the rear sound signal and the front sound signal.
  • the sound quality deteriorated in the compressed audio signal is improved and output as follows. To do.
  • the LP filter 5L is individually connected to the output interface of the multiple delay signals (backward sound signal and forward sound signal) generated by the delay circuit 2, and the low-pass filter process is performed separately for each delay signal. It is configured to do.
  • the HP filter 52H is electrically connected to the delay circuit 2 and passes a signal exceeding 4 kHz in the basic sound signal (for example, a signal delayed by n (2) [ms] from the input compressed audio signal). And generating a mid-high range sound effect signal.
  • the sound quality deteriorated in the input compressed sound signal can be suitably improved and output.
  • the LP filter 5L performs individual low-pass filter processing for each delay signal, so that each delay signal can be changed separately, and therefore This makes it possible to make finer sound quality settings.
  • the configuration shown in the first to eighth embodiments may be realized by an audio quality enhancing device incorporated in or internally connected to an audio reproducing device such as an MP3 player. You may implement
  • a voice signal that has been subjected to some processing such as a voice signal input in a decoded state after compression coding, is used for the processing.
  • some processing such as a voice signal input in a decoded state after compression coding
  • the sound quality improvement apparatus and method, and the computer program according to the present invention are accompanied by, for example, compression encoding in an audio signal input in a decoded state after compression encoding.
  • the present invention can be used for a voice quality improvement device that improves a deteriorated sound quality. Further, for example, the present invention can be used for a sound quality improvement device that is mounted on or can be connected to various computer equipment for consumer use or business use.

Abstract

 高音質化装置は、元の音声信号に対して所定種類の処理が施された処理済音声信号を、所定時間遅延させることで基本音信号を生成し、処理済音声信号を所定時間より短い時間だけ遅延させることで後方音信号を生成し、処理済音声信号を所定時間より長い時間だけ遅延させることで前方音信号を生成するディレイ手段を備える。そして、少なくとも生成された後方音信号及び生成された前方音信号に基いて、基本音信号が示す基本音に対する効果音を示す効果音信号を生成する効果音生成手段と、生成された効果音信号を基本音信号に合成する合成手段とを備える。

Description

明 細 書
高音質化装置及び方法、並びにコンピュータプログラム
技術分野
[0001] 本発明は、例えば圧縮符号化後に復号化された状態で入力された音声信号にお ける圧縮符号化に伴レ、劣化した音質を改善させる音声高音質化装置など、音声信 号に係る音質を高める高音質化装置及び方法、並びにコンピュータをそのような高 音質化装置として機能させるコンピュータプログラムの技術分野に関する。
背景技術
[0002] この種の圧縮符号化された音声信号として、 MP3 (MPEG Audio Layer-3: MP3) 或いは WMA (Windows Media Audio : WMA)等の比較的圧縮比率の高い音声信号 を聴く機会が急速に増えている。この背景には、 MP3や WMA等が容量制限の厳し い携帯オーディオやインターネットでの通信に適していることが挙げられる力 その反 面、高圧縮ゆえに再生時の音質が元の音声信号と比べて劣化してしまうという不具 合も指摘されている。
[0003] 上記不具合に対処するために、例えば、原信号の特定周波数帯域における周波 数成分が抑圧された入力信号から、該抑圧された周波数成分を近似的に生成して 入力信号に付加することで、原信号に近い信号を復元するための周波数補間装置( 特許文献 1)が提案されている。
[0004] 特許文献 1 :特願 2003— 522910号公報
発明の開示
発明が解決しょうとする課題
[0005] しかしながら、前述の特許文献 1に開示されている周波数補間装置には、以下のよ うな技術的問題が生じる可能性がある。
[0006] 即ち、前述の周波数補間装置は、あくまで失われた周波数成分を補完することで 音質を改善するものであり、立ち上がり感及び抑揚感を改善するには至らない虞が ある。加えて、生成された周波数成分を入力信号に付加する際の付加レベルは、例 えば信号スペクトルについての膨大な物理量を長時間かけて分析するものであるの で、その分析の規模或いは装置自体の規模が大きくなり、低コストでの装置搭載が困 難となる虞もある。
[0007] 本発明は、例えば上述した問題点に鑑みてなされたものであり、何らかの処理が施 された処理済の音声信号において該処理に伴い劣化した音質を改善することが可 能な、比較的小規模の、高音質化装置及び方法、並びにコンピュータをそのような高 音質化装置として機能させるコンピュータプログラムを提供することを課題とする。
[0008] (音声高音質化装置)
本発明に係る高音質化装置は上述の課題を解決するために、元の音声信号に対 して所定種類の処理が施された処理済音声信号を、所定時間遅延させることで基本 音信号を生成し、前記処理済音声信号を前記所定時間より短い時間だけ遅延させる ことで後方音信号を生成し、前記処理済音声信号を前記所定時間より長い時間だけ 遅延させることで前方音信号を生成するディレイ手段と、少なくとも前記生成された後 方音信号及び前記生成された前方音信号に基レ、て、前記基本音信号が示す基本 音に対する効果音を示す効果音信号を生成する効果音生成手段と、前記生成され た効果音信号を前記基本音信号に合成する合成手段とを備える。
[0009] 本発明によれば、その動作時には、例えば遅延回路からなるディレイ手段によって 、デコーダ等から入力される処理済音声信号が所定時間だけ遅延されることにより、 基本音信号が生成される。ここに「処理済音声信号」とは、元の音声信号に対して何 らかの処理が施された信号であり、典型的には、圧縮符号化された後に復号化処理 の少なくとも一部が施された信号である。例えば MP3或いは WMA等の高圧縮音声 データが、復号化(言い換えれば、解凍或いはデコード)されてなる PCM (Pulse Cod e Modulation : PCM)信号である力 通常の CD (Compact Disc: CD)或いはアナログ 入力信号を A/D変換して得られる PCM信号でもよレ、。このような処理済音声信号 の元となる圧縮符号化データ等の、元の音声信号は、処理時に信号の劣化が大なり 小なり発生しており、典型的には、圧縮符号化時に、最小可聴限界曲線以下として 削除される信号及び時間マスキング曲線に基いて元の成分が削除され、元の音源と 比べて音質が劣化しており、それ故に何らかの音質改善処置が必要とされているの である。 [0010] 上述の如き基本音信号の生成と並行して又は相前後して、ディレイ手段によって、 処理済音声信号が前記所定時間より短い時間だけ遅延されることにより、後方音信 号が生成される。ここでの「短い時間」とは前記所定時間より短い限りにおいて、 0以 上であればよぐ即ち全く遅延させない場合も含んでよい。更に、基本音信号に対し て相対的に進めた或いは時間軸上で進めた場合も含んでもよい。他方、ディレイ手 段によって、処理済音声信号が前記所定時間より長い時間だけ遅延されることによつ て、前方音信号が生成される。
[0011] 後方音信号及び前方音信号は夫々、少なくとも一つの信号として生成され、複数 の後方音信号が生成される場合には、それらの遅延時間は相互に異なり、同様に、 複数の前方音信号が生成される場合には、それらの遅延時間は相互に異なる。例え ば、後方音信号は基本音信号に対して 0. 6ms遅れた信号及び 1. 1ms遅れた信号 とし、他方、前方音信号は基本音信号に対して 0. 15ms進んだ信号及び 0. 8ms進 んだ信号とすればよい。
[0012] 続いて、少なくとも上述の如くに生成された後方音信号及び前方音信号に基いて、 基本音信号が示す基本音に対する効果音を示す効果音信号が、効果音生成手段 によって生成される。ここでの「少なくとも生成された後方音信号及び生成された前方 音信号に基いて」は、これら二種類の信号のみに基いてもよいし、これらに加えて「基 本音信号に基レ、て」の場合でもよレ、趣旨である。
[0013] 更に、このように生成された効果音信号は、例えば合成回路からなる合成手段によ つて基本音信号に合成されることで、基本音に対する効果音の付加が行われる。こ のように前方後方音信号のみならず後方前方音信号も効果音として基本音信号に 合成すると、例えば、時間マスキング効果曲線に基づく圧縮時に削除された音が担 つていたであろう立ち上がり感ゃ抑揚感を向上することとなるのである。この際、ディ レイ手段及び合成手段としては、例えば遅延回路及び合成回路を用いることができ るので、装置自体の規模も極力小さく抑えられる。
[0014] 尚、上述した所定時間は、基本音信号からの時間的なずれとその効果との関係を 予め実験的、経験的、シミュレーション等により求めることで、実際の高音質化装置に 要求される性能や仕様が満足されるように種類別又は固体別に予め定めればよい。 更にこのような所定時間を、当該装置の使用中や点検中に変更可能に構成してもよ レ、。加えて、後方音信号の遅延時間の所定時間との差や前方音信号の遅延時間の 所定時間との差については、好ましくは微小である力 具体的な差の値は、どのよう な効果音を生成すべきかに応じて個別具体的に設定される性質のものであり、大きく ても小さくても相応の効果が得られる。即ち、本発明に係る「後方音信号」や「前方音 信号」にある「後方」或いは「前方」に時間的に定量的な意味はなレ、。
[0015] カロえて、このような時間的にずれた形で遅延された各種信号を生成するにあたり、 F FT (Fast Fourier Transform : FFT)分析して近接周波数を生成することも可能である が、好適には、例えば遅延回路からなるディレイ手段を用いることで、必要とされる D SP (Digital Signal Processor : DSP)リソースが大幅に軽減されることとなる。
[0016] 以上の結果、比較的小規模の装置によって、処理済音声信号において劣化した音 質を好適に改善して出力可能となる。例えば、前方後方音信号のみならず後方前方 音信号も効果音として利用されるので、言うなれば時間軸上で失われた信号を復活 させることとなり、圧縮時に時間マスキング効果曲線に基づいて削除された音が担つ ていたであろう立ち上がり感ゃ抑揚感が向上する。
[0017] 本発明に係る高音質化装置の一態様では、前記効果音生成手段は、前記生成さ れた後方音信号及び前記生成された前方音信号に基いて、前記基本音に対する中 低域効果音を示す中低域効果音信号を前記効果音信号の一部として生成すると共 に、前記生成された後方音信号及び前記生成された前方音信号に基いて、前記基 本音に対する中高域効果音を示す中高域効果音信号を前記効果音信号の他の一 部として生成する。
[0018] この態様によれば、基本音に対する中低域 (例えば 300Hz以下の周波数域である 、これに限る趣旨ではない)効果音を示す中低域効果音信号が、生成された後方 音信号及び生成された前方音信号に基レ、て、効果音信号の一部として生成される。 これと並行して又は相前後して、基本音に対する中高域 (例えば 4kHz以上の周波 数域であるが、これに限る趣旨ではない)効果音を示す中高域効果音信号が、生成 された後方音信号及び生成された前方音信号に基いて、効果音信号の他の一部と して生成される。従って、入力された処理済音声信号において劣化した音質を好適 に改善して出力することが可能となる。例えば、入力の音楽信号の特性によっては中 高域の音の揺らぎによって自然な効果を付加でき、例えばボーカル中心の楽曲の音 質向上が見込まれる。
[0019] 本発明に係る高音質化装置の他の態様では、前記効果音生成手段は、前記生成 された後方音信号及び前記生成された前方音信号に加えて、前記生成された基本 音信号に基いて、前記効果音信号を生成する。
[0020] この態様によれば、効果音信号が、生成された後方音信号及び生成された前方音 信号に加えて、生成された基本音信号に基いて生成される。従って、効果音信号の 全周波数帯域のバランスが相対的に向上する。
[0021] この効果音生成手段に係る態様では、前記効果音生成手段は、前記生成された後 方音信号及び前記生成された前方音信号に基いて、前記基本音に対する中低域効 果音を示す中低域効果音信号を前記効果音信号の一部として生成すると共に、前 記生成された基本音信号に基いて、前記基本音に対する中高域効果音を示す中高 域効果音信号を前記効果音信号の他の一部として生成してもよい。
[0022] この態様によれば、中低域効果音信号が、生成された後方音信号及び生成された 前方音信号に基いて、効果音信号の一部として生成される。これと並行して又は相 前後して、中高域効果音信号が、生成された基本音信号に基いて、効果音信号の 一部として生成される。従って、中高域のバランスが相対的に向上すると共に、全体 的に入力された処理済音声信号において劣化した音質を好適に改善して出力する ことが可能となる。
[0023] 上述した中低域効果音信号に係る各態様では、前記生成された中低域効果音信 号の信号レベルを可変増幅率で増幅すると共に、前記生成された高域効果音の信 号レベルを可変増幅率で増幅する増幅手段と、前記可変増幅率を変更する増幅率 制御手段とを更に備えてもよい。
[0024] この態様によれば、生成された中低域効果音信号の信号レベルと生成された中高 域効果音の信号レベルとが、増幅率制御手段によって、可変増幅率で各々増幅され る。従って、所定種類の処理のために失われた元の音声信号の品質を大なり小なり 取り戻すことができる。具体的には、中高域及び中低域の音量感及び密度感が補わ れることとなる。
[0025] この中低域効果音信号に係る態様では、前記増幅率制御手段は、前記可変増幅 率を変更するように前記増幅手段を制御するマイクロコンピュータを有してもよい。
[0026] この態様によれば、マイクロコンピュータによって、可変増幅率を変更するように増 幅手段が制御される。例えば、処理済音声信号が WMA或いは MP3の場合、これら の信号のビットレートをマイクロコンピュータが認識し、係るビットレートに応じて可変 増幅率が変更されることになる。或いは、高音質化装置が搭載された製品の入力ファ ンクシヨンをマイクロコンピュータが認識し、係る入力ファンクションに応じて可変増幅 率が変更されることになる。従って、元の音声信号を再現するにあたって一層適切な 効果音信号を作り出すことが可能となる。
[0027] 或いはこの中低域効果音信号に係る態様では、更に、前記増幅率制御手段は、前 記効果音の音圧を検出すると共に該検出された音圧に応じて前記可変増幅率を変 更するように前記増幅手段を制御する音圧検出回路を有してもよい。
[0028] この態様によれば、例えば積分回路から成る音圧検出回路によって、効果音の音 圧が検出され、該検出された音圧に応じて可変増幅率が変更される。この際、効果 音の音圧は直接的のみならず、他の物理量から間接的に検出されてもよい。そして、 例えば検出された効果音の音圧が基本音に比べて大きすぎれば、可変増幅率が相 対的に小さくされる。このようにして、効果音の音圧に応じて好適に補正された効果 音が基本音に合成されることとなる。
[0029] 或いはこの中低域効果音信号に係る態様では、更に、前記増幅率制御手段は、前 記基本音の音圧を検出すると共に該検出された音圧に応じて前記可変増幅率を変 更するように前記増幅手段を制御する音圧検出回路を有してもよい。
[0030] この態様によれば、先ず、音圧検出回路によって、効果音に代えて基本音の音圧 が検出される。この際、基本音の音圧は、複数の周波数帯域に分割されて検出され てもよいし、或いは帯域を分割されずに全周波数帯域の合成音圧として検出されて もよレ、。そして検出された音圧に応じて可変増幅率が変更される。従って、中低域或 いは中高域のみならず、全周波数にわたって比較的バランスの良い効果音が基本 音に合成されることとなる。 [0031] 本発明に係る高音質化装置の他の態様では、前記効果音生成手段は、前記生成 された後方音信号及び前記生成された前方音信号に基いて、前記基本音に対する 中低域効果音を示す中低域効果音信号を前記効果音信号の一部として生成すると 共に、前記生成された基本音信号に基いて、前記基本音に対する高域効果音を示 す高域効果音信号を前記効果音信号の他の一部として生成する。
[0032] この態様によれば、効果音信号の一部として、基本音に対する中低域効果音を示 す中低域効果音信号が生成されると共に、効果音信号の他の一部として、基本音に 対する高域効果音を示す高域効果音信号が生成される。従って、所定種類の処理 が施された結果として元の音声信号から失われる高域成分を補填できる。例えば、 1 28kbpsの MP3に変換される際に失われる 16kHz以上の高域成分を補填できる。
[0033] この態様では、前記効果音生成手段は、前記高域効果音信号を生成する手段とし て、前記基本音信号の n (nは二以上の自然数)倍音を生成するための高周波生成 回路を有してもよい。
[0034] この態様によれば、高域効果音信号として、基本音信号の n倍音が生成される。例 えば、基本音信号の二倍音 (所謂、第 2高調波)が生成される。従って、所定種類の 処理が施された結果元の音声信号から失われる高域成分を一層自然に補填できる
[0035] 本発明に係る高音質化装置の他の態様では、前記処理済音声信号を前記所定時 間とは異なる時間だけ遅延させることで遅延音信号を生成する他のディレイ手段と、 前記生成された遅延音信号に基いて前記基本音信号が示す基本音に対する中高 域効果音を示す中高域効果音信号を生成する他の効果音生成手段とを更に備え、 前記効果音生成手段は、前記生成された後方音信号及び前記生成された前方音信 号に基いて、前記基本音に対する中低域効果音を示す中低域効果音信号を前記効 果音信号として生成し、前記合成手段は、前記生成された中低域効果音信号及び 前記生成された中高域効果音信号を前記基本音信号に合成する。
[0036] この態様によれば、他のディレイ手段は、中低域効果音信号に係る所定時間とは 異なる時間 (好適には、前記基本音信号近傍かつ、中低域効果音信号に係る所定 時間より短い時間)だけ処理済音声信号を遅延させて遅延音信号を生成する。こうし て生成された遅延音信号に基いて、他の効果音生成手段によって、中高域効果音 信号が生成される。これと同時に又は相前後して、生成された後方音信号及び生成 された前方音信号に基いて、効果音生成手段によって、中低域効果音信号が生成 される。そして、生成された中低域効果音信号及び生成された中高域効果音信号が 、合成手段によって基本音信号に合成される。従って、中高域効果音信号と中低域 効果音信号との遅延の程度を夫々異なるように設定できる。例えば、中高域効果音 信号 (特に、高域)の周波数特性に発生し得るピークやディップを極力軽減できる。
[0037] 上述した効果音生成手段に係る各態様では、前記効果音生成手段は、前記生成 された後方音信号及び前記生成された前方音信号に対して別々にフィルタリング処 理を前記効果音信号を生成する処理の一部として施してもよい。
[0038] この態様によれば、生成された後方音信号及び生成された前方音信号に対して、 効果音信号を生成する処理の一部として、別々にフィルタリング処理 (ここで言うフィ ルタリング処理には、ローパス処理、ハイパス処理、バンドパス処理が含まれる)が施 される。即ち、生成された後方音信号及び前方音信号が各々基本信号からどれだけ 遅延させられているかに応じて、カットされる周波数帯域は各々異なり、もって、効果 音の音質を一層細かく設定可能となる。
[0039] 或いは上述した効果音生成手段に係る各態様では、前記ディレイ手段は、前記処 理済音声信号を前記所定時間より短い相異なる複数の時間だけ遅延させることで前 記後方音信号を複数生成し、前記処理済音声信号を前記所定時間より長い相異な る複数の時間だけ遅延させることで前記前方音信号を複数生成し、前記効果音生成 手段は、前記生成された複数の後方音信号及び前記生成された複数の前方音信号 に対して別々に、フィルタリング処理を前記効果音信号を生成する処理の一部として 施してもよい。
[0040] この態様によれば、複数の後方音信号が、ディレイ手段によって、所定時間(例え ば、 1. 00ms)より短い相異なる複数の時間(例えば、 0. 99ms, 0. 97ms— )だけ 処理済音声信号を遅延させることで生成される。これと同時に又は相前後して、複数 の前方音信号が、所定時間より長い相異なる複数の時間(例えば、 1. 02ms, 1. 04 ms ' ' ' )だけ処理済音声信号を遅延させることで生成される。尚、上述した複数の後 方音信号と複数の前方音信号とは、同数である必要はない。後方音信号及び前方 音信号の数は、音質設定上は多い方が好ましいが、例えば各々二本ずつあれば実 践上十分効果的である。こうして生成された複数の後方音信号及び生成された複数 の前方音信号に対して、効果音生成手段が別々にフィルタリング処理を施し、効果 音信号を生成することで、効果音の音質をより一層細かく設定可能となる。
[0041] 或いは上述した効果音生成手段に係る各態様では、前記効果音生成手段は、前 記生成された後方音信号及び前記生成された前方音信号に対してまとめてフィルタ リング処理を前記効果音信号を生成する処理の一部として施してもよい。
[0042] この態様によれば、生成された後方音信号及び生成された前方音信号に対して、 効果音信号を生成する処理の一部として、まとめてフィルタリング処理 (ここで言うフィ ルタリング処理には、ローパス処理、ハイパス処理、バンドパス処理が含まれる)が施 される。この結果、処理済音声信号の品質を大なり小なり向上しつつも、装置の複雑 化を回避できる。
[0043] 或いは上述した効果音生成手段に係る各態様では、前記ディレイ手段は、前記処 理済音声信号を前記所定時間より短い相異なる複数の時間だけ遅延させることで前 記後方音信号を複数生成し、前記処理済音声信号を前記所定時間より長い相異な る複数の時間だけ遅延させることで前記前方音信号を複数生成し、前記効果音生成 手段は、前記生成された複数の後方音信号及び前記生成された複数の前方音信号 に対してまとめてフィルタリング処理を前記効果音信号を生成する処理の一部として 施してもよい。
[0044] この態様によれば、生成された複数の後方音信号及び生成された複数の前方音信 号に対して、効果音生成手段がまとめてフィルタリング処理を施すので、処理済音声 信号の品質を大なり小なり向上しつつも、装置の複雑化を回避できる。
[0045] 上述したディレイ手段に係る各態様では、前記ディレイ手段の前段において、前記 処理済音声信号に対して信号レベルを下げる処理を行う前処理手段を更に備えても よい。
[0046] この態様によれば、ディレイ手段の前段において、前処理手段によって、処理済音 声信号に対して信号レベルが大なり小なり下げられ、もって、 DSPのへッドノレーム力 S 確保される。
[0047] (高音質化方法)
本発明の高音質化方法は上記課題を解決するために、元の音声信号に対して所 定種類の処理が施された処理済音声信号を、所定時間遅延させることで基本音信 号を生成し、前記処理済音声信号を前記所定時間より短い時間だけ遅延させること で後方音信号を生成し、前記処理済音声信号を前記所定時間より長い時間だけ遅 延させることで前方音信号を生成するディレイ工程と、少なくとも前記生成された後方 音信号及び前記生成された前方音信号に基レ、て、前記基本音信号が示す基本音 に対する効果音を示す効果音信号を生成する効果音生成工程と、前記生成された 効果音信号を前記基本音信号に合成する合成工程とを備える。
[0048] 本発明の高音質化方法によれば、上述した本発明の高音質化装置の場合と同様 に、処理済音声信号において劣化した音質を好適に改善して出力可能となる。
[0049] 尚、本発明の高音質化方法においても、上述した本発明の高音質化装置における 各種態様と同様の各種態様を採ることが可能である。
[0050] (コンピュータプログラム)
本発明のコンピュータプログラムは上記課題を解決するために、コンピュータを、元 の音声信号に対して所定種類の処理が施された処理済音声信号を、所定時間遅延 させることで基本音信号を生成し、前記処理済音声信号を前記所定時間より短い時 間だけ遅延させることで後方音信号を生成し、前記処理済音声信号を前記所定時間 より長い時間だけ遅延させることで前方音信号を生成するディレイ手段と、少なくとも 前記生成された後方音信号及び前記生成された前方音信号に基レ、て、前記基本音 信号が示す基本音に対する効果音を示す効果音信号を生成する効果音生成手段と 、前記生成された効果音信号を前記基本音信号に合成する合成手段ととして機能さ せる。
[0051] 本発明のコンピュータプログラムによれば、当該コンピュータプログラムを格納する CD-ROM, DVD— ROM等の記録媒体から、当該コンピュータプログラムをコンビ ユータに読み込んで実行させれば、或いは、当該コンピュータプログラムを通信手段 を介してダウンロードさせた後に実行させれば、上述した本発明の高音質化装置を 比較的簡単に構築できる。これにより、上述した本発明の高音質化装置の場合と同 様に、処理済音声信号において劣化した音質を好適に改善して出力可能となる。
[0052] 上記課題を解決するために、コンピュータ読取可能な媒体内のコンピュータプログ ラム製品は、上述した本発明の高音質化装置 (但し、その各種態様を含む)に備えら れたコンピュータにより実行可能なプログラム命令を明白に具現化し、該コンピュータ を、前記ディレイ手段、前記効果音生成手段、及び前記合成手段のうち少なくとも一 部として機能させる。
[0053] 本発明のコンピュータプログラム製品によれば、当該コンピュータプログラム製品を 格納する ROM、 CD-ROM, DVD-ROM,ハードディスク等の記録媒体から、当 該コンピュータプログラム製品をコンピュータに読み込めば、或いは、例えば伝送波 である当該コンピュータプログラム製品を、通信手段を介してコンピュータにダウン口 ードすれば、上述した本発明の高音質化装置を比較的容易に実施可能となる。更に 具体的には、当該コンピュータプログラム製品は、上述した本発明の高音質化装置と して機能させるコンピュータ読取可能なコード(或いはコンピュータ読取可能な命令) 力 構成されてよい。
[0054] 以上説明したように、本発明の高音質化装置によれば、ディレイ手段、効果音生成 手段及び合成手段を備え、本発明の音声高音質化方法によれば、ディレイ工程、効 果音生成工程及び合成工程を備えるので、何らかの処理が施された処理済の音声 信号において該処理に伴い劣化した音質を改善することが可能となる。更に、本発 明のコンピュータプログラムによれば、コンピュータをディレイ手段、効果音生成手段 及び合成手段として機能させるので、上述した本発明の高音質化装置を、比較的容 易に構築できる。
[0055] 本発明の作用及び他の利得は次に説明する実施例から明らかにされよう。
図面の簡単な説明
[0056] [図 1]実施例に係る音声高音質化装置の基本構成を概念的に示すブロック図である
[図 2]第 1実施例に係る音声高音質化装置の構成を概念的に示すブロック図である。
[図 3]比較例に係る音声高音質化装置の構成を概念的に示すブロック図である。 [図 4]第 1実施例に係る音声高音質化装置と比較例に係る音声高音質化装置との周 波数特性における違レ、を示す特性図である。
[図 5]第 2実施例に係る音声高音質化装置の構成を概念的に示すブロック図である。
[図 6]第 3実施例に係る音声高音質化装置の構成を概念的に示すブロック図である。
[図 7]第 4実施例に係る音声高音質化装置の構成を概念的に示すブロック図である。
[図 8]第 5実施例に係る音声高音質化装置の構成を概念的に示すブロック図である。
[図 9]第 6実施例に係る音声高音質化装置の構成を概念的に示すブロック図である。
[図 10]第 7実施例に係る音声高音質化装置の構成を概念的に示すブロック図である
[図 11]第 8実施例に係る音声高音質化装置の構成を概念的に示すブロック図である 符号の説明
1 増幅回路
2 ディレイ回路
3 増幅回路
4 合成回路
7 合成回路
51B 中低域 BPフィルタ
52B 中高域 BPフィルタ
61 増幅回路
62 増幅回路
51L LPフィノレタ
52H HPフィルタ
61V 可変増幅回路
62V 可変増幅回路
6M マイクロコンピュータ
61SP 音圧検出回路
62SP 音圧検出回路 6SP 音圧検出回路
52A 高調波生成回路
2' 中高域用ディレイ回路
3' 中高域用増幅回路
4' 中高域用合成回路
5L LPフィノレタ
発明を実施するための最良の形態
[0058] 以下、本発明を実施するための最良の形態について実施例毎に順に図面に基づ いて説明する。
[0059] (1)実施例に係る音声高音質化装置の基本構成
先ず、実施例に係る音声高音質化装置の基本構成について、図 1を参照して説明 する。ここに、図 1は、実施例に係る音声高音質化装置の基本構成を概念的に示す ブロック図である。
[0060] 図 1において、本実施例に係る音声高音質化装置は、基本構成として、本発明に 係る「前処理手段」の一例としての増幅回路 1と、本発明に係る「ディレイ手段」の一 例としてのディレイ回路 2と、本発明に係る「効果音生成手段」一例としての増幅回路 3及び合成回路 4と、本発明に係る「合成手段」の一例としての合成回路 7とを備え、 入力された圧縮音声信号において劣化した音質を好適に改善して出力する。
[0061] 本実施例の音声高音質化装置は、 MP3、 WMA等の高圧縮音声データが復号ィ匕
(言い換えれば、解凍或いはデコード)されてなる、本発明に係る「処理済音声信号」 の一例である PCM信号を入力として、該 PCM信号における圧縮符号化に伴い劣化 した音質を改善した上で、出力する装置である。
[0062] 増幅回路 1は、例えばトランジスタ等の増幅素子を含んで成り、例えば MP3、 WM A等の高圧縮音声データが復号化されてなる PCM信号の信号レベルを相対的に下 げるように構成される。これにより、本実施例に係る音声高音質化装置の処理 (具体 的には、 DSP処理)用のヘッドルームを確保し、クリップを回避する。
[0063] ディレイ回路 2は、例えば遅延回路を含んで成り、電気的に接続された増幅回路 1 によって伝達される圧縮音声信号から時間的に遅れた、本発明に係る「遅延音信号 」の一例であるディレイ信号を複数本生成するように構成される。具体的には、圧縮 音声信号から n (0) [ms]〜n (k) [ms] (ここに n (0)〜n (k)は所定の実数値)遅れた ディレイ信号を複数本生成するように構成される。そして、その内から例えば n (m) [ ms]を基本音信号に指定すると、その基本音信号に対して所定前方時間(例えば n ( k) -n (m) [ms] )進んだ信号を前方音信号として、又、基本音信号に対して所定後 方時間 (例えば n (m)— n (0) [ms] )遅れた信号を後方音信号として考えることが出 来る。尚、好適には、所定前方時間と所定後方時間とが異なるように設定すれば、合 成回路 4が複数のディレイ信号を合成する際に発生するディップを極力軽減すること ができる。
[0064] 増幅回路 3は、ディレイ回路 2と電気的に接続され、上述のように生成された複数本 のディレイ信号 (即ち、後方音信号及び前方音信号)の各々のレベルを適宜調整可 するように構成される。
[0065] 合成回路 4は、各増幅回路 3と電気的に接続され、レベルが調整された後方音信 号及び前方音信号を合成するように構成される。
[0066] 合成回路 7は、合成回路 4及びディレイ回路 2と電気的に接続され、上述のように合 成された後方音信号及び前方音信号を、基本音信号に合成することで出力信号を 生成するように構成される。
[0067] 以上、図 1に示した、本実施例に係る音声高音質化装置の基本構成によると、入力 された圧縮音声信号において劣化した音質を好適に改善して出力可能となる。例え ば、前方音信号のみならず後方音信号も効果音として利用されるので、時間マスキ ング効果曲線に基づく圧縮時に削除された音が担っていたであろう立ち上力 Sり感ゃ 抑揚感が向上する。
[0068] (2)第 1実施例
第 1実施例に係る音声高音質化装置の構成を図 1に加えて図 2を参照して説明す る。ここに、図 2は、本実施例に係る音声高音質化装置の構成を概念的に示すブロッ ク図である。尚、図 2において、図 1の構成と同一の構成については同一の参照符号 を付し、その詳細な説明を適宜省略する。
[0069] 図 2において、本実施例に係る音声高音質化装置は、特に、本発明に係る「効果 音生成手段」の一例としての中低域 BPフィルタ 51B及び中高域 BPフィルタ 52Bと、 増幅回路 61と、増幅回路 62とを備え、入力された圧縮音声信号において劣化した 音質を、以下のように好適に改善して出力する。
[0070] 中低域 BPフィノレタ 51Bは、例えば帯域通過フィルタを含んで成り、合成回路 4と電 気的に接続され、例えば後方音信号と前方音信号とが合成された合成信号のうち 10 Hzから 300Hzまでの信号を通過させて中低域効果音信号を生成するよう構成され ている。
[0071] 中高域 BPフィルタ 52Bは、例えば IIR型帯域通過フィルタを含んで成り、ディレイ回 路 2と電気的に接続され、基本音信号のうち 4kHzから 12kHzまでの信号を通過させ て中高域効果音信号を生成するよう構成されている。
[0072] 増幅回路 61は、中低域 BPフィルタ 51Bと電気的に接続され、中低域効果音信号 の信号レベルを適宜調整するよう構成されてレヽる。
[0073] 増幅回路 62は、中高域 BPフィルタ 52Bと電気的に接続され、中高域効果音信号 の信号レベルを適宜調整するよう構成されてレヽる。
[0074] 以上、図 2に示した、本実施例に係る音声高音質化装置によると、入力された圧縮 音声信号において劣化した音質を好適に改善して出力可能となる。具体的には、図 2に加えて図 3及び図 4に示すように、中低域効果音信号及び中高域効果音信号が 基本音信号に合成されるので、中低域及び中高域の音量感が相対的に増すこととな る。ここに、図 3は、比較例に係る音声高音質化装置の構成を概念的に示すブロック 図であり、図 4は、第 1実施例に係る音声高音質化装置と比較例に係る音声高音質 化装置との周波数特性における違いを示す特性図である。即ち、図 3に示した比較 例に係る音声高音質化装置によって得られる出力信号の周波数特性は、図 4の破線 (処理 OFF)のように全周波数領域において平坦である力 他方で、図 2に示した本 本実施例に係る音声高音質化装置によって得られる出力信号の周波数特性は、図 4の実線(処理〇N)のように中低域及び中高域が相対的に盛り上がっており、音量 感が相対的に増すこととなる。ここで、基本音信号に加えられる効果音は前方音信号 のみならず後方音信号も加えて生成された音信号である故、合成された信号におい て楽音の立ち上がりや抑揚感を改善する事ができ、もって入力された圧縮音声信号 において劣化した音質を好適に改善して出力可能となる。
[0075] (3)第 2実施例
第 2実施例に係る音声高音質化装置の構成を図 1及び図 2に加えて図 5を参照し て説明する。ここに、図 5は、本実施例に係る音声高音質化装置の構成を概念的に 示すブロック図である。尚、図 5において、図 1及び図 2の構成と同一の構成について は同一の参照符号を付し、その詳細な説明を適宜省略する。
[0076] 図 5において、本実施例に係る音声高音質化装置は、特に、本発明に係る「効果 音生成手段」の一例としての LPフィルタ 51L及び HPフィルタ 52Hとを備え、入力さ れた圧縮音声信号において劣化した音質を、以下のように好適に改善して出力する
[0077] LPフィノレタ 51Lは、例えばローパスフィルタを含んで成り、合成回路 4と電気的に接 続され、例えば後方音信号と前方音信号とが合成された合成信号のうち 300Hzまで の信号を通過させて中低域効果音信号を生成するよう構成されている。
[0078] HPフィルタ 52Hは、例えばハイパスフィルタを含んで成り、合成回路 4と電気的に 接続され、例えば後方音信号と前方音信号とが合成された合成信号のうち 4kHzを 超える信号を通過させて中高域効果音信号を生成するよう構成されている。
[0079] 以上、図 5に示した、本実施例に係る音声高音質化装置によると、入力された圧縮 音声信号において劣化した音質を好適に改善して出力可能となる。特に、周波数特 性上、高域信号にピークやディップが発生するが、入力される圧縮音声信号の特性 によっては、中高域効果音信号に係る音の揺らぎにより、 自然な効果を付加すること となり、音質向上が見込まれる。
[0080] (4)第 3実施例
第 3実施例に係る音声高音質化装置の構成を図 2に加えて図 6を参照して説明す る。ここに、図 6は、本実施例に係る音声高音質化装置の構成を概念的に示すブロッ ク図である。尚、図 6において、図 2の構成と同一の構成については同一の参照符号 を付し、その詳細な説明を適宜省略する。
[0081] 図 6において、本実施例に係る音声高音質化装置は、特に、本発明に係る「増幅 手段」の一例としての可変増幅回路 61V及び可変増幅回路 62Vと、本発明に係る「 増幅率制御手段」の一例としてのマイクロコンピュータ 6Mとを備え、入力された圧縮 音声信号において劣化した音質を、以下のように好適に改善して出力する。
[0082] 可変増幅回路 6 IVは、中低域 BPフィルタ 51Bと電気的に接続され、中低域効果 音信号のレベルを適宜調整するよう構成されてレ、る。
[0083] 可変増幅回路 62Vは、中高域 BPフィルタ 52Bと電気的に接続され、中高域効果 音信号のレベルを適宜調整するよう構成されてレ、る。
[0084] マイクロコンピュータ 6Mは、例えば CPU (Central Processing Unit: CPU)を含んで 成り、可変増幅回路 61V及び可変増幅回路 62Vと電気的に接続され、例えば入力 される圧縮音声信号を認識し、この入力される圧縮音声信号に基いて、生成された 中低域効果音信号及び中高域効果音信号の夫々のレベルを調整するように可変増 幅回路 6 IV及び可変増幅回路 62Vを制御するよう構成されている。
[0085] 以上、図 6に示した、本実施例に係る音声高音質化装置によると、入力された圧縮 音声信号において劣化した音質を好適に改善して出力可能となる。特に、マイクロコ ンピュータ 6Mで可変増幅回路 61V及び可変増幅回路 62Vを制御するので、入力さ れる圧縮音声信号に応じた適切な効果音を作り出すことが可能となるのである。
[0086] (5)第 4実施例
第 4実施例に係る音声高音質化装置の構成を図 6に加えて図 7を参照して説明す る。ここに、図 7は、本実施例に係る音声高音質化装置の構成を概念的に示すブロッ ク図である。尚、図 7において、図 6の構成と同一の構成については同一の参照符号 を付し、その詳細な説明を適宜省略する。
[0087] 図 7において、本実施例に係る音声高音質化装置は、特に、本発明に係る「音圧 検出回路」の一例としての音圧検出回路 61SP及び音圧検出回路 62SPを備え、入 力された圧縮音声信号において劣化した音質を、以下のように好適に改善して出力 する。
[0088] 音圧検出回路 61SPは、例えば積分回路を含んで成り、 BPフィルタ 51B及び可変 増幅回路 61Vと各々電気的に接続され、中低域効果音信号の音圧のレベルを検出 し、検出されたレベルに基いて可変増幅回路 61Vをフィードフォワード的に調整する よう構成されている。例えば、検出されたレベルが比較的低ければ相対的にレベル が高くなるように中低域効果音信号のレベルを調整するよう構成されている。
[0089] 音圧検出回路 61SPも、例えば積分回路を含んで成り、 BPフィルタ 52B及び可変 増幅回路 62Vと各々電気的に接続され、音圧検出回路 61SPと同様に中高域効果 音信号のレベルを調整する。
[0090] 以上、図 7に示した、本実施例に係る音声高音質化装置によると、入力された圧縮 音声信号において劣化した音質を好適に改善して出力可能となる。特に、生成され た中低域効果音信号、中高域効果音信号の音圧のレベルに応じて基本音信号に合 成する度合いを変化させることにより、入力された圧縮音声信号に対してより適切な 効果音信号を作り出すことが可能となる。
[0091] (6)第 5実施例
第 5実施例に係る音声高音質化装置の構成を図 7に加えて図 8を参照して説明す る。ここに、図 8は、本実施例に係る音声高音質化装置の構成を概念的に示すブロッ ク図である。尚、図 8において、図 7の構成と同一の構成については同一の参照符号 を付し、その詳細な説明を適宜省略する。
[0092] 図 8において、本実施例に係る音声高音質化装置は、特に、音圧検出回路 6SPを 備え、入力された圧縮音声信号において劣化した音質を、以下のように好適に改善 して出力する。
[0093] 音圧検出回路 6SPは、例えば積分回路を含んで成り、ディレイ回路 2と電気的に接 続され、基本音信号の音圧のレベルを検出し、検出されたレベルに基いて可変増幅 回路 61V及び可変増幅回路 62Vを調整するよう構成されている。
[0094] 以上、図 8に示した、本実施例に係る音声高音質化装置によると、入力された圧縮 音声信号において劣化した音質を好適に改善して出力可能となる。特に、レベルを 調整する際に、効果音信号ではなぐ音圧検出回路 6SPによって検出された基本音 信号のレベルに応じることで、全周波数帯域のバランス良く各効果音信号を合成す ること力 S可肯 となる。
[0095] (7)第 6実施例
第 6実施例に係る音声高音質化装置の構成を図 2に加えて図 9を参照して説明す る。ここに、図 9は、本実施例に係る音声高音質化装置の構成を概念的に示すブロッ ク図である。尚、図 9において、図 2の構成と同一の構成については同一の参照符号 を付し、その詳細な説明を適宜省略する。
[0096] 図 9において、本実施例に係る音声高音質化装置は、特に、本発明に係る「効果 音生成手段」の一例としての高調波生成回路 52Aを備え、入力された圧縮音声信号 において劣化した音質を、以下のように好適に改善して出力する。
[0097] 高調波生成回路 52Aは、ディレイ回路 2と電気的に接続され、基本音信号に、該基 本音信号の n倍音 (nは二以上の自然数)を生成するための高調波生成処理を施す ことで中高域効果音信号を生成するよう構成されている。
[0098] 以上、図 9に示した、本実施例に係る音声高音質化装置によると、入力された圧縮 音声信号において劣化した音質を好適に改善して出力可能となる。特に、入力され る圧縮音声信号の圧縮時にカットされた高域成分 (例えば、 128kbpsの MP3では、 16kHz以上がカットされている)を高調波生成回路 52Aが補填することで、基本音信 号に対して一層自然な中高域効果音信号を合成することが可能となる。
[0099] (8)第 7実施例
第 7実施例に係る音声高音質化装置の構成を図 5に加えて図 10を参照して説明 する。ここに、図 10は、本実施例に係る音声高音質化装置の構成を概念的に示すブ ロック図である。尚、図 10において、図 5の構成と同一の構成については同一の参照 符号を付し、その詳細な説明を適宜省略する。
[0100] 図 10において、本実施例に係る音声高音質化装置は、特に、本発明に係る「他の ディレイ手段」の一例としての中高域用ディレイ回路 2'と、本発明に係る「他の効果 音生成手段」の一例としての中高域用増幅回路 3'、中高域用合成回路 4'及び HP フィルタ 52Hとを備え、入力された圧縮音声信号において劣化した音質を、以下のよ うに好適に改善して出力する。
[0101] 中高域用ディレイ回路 2'は、ディレイ回路 2と同様に例えば遅延回路を含んで成り 、電気的に接続された増幅回路 1によって伝達される圧縮音声信号から時間的に遅 れたディレイ信号を複数本生成するように構成される。具体的には、圧縮音声信号か ら n (0, ) [ms]〜! 1 (3, ) [ms] (ここに n (0 ' )〜! ι (3 ' )は所定の実数かつ、 n (2)近傍 の値)遅れたディレイ信号を複数本生成するように構成される。この際、中高域効果 音信号 (特に、高域)の周波数特性に現れるピークやディップを考慮すると、中高域 効果音信号の生成に供するディレイ時間(つまり、 n (0 ' )〜n (3 ' )の各々の時間間隔 )が中低域効果音信号の生成に供するディレイ時間(つまり、 n (0)〜n (4)の各々の 時間間隔)に比べて短くすることが好ましい。
[0102] 中高域用増幅回路 3'は、増幅回路 3と同様に、中高域用ディレイ回路 2'と電気的 に接続され、上述のように中高域用ディレイ回路 2'によって生成された複数本のディ レイ信号 (即ち、後方音信号及び前方音信号)の各々のレベルを適宜調整するように 構成される。
[0103] 中高域用合成回路 4'は、合成回路 4と同様に、各中高域用増幅回路 3 'と電気的 に接続され、レベルが調整された後方音信号及び前方音信号を合成するように構成 される。
[0104] HPフィルタ 52Hは、上述したように、例えば後方音信号と前方音信号とに対してま とめてハイパスのフィルタリング処理を施すことで、中高域効果音信号を生成するよう 構成されている。
[0105] 以上、図 10に示した、本実施例に係る音声高音質化装置によると、入力された圧 縮音声信号において劣化した音質を好適に改善して出力可能となる。特に、中低域 効果音信号の生成と中高域効果音信号の生成とで、異なるディレイ信号 (具体的に は、ディレイ回路 2に係るディレイ信号と中高域用ディレイ回路 2'に係るディレイ信号 )が用いられるため、中高域効果音信号 (特に、高域)の周波数特性に現れるピーク やディップを極力軽減することとなる。
[0106] (9)第 8実施例
第 8実施例に係る音声高音質化装置の構成を図 2に加えて図 11を参照して説明 する。ここに、図 11は、本実施例に係る音声高音質化装置の構成を概念的に示すブ ロック図である。尚、図 11において、図 2の構成と同一の構成については同一の参照 符号を付し、その詳細な説明を適宜省略する。
[0107] 図 11において、本実施例に係る音声高音質化装置は、特に、 LPフィノレタ 5Lを備 え、後方音信号及び前方音信号に対してフィルタリング処理を別々に施すことで、入 力された圧縮音声信号において劣化した音質を、以下のように好適に改善して出力 する。
[0108] LPフィルタ 5Lは、ディレイ回路 2が生成する複数本のディレイ信号 (後方音信号及 び前方音信号)の出力インターフェースと個別に接続され、各ディレイ信号毎に対し て別々にローパスフィルタ処理をするよう構成されてレ、る。
[0109] HPフィルタ 52Hは、ディレイ回路 2と電気的に接続され、基本音信号 (例えば入力 された圧縮音声信号から n (2) [ms]遅れた信号)のうち 4kHzを超える信号を通過さ せて中高域効果音信号を生成するよう構成されている。
[0110] 以上、図 11に示した、本実施例に係る音声高音質化装置によると、入力された圧 縮音声信号において劣化した音質を好適に改善して出力可能となる。特に、中低域 効果音信号を生成する際に、 LPフィルタ 5Lが各ディレイ信号毎に個別のローパスフ ィルタ処理をするので、各ディレイ信号に対して別々の変化をつけることができ、もつ て、より細かな音質設定が可能となるのである。
[0111] 第 1実施例から第 8実施例に示す構成は、 MP3プレーヤ等の音声再生装置の内 部に組み込まれた或いは外部に接続された音声高音質化装置によって実現してもよ いし、ディレイ工程、効果音生成工程及び合成工程を備えた音声高音質化方法に基 いて音声再生装置を動作させることによって実現してもよい。或いは、コンピュータに コンピュータプログラムを読み込ませ、コンピュータをディレイ手段及び合成手段とし て機能させることで実現してもよい。
[0112] 以上、本実施例によると、例えば圧縮符号化後に復号化された状態で入力された 音声信号のように、何らかの処理が施された処理済の音声信号にぉレ、て該処理に伴 い劣化した音質を改善することが可能となる。
[0113] 尚、本発明は、上述した実施例に限られるものではなぐ請求の範囲及び明細書全 体から読み取れる発明の要旨、或いは思想に反しない範囲で適宜変更可能であり、 そのような変更を伴う音声高音質化装置及び方法、並びにコンピュータプログラムも また、本発明の技術的範囲に含まれるものである。
産業上の利用可能性
[0114] 本発明に係る高音質化装置及び方法、並びにコンピュータプログラムは、例えば圧 縮符号化後に復号化された状態で入力された音声信号における圧縮符号化に伴い 劣化した音質を改善させる音声高音質化装置に利用可能である。また、例えば民生 用或いは業務用の各種コンピュータ機器に搭載される又は各種コンピュータ機器に 接続可能な高音質化装置等にも利用可能である。

Claims

請求の範囲
[1] 元の音声信号に対して所定種類の処理が施された処理済音声信号を、所定時間 遅延させることで基本音信号を生成し、前記処理済音声信号を前記所定時間より短 レヽ時間だけ遅延させることで後方音信号を生成し、前記処理済音声信号を前記所定 時間より長い時間だけ遅延させることで前方音信号を生成するディレイ手段と、 少なくとも前記生成された後方音信号及び前記生成された前方音信号に基いて、 前記基本音信号が示す基本音に対する効果音を示す効果音信号を生成する効果 音生成手段と、
前記生成された効果音信号を前記基本音信号に合成する合成手段と
を備えたことを特徴とする高音質化装置。
[2] 前記効果音生成手段は、前記生成された後方音信号及び前記生成された前方音 信号に基いて、前記基本音に対する中低域効果音を示す中低域効果音信号を前記 効果音信号の一部として生成すると共に、前記生成された後方音信号及び前記生 成された前方音信号に基いて、前記基本音に対する中高域効果音を示す中高域効 果音信号を前記効果音信号の他の一部として生成することを特徴とする請求の範囲 第 1項に記載の高音質化装置。
[3] 前記効果音生成手段は、前記生成された後方音信号及び前記生成された前方音 信号に加えて、前記生成された基本音信号に基いて、前記効果音信号を生成するこ とを特徴とする請求の範囲第 1項に記載の高音質化装置。
[4] 前記効果音生成手段は、前記生成された後方音信号及び前記生成された前方音 信号に基いて、前記基本音に対する中低域効果音を示す中低域効果音信号を前記 効果音信号の一部として生成すると共に、前記生成された基本音信号に基いて、前 記基本音に対する中高域効果音を示す中高域効果音信号を前記効果音信号の他 の一部として生成することを特徴とする請求の範囲第 3項に記載の高音質化装置。
[5] 前記生成された中低域効果音信号の信号レベルを可変増幅率で増幅すると共に 、前記生成された中高域効果音の信号レベルを可変増幅率で増幅する増幅手段と 前記可変増幅率を変更する増幅率制御手段と を更に備えたことを特徴とする請求の範囲第 2項に記載の高音質化装置。
[6] 前記増幅率制御手段は、前記可変増幅率を変更するように前記増幅手段を制御 するマイクロコンピュータを有することを特徴とする請求の範囲第 5項に記載の高音 質化装置。
[7] 前記増幅率制御手段は、前記効果音の音圧を検出すると共に該検出された音圧 に応じて前記可変増幅率を変更するように前記増幅手段を制御する音圧検出回路 を有することを特徴とする請求の範囲第 5項に記載の高音質化装置。
[8] 前記増幅率制御手段は、前記基本音の音圧を検出すると共に該検出された音圧 に応じて前記可変増幅率を変更するように前記増幅手段を制御する音圧検出回路 を有することを特徴とする請求の範囲第 5項に記載の高音質化装置。
[9] 前記効果音生成手段は、前記生成された後方音信号及び前記生成された前方音 信号に基いて、前記基本音に対する中低域効果音を示す中低域効果音信号を前記 効果音信号の一部として生成すると共に、前記生成された基本音信号に基いて、前 記基本音に対する高域効果音を示す高域効果音信号を前記効果音信号の他の一 部として生成することを特徴とする請求の範囲第 1項に記載の高音質化装置。
[10] 前記効果音生成手段は、前記高域効果音信号を生成する手段として、前記基本 音信号の n (nは二以上の自然数)倍音を生成するための高周波生成回路を有するこ とを特徴とする請求の範囲第 9項に記載の高音質化装置。
[11] 前記処理済音声信号を前記所定時間とは異なる時間だけ遅延させることで遅延音 信号を生成する他のディレイ手段と、
前記生成された遅延音信号に基いて前記基本音信号が示す基本音に対する中高 域効果音を示す中高域効果音信号を生成する他の効果音生成手段と
を更に備え、
前記効果音生成手段は、前記生成された後方音信号及び前記生成された前方音 信号に基いて、前記基本音に対する中低域効果音を示す中低域効果音信号を前記 効果音信号として生成し、
前記合成手段は、前記生成された中低域効果音信号及び前記生成された中高域 効果音信号を前記基本音信号に合成する ことを特徴とする請求の範囲第 1項に記載の高音質化装置。
[12] 前記効果音生成手段は、前記生成された後方音信号及び前記生成された前方音 信号に対して別々にフィルタリング処理を前記効果音信号を生成する処理の一部と して施すことを特徴とする請求の範囲第 1項に記載の高音質化装置。
[13] 前記ディレイ手段は、前記処理済音声信号を前記所定時間より短い相異なる複数 の時間だけ遅延させることで前記後方音信号を複数生成し、前記処理済音声信号を 前記所定時間より長い相異なる複数の時間だけ遅延させることで前記前方音信号を 複数生成し、
前記効果音生成手段は、前記生成された複数の後方音信号及び前記生成された 複数の前方音信号に対して別々に、フィルタリング処理を前記効果音信号を生成す る処理の一部として施すことを特徴とする請求の範囲第 1項に記載の高音質化装置
[14] 前記効果音生成手段は、前記生成された後方音信号及び前記生成された前方音 信号に対してまとめてフィルタリング処理を前記効果音信号を生成する処理の一部と して施すことを特徴とする請求の範囲第 1項に記載の高音質化装置。
[15] 前記ディレイ手段は、前記処理済音声信号を前記所定時間より短い相異なる複数 の時間だけ遅延させることで前記後方音信号を複数生成し、前記処理済音声信号を 前記所定時間より長い相異なる複数の時間だけ遅延させることで前記前方音信号を 複数生成し、
前記効果音生成手段は、前記生成された複数の後方音信号及び前記生成された 複数の前方音信号に対してまとめてフィルタリング処理を前記効果音信号を生成す る処理の一部として施すことを特徴とする請求の範囲第 1項に記載の高音質化装置
[16] 前記ディレイ手段の前段において、前記処理済音声信号に対して信号レベルを下 げる処理を行う前処理手段を
更に備えたことを特徴とする請求の範囲第 1項に記載の高音質化装置。
[17] 元の音声信号に対して所定種類の処理が施された処理済音声信号を、所定時間 遅延させることで基本音信号を生成し、前記処理済音声信号を前記所定時間より短 い時間だけ遅延させることで後方音信号を生成し、前記処理済音声信号を前記所定 時間より長い時間だけ遅延させることで前方音信号を生成するディレイ工程と、 少なくとも前記生成された後方音信号及び前記生成された前方音信号に基いて、 前記基本音信号が示す基本音に対する効果音を示す効果音信号を生成する効果 音生成工程と、
前記生成された効果音信号を前記基本音信号に合成する合成工程と
を備えたことを特徴とする高音質化方法。
コンピュータを、
元の音声信号に対して所定種類の処理が施された処理済音声信号を、所定時間 遅延させることで基本音信号を生成し、前記処理済音声信号を前記所定時間より短 レヽ時間だけ遅延させることで後方音信号を生成し、前記処理済音声信号を前記所定 時間より長い時間だけ遅延させることで前方音信号を生成するディレイ手段と、 少なくとも前記生成された後方音信号及び前記生成された前方音信号に基いて、 前記基本音信号が示す基本音に対する効果音を示す効果音信号を生成する効果 音生成手段と、
前記生成された効果音信号を前記基本音信号に合成する合成手段と
として機能させることを特徴とするコンピュータプログラム。
PCT/JP2007/051001 2006-01-26 2007-01-23 高音質化装置及び方法、並びにコンピュータプログラム WO2007086380A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
US12/162,229 US20090048695A1 (en) 2006-01-26 2007-01-23 Sound-quality improving apparatus and method, and computer program
JP2007555948A JP4371246B2 (ja) 2006-01-26 2007-01-23 高音質化装置及び方法、並びにコンピュータプログラム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2006017631 2006-01-26
JP2006-017631 2006-01-26

Publications (1)

Publication Number Publication Date
WO2007086380A1 true WO2007086380A1 (ja) 2007-08-02

Family

ID=38309170

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2007/051001 WO2007086380A1 (ja) 2006-01-26 2007-01-23 高音質化装置及び方法、並びにコンピュータプログラム

Country Status (3)

Country Link
US (1) US20090048695A1 (ja)
JP (1) JP4371246B2 (ja)
WO (1) WO2007086380A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8185815B1 (en) * 2007-06-29 2012-05-22 Ambrosia Software, Inc. Live preview

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002175092A (ja) * 2000-12-07 2002-06-21 Kenwood Corp 信号補間装置、信号補間方法及び記録媒体
JP2002374599A (ja) * 2001-06-13 2002-12-26 Nippon Hoso Kyokai <Nhk> 音響再生装置及び立体音響再生装置
JP2005128387A (ja) * 2003-10-27 2005-05-19 Yamaha Corp オーディオ帯域拡張再生装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006079349A1 (en) * 2005-01-31 2006-08-03 Sonorit Aps Method for weighted overlap-add

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002175092A (ja) * 2000-12-07 2002-06-21 Kenwood Corp 信号補間装置、信号補間方法及び記録媒体
JP2002374599A (ja) * 2001-06-13 2002-12-26 Nippon Hoso Kyokai <Nhk> 音響再生装置及び立体音響再生装置
JP2005128387A (ja) * 2003-10-27 2005-05-19 Yamaha Corp オーディオ帯域拡張再生装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
FUJIWARA H.: "Point Zukaishiki Saishin MPEG Kyokasho", 1 August 1994, pages: 170 - 174, XP003017981 *

Also Published As

Publication number Publication date
US20090048695A1 (en) 2009-02-19
JP4371246B2 (ja) 2009-11-25
JPWO2007086380A1 (ja) 2009-06-18

Similar Documents

Publication Publication Date Title
JP4747835B2 (ja) オーディオ再生の効果付加方法およびその装置
KR102422741B1 (ko) 베이스 강화
US7369906B2 (en) Digital audio signal processing
JP2008191659A (ja) 音声強調方法及び音声再生システム
JP4701684B2 (ja) 音声処理装置およびプログラム
US20090003497A1 (en) Digital signal processing device, digital signal processing method, and digital signal processing program
JP4760278B2 (ja) 補間装置、オーディオ再生装置、補間方法および補間プログラム
JP2009300707A (ja) 情報処理装置および方法、並びにプログラム
WO2000039786A1 (fr) Procede et appareil de production d&#39;effet sonore et support de stockage d&#39;un programme
WO2012111043A1 (ja) 信号処理方法、信号処理装置、再生装置およびプログラム
US20120328123A1 (en) Signal processing apparatus, signal processing method, and program
US9047876B2 (en) Audio device
JP4371246B2 (ja) 高音質化装置及び方法、並びにコンピュータプログラム
KR20100024727A (ko) 휴대 단말기의 음원 재생 장치 및 음원 재생 방법
JP5034228B2 (ja) 補間装置、音再生装置、補間方法および補間プログラム
JP2007036710A (ja) アタック信号増幅デジタル信号処理装置
WO2020179472A1 (ja) 信号処理装置および方法、並びにプログラム
JP2006350132A (ja) オーディオ再生装置、オーディオ再生方法及びオーディオ再生プログラム
JP2005114813A (ja) オーディオ信号再生装置及び再生方法
US8195317B2 (en) Data reproduction apparatus and data reproduction method
JP4715385B2 (ja) 補間装置、オーディオ再生装置、補間方法および補間プログラム
JP4516805B2 (ja) オーディオ装置
JP2008304635A (ja) 音声信号処理装置、音声再生装置および音声信号処理方法
JP4815986B2 (ja) 補間装置、オーディオ再生装置、補間方法および補間プログラム
JP2012145716A (ja) 音声信号補正装置、音声信号補正方法及びプログラム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 2007555948

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 12162229

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 07707252

Country of ref document: EP

Kind code of ref document: A1