WO2024053122A1 - 音声信号処理装置、音声信号処理方法、及び、プログラム - Google Patents

音声信号処理装置、音声信号処理方法、及び、プログラム Download PDF

Info

Publication number
WO2024053122A1
WO2024053122A1 PCT/JP2022/044499 JP2022044499W WO2024053122A1 WO 2024053122 A1 WO2024053122 A1 WO 2024053122A1 JP 2022044499 W JP2022044499 W JP 2022044499W WO 2024053122 A1 WO2024053122 A1 WO 2024053122A1
Authority
WO
WIPO (PCT)
Prior art keywords
audio signal
signal
processing
frequency
range
Prior art date
Application number
PCT/JP2022/044499
Other languages
English (en)
French (fr)
Inventor
隆 山尾
勲 角張
忠義 奥田
Original Assignee
パナソニックIpマネジメント株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by パナソニックIpマネジメント株式会社 filed Critical パナソニックIpマネジメント株式会社
Publication of WO2024053122A1 publication Critical patent/WO2024053122A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response

Definitions

  • the present disclosure relates to an audio signal processing device, an audio signal processing method, and a program.
  • Patent Document 1 discloses a technique for expanding the high frequency range of an audio signal.
  • the present disclosure provides an audio signal processing device and the like that can easily extend the high frequency range of an audio signal that does not have a 1/f characteristic, such as an audio signal such as a natural sound, so that it causes less discomfort to people. provide.
  • An audio signal processing device includes an acquisition unit that acquires an audio signal, and a high-frequency component in a frequency band higher than a first frequency higher than a human audible range based on the audio signal.
  • a first signal processing unit that generates a first treble range signal; and an addition unit that adds the first treble range signal to the audio signal to generate an extended audio signal with an expanded treble range;
  • the first signal processing unit (i) performs first signal processing on the audio signal including a first clipping process of clipping at a first amplitude, and (ii) performs first signal processing on the audio signal after the first clipping process.
  • the first high-frequency range signal is generated by performing a first high-pass filter process that passes a frequency band higher than the first frequency.
  • an audio signal processing method acquires an audio signal, and based on the audio signal, a first frequency component including a high-frequency component in a frequency band higher than a first frequency higher than a human audible range.
  • 1 treble range signal is generated, and the first treble range signal is added to the audio signal to generate an extended audio signal with an expanded treble range, and in generating the first treble range signal, the first treble range signal is added to the audio signal
  • a first signal processing including a first clipping process of clipping at a first amplitude is performed, and a first high pass that passes a frequency band higher than the first frequency with respect to the audio signal after the first clipping process.
  • the first treble range signal is generated by performing filter processing.
  • the audio signal processing device and the like according to the present disclosure can easily extend the high frequency range of an audio signal that does not have a 1/f characteristic like an audio signal such as a natural sound so that it causes less discomfort to people. .
  • FIG. 1 is a block diagram showing an example of the configuration of an audio signal processing system according to an embodiment.
  • FIG. 2 is a diagram illustrating an example of the configuration of the first signal processing section according to the embodiment.
  • FIG. 3 is a diagram illustrating an example of the waveform of an audio signal before and after each process for explaining each process by the first signal processing unit according to the embodiment.
  • FIG. 4 is a diagram illustrating an example of the configuration of the second signal processing section according to the embodiment.
  • FIG. 5 is a diagram illustrating an example of the waveform of an audio signal before and after each process for explaining each process by the second signal processing unit according to the embodiment.
  • FIG. 6 is a flowchart illustrating an example of audio signal processing by the audio signal processing device according to the embodiment.
  • FIG. 7 is a flowchart illustrating an example of a process for generating a first treble range signal among N treble range signals according to the embodiment.
  • FIG. 8 is a flowchart illustrating an example of an operation for generating a second treble range signal among the N treble range signals according to the embodiment.
  • Patent Document 1 Since the technique described in Patent Document 1 is based on the premise of performing filter processing using a 1/f characteristic filter, it is necessary to expand the treble range of an audio signal that does not have a 1/f characteristic, such as natural sounds. is not taken into account. In other words, with the conventional technology, there is a problem in that it is difficult to extend the high frequency range of an audio signal that does not have a 1/f characteristic, such as natural sounds, so as to reduce the sense of discomfort to people.
  • An audio signal processing device includes an acquisition unit that acquires an audio signal, and a high-frequency component in a frequency band higher than a first frequency higher than a human audible range based on the audio signal.
  • a first signal processing unit that generates a first treble range signal including a treble range signal; and an addition unit that adds the first treble range signal to the audio signal to generate an extended audio signal with an expanded treble range.
  • the first signal processing unit (i) performs first signal processing on the audio signal, including a first clipping process of clipping it at a first amplitude, and (ii) processes the audio signal after the first clipping process.
  • the first high-frequency range signal is generated by performing a first high-pass filter process that passes a frequency band higher than the first frequency.
  • the first clipping process in which the audio signal after the first amplification process is clipped at the first amplitude, an audio signal containing more high frequency components (harmonics) based on the original audio signal is generated. be able to.
  • the first high-pass filter processing is performed on the audio signal after the first clip processing, it is possible to generate a first high-frequency signal with a large sound pressure mainly in the high-frequency range, and the first high-pass filter processing is performed on the audio signal after the first clip processing.
  • By adding the treble range signals it is possible to generate an extended audio signal in which the treble range of the original audio signal is expanded.
  • the high frequency range of an audio signal that does not have a 1/f characteristic, such as a natural sound can be easily extended so as to cause less discomfort to people.
  • An audio signal processing device is the audio signal processing device according to the first aspect, wherein the first signal processing includes first amplification processing that amplifies the audio signal with a first gain. and the first clipping process performed on the audio signal after the first amplification process.
  • the amplification process can make the slope of the waveform of the original audio signal in the sound pressure range based on the first amplitude steeper than before the amplification process, the waveform of the audio signal after the clipping process can be made steeper than before the amplification process.
  • the angle of the bent shape can be made close to 90 degrees. Therefore, it is possible to generate an audio signal that includes more high frequency components (for example, high frequency components higher than the frequency band of the original audio signal and in the inaudible range).
  • An audio signal processing device is the audio signal processing device according to the first aspect or the second aspect, in which the first signal processing section further comprises: A first attenuation process is performed to attenuate the audio signal with a second gain, and the first treble range signal is an audio signal after the first attenuation process is further performed.
  • An audio signal processing device is the audio signal processing device according to the first aspect or the second aspect, wherein the first signal processing section further includes the first high-pass filter processing.
  • a first equalizer process is performed to amplify or attenuate a specific frequency band of the subsequent audio signal, and the first treble range signal is the audio signal further subjected to the first equalizer process.
  • An audio signal processing device is the audio signal processing device according to the first aspect or the second aspect, in which the first signal processing section further includes: A first attenuation process is performed to attenuate the audio signal with a second gain, a first equalizer process is performed to amplify or attenuate a specific frequency band of the audio signal after the first attenuation process, and the first treble signal is , and the audio signal after the first equalizer processing is further performed.
  • An audio signal processing device is an audio signal processing device according to any one of the first to fifth aspects, further comprising: a second signal processing unit that generates a second treble range signal different from the first treble range signal; the second signal processing unit includes: (i) an offset that offsets the audio signal by a predetermined sound pressure amount; (ii) performing second clipping processing to clip the audio signal after the second signal processing at a second amplitude; (iii) performing second signal processing on the audio signal after the second clipping processing;
  • the second high-frequency range signal is generated by performing a second high-pass filter process that passes a frequency band higher than the second frequency higher than the audible range, and the addition unit adds the second high-frequency range signal to the audio signal.
  • the extended audio signal is generated by adding the first treble range signal and the second treble range signal.
  • an audio signal containing more high frequency components based on the original audio signal is generated. be able to. If the audio signal after the first clip processing is clipped without offset processing, it contains many odd-numbered frequency components, and the audio signal after the second clip processing is clipped after offset processing. Contains many even-order frequency components. Therefore, in this case, the frequency characteristics of the first treble range signal and the second treble range signal can be made different, and the treble range of the original audio signal can be expanded more effectively.
  • An audio signal processing device is the audio signal processing device according to the sixth aspect, wherein the second signal processing includes the offset processing and the audio signal after the offset processing. and a second amplification process of amplifying with 3 gains.
  • the amplification process can make the slope of the waveform of the audio signal after the offset process in the sound pressure range based on the second amplitude steeper than before the amplification process, so that the audio signal after the clip process can be made steeper than before the amplification process.
  • the angle of the curved shape of the waveform can be made close to 90 degrees. Therefore, it is possible to generate an audio signal that includes more high frequency components (for example, high frequency components higher than the frequency band of the original audio signal and in the inaudible range).
  • the audio signal processing device is the audio signal processing device according to the sixth aspect or the seventh aspect, in which the second signal processing unit further includes: A second attenuation process is performed to attenuate the audio signal with a fourth gain, and the second treble range signal is the audio signal after the second attenuation process is further performed.
  • An audio signal processing device is the audio signal processing device according to the sixth aspect or the seventh aspect, wherein the second signal processing section further includes the second high-pass filter processing.
  • Second equalizer processing is performed to amplify or attenuate a specific frequency band of the subsequent audio signal, and the second treble range signal is the audio signal further subjected to the second equalizer processing.
  • the audio signal processing device is the audio signal processing device according to the sixth aspect or the seventh aspect, in which the second signal processing section further includes: A second attenuation process is performed to attenuate the audio signal with a fourth gain, a second equalizer process is performed to amplify or attenuate a specific frequency band of the audio signal after the second attenuation process, and the second high-frequency signal is , which is an audio signal after the second equalizer processing is further performed.
  • An audio signal processing device is an audio signal processing device according to any one of the first to fifth aspects, further comprising:
  • the third signal processing section includes a third signal processing section that generates a third high frequency signal different from the first high frequency signal, and the third signal processing section performs (i) a third amplification process that amplifies the audio signal with a fifth gain. (ii) performing a third clipping process of clipping the audio signal after the third amplification process at a third amplitude, and (iii) performing a third clipping process on the audio signal after the third clipping process, which is higher than the audible range.
  • the third high-frequency range signal is generated by performing a third high-pass filter process that passes a frequency band higher than the third frequency, and the addition section adds the first high-frequency range signal and the third high-frequency range signal to the audio signal.
  • the extended audio signal is generated by adding the three high-frequency range signals.
  • the third clipping process of clipping the audio signal after the third amplification process at the third amplitude it is possible to generate an audio signal that includes more high frequency components based on the original audio signal. Since the third high-pass filter process is performed on the audio signal after the third clip process, it is possible to generate a third high-frequency range signal having a large sound pressure mainly in the high-frequency range. Thereby, by adding the first treble range signal and the third treble range signal to the original audio signal, it is possible to generate an extended audio signal in which the treble range of the original audio signal is expanded more effectively.
  • An audio signal processing device is an audio signal processing device according to the eleventh aspect, which includes a set of values of the first gain and the fifth gain, the first amplitude and the fifth gain. At least one of the set of values of the third amplitude and the set of values of the first frequency and the third frequency are different from each other.
  • the third treble range signal can be generated by a process different from the process for generating the first treble range signal. Therefore, the frequency characteristics of the first treble range signal and the third treble range signal can be made different. Thereby, by adding the first treble range signal and the third treble range signal to the original audio signal, it is possible to generate an extended audio signal in which the treble range of the original audio signal is expanded more effectively.
  • An audio signal processing method acquires an audio signal, and based on the audio signal, a second audio signal including a high frequency component in a frequency band higher than a first frequency higher than a human audible range.
  • 1 treble range signal is generated, and the first treble range signal is added to the audio signal to generate an extended audio signal with an expanded treble range, and in generating the first treble range signal, the first treble range signal is added to the audio signal
  • a first signal processing including a first clipping process of clipping at a first amplitude is performed, and a first high pass that passes a frequency band higher than the first frequency with respect to the audio signal after the first clipping process.
  • the first treble range signal is generated by performing filter processing.
  • the first clipping process of clipping the audio signal after the first amplification process at the first amplitude it is possible to generate an audio signal containing more high frequency components based on the original audio signal.
  • the first high-pass filter processing is performed on the audio signal after the first clip processing, it is possible to generate a first high-frequency signal with a large sound pressure mainly in the high-frequency range, and the first high-pass filter processing is performed on the audio signal after the first clip processing.
  • By adding the treble range signals it is possible to generate an extended audio signal in which the treble range of the original audio signal is expanded.
  • the high frequency range of an audio signal that does not have a 1/f characteristic, such as a natural sound can be easily extended so as to cause less discomfort to people.
  • a program according to the fourteenth aspect of the present disclosure is a program for causing a computer to execute the audio signal processing method according to the thirteenth aspect.
  • FIG. 1 is a block diagram showing an example of the configuration of an audio signal processing system 1 according to an embodiment.
  • the audio signal processing system 1 is a system that outputs audio with the high frequency range of the audio signal AS1 (original audio signal) of the audio source expanded.
  • the audio signal processing system 1 includes an audio signal processing device 100 and a speaker 200, as shown in FIG.
  • the audio signal processing device 100 is a device that performs signal processing on the audio signal AS1 of the sound source to expand the treble range of the audio signal AS1.
  • the audio signal processing device 100 outputs an extended audio signal in which the treble range of the audio signal AS1 is expanded.
  • the audio signal processing device 100 may be realized by, for example, an AV (Audio Visual) device such as an amplifier device (preamplifier, integrated amplifier, etc.), a TV, a recording/playback device, an STB (Set Top Box), or a PC ( It may be realized by an information processing terminal such as a personal computer, a smartphone, or a tablet terminal.
  • the speaker 200 outputs output audio based on the extended audio signal output from the audio signal processing device 100.
  • the speaker 200 may be a passive speaker connected to an amplifier device, or an active speaker with a built-in amplifier.
  • the speaker 200 may be a speaker included in a TV, a smartphone, or a tablet terminal.
  • the audio signal processing system 1 may be realized by a single device such as a TV, a smartphone, or a tablet terminal.
  • the audio signal processing device 100 includes a communication IF (Interface) 101, an audio input IF (Interface) 102, a storage 103, and a signal processing circuit 104.
  • the communication IF 101 is an interface for communicating with external devices.
  • the communication IF 101 may acquire the audio signal AS1 as a sound source from the external device, for example, by communicating with the external device.
  • the communication IF 101 may communicate with an external device via a network, or may communicate directly with an external device.
  • the external device that performs communication may be a server, or may be a mobile terminal such as a smartphone or a tablet terminal.
  • the communication IF 101 may be a wireless communication interface or a wired communication interface.
  • the wireless communication interface includes, for example, wireless LAN, Bluetooth (registered trademark), and the like.
  • the wired communication interface includes, for example, a wired LAN.
  • the wired communication interface may include USB.
  • the audio input IF 102 is an interface that receives an audio signal AS1 as a sound source from an external device.
  • the audio input IF 102 includes, for example, an input terminal such as an RCA terminal or a phone terminal that receives an input of an analog audio signal, and an input terminal that receives an input of a digital audio signal such as an optical digital terminal or a coaxial digital terminal.
  • the audio input IF 102 is not limited to an input terminal that accepts input of only an audio signal, but may be an input terminal such as an HDMI (registered trademark) terminal that accepts input of an audio signal as well as an input of a video signal.
  • the storage 103 stores an audio signal AS1 as a sound source.
  • the storage 103 is, for example, a nonvolatile storage device such as an HDD (Hard Disk Drive), an SSD (Solid State Drive), or a memory card.
  • the audio signal processing device 100 does not need to include all of the communication IF 101, audio input IF 102, and storage 103, and only needs to include at least one of the communication IF 101, audio input IF 102, and storage 103.
  • the audio signal AS1 as a sound source is, for example, the sound of a natural sound (environmental sound) collected in advance in nature, such as the sound of a flowing river or waterfall in a valley, the sound of insects, birds, etc. It's a signal.
  • the audio signal AS1 as a sound source is not limited to natural sounds, and may be a music audio signal.
  • the signal processing circuit 104 obtains the audio signal AS1 as a sound source and performs audio signal processing to extend the treble range on the audio signal AS1, thereby generating an extended audio signal with the treble range extended.
  • the signal processing circuit 104 is, for example, a DSP (Digital Signal Processor).
  • the signal processing circuit 104 includes an acquisition section 110, first to Nth signal processing sections 120a to 120X, an addition section 130, and an output section 140. A part or all of each functional block included in the signal processing circuit 104 is realized by a DSP.
  • the signal processing circuit 104 may include a CPU (Central Processing Unit) or may be configured only with a CPU. A part or all of each functional block included in the signal processing circuit 104 may be realized by the CPU executing a program stored in a storage or the like.
  • CPU Central Processing Unit
  • the acquisition unit 110 acquires the audio signal AS1. Specifically, the acquisition unit 110 acquires the audio signal AS1 from at least one of the communication IF 101, the audio input IF 102, and the storage 103.
  • the first to Nth signal processing units 120a to 120X are N signal processing units (N is an integer of 3 or more). Each of the first to Nth signal processing units 120a to 120X generates a high-frequency signal containing a component in a frequency band higher than the frequency band of the audio signal AS1, based on the audio signal AS1. That is, the high frequency signal is a signal that includes components in a high frequency band that are not included in the audio signal AS1.
  • the first to Nth signal processing units 120a to 120X each generate a different high-frequency range signal because each signal processing unit executes different processing. That is, the first to Nth signal processing units 120a to 120X generate N high-frequency range signals, and the generated N high-frequency range signals are mutually different signals. Specific processing by the first to Nth signal processing units 120a to 120X will be described later.
  • the addition unit 130 adds the audio signal AS1 acquired by the acquisition unit 110 and the N high-frequency range signals generated by the N first to Nth signal processing units 120a to 120X, and calculates the high-frequency range. Generate an enhanced enhanced audio signal.
  • the output unit 140 outputs the extended audio signal generated by the addition unit 130. Specifically, output unit 140 outputs the extended audio signal to speaker 200. Note that the output unit 140 may output the extended audio signal to the storage 103 and cause the storage 103 to store the extended audio signal. Further, the output unit 140 may output the extended audio signal to an external device via the communication IF 101.
  • FIG. 2 is a diagram showing an example of the configuration of the first signal processing section 120a according to the embodiment.
  • FIG. 3 is a diagram showing an example of the waveform of an audio signal before and after each process for explaining each process by the first signal processing unit 120a according to the embodiment.
  • the vertical axis represents sound pressure and the horizontal axis represents time.
  • the first signal processing section 120a includes an amplification section 121a, a clip section 122a, a filter section 123a, and an attenuation section 124a.
  • the amplification unit 121a performs amplification processing to amplify the audio signal AS1 acquired by the acquisition unit 110 with a gain G1.
  • the amplification unit 121a amplifies the sound pressure of the audio signal AS1 shown in FIG. 3(a) with a gain G1 greater than 1, thereby generating the amplified audio signal AS2 shown in FIG. 3(b).
  • the amplification process by the amplification section 121a is an example of the first amplification process.
  • Gain G1 is an example of a first gain.
  • the clipping unit 122a performs a clipping process of clipping the audio signal AS2 after the amplification process by the amplification unit 121 with the amplitude A1. That is, the clipping unit 122a clips the audio signal AS2 so that the sound pressure range of ⁇ A1 to A1 remains, as shown in FIGS. 3B and 3C, for example. As a result, an audio signal AS3 is generated having a waveform including a linear shape in which the sound pressure does not change when the sound pressure is A1 and when the sound pressure is -A1. As shown in FIG.
  • the waveform of the audio signal AS3 has a curved shape in a portion including the starting point or the ending point of a linear shape where the sound pressure does not change, so the audio signal AS3 has a high frequency component. Contains more.
  • the amplification process can make the slope of the waveform of the audio signal AS2 steeper in the sound pressure range of -A1 to A1 than before the amplification process.
  • the angle of the curved shape of the waveform of the audio signal AS3 after clipping is 90° smaller than the angle of the curved shape caused by the clipping of the waveform of the audio signal when the audio signal AS1 is clipped without being amplified. The angle can be close to a degree.
  • the clipping process by the clipping unit 122a is an example of the first clipping process.
  • the amplitude A1 is an example of the first amplitude.
  • the filter unit 123a performs a high-pass filter process on the audio signal AS3 after the clipping process by the clipping unit 122a to pass a frequency band (treble range) higher than the frequency f1 higher than the human audible range.
  • Frequency f1 is included in the inaudible region.
  • the high-pass filter process is a process of cutting the frequency band (low range) below the frequency f1 from the audio signal AS3.
  • the filter unit 123a generates an audio signal AS4 in which the sound pressure in the high range is greater than the sound pressure in the low range, as shown in FIG. 3(d).
  • the high-pass filter processing by the filter section 123a is an example of the first high-pass filter processing.
  • Frequency f1 is an example of a first frequency.
  • the attenuation section 124a performs attenuation processing to attenuate the audio signal AS4 after the high-pass filter processing by the filter section 123a with a gain G2.
  • the attenuation unit 124a generates the attenuated audio signal AS5 shown in (e) of FIG. 3 by attenuating the sound pressure of the audio signal AS4 shown in (d) of FIG. 3 with a gain G2 smaller than 1. do.
  • Audio signal AS5 is a first treble range signal.
  • the attenuation process by the attenuation section 124a is an example of the first attenuation process.
  • Gain G2 is an example of a second gain. Note that the gain G2 may be the reciprocal of the gain G1, or may be a value different from the reciprocal of the gain G1.
  • the attenuation process by the attenuation unit 124a is performed after the high-pass filter process by the filter unit 123a, but the present invention is not limited to this, and may be performed after the clip process by the clip unit 122a.
  • high-pass filter processing is performed after attenuation processing. That is, as long as the attenuation process is performed after the clipping process by the clipping section 122a, it may be performed before or after the high-pass filtering process.
  • FIG. 4 is a diagram showing an example of the configuration of the second signal processing section 120b according to the embodiment.
  • FIG. 5 is a diagram showing an example of the waveform of an audio signal before and after each process for explaining each process by the second signal processing unit 120b according to the embodiment.
  • the vertical axis represents sound pressure and the horizontal axis represents time.
  • the second signal processing section 120b includes an offset section 125, an amplification section 121b, a clip section 122b, a filter section 123b, and an attenuation section 124b.
  • the offset unit 125 performs offset processing to offset the audio signal AS1 acquired by the acquisition unit 110 by a predetermined sound pressure amount. For example, the offset unit 125 generates the offset-processed audio signal AS12 shown in FIG. 5(b) by adding a predetermined sound pressure ⁇ SP to the sound pressure of the audio signal AS1 shown in FIG. 5(a). do. Note that the offset unit 125 may perform an offset process of subtracting a predetermined sound pressure from the sound pressure of the audio signal AS1.
  • the amplification unit 121b performs amplification processing to amplify the audio signal AS12 after the offset processing by the offset unit 125 with a gain G3.
  • the amplification process by the amplification section 121b is an example of the second amplification process.
  • Gain G3 is an example of a third gain.
  • the offset processing by the offset section 125 is performed before the amplification processing by the amplification section 121b
  • the offset processing is not limited to this, and may be performed after the amplification processing by the amplification section 121b.
  • the offset processing only needs to be performed before the clipping processing by the clipping section 122b, and may be performed before or after the amplification processing by the amplification section 121b.
  • the clip unit 122b performs a clip process of clipping the audio signal AS13 after the amplification process by the amplification unit 121b with an amplitude A2. That is, the clipping unit 122b clips the audio signal AS13 so that the sound pressure range of ⁇ A2 to A2 remains, as shown in FIGS. 5(c) and 5(d), for example. As a result, an audio signal AS14 having a waveform including a linear shape in which the sound pressure does not change when the sound pressure is A2 and when the sound pressure is ⁇ A2 is generated. As shown in FIG.
  • the waveform of the audio signal AS14 has a curved shape in a portion including the starting point or the ending point of a linear shape where the sound pressure does not change, so the audio signal AS14 has a high frequency component. Contains more.
  • the slope of the waveform of the audio signal AS13 in the sound pressure range of -A2 to A2 becomes steeper than before the amplification process, so the waveform of the audio signal AS14 after the clipping process becomes steeper than before the amplification process.
  • the angle of the bent shape can be close to 90 degrees. Therefore, the audio signal AS14 containing more high frequency components can be generated.
  • the clipping process by the clipping unit 122b is an example of the second clipping process.
  • the amplitude A2 is an example of the second amplitude.
  • the predetermined sound pressure ⁇ SP of the offset amount by the offset section 125 may be larger than, smaller than, or the same as the amplitude A2 clipped by the clip section 122b.
  • the filter unit 123b performs a high-pass filter process on the audio signal AS14 after the first clip process to pass a frequency band (treble range) higher than the frequency f2 higher than the human audible range.
  • Frequency f2 is included in the inaudible region.
  • the high-pass filter process is a process of cutting the frequency band (low range) below the frequency f2 from the audio signal AS14.
  • the filter section 123b generates an audio signal AS15 in which the sound pressure in the high range is greater than the sound pressure in the low range, as shown in FIG. 5(e).
  • the high-pass filter processing by the filter section 123b is an example of second high-pass filter processing.
  • Frequency f2 is an example of a second frequency.
  • the attenuation section 124b performs attenuation processing to attenuate the audio signal AS15 after the high-pass filter processing by the filter section 123b with a gain G4.
  • the attenuation unit 124b attenuates the sound pressure of the audio signal AS15 shown in FIG. 5(e) with a gain G4 smaller than 1, thereby generating the attenuated audio signal AS16 shown in FIG. 5(f). do.
  • the audio signal AS16 is a second treble range signal.
  • the attenuation process by the attenuation section 124b is an example of the second attenuation process.
  • Gain G4 is an example of a fourth gain. Note that the gain G4 may be the reciprocal of the gain G3, or may be a value different from the reciprocal of the gain G3.
  • the attenuation process by the attenuation unit 124b is performed after the high-pass filter process by the filter unit 123b, but the present invention is not limited to this, and may be performed after the clip process by the clip unit 122b.
  • high-pass filter processing is performed after attenuation processing. That is, as long as the attenuation process is performed after the clipping process by the clipping section 122b, it may be performed before or after the high-pass filtering process.
  • the parameters used for each process in the first signal processing section 120a and the second signal processing section 120b may be the same or different.
  • the gain G1 which is a parameter used in the amplification process by the amplification unit 121a
  • the gain G3, which is a parameter used in the amplification process by the amplification unit 121b may be the same or different.
  • the amplitude A1, which is a parameter used in the clipping process by the clipping unit 122a, and the amplitude A2, which is a parameter used in the clipping process by the clipping unit 122b may be the same or different.
  • the frequency f1 which is a parameter used for high-pass filter processing by the filter section 123a
  • the frequency f2 which is a parameter used for high-pass filter processing by the filter section 123b
  • the gain G2 which is a parameter used in the attenuation process by the attenuation section 124a
  • the gain G4 which is a parameter used in the attenuation process by the attenuation section 124b
  • the N first to Nth signal processing units 120a to 120X other signal processing units except the first signal processing unit 120a and the second signal processing unit 120b are the first signal processing unit 120a and the second signal processing unit 120X. Any configuration may be used as long as the high-frequency range signal can be generated by processing different from that of the two-signal processing section 120b.
  • the other signal processing units may have the same processing unit as the first signal processing unit 120a, for example, and may differ from the first signal processing unit 120a in any of the parameters used in the processing of each processing unit.
  • the other signal processing unit is amplified (3rd amplifying processing), which is amplified (third amplification processing), which is amplified by gain G5, and the audio signal after the amplification process (third amplification processing).
  • a clip section that performs clip processing (third clip processing) that clips at A3, and a frequency band higher than f3, which is higher than the human audible range, for the audio signal after the clip processing (third clip processing).
  • It has a filter section that performs high-pass filter processing (third high-pass filter processing) to pass through, and an attenuation section that performs attenuation processing that attenuates the audio signal after the high-pass filter processing (third high-pass filter processing) with a gain G6. It's okay. It is only necessary that one of the parameters used in each process is different from the parameter used in each process of the first signal processing section 120a. That is, at least one of the set of values of gain G1 and gain G5, the set of values of amplitude A1 and amplitude A3, the set of values of frequency f1 and frequency f3, and the set of values of gain G2 and gain G6. It is only necessary that one set of values be different from each other.
  • the other signal processing section in this case is an example of the third signal processing section.
  • the other signal processing units have the same processing unit as the second signal processing unit 120b, for example, as described above, and any of the parameters used for processing in each processing unit are different from the second signal processing unit 120b. You can leave it there.
  • the parameters used in the processing of at least one of the plurality of processing units (offset unit, amplification unit, clipping unit, filter unit, and attenuation unit) included in the other signal processing unit are the same as those of the second signal processing unit.
  • 120b offset section 125, amplification section 121b, clip section 122b, filter section 123b, and attenuation section 124b
  • the parameters used may be different.
  • the other signal processing section may further include an equalizer section.
  • the equalizer section performs equalizer processing to amplify or attenuate a specific frequency band of the audio signal after high-pass filter processing.
  • Equalizer processing is processing that performs different gain adjustments for a first frequency band and a second frequency band different from the first frequency band of an audio signal to be processed. Different gain adjustments may be amplification processing and attenuation processing, processing with different gains in amplification processing, or processing with different gains in attenuation processing. Therefore, it is possible to adjust the frequency characteristics of the audio signal after high-pass filter processing. Thereby, it is possible to generate a treble range signal whose amplitude is appropriately adjusted, and it is possible to appropriately expand the treble range of the audio signal.
  • the equalizer processing may include attenuation processing in the attenuation section. That is, the equalizer process may include a process of attenuating the entire frequency band. In this case, the other signal processing section does not need to have an attenuation section.
  • the other signal processing section may include at least a clip section and a filter section among the amplification section, clip section, filter section, attenuation section, equalizer section, and offset section.
  • At least one of the parameters used for each process is a signal having the same combination of processing units.
  • the parameters used in each process of the processing unit may be different from the parameters used in the process corresponding to the at least one parameter.
  • the N first to Nth signal processing units 120a to 120X have different combinations of processing units, or even if the combination of processing units is the same, the parameters used for processing by the processing units are different.
  • the processing differs depending on which one. Thereby, N mutually different treble range signals can be generated.
  • FIG. 6 is a flowchart illustrating an example of audio signal processing by the audio signal processing device 100 according to the embodiment.
  • the acquisition unit 110 acquires the audio signal AS1 (S11).
  • the first to Nth signal processing units 120a to 120X generate N treble range signals in which the sound pressure in the treble range is greater than that in the bass range, based on the audio signal AS1 (S12).
  • the addition unit 130 adds the audio signal AS1 acquired by the acquisition unit 110 and the N high-frequency signals generated by the N first to Nth signal processing units 120a to 120X, An extended audio signal with an expanded treble range is generated (S13).
  • the output unit 140 outputs the extended audio signal generated by the addition unit 130 (S14).
  • FIG. 7 is a flowchart illustrating an example of a process for generating a first treble range signal among N treble range signals according to the embodiment. That is, FIG. 7 shows a part of the process of step S12 for generating N high-frequency range signals.
  • the amplification unit 121a performs an amplification process to amplify the audio signal AS1 acquired by the acquisition unit 110 with a gain G1 (S21).
  • the clipping unit 122a performs a clipping process of clipping the audio signal AS2 after the amplification process by the amplification unit 121 with the amplitude A1 (S22).
  • the filter unit 123a performs high-pass filter processing on the audio signal AS3 after the first clip processing to pass a frequency band (treble range) higher than the frequency f1 higher than the human audible range (S23). .
  • the attenuation unit 124a performs an attenuation process to attenuate the audio signal AS4 after the high-pass filter processing by the filter unit 123a with a gain G2 (S24).
  • a first treble range signal is generated by executing the processes of steps S21 to S24.
  • FIG. 8 is a flowchart illustrating an example of an operation for generating a second treble range signal among the N treble range signals according to the embodiment. That is, FIG. 8 shows a part of the process of step S12 for generating N high-frequency range signals.
  • the offset unit 125 performs offset processing to offset the audio signal AS1 acquired by the acquisition unit 110 by a predetermined sound pressure amount (S25).
  • the amplification unit 121b performs amplification processing to amplify the audio signal AS12 after the offset processing by the offset unit 125 by a gain G3 (S31).
  • the clip unit 122b performs a clip process of clipping the audio signal AS13 after the amplification process by the amplification unit 121b with the amplitude A2 (S32).
  • the filter unit 123b performs high-pass filter processing on the audio signal AS14 after the first clip processing to pass a frequency band (treble range) higher than the frequency f2 higher than the human audible range (S33). .
  • the attenuation unit 124b performs an attenuation process to attenuate the audio signal AS15 after the high-pass filter processing by the filter unit 123b with a gain G4 (S34).
  • a second treble range signal is generated by executing the processes of steps S25 to S34.
  • signal processing is performed based on the combination of the configurations of the processing units included in each signal processing unit and the parameters used for the processing of each processing unit. N treble signals are generated.
  • the audio signal processing device 100 includes an acquisition section 110, a first signal processing section 120a, and an addition section 130.
  • the acquisition unit 110 acquires the audio signal AS1.
  • the first signal processing unit 120a generates a first treble signal including a treble component in a frequency band higher than a first frequency (frequency f1) which is higher than the human audible range, based on the audio signal AS1.
  • the adder 130 adds the first treble range signal to the audio signal AS1 to generate an extended audio signal with an expanded treble range.
  • the first signal processing unit 120a (i) performs first signal processing on the audio signal AS1, including a first clipping process of clipping at a first amplitude (amplitude A1), and (ii) performs first signal processing on the audio signal AS1 after the first clipping process.
  • a first high-frequency range signal is generated by performing a first high-pass filter process on the audio signal AS3 to pass a frequency band higher than the first frequency (frequency f1).
  • the audio signal includes more high frequency components based on the audio signal AS1.
  • the first high-pass filter processing is performed on the audio signal AS3 after the first clip processing, it is possible to generate a first high-frequency range signal with a large sound pressure mainly in the high-frequency range, and the first high-pass filter processing is performed on the audio signal AS3 after the first clip processing.
  • the treble range signals it is possible to generate an extended audio signal in which the treble range of the audio signal AS1 is expanded.
  • the high frequency range of the audio signal AS1 which does not have a 1/f characteristic such as natural sounds, can be easily extended so as to cause less discomfort to people.
  • the first signal processing includes a first amplification process in which the audio signal AS1 is amplified by a first gain (gain G1), and an audio signal AS2 after the first amplification process. and a first clip process performed on the clip.
  • a first amplification process in which the audio signal AS1 is amplified by a first gain (gain G1), and an audio signal AS2 after the first amplification process. and a first clip process performed on the clip.
  • the amplification process can make the slope in the sound pressure range of -A1 to A1 based on the amplitude A1 of the waveform of the audio signal AS2 steeper than before the amplification process, so that the sound after the clip process can be made steeper than before the amplification process.
  • the angle of the curved waveform of the signal AS3 can be made close to 90 degrees. Therefore, it is possible to generate the audio signal AS3 including more high frequency components (for example, high frequency components higher than the frequency band of the original audio signal AS1 and in the inaudible range).
  • the first signal processing unit 120a further performs a first attenuation process that attenuates the audio signal AS3 after the first clip process by a second gain (gain G2). conduct.
  • the first high frequency signal is the audio signal AS5 after the first attenuation process has been further performed.
  • the amplitude of the audio signal AS4 after the first clip processing (in this embodiment, after the first clip processing and the first high-pass filter processing), which contains more high-frequency components based on the audio signal AS1. can. Thereby, it is possible to generate the first high-frequency range signal whose amplitude is appropriately adjusted, and it is possible to appropriately expand the high-frequency range of the audio signal AS1.
  • the audio signal processing device 100 further includes a second signal processing section 120b.
  • the second signal processing unit 120b generates a second treble range signal different from the first treble range signal based on the audio signal AS1.
  • the second signal processing unit 120b (i) performs second signal processing including offset processing for offsetting a predetermined sound pressure ⁇ SP with respect to the audio signal AS1, and (ii) converts the audio signal AS13 after the second signal processing into a second signal processing unit 120b. 2 amplitude (amplitude A2) is performed, and (iii) the audio signal AS14 after the second clipping process is clipped at a frequency higher than the second frequency (frequency f2) which is higher than the human audible range.
  • a second high-frequency range signal is generated by performing a second high-pass filter process that passes the band.
  • the adder 130 adds the first high-frequency range signal and the second high-frequency range signal to the audio signal AS1 (in the present embodiment, adds the first high-frequency range signal and the second high-frequency range signal to N high-frequency range signals including the first high-frequency range signal and the second high-frequency range signal). (by adding the range signals) to generate an extended audio signal.
  • the audio signal containing more high frequency components based on the audio signal AS1 A signal can be generated.
  • the audio signal AS3 after the first clip processing is clip processed without being offset processed, and since the even-order frequency components are canceled out, it contains many odd-order frequency components, and the audio signal AS14 after the second clip processing is is clipped after offset processing, and contains many even-order frequency components because many even-order frequency components remain without being canceled out. Therefore, the frequency characteristics of the first treble range signal and the second treble range signal can be made different, and the treble range of the audio signal AS1 can be expanded more effectively.
  • the second signal processing includes offset processing and second amplification processing that amplifies the audio signal AS12 after the offset processing by a third gain (gain G3). .
  • the amplification process can make the slope in the sound pressure range of -A2 to A2 based on the amplitude A2 of the waveform of the audio signal AS12 steeper than before the amplification process, so that the sound after the clip process
  • the angle of the curved waveform of the signal AS14 can be made close to 90 degrees. Therefore, it is possible to generate the audio signal AS14 including more high frequency components (for example, high frequency components higher than the frequency band of the original audio signal AS1 and in the inaudible range).
  • the second signal processing unit 120b further performs a second attenuation process that attenuates the audio signal AS14 after the second clip process by a fourth gain (gain G4). conduct.
  • the second treble range signal is the audio signal AS16 after further execution of the second attenuation process.
  • the audio signal processing device 100 further includes a third signal processing section.
  • the third signal processing section generates a third treble range signal different from the first treble range signal based on the audio signal AS1.
  • the third signal processing unit (i) performs a third amplification process to amplify the audio signal AS1 with a fifth gain (gain G5), and (ii) amplifies the audio signal after the third amplification process with a third amplitude (amplitude A3).
  • a third clip process is performed to clip the audio signal, and a third high-pass filter process is performed on the audio signal after the third clip process to pass a frequency band higher than a third frequency (frequency f3) higher than the human audible range.
  • the adder 130 adds the first high-frequency range signal and the third high-frequency range signal to the audio signal AS1 (in the present embodiment, adds the first high-frequency range signal and the third high-frequency range signal to N high-frequency range signals including the first high-frequency range signal and the third high-frequency range signal). (by adding the range signals) to generate an extended audio signal.
  • the third clipping process of clipping the audio signal after the third amplification process at the third amplitude it is possible to generate an audio signal containing more high frequency components based on the audio signal AS1. Since the third high-pass filter process is performed on the audio signal after the third clip process, it is possible to generate a third high-frequency range signal having a large sound pressure mainly in the high-frequency range. Thereby, by adding the first treble range signal and the third treble range signal to the audio signal AS1, it is possible to generate an extended audio signal in which the treble range of the audio signal AS1 is expanded more effectively.
  • a set of values of a first gain (gain G1) and a fifth gain (gain G5), a first amplitude (amplitude A1) and a third amplitude (amplitude A3) are used.
  • at least one of the set of values of the first frequency (frequency f1) and the third frequency (frequency f3) are different from each other.
  • a third treble range signal can be generated. Therefore, the frequency characteristics of the first treble range signal and the third treble range signal can be made different. Thereby, by adding the first treble range signal and the third treble range signal to the audio signal AS1, it is possible to generate an extended audio signal in which the treble range of the audio signal AS1 is expanded more effectively.
  • the audio signal processing device 100 includes N first to Nth signal processing units 120a to 120X, only one of the N first to Nth signal processing units 120a to 120X Any configuration may be sufficient as long as it includes at least one. This is because the at least one signal processing unit can generate at least one high-frequency range signal, and can generate an extended audio signal in which the high-frequency range of the audio signal AS1 is expanded. That is, in the above embodiment, N is an integer of 3 or more, but the present invention is not limited to this, and N may be an integer of 1 or more.
  • each component included in the signal processing circuit 104 may be configured with dedicated hardware, or may be realized by executing a software program suitable for each component.
  • Each component may be realized by a program execution unit such as a CPU or a processor reading and executing a software program recorded on a recording medium such as a hard disk or a semiconductor memory.
  • each component may be a circuit (or integrated circuit). These circuits may constitute one circuit as a whole, or may be separate circuits. Further, each of these circuits may be a general-purpose circuit or a dedicated circuit.
  • general or specific aspects of the present disclosure may be implemented in a system, apparatus, method, integrated circuit, computer program, or non-transitory storage medium such as a computer-readable CD-ROM. Additionally, the present invention may be implemented in any combination of systems, devices, methods, integrated circuits, computer programs, and computer-readable non-transitory storage media.
  • the present disclosure may be realized as an audio signal processing method executed by an audio signal processing device (computer or DSP), or as a program for causing a computer or DSP to execute the audio signal processing method. good.
  • the processing executed by a specific processing unit may be executed by another processing unit. Further, the order of the plurality of processes in the operation of the audio signal processing device 100 described in the above embodiment may be changed, and the plurality of processes may be executed in parallel.
  • the present disclosure provides an audio signal processing device and the like that can easily extend the high frequency range of an audio signal that does not have a 1/f characteristic such as an audio signal such as a natural sound so as to cause less discomfort to people. Useful.
  • Audio signal processing system 100 Audio signal processing device 101 Communication IF 102 Audio input IF 103 Storage 104 Signal processing circuit 110 Acquisition section 120a First signal processing section 120b Second signal processing section 120X Nth signal processing section 121a, 121b Amplification section 122a, 122b Clip section 123a, 123b Filter section 124a, 124b Attenuation section 125 Offset section 130 Adding section 140 Output section 200 Speaker

Abstract

音声信号処理装置(100)は、音声信号(AS1)を取得する取得部(110)と、音声信号(AS1)に基づいて、人の可聴領域よりも高い第1周波数よりも高い周波数帯域の高音域成分を含む第1高音域信号を生成する第1信号処理部(120a)と、音声信号(AS1)に第1高音域信号を加算して、高音域が拡張された拡張音声信号を生成する加算部(130)と、を備え、第1信号処理部(120a)は、(i)音声信号(AS1)に対して、第1振幅でクリップする第1クリップ処理を含む第1信号処理を行い、(ii)第1クリップ処理後の音声信号(AS3)に対して、第1周波数よりも高い周波数帯域を通過させる第1ハイパスフィルタ処理を行う。

Description

音声信号処理装置、音声信号処理方法、及び、プログラム
 本開示は、音声信号処理装置、音声信号処理方法、及び、プログラムに関する。
 特許文献1には、オーディオ信号の高音域を拡張する技術が開示されている。
国際公開第2000/070769号
 本開示は、自然音などの音声信号のような1/f特性を有していない音声信号の高音域を、人に与える違和感が少ないように拡張することが容易にできる音声信号処理装置などを提供する。
 本開示の一態様に係る音声信号処理装置は、音声信号を取得する取得部と、前記音声信号に基づいて、人の可聴領域よりも高い第1周波数よりも高い周波数帯域の高音域成分を含む第1高音域信号を生成する第1信号処理部と、前記音声信号に前記第1高音域信号を加算して、高音域が拡張された拡張音声信号を生成する加算部と、を備え、前記第1信号処理部は、(i)前記音声信号に対して、第1振幅でクリップする第1クリップ処理を含む第1信号処理を行い、(ii)前記第1クリップ処理後の音声信号に対して、前記第1周波数よりも高い周波数帯域を通過させる第1ハイパスフィルタ処理を行うことで、前記第1高音域信号を生成する。
 また、本開示の一態様に係る音声信号処理方法は、音声信号を取得し、前記音声信号に基づいて、人の可聴領域よりも高い第1周波数よりも高い周波数帯域の高音域成分を含む第1高音域信号を生成し、前記音声信号に前記第1高音域信号を加算して、高音域が拡張された拡張音声信号を生成し、前記第1高音域信号の生成では、前記音声信号に対して、第1振幅でクリップする第1クリップ処理を含む第1信号処理を行い、前記第1クリップ処理後の音声信号に対して、前記第1周波数よりも高い周波数帯域を通過させる第1ハイパスフィルタ処理を行うことで、前記第1高音域信号を生成する。
 なお、これらの全般的または具体的な態様は、装置、集積回路、コンピュータプログラムまたはコンピュータ読み取り可能なCD-ROMなどの非一時的な記録媒体で実現されてもよく、装置、集積回路、コンピュータプログラム及び非一時的な記録媒体の任意な組み合わせで実現されてもよい。
 本開示における音声信号処理装置などは、自然音などの音声信号のような1/f特性を有していない音声信号の高音域を、人に与える違和感が少ないように拡張することが容易にできる。
図1は、実施の形態に係る音声信号処理システムの構成の一例を示すブロック図である。 図2は、実施の形態に係る第1信号処理部の構成の一例を示す図である。 図3は、実施の形態に係る第1信号処理部による各処理について説明するための各処理の前後の音声信号の波形の一例を示す図である。 図4は、実施の形態に係る第2信号処理部の構成の一例を示す図である。 図5は、実施の形態に係る第2信号処理部による各処理について説明するための各処理の前後の音声信号の波形の一例を示す図である。 図6は、実施の形態に係る音声信号処理装置の音声信号処理の一例を示すフローチャートである。 図7は、実施の形態に係るN個の高音域信号のうちの第1高音域信号を生成する処理の一例を示すフローチャートである。 図8は、実施の形態に係るN個の高音域信号のうちの第2高音域信号を生成する動作の一例を示すフローチャートである。
 (本開示の基礎となった知見)
 特許文献1に記載の技術では、1/f特性フィルタによるフィルタ処理を行うことが前提であるため、自然音などのような1/f特性を有していない音声信号の高音域を拡張することが考慮されていない。つまり、従来技術では、自然音などのような1/f特性を有していない音声信号の高音域を、人に与える違和感が少ないように拡張することが難しいという課題がある。
 本発明者らは、鋭意検討の上、自然音などの音声信号のような1/f特性を有していない音声信号の高音域を、人に与える違和感が少ないように拡張するために、下記に示すような音声信号処理装置、音声信号処理方法、及び、プログラムを見出すに至った。
 本開示の第1の態様に係る音声信号処理装置は、音声信号を取得する取得部と、前記音声信号に基づいて、人の可聴領域よりも高い第1周波数よりも高い周波数帯域の高音域成分を含む第1高音域信号を生成する第1信号処理部と、前記音声信号に前記第1高音域信号を加算して、高音域が拡張された拡張音声信号を生成する加算部と、を備え、前記第1信号処理部は、(i)前記音声信号に対して、第1振幅でクリップする第1クリップ処理を含む第1信号処理を行い、(ii)前記第1クリップ処理後の音声信号に対して、前記第1周波数よりも高い周波数帯域を通過させる第1ハイパスフィルタ処理を行うことで、前記第1高音域信号を生成する。
 これによれば、第1増幅処理後の音声信号を第1振幅でクリップする第1クリップ処理を行うことで、元の音声信号に基づく高周波成分(高調波)をより多く含む音声信号を生成することができる。そして、第1クリップ処理後の音声信号に対して第1ハイパスフィルタ処理を行うため、主に高音域の音圧が大きい第1高音域信号を生成することができ、元の音声信号に第1高音域信号を加算することで、元の音声信号の高音域が拡張された拡張音声信号を生成することができる。これにより、自然音などのような1/f特性を有していない音声信号の高音域を、人に与える違和感が少ないように拡張することが容易にできる。
 本開示の第2の態様に係る音声信号処理装置は、第1の態様に係る音声信号処理装置であって、前記第1信号処理は、前記音声信号を第1ゲインで増幅させる第1増幅処理と、前記第1増幅処理後の音声信号に対して行う前記第1クリップ処理とを含む。
 これによれば、増幅処理によって、元の音声信号の波形の、第1振幅に基づく音圧の範囲における傾きを増幅処理前よりも急にすることができるため、クリップ処理後の音声信号の波形の屈曲した形状の角度を90度に近づけることができる。よって、より多くの高周波成分(例えば、元の音声信号の周波数帯域よりも高く、かつ、非可聴領域となる高周波成分)を含む音声信号を生成することができる。
 本開示の第3の態様に係る音声信号処理装置は、第1の態様または第2の態様に係る音声信号処理装置であって、前記第1信号処理部は、さらに、前記第1クリップ処理後の音声信号を第2ゲインで減衰させる第1減衰処理を行い、前記第1高音域信号は、さらに前記第1減衰処理が実行された後の音声信号である。
 このため、元の音声信号に基づく高周波成分をより多く含む、第1クリップ処理後の音声信号の振幅の調整を行うことができる。これにより、適切に振幅が調整された第1高音域信号を生成することができ、元の音声信号の高音域を適切に拡張することができる。
 本開示の第4の態様に係る音声信号処理装置は、第1の態様または第2の態様に係る音声信号処理装置であって、前記第1信号処理部は、さらに、前記第1ハイパスフィルタ処理後の音声信号の特定の周波数帯域を増幅または減衰させる第1イコライザ処理を行い、前記第1高音域信号は、さらに前記第1イコライザ処理が実行された後の音声信号である。
 このため、第1ハイパスフィルタ処理後の音声信号の周波数特性の調整を行うことができる。これにより、適切に振幅が調整された第1高音域信号を生成することができ、元の音声信号の高音域を適切に拡張することができる。
 本開示の第5の態様に係る音声信号処理装置は、第1の態様または第2の態様に係る音声信号処理装置であって、前記第1信号処理部は、さらに、前記第1クリップ処理後の音声信号を第2ゲインで減衰させる第1減衰処理を行い、前記第1減衰処理後の音声信号の特定の周波数帯域を増幅または減衰させる第1イコライザ処理を行い、前記第1高音域信号は、さらに前記第1イコライザ処理が実行された後の音声信号である。
 このため、第1ハイパスフィルタ処理後の音声信号の振幅及び周波数特性の調整を行うことができる。これにより、適切に振幅が調整された第1高音域信号を生成することができ、元の音声信号の高音域を適切に拡張することができる。
 本開示の第6の態様に係る音声信号処理装置は、第1の態様から第5の態様のいずれか1つの態様に係る音声信号処理装置であって、さらに、前記音声信号に基づいて、前記第1高音域信号とは異なる第2高音域信号を生成する第2信号処理部を備え、前記第2信号処理部は、(i)前記音声信号に対して所定の音圧分をオフセットさせるオフセット処理を含む第2信号処理を行い、(ii)前記第2信号処理後の音声信号を第2振幅でクリップする第2クリップ処理を行い、(iii)前記第2クリップ処理後の音声信号に対して、前記可聴領域よりも高い第2周波数よりも高い周波数帯域を通過させる第2ハイパスフィルタ処理を行うことで、前記第2高音域信号を生成し、前記加算部は、前記音声信号に、前記第1高音域信号と前記第2高音域信号とを加算して、前記拡張音声信号を生成する。
 これによれば、オフセット処理後及び第2増幅処理後の音声信号を第2振幅でクリップする第2クリップ処理を行うことで、元の音声信号に基づく高周波成分をより多く含む音声信号を生成することができる。第1クリップ処理後の音声信号は、オフセット処理されずにクリップ処理されている場合、奇数次の周波数成分を多く含み、第2クリップ処理後の音声信号は、オフセット処理後にクリップ処理されているため偶数次の周波数成分を多く含む。このため、この場合に第1高音域信号及び第2高音域信号の周波数特性を異ならせることができ、より効果的に元の音声信号の高音域を拡張することができる。
 本開示の第7の態様に係る音声信号処理装置は、第6の態様に係る音声信号処理装置であって、前記第2信号処理は、前記オフセット処理と、前記オフセット処理後の音声信号を第3ゲインで増幅させる第2増幅処理とを含む。
 これによれば、増幅処理によって、オフセット処理後の音声信号の波形の、第2振幅に基づく音圧の範囲における傾きを増幅処理前よりも急にすることができるため、クリップ処理後の音声信号の波形の屈曲した形状の角度を90度に近づけることができる。よって、より多くの高周波成分(例えば、元の音声信号の周波数帯域よりも高く、かつ、非可聴領域となる高周波成分)を含む音声信号を生成することができる。
 本開示の第8の態様に係る音声信号処理装置は、第6の態様または第7の態様に係る音声信号処理装置であって、前記第2信号処理部は、さらに、前記第2クリップ処理後の音声信号を第4ゲインで減衰させる第2減衰処理を行い、前記第2高音域信号は、さらに前記第2減衰処理が実行された後の音声信号である。
 このため、元の音声信号に基づく高周波成分をより多く含む、第2クリップ処理後の音声信号の振幅の調整を行うことができる。これにより、適切に振幅が調整された第2高音域信号を生成することができ、元の音声信号の高音域をより適切に拡張することができる。
 本開示の第9の態様に係る音声信号処理装置は、第6の態様または第7の態様に係る音声信号処理装置であって、前記第2信号処理部は、さらに、前記第2ハイパスフィルタ処理後の音声信号の特定の周波数帯域を増幅または減衰させる第2イコライザ処理を行い、前記第2高音域信号は、さらに前記第2イコライザ処理が実行された後の音声信号である。
 このため、第2ハイパスフィルタ処理後の音声信号の周波数特性の調整を行うことができる。これにより、適切に振幅が調整された第2高音域信号を生成することができ、元の音声信号の高音域をより適切に拡張することができる。
 本開示の第10の態様に係る音声信号処理装置は、第6の態様または第7の態様に係る音声信号処理装置であって、前記第2信号処理部は、さらに、前記第2クリップ処理後の音声信号を第4ゲインで減衰させる第2減衰処理を行い、前記第2減衰処理後の音声信号の特定の周波数帯域を増幅または減衰させる第2イコライザ処理を行い、前記第2高音域信号は、さらに前記第2イコライザ処理が実行された後の音声信号である。
 このため、第2ハイパスフィルタ処理後の音声信号の振幅及び周波数特性の調整を行うことができる。これにより、適切に振幅が調整された第2高音域信号を生成することができ、元の音声信号の高音域をより適切に拡張することができる。
 本開示の第11の態様に係る音声信号処理装置は、第1の態様から第5の態様のいずれか1つの態様に係る音声信号処理装置であって、さらに、前記音声信号に基づいて、前記第1高音域信号とは異なる第3高音域信号を生成する第3信号処理部を備え、前記第3信号処理部は、(i)前記音声信号を第5ゲインで増幅させる第3増幅処理を行い、(ii)前記第3増幅処理後の音声信号を第3振幅でクリップする第3クリップ処理を行い、(iii)前記第3クリップ処理後の音声信号に対して、前記可聴領域よりも高い第3周波数よりも高い周波数帯域を通過させる第3ハイパスフィルタ処理を行うことで、前記第3高音域信号を生成し、前記加算部は、前記音声信号に、前記第1高音域信号と前記第3高音域信号とを加算して、前記拡張音声信号を生成する。
 これによれば、第3増幅処理後の音声信号を第3振幅でクリップする第3クリップ処理を行うことで、元の音声信号に基づく高周波成分をより多く含む音声信号を生成することができる。そして、第3クリップ処理後の音声信号に対して第3ハイパスフィルタ処理を行うため、主に高音域の音圧が大きい第3高音域信号を生成することができる。これにより、元の音声信号に第1高音域信号及び第3高音域信号を加算することで、元の音声信号の高音域がより効果的に拡張された拡張音声信号を生成することができる。
 本開示の第12の態様に係る音声信号処理装置は、第11の態様に係る音声信号処理装置であって、前記第1ゲインと前記第5ゲインとの値の組、前記第1振幅と前記第3振幅との値の組、及び、前記第1周波数と前記第3周波数との値の組の少なくともいずれか1つの値の組は、互いに異なる。
 これによれば、第1ゲインと第5ゲインとの値の組、第1振幅と第3振幅との値の組、及び、第1周波数と第3周波数との値の組の少なくともいずれか1つの値の組は、互いに異なっているため、第1高音域信号を生成する処理とは異なる処理で第3高音域信号を生成することができる。このため、第1高音域信号及び第3高音域信号の周波数特性を異ならせることができる。これにより、元の音声信号に第1高音域信号及び第3高音域信号を加算することで、元の音声信号の高音域がより効果的に拡張された拡張音声信号を生成することができる。
 本開示の第13の態様に係る音声信号処理方法は、音声信号を取得し、前記音声信号に基づいて、人の可聴領域よりも高い第1周波数よりも高い周波数帯域の高音域成分を含む第1高音域信号を生成し、前記音声信号に前記第1高音域信号を加算して、高音域が拡張された拡張音声信号を生成し、前記第1高音域信号の生成では、前記音声信号に対して、第1振幅でクリップする第1クリップ処理を含む第1信号処理を行い、前記第1クリップ処理後の音声信号に対して、前記第1周波数よりも高い周波数帯域を通過させる第1ハイパスフィルタ処理を行うことで、前記第1高音域信号を生成する。
 これによれば、第1増幅処理後の音声信号を第1振幅でクリップする第1クリップ処理を行うことで、元の音声信号に基づく高周波成分をより多く含む音声信号を生成することができる。そして、第1クリップ処理後の音声信号に対して第1ハイパスフィルタ処理を行うため、主に高音域の音圧が大きい第1高音域信号を生成することができ、元の音声信号に第1高音域信号を加算することで、元の音声信号の高音域が拡張された拡張音声信号を生成することができる。これにより、自然音などのような1/f特性を有していない音声信号の高音域を、人に与える違和感が少ないように拡張することが容易にできる。
 本開示の第14の態様に係るプログラムは、第13の態様に係る音声信号処理方法をコンピュータに実行させるためのプログラムである。
 なお、これらの全般的または具体的な態様は、装置、集積回路、コンピュータプログラムまたはコンピュータ読み取り可能なCD-ROMなどの非一時的な記録媒体で実現されてもよく、装置、集積回路、コンピュータプログラム及び非一時的な記録媒体の任意な組み合わせで実現されてもよい。
 以下、適宜図面を参照しながら、実施の形態を詳細に説明する。但し、必要以上に詳細な説明は省略する場合がある。例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。
 なお、発明者は、当業者が本開示を十分に理解するために添付図面及び以下の説明を提供するのであって、これらによって請求の範囲に記載の主題を限定することを意図するものではない。
 (実施の形態)
 [1.構成]
 図1は、実施の形態に係る音声信号処理システム1の構成の一例を示すブロック図である。
 音声信号処理システム1は、音源の音声信号AS1(元の音声信号)の高音域を拡張した音声を出力するシステムである。音声信号処理システム1は、図1に示されるように音声信号処理装置100と、スピーカ200とを備える。
 音声信号処理装置100は、音源の音声信号AS1に対して、当該音声信号AS1の高音域を拡張する信号処理を行う装置である。音声信号処理装置100は、音声信号AS1の高音域が拡張された拡張音声信号を出力する。音声信号処理装置100は、例えば、アンプ装置(プリアンプ、インテグレーテッドアンプなど)、TV、録画再生装置、STB(Set Top Box)などのAV(Audio Visual)機器で実現されてもよいし、PC(Personal Computer)、スマートフォン、タブレット端末などの情報処理端末で実現されてもよい。
 スピーカ200は、音声信号処理装置100から出力された拡張音声信号に基づく出力音声を出力する。スピーカ200は、アンプ装置に接続されるパッシブスピーカであってもよいし、アンプを内蔵しているアクティブスピーカであってもよい。また、スピーカ200は、TV、スマートフォン、タブレット端末が備えるスピーカであってもよい。この場合、音声信号処理システム1は、TV、スマートフォン、タブレット端末などの単体の機器で実現されてもよい。
 <音声信号処理装置の構成>
 音声信号処理装置100は、通信IF(Interface)101と、音声入力IF(Interface)102と、ストレージ103と、信号処理回路104とを備える。
 通信IF101は、外部機器と通信を行うためのインターフェースである。通信IF101は、例えば、外部機器と通信を行うことで、音源としての音声信号AS1を外部機器から取得してもよい。通信IF101は、ネットワークを介して外部機器と通信を行ってもよいし、外部機器と直接通信を行ってもよい。通信を行う外部機器は、サーバであってもよいし、スマートフォン、タブレット端末などの携帯端末などであってもよい。また、通信IF101は、無線通信インターフェースであってもよいし、有線通信インターフェースであってもよい。無線通信インターフェースは、例えば、無線LAN、Bluetooth(登録商標)などを含む。有線通信インターフェースは、例えば、有線LANを含む。有線通信インターフェースは、USBを含んでいてもよい。
 音声入力IF102は、外部機器から音源としての音声信号AS1を受け付けるインターフェースである。音声入力IF102は、例えば、RCA端子、フォーン端子などのアナログの音声信号の入力を受け付ける入力端子や、光デジタル端子、同軸デジタル端子などのデジタルの音声信号の入力を受け付ける入力端子を含む。なお、音声入力IF102は、音声信号のみの入力を受け付ける入力端子に限らずに、映像信号の入力と共に音声信号の入力を受け付けるHDMI(登録商標)端子などの入力端子であってもよい。
 ストレージ103は、音源としての音声信号AS1を格納している。ストレージ103は、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、メモリカードなどの不揮発性の記憶装置である。
 なお、音声信号処理装置100は、通信IF101、音声入力IF102及びストレージ103の全てを備えていなくてもよく、通信IF101、音声入力IF102及びストレージ103の少なくとも1つを備えていればよい。
 音源としての音声信号AS1は、例えば、渓谷における流れる川や滝の音、虫や鳥などの鳴き声の音などのような、自然の中などで予め収音された自然音(環境音)の音声信号である。なお、音源としての音声信号AS1は、自然音に限らずに、音楽の音声信号であってもよい。
 信号処理回路104は、音源としての音声信号AS1を取得して、音声信号AS1に対して高音域を拡張する音声信号処理を実行することで、高音域が拡張された拡張音声信号を生成する。信号処理回路104は、例えば、DSP(Digital Signal Processor)である。信号処理回路104は、取得部110と、第1~第N信号処理部120a~120Xと、加算部130と、出力部140とを備える。信号処理回路104が備える各機能ブロックの一部または全部は、DSPにより実現される。
 なお、信号処理回路104は、CPU(Central Processing Unit)を含んでもよいし、CPUのみで構成されてもよい。信号処理回路104が備える各機能ブロックの一部または全部は、CPUがストレージなどに記憶されているプログラムを実行することで実現されてもよい。
 取得部110は、音声信号AS1を取得する。具体的には、取得部110は、通信IF101、音声入力IF102及びストレージ103のうちの少なくとも1つから音声信号AS1を取得する。
 第1~第N信号処理部120a~120Xは、N個(Nは、3以上の整数)の信号処理部である。第1~第N信号処理部120a~120Xのそれぞれは、音声信号AS1に基づいて、音声信号AS1の周波数帯域よりも高い周波数帯域の成分を含む高音域信号を生成する。つまり、高音域信号は、音声信号AS1に含まれない、高い周波数帯域の成分を含む信号である。第1~第N信号処理部120a~120Xは、各信号処理部が異なる処理を実行するため、それぞれが互いに異なる高音域信号を生成する。つまり、第1~第N信号処理部120a~120XはN個の高音域信号を生成し、生成されたN個の高音域信号は互いに異なる信号である。第1~第N信号処理部120a~120Xの具体的な処理については後述する。
 加算部130は、取得部110により取得された音声信号AS1と、N個の第1~第N信号処理部120a~120Xにより生成されたN個の高音域信号とを加算して、高音域が拡張された拡張音声信号を生成する。
 出力部140は、加算部130により生成された拡張音声信号を出力する。具体的には、出力部140は、スピーカ200に拡張音声信号を出力する。なお、出力部140は、ストレージ103に拡張音声信号を出力して、ストレージに103に拡張音声信号を格納させてもよい。また、出力部140は、通信IF101を介して外部機器に拡張音声信号を出力してもよい。
 <第1~第N信号処理部の構成>
 図2は、実施の形態に係る第1信号処理部120aの構成の一例を示す図である。図3は、実施の形態に係る第1信号処理部120aによる各処理について説明するための各処理の前後の音声信号の波形の一例を示す図である。図3における音声信号の波形は、縦軸が音圧を示し、横軸が時間を示す。
 第1信号処理部120aは、増幅部121aと、クリップ部122aと、フィルタ部123aと、減衰部124aとを備える。
 増幅部121aは、取得部110により取得された音声信号AS1をゲインG1で増幅させる増幅処理を行う。増幅部121aは、図3の(a)に示す音声信号AS1の音圧を1より大きいゲインG1で増幅させることで、図3の(b)に示す増幅処理後の音声信号AS2を生成する。これにより、音声信号AS1における音圧SP1は、音圧SP2(=SP1*G1)に増幅される。増幅部121aによる増幅処理は、第1増幅処理の一例である。ゲインG1は、第1ゲインの一例である。
 クリップ部122aは、増幅部121による増幅処理後の音声信号AS2を振幅A1でクリップするクリップ処理を行う。つまり、クリップ部122aは、例えば、図3の(b)及び(c)に示すように、-A1以上A1以下の音圧の範囲が残るように音声信号AS2をクリップする。これにより、音圧がA1である場合、及び、音圧が-A1である場合で直線的で音圧が変化しない形状を含む波形を有する音声信号AS3が生成される。音声信号AS3の波形は、図3の(c)に示すように、音圧が変化しない直線状の形状の始点または終点を含む部分において屈曲した形状を有するため、音声信号AS3は、高周波成分をより多く含む。特に、音声信号AS2については、増幅処理によって、音声信号AS2の波形の-A1以上A1以下の音圧の範囲における傾きを増幅処理前よりも急にすることができる。このため、クリップ処理後の音声信号AS3の波形の屈曲した形状の角度を、音声信号AS1を増幅せずにクリップ処理した場合の音声信号の波形のクリップにより生じる屈曲した形状の角度よりも、90度に近い角度とすることができる。なお、波形の傾きを急にするとは、具体的には、波形の接線の傾きの絶対値を大きくすることである。よって、より多くの高周波成分(例えば、元の音声信号AS1の周波数帯域よりも高く、かつ、非可聴領域となる高周波成分)を含む音声信号AS3を生成することができる。クリップ部122aによるクリップ処理は、第1クリップ処理の一例である。振幅A1は、第1振幅の一例である。
 フィルタ部123aは、クリップ部122aによるクリップ処理後の音声信号AS3に対して、人の可聴領域よりも高い周波数f1よりも高い周波数帯域(高音域)を通過させるハイパスフィルタ処理を行う。周波数f1は、非可聴領域に含まれる。ハイパスフィルタ処理は、言い換えると、音声信号AS3に対して周波数f1以下の周波数帯域(低音域)をカットする処理である。これにより、フィルタ部123aは、図3の(d)に示すように、高音域の音圧が低音域の音圧よりも大きい音声信号AS4を生成する。フィルタ部123aによるハイパスフィルタ処理は、第1ハイパスフィルタ処理の一例である。周波数f1は、第1周波数の一例である。
 減衰部124aは、フィルタ部123aによるハイパスフィルタ処理後の音声信号AS4をゲインG2で減衰させる減衰処理を行う。減衰部124aは、例えば、図3の(d)に示す音声信号AS4の音圧を1より小さいゲインG2で減衰させることで、図3の(e)に示す減衰処理後の音声信号AS5を生成する。これにより、音声信号AS4における音圧SP3は、音圧SP4(=SP3*G2)に減衰される。音声信号AS5は、第1高音域信号である。減衰部124aによる減衰処理は、第1減衰処理の一例である。ゲインG2は、第2ゲインの一例である。なお、ゲインG2は、ゲインG1の逆数であってもよいし、ゲインG1の逆数とは異なる値であってもよい。
 ここで、減衰部124aによる減衰処理は、フィルタ部123aによるハイパスフィルタ処理の次に行われるとしたが、これに限らずに、クリップ部122aによるクリップ処理の次に行われてもよい。この場合、ハイパスフィルタ処理は、減衰処理の次に行われる。つまり、減衰処理は、クリップ部122aによるクリップ処理の後に行われれば、ハイパスフィルタ処理の前に行われてもよいし後に行われてもよい。
 図4は、実施の形態に係る第2信号処理部120bの構成の一例を示す図である。図5は、実施の形態に係る第2信号処理部120bによる各処理について説明するための各処理の前後の音声信号の波形の一例を示す図である。図5における音声信号の波形は、縦軸が音圧を示し、横軸が時間を示す。
 第2信号処理部120bは、オフセット部125と、増幅部121bと、クリップ部122bと、フィルタ部123bと、減衰部124bとを備える。
 オフセット部125は、取得部110により取得された音声信号AS1に対して所定の音圧分をオフセットさせるオフセット処理を行う。オフセット部125は、例えば、図5の(a)に示す音声信号AS1の音圧を所定の音圧ΔSPだけ加算することで、図5の(b)に示すオフセット処理後の音声信号AS12を生成する。なお、オフセット部125は、音声信号AS1の音圧から所定の音圧だけ減算するオフセット処理を行ってもよい。
 増幅部121bは、オフセット部125によるオフセット処理後の音声信号AS12をゲインG3で増幅させる増幅処理を行う。増幅部121bは、例えば、図5の(b)に示す音声信号AS12の音圧を1より大きいゲインG3で増幅させることで、図5の(c)に示す増幅処理後の音声信号AS13を生成する。これにより、音声信号AS12における音圧SP11は、音圧SP12(=SP11*G3)に増幅される。増幅部121bによる増幅処理は、第2増幅処理の一例である。ゲインG3は、第3ゲインの一例である。
 ここで、オフセット部125によるオフセット処理は、増幅部121bによる増幅処理の前に行われるとしたが、これに限らずに、増幅部121bによる増幅処理の次に行われてもよい。オフセット処理は、クリップ部122bによるクリップ処理より前に行われればよく、増幅部121bによる増幅処理の前に行われてもよいし後に行われてもよい。
 クリップ部122bは、増幅部121bによる増幅処理後の音声信号AS13を振幅A2でクリップするクリップ処理を行う。つまり、クリップ部122bは、例えば、図5の(c)及び(d)に示すように、-A2以上A2以下の音圧の範囲が残るように音声信号AS13をクリップする。これにより、音圧がA2である場合、及び、音圧が-A2である場合で直線的で音圧が変化しない形状を含む波形を有する音声信号AS14が生成される。音声信号AS14の波形は、図5の(d)に示すように、音圧が変化しない直線状の形状の始点または終点を含む部分において屈曲した形状を有するため、音声信号AS14は、高周波成分をより多く含む。特に、音声信号AS13は、増幅処理によって、音声信号AS13の波形の-A2以上A2以下の音圧の範囲における傾きが増幅処理前よりも急になるため、クリップ処理後の音声信号AS14の波形の屈曲した形状の角度を90度に近い角度とすることができる。よって、より多くの高周波成分を含む音声信号AS14を生成することができる。クリップ部122bによるクリップ処理は、第2クリップ処理の一例である。振幅A2は、第2振幅の一例である。
 なお、オフセット部125によるオフセット量の所定の音圧ΔSPは、クリップ部122bによるクリップする振幅A2よりも大きくてもよいし、小さくてもよいし、同じであってもよい。
 フィルタ部123bは、第1クリップ処理後の音声信号AS14に対して、人の可聴領域よりも高い周波数f2よりも高い周波数帯域(高音域)を通過させるハイパスフィルタ処理を行う。周波数f2は、非可聴領域に含まれる。ハイパスフィルタ処理は、言い換えると、音声信号AS14に対して周波数f2以下の周波数帯域(低音域)をカットする処理である。これにより、フィルタ部123bは、図5の(e)に示すように、高音域の音圧が低音域の音圧よりも大きい音声信号AS15を生成する。フィルタ部123bによるハイパスフィルタ処理は、第2ハイパスフィルタ処理の一例である。周波数f2は、第2周波数の一例である。
 減衰部124bは、フィルタ部123bによるハイパスフィルタ処理後の音声信号AS15をゲインG4で減衰させる減衰処理を行う。減衰部124bは、例えば、図5の(e)に示す音声信号AS15の音圧を1より小さいゲインG4で減衰させることで、図5の(f)に示す減衰処理後の音声信号AS16を生成する。これにより、音声信号AS15における音圧SP13は、音圧SP14(=SP13*G4)に減衰される。音声信号AS16は、第2高音域信号である。減衰部124bによる減衰処理は、第2減衰処理の一例である。ゲインG4は、第4ゲインの一例である。なお、ゲインG4は、ゲインG3の逆数であってもよいし、ゲインG3の逆数とは異なる値であってもよい。
 ここで、減衰部124bによる減衰処理は、フィルタ部123bによるハイパスフィルタ処理の次に行われるとしたが、これに限らずに、クリップ部122bによるクリップ処理の次に行われてもよい。この場合、ハイパスフィルタ処理は、減衰処理の次に行われる。つまり、減衰処理は、クリップ部122bによるクリップ処理の後に行われれば、ハイパスフィルタ処理の前に行われてもよいし後に行われてもよい。
 なお、第1信号処理部120a及び第2信号処理部120bにおける各処理に用いられるパラメータは、互いに同じであってもよいし、互いに異なっていてもよい。具体的には、増幅部121aによる増幅処理に用いられるパラメータであるゲインG1と、増幅部121bによる増幅処理に用いられるパラメータであるゲインG3とは、同じであってもよいし異なっていてもよい。また、クリップ部122aによるクリップ処理に用いられるパラメータである振幅A1と、クリップ部122bによるクリップ処理に用いられるパラメータである振幅A2とは、同じであってもよいし異なっていてもよい。また、フィルタ部123aによるハイパスフィルタ処理に用いられるパラメータである周波数f1と、フィルタ部123bによるハイパスフィルタ処理に用いられるパラメータである周波数f2とは、同じであってもよいし異なっていてもよい。また、減衰部124aによる減衰処理に用いられるパラメータであるゲインG2と、減衰部124bによる減衰処理に用いられるパラメータであるゲインG4とは、同じであってもよいし異なっていてもよい。
 また、N個の第1~第N信号処理部120a~120Xのうちの、第1信号処理部120a及び第2信号処理部120bを除く他の信号処理部は、第1信号処理部120a及び第2信号処理部120bとは異なる処理によって高音域信号を生成できればどのような構成であってもよい。
 他の信号処理部は、例えば、第1信号処理部120aと同じ処理部を有し、各処理部の処理に用いられるパラメータのいずれかが第1信号処理部120aと異なっていてもよい。具体的には、他の信号処理部は、音声信号AS1をゲインG5で増幅させる増幅処理(第3増幅処理)を行う増幅部と、当該増幅処理(第3増幅処理)後の音声信号を振幅A3でクリップするクリップ処理(第3クリップ処理)を行うクリップ部と、当該クリップ処理(第3クリップ処理)後の音声信号に対して、人の可聴領域よりも高い周波数f3よりも高い周波数帯域を通過させるハイパスフィルタ処理(第3ハイパスフィルタ処理)を行うフィルタ部と、当該ハイパスフィルタ処理(第3ハイパスフィルタ処理)後の音声信号をゲインG6で減衰させる減衰処理を行う減衰部とを有していてもよい。そして、各処理において用いられるパラメータのいずれかが、第1信号処理部120aの各処理において用いられるパラメータであると異なっていればよい。つまり、ゲインG1とゲインG5との値の組、振幅A1と振幅A3との値の組、周波数f1と周波数f3との値の組、及び、ゲインG2とゲインG6との値の組の少なくともいずれか1つの値の組が、互いに異なっていればよい。この場合の他の信号処理部は、第3信号処理部の一例である。
 また、他の信号処理部は、例えば上記と同様に、第2信号処理部120bと同じ処理部を有し、各処理部の処理に用いられるパラメータのいずれかが第2信号処理部120bと異なっていてもよい。つまり、他の信号処理部が有する複数の処理部(オフセット部、増幅部、クリップ部、フィルタ部、及び、減衰部)の少なくとも1つの処理部の処理に用いられるパラメータは、第2信号処理部120bが有する複数の処理部(オフセット部125、増幅部121b、クリップ部122b、フィルタ部123b、及び、減衰部124b)のうち上記の少なくとも1つの処理部に対応する少なくとも1つの処理部の処理に用いられるパラメータと異なっていてもよい。
 また、他の信号処理部は、さらに、イコライザ部を有していてもよい。イコライザ部は、ハイパスフィルタ処理後の音声信号の特定の周波数帯域を増幅または減衰させるイコライザ処理を行う。イコライザ処理は、処理対象の音声信号の、周波数における第1帯域と、第1帯域とは異なる第2帯域とで異なるゲイン調整を行う処理である。異なるゲイン調整とは、増幅処理及び減衰処理であってもよいし、増幅処理におけるゲインが異なる処理であってもよいし、減衰処理におけるゲインが異なる処理であってもよい。このため、ハイパスフィルタ処理後の音声信号の周波数特性の調整を行うことができる。これにより、適切に振幅が調整された高音域信号を生成することができ、音声信号の高音域を適切に拡張することができる。
 イコライザ処理は、減衰部における減衰処理を含んでいてもよい。つまり、イコライザ処理は、周波数帯域の全体を減衰させる処理を含んでもよい。この場合、他の信号処理部は、減衰部を有していなくてもよい。
 また、他の信号処理部は、増幅部、クリップ部、フィルタ部、減衰部、イコライザ部、及び、オフセット部のうち、少なくとも、クリップ部、及び、フィルタ部を有していればよい。
 また、他の信号処理部が有する処理部の構成(処理部の組合せ)が同じである場合には、各処理に用いられるパラメータのうちの少なくとも1つのパラメータが、同じ組合せの処理部を有する信号処理部の各処理に用いられるパラメータであって、上記少なくとも1つのパラメータに対応する処理に用いられるパラメータと異なっていればよい。
 このように、N個の第1~第N信号処理部120a~120Xは、処理部の組合せが異なるか、処理部の組合せが同じであっても処理部による処理に用いられるパラメータが異なるかのいずれかによって、互いの処理が異なる。これにより、互いに異なるN個の高音域信号を生成することができる。
 [2.動作]
 次に、音声信号処理装置100の動作を説明する。
 図6は、実施の形態に係る音声信号処理装置100の音声信号処理の一例を示すフローチャートである。
 まず、取得部110は、音声信号AS1を取得する(S11)。
 次に、第1~第N信号処理部120a~120Xは、音声信号AS1に基づいて、低音域よりも高音域の音圧が大きいN個の高音域信号を生成する(S12)。
 次に、加算部130は、取得部110により取得された音声信号AS1と、N個の第1~第N信号処理部120a~120Xにより生成されたN個の高音域信号とを加算して、高音域が拡張された拡張音声信号を生成する(S13)。
 次に、出力部140は、加算部130により生成された拡張音声信号を出力する(S14)。
 図7は、実施の形態に係るN個の高音域信号のうちの第1高音域信号を生成する処理の一例を示すフローチャートである。つまり、図7は、N個の高音域信号を生成するステップS12の処理の一部の処理を示す。
 まず、増幅部121aは、取得部110により取得された音声信号AS1をゲインG1で増幅させる増幅処理を行う(S21)。
 次に、クリップ部122aは、増幅部121による増幅処理後の音声信号AS2を振幅A1でクリップするクリップ処理を行う(S22)。
 次に、フィルタ部123aは、第1クリップ処理後の音声信号AS3に対して、人の可聴領域よりも高い周波数f1よりも高い周波数帯域(高音域)を通過させるハイパスフィルタ処理を行う(S23)。
 次に、減衰部124aは、フィルタ部123aによるハイパスフィルタ処理後の音声信号AS4をゲインG2で減衰させる減衰処理を行う(S24)。
 ステップS21~S24の処理が実行されることで第1高音域信号が生成される。
 図8は、実施の形態に係るN個の高音域信号のうちの第2高音域信号を生成する動作の一例を示すフローチャートである。つまり、図8は、N個の高音域信号を生成するステップS12の処理の一部の処理を示す。
 まず、オフセット部125は、取得部110により取得された音声信号AS1に対して所定の音圧分をオフセットさせるオフセット処理を行う(S25)。
 次に、増幅部121bは、オフセット部125によるオフセット処理後の音声信号AS12をゲインG3で増幅させる増幅処理を行う(S31)。
 次に、クリップ部122bは、増幅部121bによる増幅処理後の音声信号AS13を振幅A2でクリップするクリップ処理を行う(S32)。
 次に、フィルタ部123bは、第1クリップ処理後の音声信号AS14に対して、人の可聴領域よりも高い周波数f2よりも高い周波数帯域(高音域)を通過させるハイパスフィルタ処理を行う(S33)。
 次に、減衰部124bは、フィルタ部123bによるハイパスフィルタ処理後の音声信号AS15をゲインG4で減衰させる減衰処理を行う(S34)。
 ステップS25~S34の処理が実行されることで第2高音域信号が生成される。
 第3~第N信号処理部においても、各信号処理部が有する処理部の構成の組合せ、及び、各処理部の処理に用いられるパラメータに基づいた信号処理が行われることで、第3~第N高音域信号が生成される。
 [3.効果など]
 本実施の形態に係る音声信号処理装置100は、取得部110と、第1信号処理部120aと、加算部130とを備える。取得部110は、音声信号AS1を取得する。第1信号処理部120aは、音声信号AS1に基づいて、人の可聴領域よりも高い第1周波数(周波数f1)よりも高い周波数帯域の高音域成分を含む第1高音域信号を生成する。加算部130は、音声信号AS1に第1高音域信号を加算して、高音域が拡張された拡張音声信号を生成する。第1信号処理部120aは、(i)音声信号AS1に対して、第1振幅(振幅A1)でクリップする第1クリップ処理を含む第1信号処理を行い、(ii)第1クリップ処理後の音声信号AS3に対して、第1周波数(周波数f1)よりも高い周波数帯域を通過させる第1ハイパスフィルタ処理を行うことで、第1高音域信号を生成する。
 これによれば、音声信号AS1に対して、第1振幅(振幅A1)でクリップする第1クリップ処理を含む第1信号処理を行うことで、音声信号AS1に基づく高周波成分をより多く含む音声信号を生成することができる。そして、第1クリップ処理後の音声信号AS3に対して第1ハイパスフィルタ処理を行うため、主に高音域の音圧が大きい第1高音域信号を生成することができ、音声信号AS1に第1高音域信号を加算することで、音声信号AS1の高音域が拡張された拡張音声信号を生成することができる。これにより、自然音などのような1/f特性を有していない音声信号AS1の高音域を、人に与える違和感が少ないように拡張することが容易にできる。
 また、本実施の形態に係る音声信号処理装置100において、第1信号処理は、音声信号AS1を第1ゲイン(ゲインG1)で増幅させる第1増幅処理と、第1増幅処理後の音声信号AS2に対して行う第1クリップ処理とを含む。
 これによれば、増幅処理によって、音声信号AS2の波形の振幅A1に基づく-A1以上A1以下の音圧の範囲における傾きを増幅処理前よりも急にすることができるため、クリップ処理後の音声信号AS3の波形の屈曲した形状の角度を90度に近づけることができる。よって、より多くの高周波成分(例えば、元の音声信号AS1の周波数帯域よりも高く、かつ、非可聴領域となる高周波成分)を含む音声信号AS3を生成することができる。
 また、本実施の形態に係る音声信号処理装置100において、第1信号処理部120aは、さらに、第1クリップ処理後の音声信号AS3を第2ゲイン(ゲインG2)で減衰させる第1減衰処理を行う。第1高音域信号は、さらに第1減衰処理が実行された後の音声信号AS5である。
 このため、音声信号AS1に基づく高周波成分をより多く含む、第1クリップ処理後(本実施の形態では第1クリップ処理及び第1ハイパスフィルタ処理後)の音声信号AS4の振幅の調整を行うことができる。これにより、適切に振幅が調整された第1高音域信号を生成することができ、音声信号AS1の高音域を適切に拡張することができる。
 また、本実施の形態に係る音声信号処理装置100は、さらに、第2信号処理部120bを備える。第2信号処理部120bは、音声信号AS1に基づいて、第1高音域信号とは異なる第2高音域信号を生成する。第2信号処理部120bは、(i)音声信号AS1に対して所定の音圧ΔSPをオフセットさせるオフセット処理を含む第2信号処理を行い、(ii)第2信号処理後の音声信号AS13を第2振幅(振幅A2)でクリップする第2クリップ処理を行い、(iii)第2クリップ処理後の音声信号AS14に対して、人の可聴領域よりも高い第2周波数(周波数f2)よりも高い周波数帯域を通過させる第2ハイパスフィルタ処理を行うことで、第2高音域信号を生成する。加算部130は、音声信号AS1に、第1高音域信号と第2高音域信号とを加算して(本実施の形態では第1高音域信号と第2高音域信号とを含むN個の高音域信号を加算して)、拡張音声信号を生成する。
 これによれば、オフセット処理後及び第2増幅処理後の音声信号AS13を第2振幅(振幅A2)でクリップする第2クリップ処理を行うことで、音声信号AS1に基づく高周波成分をより多く含む音声信号を生成することができる。第1クリップ処理後の音声信号AS3は、オフセット処理されずにクリップ処理されており、偶数次の周波数成分が打ち消されるため、奇数次の周波数成分を多く含み、第2クリップ処理後の音声信号AS14は、オフセット処理後にクリップ処理されており、偶数次の周波数成分が打ち消されずに多く残るため偶数次の周波数成分を多く含む。このため、第1高音域信号及び第2高音域信号の周波数特性を異ならせることができ、より効果的に音声信号AS1の高音域を拡張することができる。
 また、本実施の形態に係る音声信号処理装置100において、第2信号処理は、オフセット処理と、オフセット処理後の音声信号AS12を第3ゲイン(ゲインG3)で増幅させる第2増幅処理とを含む。
 これによれば、増幅処理によって、音声信号AS12の波形の振幅A2に基づく-A2以上A2以下の音圧の範囲における傾きを増幅処理前よりも急にすることができるため、クリップ処理後の音声信号AS14の波形の屈曲した形状の角度を90度に近づけることができる。よって、より多くの高周波成分(例えば、元の音声信号AS1の周波数帯域よりも高く、かつ、非可聴領域となる高周波成分)を含む音声信号AS14を生成することができる。
 また、本実施の形態に係る音声信号処理装置100において、第2信号処理部120bは、さらに、第2クリップ処理後の音声信号AS14を第4ゲイン(ゲインG4)で減衰させる第2減衰処理を行う。第2高音域信号は、さらに第2減衰処理が実行された後の音声信号AS16である。
 このため、音声信号AS1に基づく高周波成分をより多く含む、第2クリップ処理後(本実施の形態では第2クリップ処理及び第2ハイパスフィルタ処理後)の音声信号AS15の振幅の調整を行うことができる。これにより、適切に振幅が調整された第2高音域信号を生成することができ、音声信号AS1の高音域をより適切に拡張することができる。
 また、本実施の形態に係る音声信号処理装置100は、さらに、第3信号処理部を備える。第3信号処理部は、音声信号AS1に基づいて、第1高音域信号とは異なる第3高音域信号を生成する。第3信号処理部は、(i)音声信号AS1を第5ゲイン(ゲインG5)で増幅させる第3増幅処理を行い、(ii)第3増幅処理後の音声信号を第3振幅(振幅A3)でクリップする第3クリップ処理を行い、第3クリップ処理後の音声信号に対して、人の可聴領域よりも高い第3周波数(周波数f3)よりも高い周波数帯域を通過させる第3ハイパスフィルタ処理を行うことで、第3高音域信号を生成する。加算部130は、音声信号AS1に、第1高音域信号と第3高音域信号とを加算して(本実施の形態では第1高音域信号と第3高音域信号とを含むN個の高音域信号を加算して)、拡張音声信号を生成する。
 これによれば、第3増幅処理後の音声信号を第3振幅でクリップする第3クリップ処理を行うことで、音声信号AS1に基づく高周波成分をより多く含む音声信号を生成することができる。そして、第3クリップ処理後の音声信号に対して第3ハイパスフィルタ処理を行うため、主に高音域の音圧が大きい第3高音域信号を生成することができる。これにより、音声信号AS1に第1高音域信号及び第3高音域信号を加算することで、音声信号AS1の高音域がより効果的に拡張された拡張音声信号を生成することができる。
 また、本実施の形態に係る音声信号処理装置100において、第1ゲイン(ゲインG1)と第5ゲイン(ゲインG5)との値の組、第1振幅(振幅A1)と第3振幅(振幅A3)との値の組、及び、第1周波数(周波数f1)と第3周波数(周波数f3)との値の組の少なくともいずれか1つの値の組は、互いに異なる。
 これによれば、第1ゲイン(ゲインG1)と第5ゲイン(ゲインG5)との値の組、第1振幅(振幅A1)と第3振幅(振幅A3)との値の組、及び、第1周波数(周波数f1)と第3周波数(周波数f3)との値の組の少なくともいずれか1つの値の組は、互いに異なっているため、第1高音域信号を生成する処理とは異なる処理で第3高音域信号を生成することができる。このため、第1高音域信号及び第3高音域信号の周波数特性を異ならせることができる。これにより、音声信号AS1に第1高音域信号及び第3高音域信号を加算することで、音声信号AS1の高音域がより効果的に拡張された拡張音声信号を生成することができる。
 [4.変形例]
 上記実施の形態に係る音声信号処理装置100は、N個の第1~第N信号処理部120a~120Xを備えるとしたが、N個の第1~第N信号処理部120a~120Xのうちの少なくとも1つを備える構成であればよい。少なくとも1つの信号処理部により、少なくとも1つの高音域信号を生成でき、音声信号AS1の高音域が拡張された拡張音声信号を生成することができるからである。つまり、上記実施の形態では、Nは3以上の整数としたが、これに限らずに、Nは1以上の整数であってもよい。
 また、上記実施の形態において、信号処理回路104が有する各構成要素は、専用のハードウェアで構成されるか、各構成要素に適したソフトウェアプログラムを実行することによって実現されてもよい。各構成要素は、CPUまたはプロセッサなどのプログラム実行部が、ハードディスクまたは半導体メモリなどの記録媒体に記録されたソフトウェアプログラムを読み出して実行することによって実現されてもよい。
 また、各構成要素は、回路(または集積回路)でもよい。これらの回路は、全体として1つの回路を構成してもよいし、それぞれ別々の回路でもよい。また、これらの回路は、それぞれ、汎用的な回路でもよいし、専用の回路でもよい。
 また、本開示の全般的または具体的な態様は、システム、装置、方法、集積回路、コンピュータプログラムまたはコンピュータ読み取り可能なCD-ROMなどの非一時的な記録媒体で実現されてもよい。また、システム、装置、方法、集積回路、コンピュータプログラム及びコンピュータ読み取り可能な非一時的な記録媒体の任意な組み合わせで実現されてもよい。
 例えば、本開示は、音声信号処理装置(コンピュータまたはDSP)が実行する音声信号処理方法として実現されてもよいし、上記音声信号処理方法をコンピュータまたはDSPに実行させるためのプログラムとして実現されてもよい。
 また、上記実施の形態において、特定の処理部が実行する処理を別の処理部が実行してもよい。また、上記実施の形態において説明された音声信号処理装置100の動作における複数の処理の順序は、変更されてもよいし、複数の処理は、並行して実行されてもよい。
 その他、各実施の形態に対して当業者が思いつく各種変形を施して得られる形態、または、本開示の趣旨を逸脱しない範囲で各実施の形態に係る構成要素及び機能を任意に組み合わせることで実現される形態も本開示に含まれる。
 本開示は、自然音などの音声信号のような1/f特性を有していない音声信号の高音域を、人に与える違和感が少ないように拡張することが容易にできる音声信号処理装置などとして有用である。
  1  音声信号処理システム
100  音声信号処理装置
101  通信IF
102  音声入力IF
103  ストレージ
104  信号処理回路
110  取得部
120a  第1信号処理部
120b  第2信号処理部
120X  第N信号処理部
121a、121b  増幅部
122a、122b  クリップ部
123a、123b  フィルタ部
124a、124b  減衰部
125  オフセット部
130  加算部
140  出力部
200  スピーカ

Claims (14)

  1.  音声信号を取得する取得部と、
     前記音声信号に基づいて、人の可聴領域よりも高い第1周波数よりも高い周波数帯域の高音域成分を含む第1高音域信号を生成する第1信号処理部と、
     前記音声信号に前記第1高音域信号を加算して、高音域が拡張された拡張音声信号を生成する加算部と、を備え、
     前記第1信号処理部は、(i)前記音声信号に対して、第1振幅でクリップする第1クリップ処理を含む第1信号処理を行い、(ii)前記第1クリップ処理後の音声信号に対して、前記第1周波数よりも高い周波数帯域を通過させる第1ハイパスフィルタ処理を行うことで、前記第1高音域信号を生成する
     音声信号処理装置。
  2.  前記第1信号処理は、前記音声信号を第1ゲインで増幅させる第1増幅処理と、前記第1増幅処理後の音声信号に対して行う前記第1クリップ処理とを含む
     請求項1に記載の音声信号処理装置。
  3.  前記第1信号処理部は、さらに、前記第1クリップ処理後の音声信号を第2ゲインで減衰させる第1減衰処理を行い、
     前記第1高音域信号は、さらに前記第1減衰処理が実行された後の音声信号である
     請求項2に記載の音声信号処理装置。
  4.  前記第1信号処理部は、さらに、前記第1ハイパスフィルタ処理後の音声信号の特定の周波数帯域を増幅または減衰させる第1イコライザ処理を行い、
     前記第1高音域信号は、さらに前記第1イコライザ処理が実行された後の音声信号である
     請求項2に記載の音声信号処理装置。
  5.  前記第1信号処理部は、さらに、
     前記第1クリップ処理後の音声信号を第2ゲインで減衰させる第1減衰処理を行い、
     前記第1減衰処理後の音声信号の特定の周波数帯域を増幅または減衰させる第1イコライザ処理を行い、
     前記第1高音域信号は、さらに前記第1イコライザ処理が実行された後の音声信号である
     請求項2に記載の音声信号処理装置。
  6.  さらに、
     前記音声信号に基づいて、前記第1高音域信号とは異なる第2高音域信号を生成する第2信号処理部を備え、
     前記第2信号処理部は、(i)前記音声信号に対して所定の音圧分をオフセットさせるオフセット処理を含む第2信号処理を行い、(ii)前記第2信号処理後の音声信号を第2振幅でクリップする第2クリップ処理を行い、(iii)前記第2クリップ処理後の音声信号に対して、前記可聴領域よりも高い第2周波数よりも高い周波数帯域を通過させる第2ハイパスフィルタ処理を行うことで、前記第2高音域信号を生成し、
     前記加算部は、前記音声信号に、前記第1高音域信号と前記第2高音域信号とを加算して、前記拡張音声信号を生成する
     請求項1から5のいずれか1項に記載の音声信号処理装置。
  7.  前記第2信号処理は、前記オフセット処理と、前記オフセット処理後の音声信号を第3ゲインで増幅させる第2増幅処理とを含む
     請求項6に記載の音声信号処理装置。
  8.  前記第2信号処理部は、さらに、前記第2クリップ処理後の音声信号を第4ゲインで減衰させる第2減衰処理を行い、
     前記第2高音域信号は、さらに前記第2減衰処理が実行された後の音声信号である
     請求項7に記載の音声信号処理装置。
  9.  前記第2信号処理部は、さらに、前記第2ハイパスフィルタ処理後の音声信号の特定の周波数帯域を増幅または減衰させる第2イコライザ処理を行い、
     前記第2高音域信号は、さらに前記第2イコライザ処理が実行された後の音声信号である
     請求項7に記載の音声信号処理装置。
  10.  前記第2信号処理部は、さらに、
     前記第2クリップ処理後の音声信号を第4ゲインで減衰させる第2減衰処理を行い、
     前記第2減衰処理後の音声信号の特定の周波数帯域を増幅または減衰させる第2イコライザ処理を行い、
     前記第2高音域信号は、さらに前記第2イコライザ処理が実行された後の音声信号である
     請求項7に記載の音声信号処理装置。
  11.  さらに、
     前記音声信号に基づいて、前記第1高音域信号とは異なる第3高音域信号を生成する第3信号処理部を備え、
     前記第3信号処理部は、(i)前記音声信号を第5ゲインで増幅させる第3増幅処理を行い、(ii)前記第3増幅処理後の音声信号を第3振幅でクリップする第3クリップ処理を行い、(iii)前記第3クリップ処理後の音声信号に対して、前記可聴領域よりも高い第3周波数よりも高い周波数帯域を通過させる第3ハイパスフィルタ処理を行うことで、前記第3高音域信号を生成し、
     前記加算部は、前記音声信号に、前記第1高音域信号と前記第3高音域信号とを加算して、前記拡張音声信号を生成する
     請求項2から5のいずれか1項に記載の音声信号処理装置。
  12.  前記第1ゲインと前記第5ゲインとの値の組、前記第1振幅と前記第3振幅との値の組、及び、前記第1周波数と前記第3周波数との値の組の少なくともいずれか1つの値の組は、互いに異なる
     請求項11に記載の音声信号処理装置。
  13.  音声信号を取得し、
     前記音声信号に基づいて、人の可聴領域よりも高い第1周波数よりも高い周波数帯域の高音域成分を含む第1高音域信号を生成し、
     前記音声信号に前記第1高音域信号を加算して、高音域が拡張された拡張音声信号を生成し、
     前記第1高音域信号の生成では、
     前記音声信号に対して、第1振幅でクリップする第1クリップ処理を含む第1信号処理を行い、
     前記第1クリップ処理後の音声信号に対して、前記第1周波数よりも高い周波数帯域を通過させる第1ハイパスフィルタ処理を行うことで、前記第1高音域信号を生成する
     音声信号処理方法。
  14.  請求項13に記載の音声処理方法をコンピュータに実行させるためのプログラム。
PCT/JP2022/044499 2022-09-05 2022-12-02 音声信号処理装置、音声信号処理方法、及び、プログラム WO2024053122A1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2022141047 2022-09-05
JP2022-141047 2022-09-05

Publications (1)

Publication Number Publication Date
WO2024053122A1 true WO2024053122A1 (ja) 2024-03-14

Family

ID=90192191

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2022/044499 WO2024053122A1 (ja) 2022-09-05 2022-12-02 音声信号処理装置、音声信号処理方法、及び、プログラム

Country Status (1)

Country Link
WO (1) WO2024053122A1 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH082119B2 (ja) * 1991-12-11 1996-01-10 オンキヨー株式会社 音響再生装置
JP2003015695A (ja) * 2001-07-05 2003-01-17 Matsushita Electric Ind Co Ltd オーディオ帯域拡張装置
JP2005128387A (ja) * 2003-10-27 2005-05-19 Yamaha Corp オーディオ帯域拡張再生装置
JP2010081208A (ja) * 2008-09-25 2010-04-08 Takenaka Komuten Co Ltd 電気音響システム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH082119B2 (ja) * 1991-12-11 1996-01-10 オンキヨー株式会社 音響再生装置
JP2003015695A (ja) * 2001-07-05 2003-01-17 Matsushita Electric Ind Co Ltd オーディオ帯域拡張装置
JP2005128387A (ja) * 2003-10-27 2005-05-19 Yamaha Corp オーディオ帯域拡張再生装置
JP2010081208A (ja) * 2008-09-25 2010-04-08 Takenaka Komuten Co Ltd 電気音響システム

Similar Documents

Publication Publication Date Title
JP5448771B2 (ja) 音響処理装置及び方法
JP5680789B2 (ja) 改善されたオーディオのための統合されたサイコアコースティック・バス・エンハンスメント(pbe)
JP5074115B2 (ja) 音響信号処理装置及び音響信号処理方法
JP3605363B2 (ja) 音響効果装置、その方法及びプログラム記録媒体
KR101489035B1 (ko) 오디오 신호 프로세싱을 위한 방법 및 장치
JP4886881B2 (ja) 音響補正装置、音響出力装置、及び音響補正方法
US20100189283A1 (en) Tone emphasizing device, tone emphasizing method, tone emphasizing program, and recording medium
US20150365061A1 (en) System and method for modifying an audio signal
WO2024053122A1 (ja) 音声信号処理装置、音声信号処理方法、及び、プログラム
JPWO2008041321A1 (ja) 信号処理装置及びそれを用いた放送装置
TWI501657B (zh) 電子音訊裝置
JP2007036710A (ja) アタック信号増幅デジタル信号処理装置
JP2021087217A (ja) アクティブスピーカのクリッピング歪み回避または最大音響レベル増大のためのリミッタシステム及び方法
CN105812995B (zh) 一种噪音滤除方法和装置
WO2017183405A1 (ja) 音響処理装置および音響処理方法
JP5715910B2 (ja) ダイナミックレンジ拡張装置
EP3471267B1 (en) Method and apparatus for repairing distortion of an audio signal
JP2006197580A (ja) 音声信号振幅制限器
CN104023296A (zh) 声音输出方法和装置及移动终端
KR20190105254A (ko) 인공 지능에 기반한 풀 디지털 오디오 처리 장치
JP2000349579A (ja) デジタルオーディオ用帯域制限アナログフィルタ及びこれを用いた音声信号増幅装置
JP6604728B2 (ja) 音声処理装置及び音声処理方法
Massarani Transfer-function measurement with sweeps
JP5961870B2 (ja) ローパスフィルタ付アダプタ又はローパスフィルタ付スピーカアンプ
TWI584275B (zh) 電子裝置和聲音信號的分析與播放方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22958200

Country of ref document: EP

Kind code of ref document: A1