WO2010044439A1 - 音声信号調整装置及び音声信号調整方法 - Google Patents

音声信号調整装置及び音声信号調整方法 Download PDF

Info

Publication number
WO2010044439A1
WO2010044439A1 PCT/JP2009/067834 JP2009067834W WO2010044439A1 WO 2010044439 A1 WO2010044439 A1 WO 2010044439A1 JP 2009067834 W JP2009067834 W JP 2009067834W WO 2010044439 A1 WO2010044439 A1 WO 2010044439A1
Authority
WO
WIPO (PCT)
Prior art keywords
gain
level
input signal
short
term
Prior art date
Application number
PCT/JP2009/067834
Other languages
English (en)
French (fr)
Inventor
成文 後田
Original Assignee
シャープ株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by シャープ株式会社 filed Critical シャープ株式会社
Priority to CN200980151666.4A priority Critical patent/CN102257728B/zh
Priority to US13/124,826 priority patent/US8787595B2/en
Priority to EP09820617A priority patent/EP2352225A1/en
Priority to JP2010533920A priority patent/JP5236006B2/ja
Publication of WO2010044439A1 publication Critical patent/WO2010044439A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/02Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
    • H03G9/025Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers frequency-dependent volume compression or expansion, e.g. multiple-band systems
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/005Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/13Aspects of volume control, not necessarily automatic, in stereophonic sound systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Definitions

  • the present invention relates to an audio signal adjustment device and an audio signal adjustment method, and more particularly to an audio signal adjustment device and an audio signal adjustment method for adjusting an audio signal by automatic gain adjustment.
  • An object of the present invention is to provide a technique for improving the control accuracy by performing volume control in accordance with a human hearing level.
  • the apparatus relates to an audio signal adjustment apparatus.
  • the apparatus includes long-term gain adjusting means for controlling the amplitude of the input signal for a relatively long period of time, and short-term gain adjusting means for controlling the amplitude of the input signal for a relatively short period of time.
  • the long-term gain adjusting means may reflect a loudness level, which is a level based on human hearing, in the input signal when controlling the amplitude of the input signal.
  • the short-term gain adjusting means may reflect a loudness level, which is a level based on human hearing, in the input signal when controlling the amplitude of the input signal.
  • the long-term gain adjusting means may control the amplitude of the input signal by reflecting the output sound pressure characteristic of the sound output means that is the output destination of the signal of the sound signal adjusting device. Further, the short-term gain adjusting means may control the amplitude of the input signal by reflecting the output sound pressure characteristic of the sound output means that is the output destination of the signal of the sound signal adjusting device.
  • the long-term gain adjusting means and the short-term gain adjusting means may perform amplitude control based on the input signal buffered for a certain period of time.
  • the input signal buffered for a certain period of time may be a prefetched signal. Further, the long-term gain adjusting means may perform feedback control by reflecting an input signal after control of the previous long-term gain.
  • the short-term gain adjusting means may perform control by reflecting a signal after control of the long-term gain of the long-term gain adjusting means. Further, the short-term gain adjusting means may control the amplitude of the input signal by dividing the input signal into a voice band and a band other than the voice band. The short-term gain adjusting means may change the attack time according to the rising degree of the input signal in the control of the amplitude of the short-term gain. Further, the short-term gain adjusting means may calculate the rising degree of the input signal based on a loudness level of the input signal, a standard deviation of the loudness level, and an average value.
  • the short-term gain adjusting means may change the amount of amplification of the short-term gain according to the rising degree of the loudness level of the input signal in controlling the amplitude of the short-term gain.
  • the short-term gain adjusting unit may calculate a short-term gain change width each time the target gain of the input signal is calculated.
  • the long-term gain adjusting means may adjust the long-term gain in accordance with a short-term gain control change in the short-term gain adjusting means.
  • the comparison means for comparing the level of the input signal with a predetermined threshold level to calculate a difference level, the level of the input signal input during a past fixed period, and the level of the input signal currently input
  • a level change degree calculating means for calculating a degree of change in level and a gain adjustment for calculating a gain adjustment amount of a gain adjustment process applied to the input signal according to the difference level calculated by the comparing means
  • a source / content specifying unit that specifies a source of the input signal or a genre of content including the input signal
  • the gain adjustment amount calculating unit includes the source or the source specified by the source / content specifying unit.
  • the calculation procedure of the gain adjustment amount may be settable.
  • Another embodiment of the present invention relates to an audio signal adjustment method. This method includes a long-term gain adjustment step of controlling the amplitude of the input signal in the relatively long term, and a short-term gain adjustment step of controlling the amplitude of the input signal in a relatively short term.
  • the long-term gain adjustment step may reflect a loudness level, which is a level based on human sensation, in controlling the amplitude of the input signal.
  • the short-term gain adjustment step may reflect a loudness level, which is a level based on human sensation, in controlling the amplitude of the input signal.
  • the amplitude of the input signal may be controlled by reflecting the output sound pressure characteristic of the sound output means that is the output destination of the signal controlled by the sound signal adjustment method.
  • the amplitude of the input signal may be controlled by reflecting the output sound pressure characteristic of the sound output means that is the output destination of the signal controlled by the sound signal adjustment method.
  • the amplitude may be controlled based on the input signal buffered for a certain time.
  • the input signal buffered for a certain period of time may be a prefetched signal.
  • feedback control may be performed by reflecting the input signal after the previous long-term gain control.
  • the short-term gain adjustment step may be controlled by reflecting a signal after the long-term gain control in the long-term gain adjustment step.
  • the short-term gain adjustment step may control the amplitude of the input signal by dividing the input signal into a voice band and a band other than the voice band.
  • the attack time may be changed in accordance with the rising degree of the input signal in controlling the short-term gain amplitude.
  • the rising degree of the input signal may be calculated based on a loudness level of the input signal, a standard deviation of the loudness level, and an average value.
  • the short-term gain adjustment step may change the amount of amplification of the short-term gain according to the rising degree of the loudness level of the input signal in controlling the amplitude of the short-term gain.
  • the short-term gain adjustment step may calculate a short-term gain change width each time the target gain of the input signal is calculated.
  • the long-term gain may be adjusted according to a short-term gain control change in the short-term gain adjustment means.
  • Another aspect of this invention is related with an audio
  • This audio signal adjustment device acquires an input signal, compares the level of the input signal with a predetermined threshold level, calculates a difference level, and compares the input signal input in a past fixed period.
  • a level change degree calculating means for comparing a level with a level of the input signal currently input and calculating a level change degree, a difference level calculated by the comparison means, and a level change degree calculating means
  • a gain adjustment amount calculating means for calculating a gain adjustment amount according to the calculated compression ratio, and a gain adjustment amount calculating means for the inputted input signal.
  • Gain adjusting means for adjusting the amount of gain adjustment.
  • Another aspect of this invention is related with an audio
  • This audio signal adjustment device acquires an input signal, compares the level of the input signal with a predetermined threshold level, calculates a difference level, and compares the input signal input in a past fixed period.
  • a level change degree calculating means for comparing a level with a level of the input signal currently input and calculating a level change degree, a difference level calculated by the comparison means, and a level change degree calculating means
  • a gain adjustment amount calculating means for calculating a gain adjustment amount based on the calculated level change, and calculating a gain adjustment amount according to the calculated threshold; and the gain adjustment for the input signal Gain adjusting means for adjusting only the gain adjustment amount calculated by the amount calculating means.
  • Another aspect of this invention is related with an audio
  • This audio signal adjustment device acquires an input signal, compares the level of the input signal with a predetermined threshold level, calculates a difference level, and compares the input signal input in a past fixed period.
  • a level change degree calculating means for comparing a level with a level of the input signal currently input and calculating a level change degree, a difference level calculated by the comparison means, and a level change degree calculating means
  • a gain adjustment amount calculation means for calculating a gain adjustment amount and a compression rate from the level change degree, and calculating a gain adjustment amount according to the calculated threshold and compression rate; and
  • gain adjusting means for adjusting only the gain adjustment amount calculated by the gain adjustment amount calculating means.
  • the audio gain adjusting apparatus 10 described below performs long-term gain adjustment on an input signal, band-divides the output signal by a band division filter, and performs short-term on the output signal for each divided band. Finally, the gain is adjusted, and finally the output signals are synthesized to obtain the final output.
  • the long-term gain is obtained by converting a signal in a certain section after the long-term gain processing into a human auditory level (hereinafter referred to as “loudness level”) and comparing it with a set threshold (a suppression threshold or an amplification threshold). calculate.
  • a loudness level for example, a level reflecting a loudness curve defined in an ITU-R (International Telecommunication Union Radiocommunications Sector) standard can be used. More specifically, the loudness level is calculated by inverting the characteristic indicated by the loudness curve.
  • the suppression threshold is a threshold referred to when signal suppression processing is performed.
  • the amplification threshold is a threshold that is referred to when signal amplification processing is performed. In addition to the above two threshold values, a lower threshold value is set to prevent amplifying background noise and the like.
  • the short-term gain is obtained by converting a signal in a certain section that has passed through the band-pass filter (BPF) into a loudness level, comparing it with the loudness level after passing through the long-term gain, and comparing each with a set threshold value. Calculate the value.
  • the attack time and release time for changing to the target value are calculated.
  • the short-term gain is changed based on the calculated target value, attack time, and release time.
  • long term and short term used in the present embodiment mean relative periods, and “long term” is a period of 30 times or more of “short term” and adaptively updated. Is assumed. By such processing, the dynamic range intended by the creator of the content (source) can be secured.
  • FIG. 1 is a functional block diagram showing a schematic configuration of an audio gain adjusting apparatus 10 according to the present embodiment, which is mounted on a television or audio equipment.
  • the components of the present embodiment are realized by, for example, an LSI (Large Scale Integrated Circuit) such as a DSP (Digital Signal Processor), a memory, or an arbitrary program.
  • the audio gain adjusting apparatus 10 includes an audio signal input unit 12 that acquires an audio signal to be adjusted, a long-term gain reflecting unit 14 that reflects adjustment of a long-term gain on the acquired audio signal, and long-term gain reflection.
  • a synthesis unit 40 that synthesizes the audio signal and an audio signal output unit 42 that outputs the synthesized audio signal are provided.
  • the audio gain adjusting apparatus 10 includes a long-term gain calculating unit 50 that calculates a long-term gain reflected by the long-term gain reflecting unit 14 and a short-term gain calculating unit 60 that calculates a short-term gain adjusted by the short-term gain reflecting unit 30.
  • the calculation result in the long-term gain calculation unit 50 is used for calculation of the short-term gain in the short-term gain calculation unit 60 together with the long-term gain reflection unit 14.
  • the frequency separation unit 20 includes an LPF 22, an HPF 24, and a BPF 26.
  • the short-term gain reflecting unit 30 includes a low frequency reflecting unit 32, a high frequency reflecting unit 34, and a medium frequency reflecting unit 36.
  • the LPF 22 outputs a signal in a frequency band of less than 100 Hz to the low frequency reflection unit 32.
  • the HPF 24 outputs a signal in a frequency band greater than 8000 Hz to the high frequency reflection unit 34.
  • the BPF 26 outputs a signal in a frequency band of 100 Hz to 8000 Hz to the intermediate frequency reflection unit 36 and also outputs it to the amplification unit 70 of the short-term gain calculation unit 60 described later. Then, the low-frequency reflection unit 32, the high-frequency reflection unit 34, and the medium-frequency reflection unit 36 reflect the amount of change in the short-term gain calculated by the short-term gain update unit 90 on the signals acquired from the LPF 22, the HPF 24, and the BPF 26, respectively. To the unit 40.
  • the medium frequency reflection unit 36 acquires the amount of change in the short-term gain from the first update unit 92 of the short-term gain update unit 90, and the low-frequency reflection unit 32 and the high-frequency reflection unit 34 The amount of short-term gain change is acquired from the second update unit 94 of the update unit 90.
  • the loudness level of the signal input to the audio signal input unit 12 is “loudness level 1”
  • the loudness level of the signal whose long-term gain is adjusted by the long-term gain reflecting unit 14 is “loudness level 2”
  • the medium frequency The loudness level of the signal after filtering by the reflection unit 36 is set to “loudness level 3”.
  • FIG. 2 is a functional block diagram of the long-term gain calculation unit 50 according to the present embodiment.
  • the long-term gain calculation unit 50 includes an audio signal storage unit 52, a loudness level conversion unit 54, a level comparison count unit 56, and a long-term gain update unit 58.
  • the audio signal storage unit 52 acquires the output of the long-term gain reflecting unit 14 and stores it in the buffer as one frame for a predetermined time.
  • a predetermined time for example, 10 ms is assumed as the predetermined time.
  • the loudness level conversion unit 54 obtains an audio signal for each frame from the audio signal storage unit 52 and calculates a loudness level 2.
  • the loudness level 2 calculated by the loudness level conversion unit 54 is output to the level comparison count unit 56 and also to the short-term gain calculation unit 60 of the suppression unit 80 described later.
  • the level comparison / counting unit 56 determines where the input level is located in the long term with respect to the suppression threshold and the amplification threshold as described above. Specifically, the level comparison count unit 56 has a counter function for long-term gain control, and the initial value of the counter value is “0” and the initial value of the long-term gain is “0 dB”. Then, the following processes (1) to (4) are executed in units of frames. (1) When the loudness level 2 after reflecting the long-term gain exceeds the suppression threshold, the counter value is increased by “1”. (2) When the loudness level 2 after reflecting the long-term gain falls below the amplification threshold, the counter value is decreased by “1”.
  • the counter value is increased or decreased by “1” in a direction to return the long-term gain to the initial value.
  • the long-term gain is updated by one step larger or smaller, and the counter value is reset to the initial value “0”.
  • the long-term gain is decreased by “0.2 dB”.
  • the long-term gain is increased by “0.2 dB”.
  • the long-term gain is limited to a range of ⁇ 4.0 and is controlled so that the adjustment range is not excessive. Then, the long-term gain updating unit 58 notifies the long-term gain reflecting unit 14 of the long-term gain value.
  • FIG. 3 is a flowchart showing a schematic process of short-term gain adjustment processing.
  • the control amount is determined using loudness level 2 and loudness level 3.
  • signals, threshold values, gains, and the like are described as follows.
  • Loudness levels 1 to 3 L1 to L3 Suppression threshold: Th_cmp Amplification threshold: Th_amp Gain: G Target gain: Gt Temporary target gain: Gd
  • the loudness level 2 is compared with the suppression threshold (S10), and when the loudness level 2 exceeds the suppression threshold (Y in S10), a suppression process is performed (S20).
  • the loudness level 3 is compared with the amplification threshold (S30).
  • an amplification process is performed (S40).
  • the loudness level 3 is larger than the amplification threshold (Y in S30)
  • a convergence process is performed (S50). The convergence processing is processing performed so that the gain approaches “1”.
  • FIG. 4 is a functional block diagram showing the short-term gain calculation unit 60 in detail.
  • the short-term gain calculation unit 60 mainly includes an amplifying unit 70 for determining an adjustment amount for adjusting the gain so that a person's conversation can be easily heard, and a gain in a case where the entire signal level is suppressed and the volume is suddenly increased.
  • a suppression unit 80 that determines an adjustment amount in order to adjust the signal
  • a short-term gain update unit 90 that reflects the determined adjustment amount in a signal.
  • the short-term gain update unit 90 includes a first update unit 92 that reflects the processing results of the amplification unit 70 and the suppression unit 80 on the medium frequency reflection unit 36, and the low frequency reflection unit 32 and the high frequency reflection unit that process results of the suppression unit 80.
  • a second update unit 94 to be reflected in the data.
  • the suppression unit 80 includes a long-term gain adjustment unit 81, a level / threshold comparison unit 82, a suppression target gain calculation unit 83, a suppression gain change width calculation unit 84, a loudness level storage unit 85, and an average level calculation unit 86. , A level standard deviation calculator 87 and a level rise detector 88 are provided.
  • FIG. 5 is a flowchart mainly showing processing in the suppression unit 80. Suppression processing by the suppression unit 80 will be described with reference to this flowchart, and subsequently, components corresponding to each process will be described.
  • a quick suppression process is performed by the normal process.
  • the attack time is set to 1.0 ms.
  • Condition A (1) The suppression threshold exceeds 10 dB or more.
  • the current loudness level 2 is higher than the peak value of the previous loudness level 2 by a first predetermined value (for example, about several dB) or more.
  • the difference between the average value and the current loudness level 2 exceeds the predetermined multiple (m ⁇ ⁇ ) of the standard deviation ⁇ by a second predetermined value (for example, about several dB) or more.
  • Condition B (4) The difference between the average value and the current loudness level 2 exceeds the predetermined multiple (m ⁇ ⁇ ) of the standard deviation ⁇ by a third predetermined value that is greater than the second predetermined value.
  • a level / threshold comparison process is performed to determine whether or not the loudness level 1 exceeds the suppression threshold.
  • the suppression target gain is recalculated from the difference in the loudness level.
  • a suppression process is set (S205).
  • the attack time is set to 100 ms.
  • the loudness level storage unit 85 stores a certain number of loudness levels 2 acquired from the loudness level conversion unit 54.
  • 40 (500 ms) loudness levels 2 are stored.
  • the average level calculation unit 86 calculates the average value of the loudness level 2 stored in the loudness level storage unit 85.
  • the level standard deviation calculation unit 87 calculates the standard deviation ⁇ from the loudness level 2 stored in the loudness level storage unit 85 and the average value of the loudness calculated by the average level calculation unit 86.
  • the level rising detection unit 88 analyzes the rising degree of the loudness level 2. Specifically, the level rising detection unit 88 determines whether or not the above condition A and condition B are satisfied.
  • the long-term gain adjustment unit 81 acquires the value of the long-term gain from the long-term gain update unit 58 of the long-term gain calculation unit 50 described above, reflects its inverse characteristic on the loudness level acquired from the loudness level conversion unit 54, and Is calculated and output to the level / threshold comparison unit 82.
  • the level / threshold comparing unit 82 executes the above-described level / threshold comparing process for comparing the loudness level 2 acquired from the loudness level converting unit 54 with the loudness level 1 acquired from the long-term gain adjusting unit 81.
  • the suppression target gain calculation unit 83 receives the result of the level / threshold comparison processing of the level / threshold comparison unit 82, and calculates the suppression target gain from the difference between the suppression threshold and the current loudness level as necessary. Recalculate.
  • the suppression gain change width calculation unit 84 calculates a gain change amount for each sample from the difference between the current gain and the suppression target gain based on the processing results of the suppression target gain calculation unit 83 and the level rise detection unit 88.
  • the short-term gain update unit 90 is notified.
  • the amplification unit 70 includes an audio signal storage unit 71, a loudness level conversion unit 72, a level / threshold comparison unit 73, a level rise detection unit 74, an amplification target gain calculation unit 75, and an amplification gain change width calculation unit 76. It has.
  • FIG. 6 is a flowchart mainly showing processing in the amplification unit 70. The amplification processing will be described in association with this flowchart and the components of the amplification unit 70 shown in FIG. 4 and the amplification unit 70.
  • the audio signal storage unit 71 acquires the output of the BPF 26 and stores it in the buffer as one frame for a predetermined time.
  • the predetermined time similarly to the audio signal storage unit 52 of the long-term gain calculation unit 50, for example, 12.5 ms is assumed as the predetermined time.
  • the loudness level conversion unit 72 calculates a loudness level for each frame.
  • the level / threshold comparing unit 73 determines whether or not the loudness level calculated for each frame is between the amplification threshold and the lower threshold. That is, the level / threshold comparing unit 73 determines whether the loudness level is below the amplification value and above the lower limit threshold.
  • the lower threshold is set so as to be processed while ignoring noise.
  • the level rise detection unit 74 analyzes the degree of rise of the loudness level (S401).
  • the level rise detection unit 74 analyzes the loudness level of the signal acquired from the BPF 26, that is, the signal in the frequency band of human speech, and when all of the following conditions C of (1) to (4) are satisfied (S401) Y), the amplification target gain is set (S402, S403).
  • Condition C (1) The current gain is 0.9 or more.
  • Loudness level 3 rises for 2 consecutive times.
  • the value of the continuous increase in (2) is not less than a predetermined value.
  • the start value of the above (2) continuous rise is not less than the lower limit threshold.
  • the amplification target gain calculation unit 75 calculates the rising degree (S402), calculates the difference from the amplification threshold (S403), and determines the amplification target gain from these values and the amplification gain upper limit value (S404).
  • the amplification target gain calculation unit 75 calculates a gain change amount for each sample from the current gain and the amplification target gain, and notifies the short-term gain update unit 90 (S405).
  • the amplification target gain calculation unit 75 When the condition C is not satisfied in step S401 (N in S401), the amplification target gain calculation unit 75 simply calculates a temporary target gain from the difference between the amplification threshold and the loudness level 3 (S406), and the temporary target gain. And the current target gain are compared (S407).
  • the amplification target gain calculation unit 75 sets the temporary target gain calculated as the target gain (S408).
  • the amplification target gain calculation unit 75 does not change the target gain (S409).
  • the first update unit 92 of the short-term gain update unit 90 calculates the gain for each sample so that the gain changes in the direction to become the suppression target gain or the amplification target gain.
  • the first update unit 92 notifies the calculated gain to the intermediate frequency reflection unit 36, and the intermediate frequency reflection unit 36 adjusts the gain of the signal so as to be the notified gain.
  • the second updating unit 94 calculates a gain for each sample so that the gain changes in a direction to become a suppression target gain.
  • the second update unit 94 notifies the calculated gain to the low-frequency reflection unit 32 and the high-frequency reflection unit 34, and the low-frequency reflection unit 32 and the high-frequency reflection unit 34 signal the gain to be the notified gain. Adjust the gain.
  • the gain is also calculated based on the loudness level 2 and the loudness level 3.
  • the short-term gain at that time is replaced with the old gain, and the current gain is further multiplied by “1”. Then, the current gain is changed. Therefore, the short-term gain is expressed as a product of the old gain and the current gain.
  • a short-term gain calculation procedure when the suppression process of S20 is performed, that is, when the loudness level 2 is higher than the suppression threshold will be described.
  • the difference is larger than the gain change width, the current gain is increased by the change width.
  • a short-term gain calculation procedure when the amplification process of S40 is performed, that is, when the loudness level 3 exceeds the amplification threshold will be described.
  • the current gain is changed so that the product of the old gain and the current gain approaches “1”. If the product of the old gain and the current gain is greater than “1”, the current gain is decreased. After further reduction, when the product of the old gain and the current gain after reduction becomes less than “1”, the product is adjusted to be “1”. If the product of the old gain and the current gain is “1” or less, the current gain is increased. After the increase, when the product of the old gain and the current gain after the increase exceeds “1”, the gain is adjusted to “1”.
  • FIG. 7 shows the result of the automatic gain adjustment process according to the above configuration and flow for the non-applicable condition (FIG. 7A) and the applied condition (FIG. 7B). As can be seen from the figure, the volume level change is small.
  • the automatic gain adjustment process of the present embodiment it is possible to adjust to a sound that is easy for the user to hear while securing a dynamic range intended by the content creator to some extent. As a result, the volume operation burden on the user can be reduced.
  • the short-term gain reflecting unit 30 may be configured to include only the medium frequency reflecting unit 36 so that only signals in the frequency band of the human voice are controlled. Compared with the configuration having the low-frequency reflection unit 32 and the high-frequency reflection unit 34, the processing load is reduced although the effect is reduced.
  • the processing result of the short-term gain calculation unit 60 may be reflected in the processing of the long-term gain calculation unit.
  • the scene changes suddenly when the long-term gain is increasing, and if the overall level increases, the short-term gain decreases greatly. The amount of change is likely to fluctuate. Therefore, when it is determined that the long-term gain is increasing, the decrease speed of the long-term gain may be temporarily increased if the short-term gain is greatly reduced. As a result, the wobbling can be reduced.
  • each of the BPF 26 and the medium frequency reflecting unit 36 may be further divided into a plurality.
  • FIGS. 8 and 9 are functional block diagrams of the long-term gain calculating unit 50a and the short-term gain calculating unit 60a of the audio gain adjusting apparatus 10 according to the modification.
  • automatic gain adjustment is performed based on the loudness characteristic that reflects human audibility.
  • the characteristic of output means such as a speaker is further reflected.
  • voice gain adjustment apparatus 10 of the above-mentioned embodiment since it is realizable with the structure similar to the structure of the audio
  • the long-term gain calculation unit 50a of this modification includes an output sound pressure characteristic application unit 53 for reflecting characteristics of a speaker or the like between the audio signal storage unit 52 and the loudness level conversion unit 54.
  • the amplification unit 70a of the short-term gain calculation unit 60a includes an output sound pressure characteristic application unit 77 for reflecting characteristics of a speaker or the like between the audio signal storage unit 71 and the loudness level conversion unit 72.
  • a part of the processing in the first embodiment is changed.
  • one of the different points is in the processing of the level comparison count unit 56.
  • the level comparison count unit 56 has a counter function for long-term gain control, the initial value of the counter value is “0”, and the initial value of the long-term gain. Is “0 dB”.
  • the following processes (1) to (4) are executed.
  • a different process is the process (3). (1) When the loudness level 2 after reflecting the long-term gain exceeds the suppression threshold, the counter value is increased by “1”. (2) When the loudness level 2 after reflecting the long-term gain falls below the amplification threshold, the counter value is decreased by “1”.
  • the long-term gain is counted in a direction to return to the initial value.
  • the long-term gain is updated one step larger or smaller, and the counter value is reset to the initial value “0”.
  • the long-term gain is decreased by “0.2 dB”.
  • the long-term gain is increased by “0.2 dB”.
  • the long-term gain is limited to a range of ⁇ 4.0 and is controlled so that the adjustment range is not excessive. Then, the long-term gain updating unit 58 notifies the long-term gain reflecting unit 14 of the long-term gain value.
  • the next difference is the short-term gain adjustment process. Specifically, the processing of the suppression processing (S20) in FIG. 3, that is, the various conditions and the contents of the processing in the processing in FIG. 5 are different.
  • the quick suppression process is performed only when the following condition (S204) is satisfied.
  • the process of S203 of the first embodiment is omitted.
  • the conditions for performing the suppression processing to avoid this are different. Specifically, the following conditions (1) and (2) (condition A1; corresponding to condition A in FIG. 5) are satisfied simultaneously, or condition (3) (condition B1; corresponding to condition B in FIG. 5). ) Is satisfied (Y in S204), quick suppression processing is performed by the normal processing shown in S202 described above.
  • the attack time is set to 1.0 ms.
  • the difference from the first embodiment is that the condition A (3) in the first embodiment is omitted.
  • Condition A1 (1) The suppression threshold exceeds 10 dB or more. (2) The difference between the average value and the current loudness level 2 exceeds the predetermined multiple (m ⁇ ⁇ ) of the standard deviation ⁇ by a second predetermined value (for example, about several dB) or more.
  • Condition B1 (3) The difference between the average value and the current loudness level 2 exceeds the predetermined multiple (m ⁇ ⁇ ) of the standard deviation ⁇ by a third predetermined value that is greater than the second predetermined value.
  • a level / threshold comparison process is performed to determine whether or not the loudness level 1 exceeds the suppression threshold.
  • the suppression target gain is recalculated from the difference in the loudness level.
  • a suppression process with a slower speed than the normal process is set (S205).
  • the attack time is set to 100 ms. Note that the configuration of the suppression unit 80 for executing the suppression process is the same as that of the first embodiment.
  • the level rise detection unit 74 analyzes the degree of rise of the loudness level (S401).
  • the level rising detection unit 74 analyzes the loudness level of the signal acquired from the BPF 26, that is, the signal in the frequency band of human speech, and satisfies the following condition C1 (condition C in FIG. 6).
  • condition C1 condition C in FIG. 6
  • an amplification target gain is set (S403).
  • Condition C1 (1) The current gain is 0.99 or more.
  • Loudness level 3 rises for 2 consecutive times.
  • the value of the continuous increase in (2) is not less than a predetermined value.
  • the start value of the above (2) continuous rise is not less than the lower limit threshold.
  • the amplification target gain calculation unit 75 calculates the difference from the amplification threshold (S403), and determines the amplification target gain from the value and the amplification gain upper limit value (S404). That is, the process of S402 of the first embodiment is omitted. For example, if “the difference ⁇ long-term gain” is less than a predetermined maximum amplification value, the difference is set as the amplification target gain. In other cases, “maximum amplification value / long-term gain” is set as the amplification target gain. Further, the condition C1 (1) is different, and “0.9 or more” is “0.99 or more”.
  • the amplification target gain calculation unit 75 calculates a gain change amount for each sample from the current gain and the amplification target gain, and notifies the short-term gain update unit 90 (S405).
  • the amplification target gain calculation unit 75 When the condition C1 is not satisfied in the step of S401 (N of S401), the amplification target gain calculation unit 75 simply calculates a temporary target gain from the difference between the amplification threshold and the loudness level 3 (S406), and the temporary target gain. And the current target gain are compared (S407).
  • the amplification target gain calculation unit 75 sets the temporary target gain calculated as the target gain (S408).
  • the amplification target gain calculation unit 75 does not change the target gain (S409).
  • the amplification target gain calculation unit 75 sets the amplification release time to the length of one frame, and recalculates the release change width, that is, the gain increase width for each step.
  • the first update unit 92 of the short-term gain update unit 90 calculates the gain for each sample so that the gain changes in the direction to become the suppression target gain or the amplification target gain.
  • the first update unit 92 notifies the calculated gain to the intermediate frequency reflection unit 36, and the intermediate frequency reflection unit 36 adjusts the gain of the signal so as to be the notified gain.
  • the second updating unit 94 calculates a gain for each sample so that the gain changes in a direction to become a suppression target gain.
  • the second update unit 94 notifies the calculated gain to the low-frequency reflection unit 32 and the high-frequency reflection unit 34, and the low-frequency reflection unit 32 and the high-frequency reflection unit 34 signal the gain to be the notified gain. Adjust the gain.
  • the gain is also calculated based on the loudness level 2 and the loudness level 3.
  • the product of the old gain and the current gain is used in the first embodiment, a short-term gain is used in this embodiment.
  • a procedure for calculating the short-term gain when the suppression process of S20 of the present embodiment is performed, that is, when the loudness level 2 exceeds the suppression threshold will be described.
  • a short-term gain calculation procedure when the amplification process of S40 is performed, that is, when the loudness level 3 exceeds the amplification threshold will be described.
  • the current gain is changed so that the short-term gain approaches “1”. If the short-term gain is greater than “1”, the current gain is decreased. When the short-term gain becomes less than “1” after the decrease, the gain is adjusted to be “1”. When the short-term gain is “1” or less, the current gain is increased. When the short-term gain exceeds “1” after the increase, the gain is adjusted to “1”.
  • volume adjustment at the time of switching the input source or switching scenes in the source will be described.
  • the volume level may suddenly change greatly when the input source is switched or when a scene is switched within the source.
  • a technique for solving such a problem a technique of automatically adjusting a gain, such as ALC (Auto Level Control) or DRC (Dynamic Range Compression) has been used. These techniques simply attenuate the signal at a constant rate relative to the amount by which the volume level of the input source exceeds a set threshold level.
  • the gain adjustment method is changed not only according to the instantaneous volume level but also according to the volume level of the audio signal that has been viewed immediately before. Thereby, the discomfort felt by the viewer is reduced. Therefore, when the volume level of an input signal (also referred to as an acoustic signal or an audio signal) exceeds a predetermined threshold level, the amount of gain adjustment depends on the state of the volume level of the past audio signal up to that point. To change. Details will be described below.
  • FIG. 10 is a functional block diagram showing a schematic configuration of the audio gain adjusting apparatus 110 according to the present embodiment, and the audio gain adjusting apparatus 110 is mounted on a television or audio equipment.
  • the audio gain adjustment device 110 includes an audio signal input unit 112, a gain adjustment unit 120, a gain control unit 130, and an audio signal output unit 142.
  • the audio signal input unit 112 has the same function as the audio signal input unit 12 of the first embodiment, and acquires an audio signal to be adjusted.
  • the gain adjustment unit 120 performs gain adjustment on the audio signal according to the calculation result of the gain control unit 130.
  • the audio signal output unit 142 has the same function as the audio signal output unit 42 of the first embodiment, and outputs an audio signal that has been gain-adjusted.
  • the gain control unit 130 includes a threshold / level comparison unit 132, a level change calculation unit 134, a gain adjustment amount calculation unit 136, and a source identification unit 138.
  • the threshold / level comparison unit 132 compares the level value of the audio signal input from the audio signal input unit 112 with a preset threshold level, and calculates a difference level.
  • the level change calculation unit 134 compares the level of the audio signal input during a past fixed period (for example, 1 second) with the level of the currently input audio signal, calculates the level change, and calculates the gain adjustment amount. Notification to the unit 136. It should be noted that the level of the audio signal for a predetermined period including the past fixed period is stored in the level change degree calculation unit 134.
  • the gain adjustment amount calculation unit 136 uses the level change degree calculation unit 134.
  • the compression rate of the audio signal is calculated according to the calculated level change degree, and the gain adjustment amount is calculated according to the calculated compression rate.
  • the gain adjustment amount calculation unit 136 calculates the gain adjustment amount according to any of the following procedures (1) to (3).
  • (1) Calculation procedure 1 The compression rate of the audio signal is calculated according to the level change calculated by the level change calculation unit 134, and the gain adjustment amount is calculated according to the calculated compression rate.
  • Calculation procedure 2 A threshold for gain adjustment is calculated according to the level change calculated by the level change calculation unit 134, and a gain adjustment amount is calculated according to the calculated threshold.
  • Calculation procedure 3 The gain adjustment threshold and compression rate are calculated according to the level change calculated by the level change calculation unit 134, and the gain adjustment amount is calculated according to the calculated threshold and compression rate. To do. Which of the above calculation procedures is used is set in advance by the user or according to the selected source and the content being played back. These settings are determined based on identification by the source identification unit 138.
  • the source specifying unit 138 specifies the content of the audio signal currently being played back.
  • the audio gain adjusting device 110 is mounted on a digital broadcast television.
  • broadcast data includes program information such as a content genre and is used for an electronic program guide or the like.
  • the source identification unit 138 can identify what genre the current content is based on such program information, and can determine which calculation procedure is used for gain adjustment.
  • the source specifying unit 138 can determine which calculation procedure is used when a channel is switched or when an input source is switched. And under which conditions, which calculation procedure is used is preset and may be selectable by the user. For example, in the case of movie content, the signal level may suddenly change due to sound effects or the like. In such a case, if processing in the direction of compressing the gain is performed, the original effect may be reduced. Therefore, when it is determined that the content is a movie, an undesirable process can be avoided by not performing the process of compressing the gain. Also, if the news is being broadcast, it is not expected that the volume will change greatly. Therefore, the compression rate can be set relatively high so that it does not feel noisy when changing to CM. In addition, a button for temporarily stopping the compression process may be provided on a remote control device that operates a television or the like.
  • the gain adjusting unit 120 reflects the gain adjustment amount calculated by the gain adjustment amount calculating unit 136 to the audio signal input from the audio signal input unit 112 and outputs the reflected signal to the audio signal output unit.
  • the compression rate is changed in proportion to the degree of level change. That is, the compression rate is increased as the level change degree increases. Not only when switching from a program to CM, but also when switching from a quiet scene to a scene where a loud sound suddenly appears in a program or movie, the compression ratio increases according to the strength. As a result, the viewer can view more comfortably.
  • the compression rate is changed exponentially according to the level change degree. Normally, the compression rate is set low, but when a large amount of sound is reproduced suddenly to some extent, strong compression can be applied exponentially. For this reason, it is possible to suppress only the audio signal that the viewer feels noisy while maintaining a natural audibility during normal times.
  • the following three methods (a) to (c) are used.
  • 14 to 16 show the relationship between the level change degree and the threshold value.
  • the threshold value is lowered when the level change degree exceeds a predetermined value. This is effective when a large audio signal is suddenly reproduced from the silent state. Specifically, when switching from a program to a CM in broadcasting or the like, the threshold value is lowered only when a CM sound suddenly flows from one second of silence. As a result, it can be reduced that the viewer feels noisy with respect to a large audio signal.
  • the threshold value is changed in proportion to the level change degree. That is, the threshold value is reduced as the level change degree increases. Not only when switching from a program to CM, but also when switching from a quiet scene to a scene where a loud sound suddenly appears in a program or movie, the threshold value is reduced according to the strength. As a result, the viewer can view more comfortably.
  • the threshold value is changed exponentially according to the level change degree. Normally, the threshold value is increased. However, when a large amount of sound is reproduced suddenly to some extent, the threshold value can be lowered exponentially. As a result, it is possible to suppress only audio signals that the viewer feels noisy while maintaining a natural audibility during normal times.
  • the calculation procedure 3 is a process in which the calculation procedures 1 and 2 are combined. Control by changing the threshold and the compression rate simultaneously. When the threshold value is lowered, the compression rate is reduced, and the output level with respect to the maximum input is made constant. As a result, it is possible to suppress only the audio signal that the viewer feels noisy. As shown in FIG. 17 and FIG. 18, the input level and the output level become smaller than the conventional output level when the input level exceeds a predetermined value. Further, as shown in FIG. 19, when the input level becomes a predetermined value or more, the output level is limited to a constant value.
  • the present embodiment it is possible to perform gain adjustment in accordance with the volume feeling actually felt by humans in various types of content. Therefore, the viewer can view the content more comfortably.
  • the above technique may be reflected in the direction opposite to the compression.
  • action-related movie content and the like include many explosion scenes and the like, and the scene may be expressed more effectively by a scene that suddenly increases the volume from silence.
  • the audio signal may be processed so as to be amplified rather than compressed.
  • the third embodiment is added to the first embodiment or the second embodiment. That is, as in the first embodiment or the second embodiment, the long-term gain and the short-term gain are adjusted using the loudness level, and the user listens while securing the dynamic range intended by the content creator. Adjust to an easy sound. Furthermore, as in the third embodiment, the state of the volume level of the audio signal that has been viewed until immediately before the volume level suddenly changes greatly when the input source is switched or the scene is switched within the source. The gain adjustment method is changed according to the above.
  • FIG. 20 is a functional block diagram showing a schematic configuration of the audio gain adjusting device 210 according to the present embodiment, and the third embodiment is simply connected in series to the first embodiment or the second embodiment. An embodiment is shown.
  • This audio gain adjusting device 210 is similar to the audio gain adjusting device 10 of FIG. 1 of the first embodiment, between the audio signal input unit 12 and the long-term gain reflecting unit 14, and the gain adjusting unit 120 of the third embodiment.
  • the gain control unit 130 is provided. Note that the function of each component having the same reference numeral is the same as that of the above-described configuration, and thus the description thereof is omitted here.
  • the gain adjusting unit 120 and the gain control unit 130 exhibit the same operations and effects even when provided between the synthesis unit 40 and the audio signal output unit 42.
  • the third embodiment may be simply connected in series to the first embodiment or the second embodiment, but the third embodiment may be the first or second.
  • the suppression target gain of the embodiment is incorporated into the functional part, the suppression target gain can be effectively obtained along with the reduction of the processing amount.
  • FIG. 21 is a modification of the present embodiment, and shows a configuration in which the suppression target gain calculation unit 83 of the suppression unit 80 shown in the first embodiment includes a gain adjustment unit 120 and a gain control unit 130. .
  • the functions of the gain adjustment unit 120 and the gain control unit 130 are almost the same as those in the third embodiment, but here the gain adjustment is performed based on the loudness level instead of the audio signal.
  • the suppression target gain calculation unit 83 of the suppression unit 80 shown in the second embodiment may include a gain adjustment unit 120 and a gain control unit 130.
  • the gain control unit 130 includes a threshold value / level comparison unit 132, a gain adjustment amount calculation unit 136, and a source identification unit 138.
  • the level change degree calculation unit 134 is omitted, and the rise degree calculated by the level rise detection unit 88 is used as the level change degree calculated by the level change degree calculation unit 134.
  • the threshold / level comparison unit 132 compares the loudness level value acquired from the level / threshold comparison unit 82 with a preset threshold level, calculates a difference level, and notifies the gain adjustment amount calculation unit 136 of the difference level.
  • the gain adjustment amount calculation unit 136 calculates the level rise detection unit 88 when the difference level calculated by the threshold / level comparison unit 132 is positive, that is, when the loudness level value exceeds a preset threshold.
  • a suppression rate (ratio) for calculating the suppression target gain is calculated according to the degree of level change, and is output to the gain adjustment unit 120.
  • the gain adjustment unit 120 is similar to the above-described embodiment.
  • the suppression target gain is recalculated from the difference between the suppression threshold and the current loudness level as necessary.
  • the gain adjustment unit 120 sets the suppression rate calculated by the gain adjustment amount calculation unit 136 to the loudness level input from the level / threshold comparison unit 82. Switching is performed to calculate the suppression target gain and output it to the suppression gain change width calculation unit 84. Further, the source specifying unit 138 specifies content in the same manner as described above. Information on the identified content is reflected in the suppression rate calculation process in the gain adjustment amount calculation unit 136 described above.
  • the functions of the gain adjustment unit 120 and the gain control unit 130 are not limited to the configuration included in the suppression target gain calculation unit 83, and are included in the level / threshold comparison unit 82 and the suppression gain change width calculation unit 84, for example. May be.
  • Audio gain adjustment device 10
  • Audio signal input unit 14
  • Long-term gain reflection unit 20
  • Frequency separation unit 22
  • HPF 26 BPF 30
  • Short-term gain reflection unit 32
  • Low-frequency reflection unit 34
  • High-frequency reflection unit 36
  • Medium-frequency reflection unit 40
  • Synthesis unit 42
  • Audio signal output unit 50, 50a Long-term gain calculation unit 52
  • Audio signal storage unit 53
  • Output sound pressure characteristic application unit 54
  • Loudness level conversion Unit 56
  • level comparison count unit 58 long-term gain update unit
  • 60 60
  • 60 60
  • 70 70
  • 70a amplification unit 71
  • audio signal storage unit 72
  • loudness level conversion unit 73
  • level / threshold comparison unit 74
  • level rise detection unit 75
  • Amplification target gain calculation unit 76
  • Amplification gain change width calculation section 77
  • Output sound pressure characteristic application section 80
  • Suppression section 81
  • Level standard deviation calculation part 88
  • Level rise Detector 90 90 short gain update unit

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Control Of Amplification And Gain Control (AREA)

Abstract

 人間の実聴感レベルに即した音量制御を行い制御精度を向上させる。  図1に示すように、音声ゲイン調整装置10は、調整する音声信号を取得する音声信号入力部12と、取得した音声信号に対して長期ゲインの調整を反映させる長期ゲイン反映部14と、長期ゲイン反映部14からの音声信号を3つの周波数帯域に分割する周波数分離部20と、分割された周波数帯域毎に短期ゲインの調整を反映させる短期ゲイン反映部30と、短期ゲイン反映部30から出力される音声信号を合成する合成部40と、合成された音声信号を出力する音声信号出力部42とを備える。

Description

音声信号調整装置及び音声信号調整方法
 本発明は、音声信号調整装置及び音声信号調整方法に関し、特に、自動利得調整により音声信号を調整する音声信号調整装置及び音声信号調整方法に関する。
 近年、デジタル放送・VOD(Video On Demand)放送・DVD(Digital Versatile Disk)・Blu-ray(登録商標)ディスク等、世の中には様々なメディアソースがあり、ユーザはそれらのソースを自由に切り換えて楽しむことができる。しかしながら、ソース毎に製作者や放送業者が異なるため、音声の収録レベルやダイナミックレンジが異なってしまうことが多く、番組の切り替わり時やソースの切換時に意図しない大きな音が出力されたり、あるいは小さい音になり聴き取り辛くなったりすることがある。これによりユーザはボリュームをその都度操作して聞き易い音量に揃えなくてはならないという不便さがあった。
 上述のようなメディアソース間の音量やダイナミックレンジの違いを調整する技術がいくつか提案されている。例えば、帯域分割された音声信号ごとに利得調整を行い、再び加算して信号を出力することにより、信号レベルを平均化するという技術がある(特許文献1参照)。この技術を用いることで、高周波成分が欠落して音声が不明瞭にならないようにしている。
特開2003-299181号公報
 ところで、特許文献1に開示の技術では、入力信号の電圧値に対して利得を変化させるため、人間の実聴感レベルに即した制御になっておらず制御精度の点で改善が必要であった。また、全体的にレベルが高い(低い)場合には入力信号の変化に対して利得の変化量が大きくなるため、出力信号のふらつきが大きくなってしまうという課題があった。
 本発明の目的は、人間の実聴感レベルに即した音量制御を行い制御精度を向上させる技術を提供することにある。
 本発明に係る装置は、音声信号調整装置に関する。この装置は、入力信号の振幅を相対的に長期的に制御する長期ゲイン調整手段と、前記入力信号の前記振幅を相対的に短期的に制御する短期ゲイン調整手段と、を備える。
 また、前記長期ゲイン調整手段は、前記入力信号の振幅の制御のときに、前記入力信号を人間の聴感に基づくレベルであるラウドネスレベルを反映させてもよい。
 また、前記短期ゲイン調整手段は、前記入力信号の振幅の制御のときに、前記入力信号を人間の聴感に基づくレベルであるラウドネスレベルを反映させてもよい。
 また、前記長期ゲイン調整手段は、当該音声信号調整装置の信号の出力先である音声出力手段の出力音圧特性を反映させて前記入力信号の振幅を制御してもよい。
 また、前記短期ゲイン調整手段は、当該音声信号調整装置の信号の出力先である音声出力手段の出力音圧特性を反映させて前記入力信号の振幅を制御してもよい。
 また、前記長期ゲイン調整手段及び前記短期ゲイン調整手段は、一定時間バッファされた前記入力信号をもとに振幅の制御を行ってもよい。
 また、前記一定時間バッファされた前記入力信号は、先読みされた信号であってもよい。
 また、前記長期ゲイン調整手段は、前回の長期ゲインの制御後の入力信号を反映させてフィードバック制御してもよい。
 また、前記短期ゲイン調整手段は、前記長期ゲイン調整手段の長期ゲインの制御後の信号を反映させて制御してもよい。
 また、前記短期ゲイン調整手段は、前記入力信号を音声帯域と前記音声帯域以外の帯域とに分けて前記入力信号の振幅を制御してもよい。
 また、前記短期ゲイン調整手段は、短期ゲインの振幅の制御においてアタック時間を入力信号の立ち上がり度合いに応じて変更してもよい。
 また、前記短期ゲイン調整手段は、前記入力信号の前記立ち上がり度合いを、前記入力信号のラウドネスレベルと、前記ラウドネスレベルの標準偏差及び平均値とをもとに算出してもよい。
 また、前記短期ゲイン調整手段は、短期ゲインの振幅の制御において、前記短期ゲインの増幅量を前記入力信号のラウドネスレベルの立ち上がり度合いに応じて変更してもよい。
 また、前記短期ゲイン調整手段は、前記入力信号のターゲットゲインを算出するたびに、短期ゲインの変化幅を算出してもよい。
 また、前記長期ゲイン調整手段は、前記短期ゲイン調整手段における短期ゲインの制御変化に応じて長期ゲインを調整してもよい。
 また、前記入力信号のレベルと予め定められた閾値レベルとを比較し、差分レベルを算出する比較手段と、過去一定期間に入力された前記入力信号のレベルと現在入力された前記入力信号のレベルとを比較し、レベルの変化度を算出するレベル変化度算出手段と、前記比較手段で算出された差分レベルに応じて、前記入力信号に施す利得調整処理の利得の調整量を算出する利得調整量算出手段と、入力された前記入力信号に対して、前記利得調整量算出手段で算出された利得の調整量だけ調整を施す利得調整手段と、を備えてもよい。
 また、前記入力信号のソースまたは前記入力信号が含まれるコンテンツのジャンルを特定するソース・コンテンツ特定手段を備え、前記利得調整量算出手段は、前記ソース・コンテンツ特定手段において特定された前記ソース又は前記ジャンルに応じて、前記利得の調整量の算出手順を設定可能であってもよい。
 本発明のある別の態様は、音声信号調整方法に関する。この方法は、入力信号の振幅を相対的に長期的に制御する長期ゲイン調整工程と、前記入力信号の前記振幅を相対的に短期的に制御する短期ゲイン調整工程と、を備える。
 また、前記長期ゲイン調整工程は、前記入力信号の振幅の制御のときに、前記入力信号を人間の聴感に基づくレベルであるラウドネスレベルを反映させてもよい。
 また、前記短期ゲイン調整工程は、前記入力信号の振幅の制御のときに、前記入力信号を人間の聴感に基づくレベルであるラウドネスレベルを反映させてもよい。
 また、前記長期ゲイン調整工程は、当該音声信号調整方法により制御された信号の出力先である音声出力手段の出力音圧特性を反映させて前記入力信号の振幅を制御してもよい。
 また、前記短期ゲイン調整工程は、当該音声信号調整方法により制御された信号の出力先である音声出力手段の出力音圧特性を反映させて前記入力信号の振幅を制御してもよい。
 また、前記長期ゲイン調整工程及び前記短期ゲイン調整工程は、一定時間バッファされた前記入力信号をもとに振幅の制御を行ってもよい。
 また、前記一定時間バッファされた前記入力信号は、先読みされた信号であってもよい。
 また、前記長期ゲイン調整工程は、前回の長期ゲインの制御後の入力信号を反映させてフィードバック制御してもよい。
 また、前記短期ゲイン調整工程は、前記長期ゲイン調整工程の長期ゲインの制御後の信号を反映させて制御してもよい。
 また、前記短期ゲイン調整工程は、前記入力信号を音声帯域と前記音声帯域以外の帯域とに分けて前記入力信号の振幅を制御してもよい。
 また、前記短期ゲイン調整工程は、短期ゲインの振幅の制御においてアタック時間を入力信号の立ち上がり度合いに応じて変更してもよい。
 また、前記短期ゲイン調整工程は、前記入力信号の前記立ち上がり度合いを、前記入力信号のラウドネスレベルと、前記ラウドネスレベルの標準偏差及び平均値とをもとに算出してもよい。
 また、前記短期ゲイン調整工程は、短期ゲインの振幅の制御において、前記短期ゲインの増幅量を前記入力信号のラウドネスレベルの立ち上がり度合いに応じて変更してもよい。
 また、前記短期ゲイン調整工程は、前記入力信号のターゲットゲインを算出するたびに、短期ゲインの変化幅を算出してもよい。
 また、前記長期ゲイン調整工程は、前記短期ゲイン調整手段における短期ゲインの制御変化に応じて長期ゲインを調整してもよい。
 本発明の別の態様は音声信号調整装置に関する。この音声信号調整装置は、入力信号を取得し、前記入力信号のレベルと予め定められた閾値レベルとを比較し、差分レベルを算出する比較手段と、過去一定期間に入力された前記入力信号のレベルと現在入力された前記入力信号のレベルとを比較し、レベルの変化度を算出するレベル変化度算出手段と、前記比較手段で算出された差分レベルと、前記レベル変化度算出手段で算出されたレベル変化度から圧縮率を算出し、算出された圧縮率に従って、利得の調整量を算出する利得調整量算出手段と、入力された前記入力信号に対して、前記利得調整量算出手段で算出された利得の調整量だけ調整を施す利得調整手段と、を備える。
 本発明の別の態様は音声信号調整装置に関する。この音声信号調整装置は、入力信号を取得し、前記入力信号のレベルと予め定められた閾値レベルとを比較し、差分レベルを算出する比較手段と、過去一定期間に入力された前記入力信号のレベルと現在入力された前記入力信号のレベルとを比較し、レベルの変化度を算出するレベル変化度算出手段と、前記比較手段で算出された差分レベルと、前記レベル変化度算出手段で算出されたレベル変化度から利得の調整量算出用の閾値を算出し、算出された閾値に従って、利得の調整量を算出する利得調整量算出手段と、前記入力された入力信号に対して、前記利得調整量算出手段で算出された利得の調整量だけ調整を施す利得調整手段と、を備える。
 本発明の別の態様は音声信号調整装置に関する。この音声信号調整装置は、入力信号を取得し、前記入力信号のレベルと予め定められた閾値レベルとを比較し、差分レベルを算出する比較手段と、過去一定期間に入力された前記入力信号のレベルと現在入力された前記入力信号のレベルとを比較し、レベルの変化度を算出するレベル変化度算出手段と、前記比較手段で算出された差分レベルと、前記レベル変化度算出手段で算出されたレベル変化度から利得の調整量算出用の閾値と圧縮率を算出し、算出された閾値及び圧縮率に従って、利得の調整量を算出する利得調整量算出手段と、前記入力された入力信号に対して、前記利得調整量算出手段で算出された利得の調整量だけ調整を施す利得調整手段と、を備える。
 本発明によれば、人間の実聴感レベルに即した音量制御を行い制御精度を向上させることができる。
第1の実施形態に係る、音声ゲイン調整装置の機能ブロック図である。 第1の実施形態に係る、長期ゲイン算出部の機能ブロック図である。 第1の実施形態に係る、音声ゲイン調整装置の短期ゲイン調整処理の概略工程を示すフローチャートである。 第1の実施形態に係る、短期ゲイン算出部の機能ブロック図である。 第1の実施形態に係る、短期ゲイン算出部の抑圧部における処理を示したフローチャートである。 第1の実施形態に係る、短期ゲイン算出部の増幅部における処理を示したフローチャートである。 第1の実施形態に係る、音声ゲイン調整装置による自動利得調整処理の実験結果を示したグラフである。 第1の実施形態の変形例に係る、音声ゲイン調整装置の長期ゲイン算出部の機能ブロック図である。 第1の実施形態の変形例に係る、音声ゲイン調整装置の短期ゲイン算出部の機能ブロック図である。 第3の実施形態に係る、音声ゲイン調整装置の概略構成を示す機能ブロック図である。 第3の実施形態に係る、算出手順1の(a)におけるレベル変化度と圧縮率の関係を示す図である。 第3の実施形態に係る、算出手順1の(b)におけるレベル変化度と圧縮率の関係を示す図である。 第3の実施形態に係る、算出手順1の(c)におけるレベル変化度と圧縮率の関係を示す図である。 第3の実施形態に係る、算出手順2の(a)におけるレベル変化度と閾値の関係を示す図である。 第3の実施形態に係る、算出手順2の(b)におけるレベル変化度と閾値の関係を示す図である。 第3の実施形態に係る、算出手順2の(c)におけるレベル変化度と閾値の関係を示す図である。 第3の実施形態に係る、算出手順3における入力レベルと出力レベルの関係の一例を示す図である。 第3の実施形態に係る、算出手順3における入力レベルと出力レベルの関係の一例を示す図である。 第3の実施形態に係る、算出手順3における入力レベルと出力レベルの関係の一例を示す図である。 第4の実施形態に係る、音声ゲイン調整装置の概略構成を示す機能ブロック図である。 第4の実施形態の変形例に係る、音声ゲイン調整装置の抑圧ターゲットゲイン算出部の構成を示す機能ブロック図である。
 つぎに、本発明を実施するための形態(以下、単に「実施形態」という)を、図面を参照して具体的に説明する。
 <第1の実施形態>
 まず概要について説明する。以下に説明する音声ゲイン調整装置10は、入力信号に対して、長期的なゲイン調整を行い、その出力信号を帯域分割フィルタにより帯域分割し、分割された帯域毎に出力信号に対して短期的なゲイン調整を行い、最後に各出力信号を合成して最終出力とする。
 長期ゲインは、長期ゲイン処理後の一定区間の信号を人間の聴感上のレベル(以下、「ラウドネスレベル」という)に変換し、設定されている閾値(抑圧閾値や増幅閾値)と比較することにより算出する。このラウドネスレベルは、例えばITU-R(International Telecommunication Union Radiocommunications Sector)標準規格に規定されているラウドネス曲線を反映させたレベルを用いることができる。より具体的には、ラウドネス曲線で示される特性を反転させてラウドネスレベルが算出される。抑圧閾値とは、信号抑圧処理がなされるときに参照する閾値である。また、増幅閾値とは、信号増幅処理がなされるときに参照される閾値である。また、上記二つの閾値の他に、背景ノイズ等を増幅することを防ぐために、下限閾値が設定される。
 そして短期ゲインは、バンドパスフィルタ(BPF)を通過した一定区間の信号をラウドネスレベルに変換し、長期ゲイン通過後のラウドネスレベルとあわせて、それぞれ設定されている閾値と比較し、短期ゲインのターゲット値を算出する。また、同時にターゲット値に変化させるアタック時間及びリリース時間を算出する。算出されたターゲット値、アタック時間及びリリース時間をもとに、短期ゲインを変化させる。この様な機能によって、ユーザが聞きやすい音に調整することができ、その結果、ユーザのボリューム操作負担を軽減することができる。なお、本実施形態において用いる「長期」及び「短期」とは、相対的な期間を意味しており、「長期」は、「短期」の30倍以上の期間でかつ適応的に更新される期間を想定している。このような処理によって、コンテンツ(ソース)の製作者が意図するダイナミックレンジを確保することができる。
 図1は、本実施形態に係る音声ゲイン調整装置10の概略構成を示す機能ブロック図であり、テレビやオーディオ機器に搭載される。本実施形態の構成要素は、例えば、DSP(Digital Signal Processor)等のLSI(大規模集積回路)やメモリ、任意のプログラムにより実現される。図示のように、音声ゲイン調整装置10は、調整する音声信号を取得する音声信号入力部12と、取得した音声信号に対して長期ゲインの調整を反映させる長期ゲイン反映部14と、長期ゲイン反映部14からの音声信号を3つの周波数帯域に分割する周波数分離部20と、分割された周波数帯域毎に短期ゲインの調整を反映させる短期ゲイン反映部30と、短期ゲイン反映部30から出力される音声信号を合成する合成部40と、合成された音声信号を出力する音声信号出力部42とを備える。
 さらに、音声ゲイン調整装置10は、長期ゲイン反映部14で反映させる長期ゲインを算出する長期ゲイン算出部50と、短期ゲイン反映部30で調整する短期ゲインを算出する短期ゲイン算出部60とを備える。本実施形態では、長期ゲイン算出部50における算出結果は、長期ゲイン反映部14とともに短期ゲイン算出部60における短期ゲインの算出にも利用される。
 周波数分離部20は、LPF22と、HPF24と、BPF26とを備えている。また、短期ゲイン反映部30は、低周波反映部32と、高周波反映部34と、中周波反映部36とを備えている。
 本実施形態では、LPF22は、100Hz未満の周波数帯域の信号を低周波反映部32へ出力する。HPF24は、8000Hzより大きい周波数帯域の信号を高周波反映部34に出力する。BPF26は100Hz~8000Hzの周波数帯域の信号を中周波反映部36へ出力するとともに、後述する短期ゲイン算出部60の増幅部70へ出力する。そして、低周波反映部32、高周波反映部34及び中周波反映部36は、短期ゲイン更新部90で算出された短期ゲインの変化量をそれぞれLPF22、HPF24及びBPF26から取得した信号に反映させ、合成部40に出力する。
 なお、詳細は後述するが、中周波反映部36は短期ゲインの変化量を短期ゲイン更新部90の第1の更新部92から取得し、低周波反映部32及び高周波反映部34は、短期ゲイン更新部90の第2の更新部94から短期ゲインの変化量を取得する。また、音声信号入力部12に入力される信号のラウドネスレベルを「ラウドネスレベル1」、長期ゲイン反映部14で長期ゲインの調整がなされた信号のラウドネスレベルを「ラウドネスレベル2」、さらに、中周波反映部36でフィルタリングされた後の信号のラウドネスレベルを「ラウドネスレベル3」とする。
 図2は、本実施形態に係る長期ゲイン算出部50の機能ブロック図である。図示のように、長期ゲイン算出部50は、音声信号記憶部52と、ラウドネスレベル変換部54と、レベル比較カウント部56と、長期ゲイン更新部58とを備えている。
 音声信号記憶部52は、長期ゲイン反映部14の出力を取得して、所定時間だけ1フレームとしてバッファに記憶する。ここでは、所定時間として、例えば、10msを想定している。
 ラウドネスレベル変換部54は、音声信号記憶部52から1フレーム毎の音声信号を取得してラウドネスレベル2を算出する。ラウドネスレベル変換部54で算出したラウドネスレベル2は、レベル比較カウント部56へ出力されるとともに、後述する抑圧部80の短期ゲイン算出部60に出力される。
 レベル比較カウント部56は、上述したように抑圧閾値と増幅閾値に対して入力レベルが長期的にどのあたりに位置するかを判断する。具体的には、レベル比較カウント部56は、長期ゲイン制御用のカウンタ機能を備えており、カウンタ値の初期値を「0」、長期ゲインの所期値を「0dB」としている。そして、以下の(1)~(4)の処理がフレーム単位で実行される。
 (1) 長期ゲイン反映後のラウドネスレベル2が抑圧閾値を越えたらカウンタ値を「1」だけ増やす。
 (2) 長期ゲイン反映後のラウドネスレベル2が増幅閾値を下回ったらカウンタ値を「1」だけ減らす。
 (3) 上記(1)(2)のいずれでも無い場合、長期ゲインを初期値に戻す方向にカウンタ値を「1」だけ増減させる。
 (4) 上記(1)~(3)による処理の結果、カウンタ値が予め定められた数値に達すると、長期ゲインは1ステップ大きく又は小さく更新され、カウンタ値は初期値「0」にリセットされる。ここでは、カウンタ値が「所定の上限閾値」を越えると、長期ゲインが「0.2dB」減少される。また、カウンタ値が「所定の下限閾値」を下回ると長期ゲインが「0.2dB」増加される。なお、長期ゲインは、±4.0の範囲に限定し、調整幅が過度にならないように制御されている。そして、長期ゲイン更新部58は、長期ゲインの値を長期ゲイン反映部14へ通知する。
 つぎに短期ゲインの調整処理について説明する。図3は、短期ゲイン調整処理の概略工程を示すフローチャートである。短期ゲインの調整処理では、ラウドネスレベル2及びラウドネスレベル3を用いて制御量を決定する。なお、図3及び後述の図5、図6の表記において、信号、閾値及びゲイン等を以下のように表記している。
 ラウドネスレベル1~3: L1~L3
 抑圧閾値: Th_cmp
 増幅閾値: Th_amp
 ゲイン: G
 ターゲットゲイン: Gt
 仮ターゲットゲイン: Gd
 まず、ラウドネスレベル2が抑圧閾値と比較され(S10)、ラウドネスレベル2が抑圧閾値を上回るときに(S10のY)、抑圧処理がなされる(S20)。また、ラウドネスレベル2が抑圧閾値を上回らなかったときには(S10のN)、ラウドネスレベル3が増幅閾値と比較される(S30)。ラウドネスレベル3が増幅閾値以下である場合(S30のN)、増幅処理がなされる(S40)。またラウドネスレベル3が増幅閾値より大きい場合(S30のY)、収束処理がなされる(S50)。収束処理とはゲインが「1」に近づくように行う処理である。
 詳細な処理については図5及び図6で説明するが、このようなフローの処理を実行することで、入力レベルに対して短期的に制御する機能によって、コンテンツや番組の切り替わり時や、シーンの切り替わり時、シーンの中の爆発音があった時等に、急に大音量に変化した場合に音量の変化を抑制する。また、音声帯域(BPF26でろ波されて出力される周波数帯域)のレベルが小さい場合には、その帯域を持ち上げることで会話を聞き取りやすくする。短期ゲインは、長期ゲインと比較して素早いゲイン調整が必要であるので、聴感の自然性に大きな影響を及ぼす制御がなされる。聴取者がふらつきを感じやすいパターンとして、音声信号が定常状態にあるときにゲインが変化してしまう状況が挙げられる。本実施形態では、音声信号の定常状態を分析することで、定常状態では、急激にゲインを変化させないように制御される。
 図4は、短期ゲイン算出部60を詳細に示した機能ブロック図である。短期ゲイン算出部60は、主に人の会話を聞き取りやすくゲインを調整するために調整量を決定する増幅部70と、全体の信号レベルを抑圧して急激に大音量になるような場合にゲインを調整するために調整量を決定する抑圧部80と、決定された調整量を信号に反映させる短期ゲイン更新部90とを備えている。短期ゲイン更新部90は、増幅部70と抑圧部80の処理結果を中周波反映部36に反映させる第1の更新部92と、抑圧部80の処理結果を低周波反映部32と高周波反映部34に反映させる第2の更新部94とを備える。
 抑圧部80は、長期ゲイン調整部81と、レベル・閾値比較部82と、抑圧ターゲットゲイン算出部83と、抑圧ゲイン変化幅算出部84と、ラウドネスレベル記憶部85と、平均レベル算出部86と、レベル標準偏差算出部87と、レベル立ち上がり検出部88とを備えている。
 図5は、主に抑圧部80における処理を示したフローチャートである。抑圧部80による抑圧処理をこのフローチャートで説明し、つづいて、各工程に対応する構成要素について説明する。
 この抑圧処理では、ゲインが所定値、ここでは「0dB」を上回っているか否かを判断する(S201)。ゲインが「0dB」以下の場合(S201のY)、増幅中でないと判断し、通常処理として、予め設定されているアタック時間やリリース時間に基づき現在のゲインと抑圧ターゲットゲインとから1サンプル毎のゲインの変化幅が算出される(S202)。
 ゲインが「0dB」を上回っている場合(S201のN)、ゲインが「所定の閾値Th_g」を上回るか否かが判断される(S203)。現在のゲインが「所定の閾値Th_g」を上回る場合には(S203のY)、過剰増幅がなされていると見なされ、増幅ゲイン上限値が現在のゲインに更新される。ただし、増幅中に素早くゲインを下げると不自然な聴感になってしまう虞があるため、以下の条件(S204)を満たす場合にのみ素早い抑制処理がなされる。具体的には、以下の(1)~(3)の条件(条件A)を同時に満たす場合、または(4)の条件(条件B)を満たす場合に(S204のY)、上述のS202で示した通常処理により、素早い抑圧処理がなされる。ここでは例えばアタック時間が1.0msに設定される。
 条件A:
(1) 抑圧閾値を10dB以上オーバーしている。
(2) 現在のラウドネスレベル2が、その直前のラウドネスレベル2のピーク値よりも第1所定値(例えば数dB程度)以上大きい。
(3) 平均値と現在のラウドネスレベル2の差が、標準偏差σの所定倍数(m×σ)よりも第2所定値(例えば数dB程度)以上越えている。
 条件B:
(4) 平均値と現在のラウドネスレベル2の差が、標準偏差σの所定倍数(m×σ)よりも、第2所定値よりも大きな第3所定値以上越えている。
 なお、条件Aまたは条件Bを満たしている場合において、さらに、ラウドネスレベル1が抑圧閾値を越えているか否かのレベル・閾値比較処理がなされ、越えていると判断されると、増幅閾値と現在のラウドネスレベルの差分から抑圧ターゲットゲインが再算出される。
 S203のステップでゲインが「所定の閾値Th_g」以下である場合(S203のN)またはS204のステップで条件Aまたは条件Bを満たさない場合(S204のN)、通常処理よりも緩やかな速さの抑制処理が設定される(S205)。ここでは例えばアタック時間が100msに設定される。
 つぎに、上記の抑圧処理を実行するための抑圧部80の構成について説明する。
 まず、ラウドネスレベル記憶部85は、ラウドネスレベル変換部54から取得したラウドネスレベル2を一定数記憶する。ここでは、例えば40個(500ms)のラウドネスレベル2が記憶される。
 そして、平均レベル算出部86は、ラウドネスレベル記憶部85に記憶されているラウドネスレベル2の平均値を算出する。
 つづいて、レベル標準偏差算出部87が、ラウドネスレベル記憶部85に記憶されているラウドネスレベル2と、平均レベル算出部86で算出されたラウドネスの平均値から標準偏差σを算出する。
 レベル立ち上がり検出部88は、ラウドネスレベル2の立ち上がり度合いを分析する。具体的には、レベル立ち上がり検出部88は、上述の条件Aや条件Bを満たすか否かを判断する。
 長期ゲイン調整部81は、上述した長期ゲイン算出部50の長期ゲイン更新部58から長期ゲインの値を取得し、その逆特性をラウドネスレベル変換部54から取得したラウドネスレベルに対して反映させ、オリジナルの信号のラウドネスレベル1を算出し、レベル・閾値比較部82に出力する。
 レベル・閾値比較部82は、ラウドネスレベル変換部54から取得したラウドネスレベル2と長期ゲイン調整部81から取得したラウドネスレベル1とを比較する上述のレベル・閾値比較処理を実行する。
 そして抑圧ターゲットゲイン算出部83は、上述したように、レベル・閾値比較部82のレベル・閾値比較処理の結果を受けて必要に応じて、抑圧閾値と現在のラウドネスレベルの差分から抑圧ターゲットゲインを再算出する。
 抑圧ゲイン変化幅算出部84は、抑圧ターゲットゲイン算出部83やレベル立ち上がり検出部88の処理の結果に基づいて、現在のゲインと抑圧ターゲットゲインとの差分から1サンプル毎のゲイン変化量を算出し、短期ゲイン更新部90に通知する。
 つぎにS40の増幅処理及び増幅部70に関して説明する。増幅部70は、音声信号記憶部71と、ラウドネスレベル変換部72と、レベル・閾値比較部73と、レベル立ち上がり検出部74と、増幅ターゲットゲイン算出部75と、増幅ゲイン変化幅算出部76とを備えている。
 図6は、主に増幅部70における処理を示したフローチャートである。このフローチャートと図4に示す増幅部70の構成要素と増幅部70とを対応付けて増幅処理について説明する。
 音声信号記憶部71は、BPF26の出力を取得して、所定時間だけ1フレームとしてバッファに記憶する。ここでは、長期ゲイン算出部50の音声信号記憶部52と同様に、所定時間として、例えば、12.5msを想定している。
 ラウドネスレベル変換部72は、フレーム毎にラウドネスレベルを算出する。
 レベル・閾値比較部73は、フレーム毎に算出されたラウドネスレベルが増幅閾値と下限閾値の間にあるか否かを判断する。つまり、レベル・閾値比較部73は、ラウドネスレベルが増幅値を下回っており、かつ、下限閾値を上回っているかを判断する。ここで下限閾値は、ノイズを無視して処理するために設定されている。
 レベル立ち上がり検出部74は、ラウドネスレベルの立ち上がり度合いを分析する(S401)。レベル立ち上がり検出部74は、BPF26から取得した信号、つまり、人の音声の周波数帯域の信号のラウドネスレベルを分析して、下記の(1)~(4)の条件Cに全て当てはまる場合に(S401のY)、増幅ターゲットゲインを設定する(S402、S403)。
 条件C:
 (1) 現在のゲインが0.9以上である。
 (2) ラウドネスレベル3が2連続で上昇している。
 (3) 上記(2)の連続上昇の値が所定値以上である。
 (4) 上記(2)連続上昇の開始値が下限閾値以上である。
 増幅ターゲットゲイン算出部75は、立ち上がり度合いを算出し(S402)、増幅閾値との差分を算出し(S403)、それらの値と増幅ゲイン上限値から増幅ターゲットゲインを決定する(S404)。
 その後、増幅ターゲットゲイン算出部75は、現在のゲインと増幅ターゲットゲインから、1サンプル毎のゲイン変化量を算出し短期ゲイン更新部90に通知する(S405)。
 S401のステップにおいて条件Cを満たさない場合(S401のN)、増幅ターゲットゲイン算出部75は、単純に増幅閾値とラウドネスレベル3の差分から、仮ターゲットゲインを算出し(S406)、その仮ターゲットゲインと現在のターゲットゲインとを比較する(S407)。
 現在のターゲットゲインより仮ターゲットゲインが小さい場合(S407のN)、増幅ターゲットゲイン算出部75は、ターゲットゲインとして算出した仮ターゲットゲインを設定する(S408)。仮ターゲットゲインが現在のターゲットゲイン以上の場合(S407のY)、増幅ターゲットゲイン算出部75は、ターゲットゲインを変更せずにそのままとする(S409)。
 そして、短期ゲイン更新部90の第1の更新部92は、抑圧ターゲットゲイン又は増幅ターゲットゲインになる方向にゲインが変化するように、サンプル毎にゲインを算出する。第1の更新部92は算出したゲインを中周波反映部36に対して通知し、中周波反映部36はその通知されたゲインとなるように信号のゲインを調整する。同様に、第2の更新部94は、抑圧ターゲットゲインになる方向にゲインが変化するようにサンプル毎にゲインを算出する。第2の更新部94は算出したゲインを低周波反映部32及び高周波反映部34に対して通知し、ゲインを低周波反映部32及び高周波反映部34はその通知されたゲインとなるように信号のゲインを調整する。
 ここで、短期ゲインの算出処理について概要を説明する。ゲインの算出も、ラウドネスレベル2及びラウドネスレベル3をもとに算出される。ターゲットゲインが算出された時点で、そのときの短期ゲインが旧ゲインとして置き換えられ、さらに現ゲインが「1」倍にされる。そして現ゲインが変化されていく。したがって、短期ゲインは旧ゲインと現ゲインとの積として表される。
 S20の抑圧処理がなされた場合、つまり、ラウドネスレベル2が抑圧閾値を上回っている場合の短期ゲインの算出手順について説明する。
 (1)旧ゲインと現ゲインの積が、抑圧ゲインターゲットより大きい場合は、ゲインが減少される。
 (2)旧ゲインと現ゲインの積が抑圧ゲインターゲット以下である場合は、さらに、旧ゲインと現ゲインの差分とゲインの変化幅とを比較する。比較の結果、差分がゲインの変化幅以下である場合、旧ゲインと現ゲインの積を抑圧ゲインターゲットに置き換える。差分がゲインの変化幅より大きい場合、現ゲインを上記変化幅だけ増加させる。
 S40の増幅処理がなされた場合、つまり、ラウドネスレベル3が増幅閾値を上回っている場合の短期ゲインの算出手順について説明する。
 (1)旧ゲインと現ゲインの積が増幅ターゲットゲイン以下の場合は、現ゲインを算出された変化幅だけ増加させる。
 (2)旧ゲインと現ゲインの積が増幅ターゲットゲインより大きい場合、さらに旧ゲインと現ゲインの差分を比較する。その差分がS405の処理で算出されたゲインの変化幅以下の場合、旧ゲインと現ゲインとの積を抑圧ターゲットゲインに置き換えられる。また、前記の差分が、前記の変化幅より大きい場合、現ゲインが前記変化幅だけ減少される。
 S50の収束処理がなされるとき、旧ゲインと現ゲインとの積が「1」に近づくように現ゲインが変化される。旧ゲインと現ゲインの積が「1」より大きい場合は、現ゲインが減少される。さらに減少した後、旧ゲインと減少させた後の現ゲインとの積が「1」未満になった場合は、「1」になるように調整される。旧ゲインと現ゲインの積が「1」以下の場合は、現ゲインが増加される。増加後、旧ゲインと増加後の現ゲインの積が「1」を越えた場合には、「1」になるように調整される。
 図7に上記構成及びフローによる自動利得調整処理の結果を、適用しない条件(図7(a))と適用した条件(図7(b))について示している。図から分かるように音量レベル変化が小さくなっている。
 以上、本実施形態の自動利得調整処理によると、コンテンツの製作者が意図するダイナミックレンジをある程度確保しながら、ユーザが聞きやすい音に調整することができる。その結果、ユーザのボリューム操作負担を軽減することができる。
 以上、本発明を実施形態をもとに説明した。この実施形態は例示であり、それらの各構成要素及びその組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。
 例えば、短期ゲイン反映部30において、人間の声の周波数帯域の信号のみが制御されるように中周波反映部36のみの構成としてもよい。低周波反映部32や高周波反映部34がある構成と比較すると、効果は低下するものの処理負荷が低減される。
 さらに、短期ゲイン算出部60の処理の結果が長期ゲイン算出部の処理に反映されてもよい。具体的には、例えば、長期ゲインが上昇方向になっているときに急にシーンが変わって、全体的なレベルが大きくなった場合には短期ゲインが大きく減少方向になるが、このとき短期ゲインの変化量がふらつきやすくなる。そこで、長期ゲインが上昇中であると判断されたときに、短期ゲインが大きく減少したら長期ゲインの減少スピードを一時的に速めてもよい。これによって、そのふらつきを少なくすることができる。また、BPF26及び中周波反映部36をそれぞれさらに複数に分割してもよい。
 図8及び図9に変形例に係る音声ゲイン調整装置10の長期ゲイン算出部50a及び短期ゲイン算出部60aの機能ブロック図を示す。上述の実施形態では、人間の聴感を反映させたラウドネス特性をもとに、自動利得調整がなされたが、本変形例では、さらに、スピーカ等の出力手段の特性が反映される。ここでは、上述の実施形態の音声ゲイン調整装置10の構成と類似の構成で実現できるので、異なる部分についてのみ図示して説明する。
 この変形例の長期ゲイン算出部50aは、音声信号記憶部52とラウドネスレベル変換部54の間に、スピーカ等の特性を反映させるための出力音圧特性適用部53を備えている。同様に、短期ゲイン算出部60aの増幅部70aが、音声信号記憶部71とラウドネスレベル変換部72の間に、スピーカ等の特性を反映させるための出力音圧特性適用部77を備えている。このように、スピーカ等の出力特性によって生じる不要な音量制御(自動利得調整処理)がなくなり、制御精度が向上する。
 <第2の実施形態>
 本実施形態では、第1の実施形態における処理を一部変更している。
 まず異なる点の一つにレベル比較カウント部56の処理にある。具体的には、まず第1の実施形態と同様に、レベル比較カウント部56は、長期ゲイン制御用のカウンタ機能を備えており、カウンタ値の初期値を「0」、長期ゲインの所期値を「0dB」としている。そして、第1の実施形態と異なり以下の(1)~(4)の処理が実行される。なお異なる処理は(3)の処理にある。
 (1) 長期ゲイン反映後のラウドネスレベル2が抑圧閾値を越えたらカウンタ値を「1」だけ増やす。
 (2) 長期ゲイン反映後のラウドネスレベル2が増幅閾値を下回ったらカウンタ値を「1」だけ減らす。
 (3) 長期ゲイン反映後のラウドネスレベル2が下限閾値を下回ったら、長期ゲインを初期値に戻す方向にカウントする。
 (4) 上記(1)~(3)による処理の結果、カウンタ値が予め定められた数値に達すると、長期ゲインが1ステップ大きく又は小さく更新され、カウンタ値は初期値「0」にリセットされる。そして第1の実施形態と同様に、カウンタ値が「所定の上限閾値」を越えると、長期ゲインが「0.2dB」減少される。また、カウンタ値が「所定の下限閾値」を下回ると長期ゲインが「0.2dB」増加される。なお、長期ゲインは、±4.0の範囲に限定し、調整幅が過度にならないように制御されている。そして、長期ゲイン更新部58は、長期ゲインの値を長期ゲイン反映部14へ通知する。
 つぎに異なる点は、短期ゲインの調整処理にある。具体的には、図3の抑圧処理(S20)の処理、つまり、図5の処理における各種条件及び処理の内容が異なる。
 この抑圧処理では、ゲインが所定値、ここでは「0dB」を上回っているか否かを判断する(S201)。ゲインが「0dB」以下の場合(S201のY)、増幅中でないと判断し、通常処理として、予め設定されているアタック時間やリリース時間に基づき現在のゲインと抑圧ターゲットゲインとから1サンプル毎のゲインの変化幅が算出される(S202)。
 ゲインが「0dB」を上回っている場合(S201のN)、以下の条件(S204)を満たす場合にのみ素早い抑制処理がなされる。ここでは、第1の実施形態のS203の処理を省いている。増幅中に素早くゲインを下げると不自然な聴感になってしまう虞がある。そこで、このことを回避する為の抑圧処理を行う条件を異なるものとしている。具体的には、以下の(1)及び(2)の条件(条件A1;図5の条件Aに対応)を同時に満たす場合、または(3)の条件(条件B1;図5の条件Bに対応)を満たす場合に(S204のY)、上述のS202で示した通常処理により、素早い抑圧処理がなされる。ここでは例えばアタック時間が1.0msに設定される。第1の実施形態と異なる点は、第1の実施形態における条件Aの(3)が省かれていることにある。
 条件A1:
(1) 抑圧閾値を10dB以上オーバーしている。
(2) 平均値と現在のラウドネスレベル2の差が、標準偏差σの所定倍数(m×σ)よりも第2所定値(例えば数dB程度)以上越えている。
 条件B1:
(3) 平均値と現在のラウドネスレベル2の差が、標準偏差σの所定倍数(m×σ)よりも、第2所定値よりも大きな第3所定値以上越えている。
 なお、条件A1または条件B1を満たしている場合において、さらに、ラウドネスレベル1が抑圧閾値を越えているか否かのレベル・閾値比較処理がなされ、越えていると判断されると、抑圧閾値と現在のラウドネスレベルの差分から抑圧ターゲットゲインが再算出される。
 S204のステップで条件A1または条件B1を満たさない場合(S204のN)、通常処理よりも緩やかな速さの抑制処理が設定される(S205)。ここでは例えばアタック時間が100msに設定される。
 なお、上記の抑圧処理を実行するための抑圧部80の構成については第1の実施形態と同様である。
 つぎに異なる点は、図3の増幅処理(S40)の内容、つまり、図6の処理における各種条件及び処理の内容が異なる。
 レベル立ち上がり検出部74は、ラウドネスレベルの立ち上がり度合いを分析する(S401)。レベル立ち上がり検出部74は、BPF26から取得した信号、つまり、人の音声の周波数帯域の信号のラウドネスレベルを分析して、下記の(1)~(4)の条件C1(図6の条件Cに対応)に全て当てはまる場合に(S401のY)、増幅ターゲットゲインを設定する(S403)。
 条件C1:
 (1) 現在のゲインが0.99以上である。
 (2) ラウドネスレベル3が2連続で上昇している。
 (3) 上記(2)の連続上昇の値が所定値以上である。
 (4) 上記(2)連続上昇の開始値が下限閾値以上である。
 増幅ターゲットゲイン算出部75は、増幅閾値との差分を算出し(S403)、その値と増幅ゲイン上限値から増幅ターゲットゲインを決定する(S404)。つまり、第1の実施形態のS402の処理が省かれている。例えば、「上記差分×長期ゲイン」が、所定の最大増幅値未満なら、その差分が増幅ターゲットゲインとされる。それ以外の時には、「最大増幅値/長期ゲイン」が増幅ターゲットゲインとされる。また、条件C1の(1)が異なり、「0.9以上」が「0.99以上」となっている。
 その後、増幅ターゲットゲイン算出部75は、現在のゲインと増幅ターゲットゲインから、1サンプル毎のゲイン変化量を算出し短期ゲイン更新部90に通知する(S405)。
 S401のステップにおいて条件C1を満たさない場合(S401のN)、増幅ターゲットゲイン算出部75は、単純に増幅閾値とラウドネスレベル3の差分から、仮ターゲットゲインを算出し(S406)、その仮ターゲットゲインと現在のターゲットゲインとを比較する(S407)。
 現在のターゲットゲインより仮ターゲットゲインが小さい場合(S407のN)、増幅ターゲットゲイン算出部75は、ターゲットゲインとして算出した仮ターゲットゲインを設定する(S408)。仮ターゲットゲインが現在のターゲットゲイン以上の場合(S407のY)、増幅ターゲットゲイン算出部75は、ターゲットゲインを変更せずにそのままとする(S409)。このとき、増幅ターゲットゲイン算出部75は、増幅リリースタイムを1フレームの長さとし、リリースの変化幅、つまり1ステップ毎のゲイン上昇幅を再度算出する。
 そして、短期ゲイン更新部90の第1の更新部92は、抑圧ターゲットゲイン又は増幅ターゲットゲインになる方向にゲインが変化するように、サンプル毎にゲインを算出する。第1の更新部92は算出したゲインを中周波反映部36に対して通知し、中周波反映部36はその通知されたゲインとなるように信号のゲインを調整する。同様に、第2の更新部94は、抑圧ターゲットゲインになる方向にゲインが変化するようにサンプル毎にゲインを算出する。第2の更新部94は算出したゲインを低周波反映部32及び高周波反映部34に対して通知し、ゲインを低周波反映部32及び高周波反映部34はその通知されたゲインとなるように信号のゲインを調整する。
 ここで、短期ゲインの算出処理について概要を説明する。ゲインの算出も、ラウドネスレベル2及びラウドネスレベル3をもとに算出される。なお、第1の実施形態では旧ゲインと現ゲインの積を用いたが、本実施形態では、短期ゲインを用いる。
 本実施形態のS20の抑圧処理がなされた場合、つまり、ラウドネスレベル2が抑圧閾値を上回っている場合の短期ゲインの算出手順について説明する。
 (1)短期ゲインが抑圧ゲインターゲットより大きい場合は、短期ゲインが減少される。
 (2)短期ゲインが抑圧ゲインターゲット以下である場合は、さらに、短期ゲインとゲインの変化幅とを比較する。比較の結果、それらの差分がゲインの変化幅以下である場合、短期ゲインを抑圧ゲインターゲットに置き換える。また、上記差分がゲインの変化幅より大きい場合、短期ゲインを上記変化幅だけ増加させる。
 S40の増幅処理がなされた場合、つまり、ラウドネスレベル3が増幅閾値を上回っている場合の短期ゲインの算出手順について説明する。
 (1)短期ゲインが増幅ターゲットゲイン以下の場合は、算出された変化幅だけ短期ゲインを増加させる。
 (2)短期ゲインが増幅ターゲットゲインより大きい場合、さらに短期ゲインと増幅ターゲットゲインとの差分を比較する。その差分がS405の処理で算出されたゲインの変化幅以下の場合、短期ゲインを増幅ターゲットゲインに置き換えられる。また、前記の差分が、前記の変化幅より大きい場合、短期ゲインが前記変化幅だけ減少される。
 S50の収束処理がなされるとき、短期ゲインが「1」に近づくように現ゲインが変化される。短期ゲインが「1」より大きい場合は、現ゲインが減少される。減少した後、短期ゲインが「1」未満になった場合は、「1」になるように調整される。短期ゲインが「1」以下の場合は、現ゲインが増加される。増加後、短期ゲインが「1」を越えた場合には、「1」になるように調整される。
 以上、本実施形態によると第1の実施形態と同様の効果が得られる。
 <第3の実施形態>
 本実施形態では、入力ソースの切換時やソース内でのシーン切替り時における音量調整について説明する。テレビやオーディオ機器等において、入力ソースの切換時やソース内でのシーン切替り時、音量レベルが急に大きく変化する場合がある。そのような場合、視聴者はその都度不快に感じたり驚いたりして頻繁に音量操作をしなければならないという課題があった。このような課題を解決する手法として、ALC(オートレベルコントロール)やDRC(ダイナミックレンジコンプレッション)といった自動的に利得を調整する技術が用いられてきた。これらの技術は単純に入力ソースの音量レベルが設定した閾値レベルを超えた量に対して一定の比率で信号を減衰させる。
 ところで、人間は、耳に入ってきた音の音圧レベルだけではなく、周波数特性やその音圧レベルに至るまでの変化の仕方等、様々な影響を受けて音の大きさを感じている。例えば、同じ音圧レベルであっても無音状態から再生されたときは音をより大きく感じやすい。そのため、閾値レベルを超えた音響信号(音声信号)に対して常に同じ比率で減衰させる技術では十分に効果を発揮できないことがある。
 そこで、本実施形態では、瞬間の音量レベルだけでなく、直前まで視聴していた音声信号の音量レベルの状態に応じて利得の調整方法を変化させる。それによって、視聴者が感じる不快感を軽減する。そのため、入力信号(音響信号又は音声信号ともいう)において、その音量レベルが予め定められた閾値レベルを超えた場合に、その時点までの過去の音声信号の音量レベルの状態によって、利得の調整量を変化させる。以下、詳細に説明する。
 図10は、本実施形態に係る音声ゲイン調整装置110の概略構成を示す機能ブロック図であり、音声ゲイン調整装置110はテレビやオーディオ機器に搭載される。図示のように、音声ゲイン調整装置110は、音声信号入力部112と、利得調整部120と、利得制御部130と、音声信号出力部142とを備えている。
 音声信号入力部112は、第1の実施形態の音声信号入力部12と同様の機能を有し、調整する音声信号を取得する。利得調整部120は、利得制御部130の算出結果に応じて音声信号に対して利得調整を施す。音声信号出力部142は、第1の実施形態の音声信号出力部42と同様の機能を有し、利得調整がなされた音声信号を出力する。
 利得制御部130は、閾値・レベル比較部132と、レベル変化度算出部134と、利得調整量算出部136と、ソース特定部138とを有する。
 閾値・レベル比較部132は、音声信号入力部112より入力された音声信号のレベル値と予め設定された閾値レベルとを比較し、差分レベルを算出する。
 レベル変化度算出部134は、過去一定期間(例えば1秒間)に入力された音声信号のレベルと現在入力された音声信号のレベルとを比較し、レベルの変化度を算出し、利得調整量算出部136へ通知する。なお、上記過去一定期間を含む所定期間の音声信号のレベルは、レベル変化度算出部134に記憶される。
 利得調整量算出部136は、閾値・レベル比較部132で算出された差分レベルが正、つまり音声信号のレベル値が予め設定された閾値を超えている場合には、レベル変化度算出部134で算出されたレベル変化度に応じて音声信号の圧縮率を算出し、算出された圧縮率に従って、利得の調整量を算出する。具体的には、利得調整量算出部136は、以下の(1)~(3)のいずれかの手順に従って利得調整量を算出する。
(1)算出手順1:レベル変化度算出部134で算出されたレベル変化度に応じて音声信号の圧縮率を算出し、算出された圧縮率に従って、利得の調整量を算出する。
(2)算出手順2:レベル変化度算出部134で算出されたレベル変化度に応じて利得調整用の閾値を算出し、算出された閾値に従って、利得の調整量を算出する。
(3)算出手順3:レベル変化度算出部134で算出されたレベル変化度に応じて利得調整用の閾値と圧縮率を算出し、算出された閾値と圧縮率に従って、利得の調整量を算出する。
 上記いずれの算出手順が用いられるかは、あらかじめユーザが設定したり、選択されているソースや再生されているコンテンツに応じて設定される。それら設定は、ソース特定部138による特定にもとづいて定まる。
 ソース特定部138は、現在再生されている音声信号のコンテンツを特定する。ここで、音声ゲイン調整装置110がデジタル放送用テレビに搭載されている場合を想定する。デジタル放送では、放送されるデータに、コンテンツのジャンル等の番組情報が含まれ、電子番組表等に利用されている。ソース特定部138は、そのような番組情報をもとに現在のコンテンツがどのようなジャンルであるか特定し、いずれの算出手順を用いて利得調整をするかを決定することができる。
 また、ソース特定部138は、チャンネルが切り替わったときや、入力ソースが切り替わったときに、いずれの算出手順を用いるかを決定することができる。そしてどのような条件のときにいずれの算出手順を用いるかは、予め設定されているとともに、ユーザが選択可能となっていてもよい。例えば、映画のコンテンツでは、本来は効果音等のために信号のレベルが急激に変化する場合がある。そのような場合に、利得を圧縮する方向の処理がなされると、本来の効果が小さくなってしまうことがある。そこで、コンテンツが映画であることが判明している場合に、利得を圧縮する処理を行わないようにすることで、好ましくない処理を回避できる。また、ニュースの放送中であれば、大きく音量が変化することは想定されないので、比較的圧縮率を高く設定するようにし、CMへ変わったときなどにうるさいと感じないようにできる。また、テレビ等を操作するリモコン装置に上記圧縮する処理を一時的に停止するボタンが設けられてもよい。
 利得調整部120は、音声信号入力部112より入力された音声信号に対して、利得調整量算出部136で算出された利得の調整量を反映させ音声信号出力部に出力する。
 つぎに、レベル変化度算出部134における利得の調整量の算出手順1~3について説明する。
(1)算出手順1について、以下の(a)~(c)の3種類の手法を用いる。図11~14に、レベル変化度と圧縮率の関係を示す。なお、図11~14において、圧縮率を便宜的に無限大(∞)で表記しているが、当然に適宜設定可能である。
(a)図11に示すように、レベル変化度が予め定めた値を超えている場合にのみ圧縮をかける。いわゆるリミッタと同じ処理である。この手法を用いると、無音状態から急に大きな音声信号が再生される時に効果を奏する。具体的には放送等において番組からCM(commercial message)に切り替わる際、1秒の無音から急にCMの音声が流れるような場合にのみ最大の圧縮率になり、視聴者が大きな音声信号に対してうるさいと感じることが低減できる。
(b)図12に示すように、レベル変化度に比例して、圧縮率を変化させる。つまり、レベル変化度が大きくなるほど圧縮率を大きくする。番組からCMに切り替わる時だけでなく、番組や映画内で静かなシーンから急に大きな音が出るシーンに切り替わった際にも、その強さに応じて圧縮率が大きくなる。その結果、視聴者はより快適に視聴することができる。
(c)図13に示すように、レベル変化度に応じて指数関数的に圧縮率を変化させる。通常は圧縮率を低くしているが、ある程度急に大きな音声が再生されるようになってくる場合には、指数関数的に強い圧縮をかけることができる。このため、通常時は自然な聴感を保ったまま、視聴者がうるさいと感じてしまう音声信号のみを抑え込むことができる。
(2)算出手順2について、以下の(a)~(c)の3種類の手法を用いる。図14~図16にレベル変化度と閾値の関係を示す。
 (a)図14に示すように、レベル変化度が予め定めた値を超えている場合に閾値を下げる。無音状態から急に大きな音声信号が再生されるときに効果を奏する。具体的には放送等において番組からCMに切り替わる際、1秒の無音から急にCMの音声が流れるような場合にのみ閾値が下がる。その結果、視聴者が大きな音声信号に対してうるさいと感じることが低減できる。
 (b)図15に示すように、レベル変化度に比例して、閾値を変化させる。つまり、レベル変化度が大きくなるほど閾値を小さくする。番組からCMに切り替わる時だけでなく、番組や映画内で静かなシーンから急に大きな音が出るシーンに切り替わった際にもその強さに応じて閾値が小さく。その結果、視聴者はより快適に視聴することができる。
 (c)図16に示すように、レベル変化度に応じて指数関数的に閾値を変化させる。
 通常は閾値を大きくしているが、ある程度急に大きな音声が再生されるようになってくる場合には指数関数的に閾値を下げることができる。その結果、通常時は自然な聴感を保ったまま、視聴者がうるさいと感じてしまう音声信号のみを抑え込むことができる。
(2)算出手順3については、上記の算出手順1及び2をあわせた処理である。
 閾値と圧縮率を同時に変化させて制御する。閾値を下げたときには圧縮率を小さくし、最大入力に対する出力レベルを一定にする。その結果、視聴者がうるさいと感じてしまう音声信号のみを抑え込むことができる。入力レベルと出力レベルは、図17や図18に示すように、入力レベルが所定値以上となると、対応する出力レベルが従来より小さくなる。また、図19に示すように、入力レベルが所定値以上となると、出力レベルは一定値にリミットされる。
 以上、本実施形態によると、様々な種類のコンテンツにおいて、人間が実際に感じる音量感により即した利得調整が可能となる。したがって、視聴者はより快適にコンテンツを視聴することができる。なお、上記技術を圧縮とは逆の方向に反映させてもよい。つまり、アクション系の映画のコンテンツなどでは、爆発シーンなどが多く含まれ、静寂から急激に大音量にするシーンによって、シーンをより効果的に表現することがある。そのような場合、圧縮ではなく増幅するように音声信号に対して処理を施してもよい。
 <第4の実施形態>
 本実施形態は、第1の実施形態又は第2の実施形態に第3の実施形態を追加したものである。つまり、第1の実施形態又は第2の実施形態と同様に、ラウドネスレベルを用いて長期ゲイン及び短期ゲインを調整することでコンテンツの製作者が意図するダイナミックレンジをある程度確保しながら、ユーザが聞きやすい音に調整する。さらに、第3の実施形態と同様に、入力ソースの切換時やソース内でのシーン切替り時、音量レベルが急に大きく変化する場合に、直前まで視聴していた音声信号の音量レベルの状態に応じて利得の調整方法を変化させる。
 図20は、本実施形態に係る音声ゲイン調整装置210の概略構成を示す機能ブロック図であり、第1の実施形態又は第2の実施形態に第3の実施形態を単純に直列的に接続する態様について示している。この音声ゲイン調整装置210は、第1の実施形態の図1の音声ゲイン調整装置10において、音声信号入力部12と長期ゲイン反映部14の間に、第3の実施形態の利得調整部120と利得制御部130とを設けた構成となっている。なお、同一符号を有する各構成要素の機能は上述の構成と同一であるのでここでは説明を省略する。
 なお、利得調整部120及び利得制御部130は、合成部40と音声信号出力部42の間に設けられても同様の作用・効果を奏する。
 なお、図20に示したように、第1の実施形態又は第2の実施形態に第3の実施形態を単純に直列的に接続する態様でもよいが、第3の実施形態を第1または2の実施形態の抑圧ターゲットゲインを算出する機能部分に取り込んだ態様とすることによって、処理量の低減とともに、効果的に抑圧ターゲットゲインを求めることも出来る。
 図21は、本実施形態の変形例であって、第1の実施形態で示した抑圧部80の抑圧ターゲットゲイン算出部83に、利得調整部120及び利得制御部130を備える構成を示している。利得調整部120及び利得制御部130の機能は第3の実施形態とほぼ同様であるが、ここでは音声信号ではなくラウドネスレベルをもとに利得調整を行う。第2の実施形態で示した抑圧部80の抑圧ターゲットゲイン算出部83に、利得調整部120及び利得制御部130を備えてもよい。
 利得制御部130は、閾値・レベル比較部132と、利得調整量算出部136と、ソース特定部138とを有する。なおここでは、上記のレベル変化度算出部134が省かれており、レベル変化度算出部134が算出したレベル変化度には、レベル立ち上がり検出部88で算出する立ち上がり度が用いられる。
 閾値・レベル比較部132は、レベル・閾値比較部82から取得したラウドネスレベル値と予め設定された閾値レベルとを比較し、差分レベルを算出し、利得調整量算出部136へ通知する。
 利得調整量算出部136は、閾値・レベル比較部132で算出された差分レベルが正、つまりラウドネスレベル値が予め設定された閾値を超えている場合には、レベル立ち上がり検出部88で算出されたレベル変化度に応じて、抑圧ターゲットゲインを算出するための抑圧率(レシオ)を算出し、利得調整部120に出力する。利得調整部120は、利得調整量算出部136からの出力がない場合、つまり、閾値・レベル比較部132で算出された差分レベルが負またはゼロの場合、上述の実施形態同様に、レベル・閾値比較部82のレベル・閾値比較処理の結果を受けて必要に応じて、抑圧閾値と現在のラウドネスレベルの差分から抑圧ターゲットゲインを再算出する。一方、利得調整量算出部136からの出力がある場合、利得調整部120は、レベル・閾値比較部82より入力されたラウドネスレベルに対して、利得調整量算出部136で算出された抑圧率に切り換えて抑圧ターゲットゲインを算出し抑圧ゲイン変化幅算出部84に出力する。また、ソース特定部138は、上述と同様に、コンテンツを特定する。特定されたコンテンツの情報が上記の利得調整量算出部136における抑圧率算出の処理に反映される。このような構成及び処理によって、瞬間の音量レベルだけでなく、直前まで視聴していた音声信号の音量レベルの状態に応じて利得の調整方法を変化させる場合に、より人間の聴感に近いラウドネスレベルを用いて処理を実行できる。そして、その場合に、コンテンツの特性を反映させることができる。
 なお、利得調整部120及び利得制御部130の機能は、抑圧ターゲットゲイン算出部83に含まれる構成に限る主ではなく、例えば、レベル・閾値比較部82や抑圧ゲイン変化幅算出部84に含まれてもよい。
10、110、210 音声ゲイン調整装置
12 音声信号入力部
14 長期ゲイン反映部
20 周波数分離部
22 LPF
24 HPF
26 BPF
30 短期ゲイン反映部
32 低周波反映部
34 高周波反映部
36 中周波反映部
40 合成部
42 音声信号出力部
50、50a 長期ゲイン算出部
52 音声信号記憶部
53 出力音圧特性適用部
54 ラウドネスレベル変換部
56 レベル比較カウント部
58 長期ゲイン更新部
60、60a 短期ゲイン算出部
70、70a 増幅部
71 音声信号記憶部
72 ラウドネスレベル変換部
73 レベル・閾値比較部
74 レベル立ち上がり検出部
75 増幅ターゲットゲイン算出部
76 増幅ゲイン変化幅算出部
77 出力音圧特性適用部
80 抑圧部
81 長期ゲイン調整部
82 レベル・閾値比較部
83 抑圧ターゲットゲイン算出部
84 抑圧ゲイン変化幅算出部
85 ラウドネスレベル記憶部
86 平均レベル算出部
87 レベル標準偏差算出部
88 レベル立ち上がり検出部
90 短期ゲイン更新部
130 利得制御部
132 閾値・レベル比較部
134 レベル変化度算出部
136 利得調整量算出部
138 ソース特定部
140 長期ゲイン反映部

Claims (35)

  1.  入力信号の振幅を相対的に長期的に制御する長期ゲイン調整手段と、
     前記入力信号の前記振幅を相対的に短期的に制御する短期ゲイン調整手段と、
     を備えることを特徴とする音声信号調整装置。
  2.  前記長期ゲイン調整手段は、前記入力信号の振幅の制御のときに、前記入力信号を人間の聴感に基づくレベルであるラウドネスレベルを反映させることを特徴とする請求項1に記載の音声信号調整装置。
  3.  前記短期ゲイン調整手段は、前記入力信号の振幅の制御のときに、前記入力信号を人間の聴感に基づくレベルであるラウドネスレベルを反映させることを特徴とする請求項1または2に記載の音声信号調整装置。
  4.  前記長期ゲイン調整手段は、当該音声信号調整装置の信号の出力先である音声出力手段の出力音圧特性を反映させて前記入力信号の振幅を制御することを特徴とする請求項1から3までのいずれかに記載の音声信号調整装置。
  5.  前記短期ゲイン調整手段は、当該音声信号調整装置の信号の出力先である音声出力手段の出力音圧特性を反映させて前記入力信号の振幅を制御することを特徴とする請求項1から4までのいずれかに記載の音声信号調整装置。
  6.  前記長期ゲイン調整手段及び前記短期ゲイン調整手段は、一定時間バッファされた前記入力信号をもとに振幅の制御を行うことを特徴とする請求項1から5までのいずれかに記載の音声信号調整装置。
  7.  前記一定時間バッファされた前記入力信号は、先読みされた信号であることを特徴とする請求項6に記載の音声信号調整装置。
  8.  前記長期ゲイン調整手段は、前回の長期ゲインの制御後の入力信号を反映させてフィードバック制御することを特徴とする請求項1から7までのいずれかに記載の音声信号調整装置。
  9.  前記短期ゲイン調整手段は、前記長期ゲイン調整手段の長期ゲインの制御後の信号を反映させて制御することを特徴とする請求項1から8までのいずれかに記載の音声信号調整装置。
  10.  前記短期ゲイン調整手段は、前記入力信号を音声帯域と前記音声帯域以外の帯域とに分けて前記入力信号の振幅を制御することを特徴とする請求項1から9までのいずれかに記載の音声信号調整装置。
  11.  前記短期ゲイン調整手段は、短期ゲインの振幅の制御においてアタック時間を入力信号の立ち上がり度合いに応じて変更することを特徴とする請求項1から10までのいずれかに記載の音声信号調整装置。
  12.  前記短期ゲイン調整手段は、前記入力信号の前記立ち上がり度合いを、前記入力信号のラウドネスレベルと、前記ラウドネスレベルの標準偏差及び平均値とをもとに算出することを特徴とする請求項11に記載の音声信号調整装置。
  13.  前記短期ゲイン調整手段は、短期ゲインの振幅の制御において、前記短期ゲインの増幅量を前記入力信号のラウドネスレベルの立ち上がり度合いに応じて変更することを特徴とする請求項1から12のいずれかに記載の音声信号調整装置。
  14.  前記短期ゲイン調整手段は、前記入力信号のターゲットゲインを算出するたびに、短期ゲインの変化幅を算出することを特徴とする請求項1から13のいずれかに記載の音声信号調整装置。
  15.  前記長期ゲイン調整手段は、前記短期ゲイン調整手段における短期ゲインの制御変化に応じて長期ゲインを調整することを特徴とする請求項1から14のいずれかに記載の音声信号調整装置。
  16.  入力信号の振幅を相対的に長期的に制御する長期ゲイン調整工程と、
     前記入力信号の前記振幅を相対的に短期的に制御する短期ゲイン調整工程と、
     を備えることを特徴とする音声信号調整方法。
  17.  前記長期ゲイン調整工程は、前記入力信号の振幅の制御のときに、前記入力信号を人間の聴感に基づくレベルであるラウドネスレベルを反映させることを特徴とする請求項16に記載の音声信号調整方法。
  18.  前記短期ゲイン調整工程は、前記入力信号の振幅の制御のときに、前記入力信号を人間の聴感に基づくレベルであるラウドネスレベルを反映させることを特徴とする請求項16または17に記載の音声信号調整方法。
  19.  前記長期ゲイン調整工程は、当該音声信号調整方法により制御された信号の出力先である音声出力手段の出力音圧特性を反映させて前記入力信号の振幅を制御することを特徴とする請求項16から18までのいずれかに記載の音声信号調整方法。
  20.  前記短期ゲイン調整工程は、当該音声信号調整方法により制御された信号の出力先である音声出力手段の出力音圧特性を反映させて前記入力信号の振幅を制御することを特徴とする請求項16から19までのいずれかに記載の音声信号調整方法。
  21.  前記長期ゲイン調整工程及び前記短期ゲイン調整工程は、一定時間バッファされた前記入力信号をもとに振幅の制御を行うことを特徴とする請求項16から20までのいずれかに記載の音声信号調整方法。
  22.  前記一定時間バッファされた前記入力信号は、先読みされた信号であることを特徴とする請求項21に記載の音声信号調整方法。
  23.  前記長期ゲイン調整工程は、前回の長期ゲインの制御後の入力信号を反映させてフィードバック制御することを特徴とする請求項16から22までのいずれかに記載の音声信号調整方法。
  24.  前記短期ゲイン調整工程は、前記長期ゲイン調整工程の長期ゲインの制御後の信号を反映させて制御することを特徴とする請求項16から23までのいずれかに記載の音声信号調整方法。
  25.  前記短期ゲイン調整工程は、前記入力信号を音声帯域と前記音声帯域以外の帯域とに分けて前記入力信号の振幅を制御することを特徴とする請求項16から24までのいずれかに記載の音声信号調整方法。
  26.  前記短期ゲイン調整工程は、短期ゲインの振幅の制御においてアタック時間を入力信号の立ち上がり度合いに応じて変更することを特徴とする請求項16から25までのいずれかに記載の音声信号調整方法。
  27.  前記短期ゲイン調整工程は、前記入力信号の前記立ち上がり度合いを、前記入力信号のラウドネスレベルと、前記ラウドネスレベルの標準偏差及び平均値とをもとに算出することを特徴とする請求項26に記載の音声信号調整方法。
  28.  前記短期ゲイン調整工程は、短期ゲインの振幅の制御において、前記短期ゲインの増幅量を前記入力信号のラウドネスレベルの立ち上がり度合いに応じて変更することを特徴とする請求項16から27のいずれかに記載の音声信号調整方法。
  29.  前記短期ゲイン調整工程は、前記入力信号のターゲットゲインを算出するたびに、短期ゲインの変化幅を算出することを特徴とする請求項16から28のいずれかに記載の音声信号調整方法。
  30.  前記長期ゲイン調整工程は、前記短期ゲイン調整手段における短期ゲインの制御変化に応じて長期ゲインを調整することを特徴とする請求項16から29のいずれかに記載の音声信号調整方法。
  31.  前記入力信号のレベルと予め定められた閾値レベルとを比較し、差分レベルを算出する比較手段と、
     過去一定期間に入力された前記入力信号のレベルと現在入力された前記入力信号のレベルとを比較し、レベルの変化度を算出するレベル変化度算出手段と、
     前記比較手段で算出された差分レベルに応じて、前記入力信号に施す利得調整処理の利得の調整量を算出する利得調整量算出手段と、
     入力された前記入力信号に対して、前記利得調整量算出手段で算出された利得の調整量だけ調整を施す利得調整手段と、
     を備えることを特徴とする請求項1から15のいずれかに記載の音声信号調整装置。
  32.  前記入力信号のソースまたは前記入力信号が含まれるコンテンツのジャンルを特定するソース・コンテンツ特定手段を備え、
     前記利得調整量算出手段は、前記ソース・コンテンツ特定手段において特定された前記ソース又は前記ジャンルに応じて、前記利得の調整量の算出手順を設定可能であることを特徴とする請求項31に記載の音声信号調整装置。
  33.  入力信号を取得し、前記入力信号のレベルと予め定められた閾値レベルとを比較し、差分レベルを算出する比較手段と、
     過去一定期間に入力された前記入力信号のレベルと現在入力された前記入力信号のレベルとを比較し、レベルの変化度を算出するレベル変化度算出手段と、
     前記比較手段で算出された差分レベルと、前記レベル変化度算出手段で算出されたレベル変化度から圧縮率を算出し、算出された圧縮率に従って、利得の調整量を算出する利得調整量算出手段と、
     入力された前記入力信号に対して、前記利得調整量算出手段で算出された利得の調整量だけ調整を施す利得調整手段と、
     を備えることを特徴とする音声信号調整装置。
  34.  入力信号を取得し、前記入力信号のレベルと予め定められた閾値レベルとを比較し、差分レベルを算出する比較手段と、
     過去一定期間に入力された前記入力信号のレベルと現在入力された前記入力信号のレベルとを比較し、レベルの変化度を算出するレベル変化度算出手段と、
     前記比較手段で算出された差分レベルと、前記レベル変化度算出手段で算出されたレベル変化度から利得の調整量算出用の閾値を算出し、算出された閾値に従って、利得の調整量を算出する利得調整量算出手段と、
     前記入力された入力信号に対して、前記利得調整量算出手段で算出された利得の調整量だけ調整を施す利得調整手段と、
     を備えることを特徴とする音声信号調整装置。
  35.  入力信号を取得し、前記入力信号のレベルと予め定められた閾値レベルとを比較し、差分レベルを算出する比較手段と、
     過去一定期間に入力された前記入力信号のレベルと現在入力された前記入力信号のレベルとを比較し、レベルの変化度を算出するレベル変化度算出手段と、
     前記比較手段で算出された差分レベルと、前記レベル変化度算出手段で算出されたレベル変化度から利得の調整量算出用の閾値と圧縮率を算出し、算出された閾値及び圧縮率に従って、利得の調整量を算出する利得調整量算出手段と、
     前記入力された入力信号に対して、前記利得調整量算出手段で算出された利得の調整量だけ調整を施す利得調整手段と、
     を備えることを特徴とする音声信号調整装置。
PCT/JP2009/067834 2008-10-17 2009-10-15 音声信号調整装置及び音声信号調整方法 WO2010044439A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN200980151666.4A CN102257728B (zh) 2008-10-17 2009-10-15 音频信号调节设备及音频信号调节方法
US13/124,826 US8787595B2 (en) 2008-10-17 2009-10-15 Audio signal adjustment device and audio signal adjustment method having long and short term gain adjustment
EP09820617A EP2352225A1 (en) 2008-10-17 2009-10-15 Audio signal adjustment device and audio signal adjustment method
JP2010533920A JP5236006B2 (ja) 2008-10-17 2009-10-15 音声信号調整装置及び音声信号調整方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2008268742 2008-10-17
JP2008-268742 2008-10-17

Publications (1)

Publication Number Publication Date
WO2010044439A1 true WO2010044439A1 (ja) 2010-04-22

Family

ID=42106603

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2009/067834 WO2010044439A1 (ja) 2008-10-17 2009-10-15 音声信号調整装置及び音声信号調整方法

Country Status (5)

Country Link
US (1) US8787595B2 (ja)
EP (1) EP2352225A1 (ja)
JP (1) JP5236006B2 (ja)
CN (1) CN102257728B (ja)
WO (1) WO2010044439A1 (ja)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110051959A1 (en) * 2009-08-26 2011-03-03 Yamaha Corporation Sound Volume Adjusting Apparatus
US20120224720A1 (en) * 2011-03-03 2012-09-06 JVC Kenwood Corporation Sound volume control device, sound volume control method, and sound volume control program
CN102883244A (zh) * 2011-07-25 2013-01-16 美商威睿电通公司 声震防护的装置及方法
JP2013162517A (ja) * 2012-02-01 2013-08-19 Harman Becker Automotive Systems Gmbh 信号音量に基いた信号利得の適合時のピーク検出
JP2013223130A (ja) * 2012-04-17 2013-10-28 Nec Engineering Ltd ラウドネス調整装置、ラウドネス調整方法、及びプログラム
JP2014219470A (ja) * 2013-05-02 2014-11-20 ヤマハ株式会社 音声処理装置及びプログラム
JP2015516762A (ja) * 2012-04-12 2015-06-11 ドルビー ラボラトリーズ ライセンシング コーポレイション オーディオ信号におけるラウドネス変化をレベリングするシステム及び方法
JP2016514856A (ja) * 2013-03-21 2016-05-23 インテレクチュアル ディスカバリー カンパニー リミテッド オーディオ信号大きさの制御方法及び装置
JP2016520854A (ja) * 2013-03-21 2016-07-14 インテレクチュアル ディスカバリー カンパニー リミテッド オーディオ信号大きさの制御方法及び装置
JP2017506038A (ja) * 2014-01-30 2017-02-23 ホアウェイ・テクノロジーズ・カンパニー・リミテッド オーディオ信号を圧縮するためのオーディオ圧縮システム
JP2019511888A (ja) * 2016-04-12 2019-04-25 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 個々のサウンド領域を提供するための装置および方法
CN109817189A (zh) * 2018-12-29 2019-05-28 深圳市蔚科电子科技开发有限公司 音频信号的调节方法、音效调节设备及系统

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012075039A (ja) * 2010-09-29 2012-04-12 Sony Corp 制御装置、および制御方法
JP5569436B2 (ja) * 2011-03-04 2014-08-13 株式会社Jvcケンウッド 音声信号補正装置、音声信号補正方法及びプログラム
TWI489773B (zh) * 2011-09-08 2015-06-21 Wistron Corp Dynamic audio amplifier circuit and method thereof
US20130136282A1 (en) * 2011-11-30 2013-05-30 David McClain System and Method for Spectral Personalization of Sound
US9312829B2 (en) 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
KR101945816B1 (ko) * 2012-06-08 2019-02-11 삼성전자주식회사 단말기의 볼륨조절 장치 및 방법
DK2864983T3 (en) * 2012-06-20 2018-03-26 Widex As PROCEDURE FOR SOUND HEARING IN A HEARING AND HEARING
EP2693637A1 (en) * 2012-08-01 2014-02-05 Harman Becker Automotive Systems GmbH Automatic loudness control
JP6079119B2 (ja) 2012-10-10 2017-02-15 ティアック株式会社 録音装置
GB2510323B (en) * 2012-11-13 2020-02-26 Snell Advanced Media Ltd Management of broadcast audio loudness
US10027303B2 (en) 2012-11-13 2018-07-17 Snell Advanced Media Limited Management of broadcast audio loudness
US9413322B2 (en) * 2012-11-19 2016-08-09 Harman International Industries, Incorporated Audio loudness control system
EP2992605B1 (en) 2013-04-29 2017-06-07 Dolby Laboratories Licensing Corporation Frequency band compression with dynamic thresholds
JP6323089B2 (ja) 2014-03-14 2018-05-16 ヤマハ株式会社 レベル調整方法およびレベル調整装置
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
FR3031852B1 (fr) * 2015-01-19 2018-05-11 Devialet Amplificateur a reglage de niveau sonore automatique
CN107925388B (zh) 2016-02-17 2021-11-30 弗劳恩霍夫应用研究促进协会 后置处理器、预处理器、音频编解码器及相关方法
US10149053B2 (en) * 2016-08-05 2018-12-04 Onkyo Corporation Signal processing device, signal processing method, and speaker device
EP3389183A1 (en) * 2017-04-13 2018-10-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for processing an input audio signal and corresponding method
US10074358B1 (en) * 2017-09-07 2018-09-11 GM Global Technology Operations LLC Audio control systems and methods for vehicles with variable compression ratio engines
US11086591B2 (en) * 2018-09-07 2021-08-10 Gracenote, Inc. Methods and apparatus for dynamic volume adjustment via audio classification
US11775250B2 (en) 2018-09-07 2023-10-03 Gracenote, Inc. Methods and apparatus for dynamic volume adjustment via audio classification
CN109151667B (zh) * 2018-09-21 2024-03-01 上海艾为电子技术股份有限公司 一种信号处理方法、装置及扬声器
CN111048108B (zh) * 2018-10-12 2022-06-24 北京微播视界科技有限公司 音频处理方法和装置
JP7427531B2 (ja) * 2020-06-04 2024-02-05 フォルシアクラリオン・エレクトロニクス株式会社 音響信号処理装置及び音響信号処理プログラム
CN112083807B (zh) * 2020-09-20 2021-10-29 吉林大学 一种基于音触转换的足部地形触觉再现方法及装置
CN114915275A (zh) * 2021-02-08 2022-08-16 祖玛视频通讯公司 两级数字自动增益控制
CN116386650A (zh) * 2023-03-29 2023-07-04 广州市迪士普音响科技有限公司 一种基于应用程序的音频增益方法及装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0590857A (ja) * 1991-09-28 1993-04-09 Victor Co Of Japan Ltd 音響効果装置
JPH05243881A (ja) * 1992-02-27 1993-09-21 Matsushita Electric Ind Co Ltd 音場再生装置
JPH06169229A (ja) * 1992-11-30 1994-06-14 Matsushita Electric Ind Co Ltd 自動利得制御装置
JPH07122953A (ja) * 1993-10-22 1995-05-12 Matsushita Electric Ind Co Ltd 信号レベル圧縮装置
JP2005191851A (ja) * 2003-12-25 2005-07-14 Yamaha Corp 音声出力装置
WO2007127023A1 (en) * 2006-04-27 2007-11-08 Dolby Laboratories Licensing Corporation Audio gain control using specific-loudness-based auditory event detection
JP4013906B2 (ja) * 2004-02-16 2007-11-28 ヤマハ株式会社 音量制御装置
JP2008518565A (ja) * 2004-10-26 2008-05-29 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション オーディオ信号の感知音量及び/又は感知スペクトルバランスの計算と調整

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4922535A (en) * 1986-03-03 1990-05-01 Dolby Ray Milton Transient control aspects of circuit arrangements for altering the dynamic range of audio signals
US5666424A (en) * 1990-06-08 1997-09-09 Harman International Industries, Inc. Six-axis surround sound processor with automatic balancing and calibration
DE69319456T2 (de) 1992-01-30 1999-03-25 Matsushita Electric Ind Co Ltd Schallfeldsteuerungssystem
WO2002015395A1 (en) 2000-07-27 2002-02-21 Clear Audio Ltd. Voice enhancement system
JP2003299181A (ja) * 2002-04-03 2003-10-17 Sony Corp オーディオ信号処理装置及びオーディオ信号処理方法
US7551745B2 (en) * 2003-04-24 2009-06-23 Dolby Laboratories Licensing Corporation Volume and compression control in movie theaters
WO2008078232A1 (en) * 2006-12-21 2008-07-03 Koninklijke Philips Electronics N.V. A system for processing audio data
US8275153B2 (en) * 2007-04-16 2012-09-25 Evertz Microsystems Ltd. System and method for generating an audio gain control signal
KR20100049590A (ko) * 2007-08-16 2010-05-12 디티에스, 인코포레이티드 압축 디지털 텔레비젼을 위한 오디오 처리 방법 및 장치

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0590857A (ja) * 1991-09-28 1993-04-09 Victor Co Of Japan Ltd 音響効果装置
JPH05243881A (ja) * 1992-02-27 1993-09-21 Matsushita Electric Ind Co Ltd 音場再生装置
JPH06169229A (ja) * 1992-11-30 1994-06-14 Matsushita Electric Ind Co Ltd 自動利得制御装置
JPH07122953A (ja) * 1993-10-22 1995-05-12 Matsushita Electric Ind Co Ltd 信号レベル圧縮装置
JP2005191851A (ja) * 2003-12-25 2005-07-14 Yamaha Corp 音声出力装置
JP4013906B2 (ja) * 2004-02-16 2007-11-28 ヤマハ株式会社 音量制御装置
JP2008518565A (ja) * 2004-10-26 2008-05-29 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション オーディオ信号の感知音量及び/又は感知スペクトルバランスの計算と調整
WO2007127023A1 (en) * 2006-04-27 2007-11-08 Dolby Laboratories Licensing Corporation Audio gain control using specific-loudness-based auditory event detection

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8670574B2 (en) * 2009-08-26 2014-03-11 Yamaha Corporation Sound volume adjusting apparatus
US9270242B2 (en) 2009-08-26 2016-02-23 Yamaha Corporation Sound volume adjusting apparatus
US20110051959A1 (en) * 2009-08-26 2011-03-03 Yamaha Corporation Sound Volume Adjusting Apparatus
US20120224720A1 (en) * 2011-03-03 2012-09-06 JVC Kenwood Corporation Sound volume control device, sound volume control method, and sound volume control program
US8995686B2 (en) * 2011-03-03 2015-03-31 JVC Kenwood Corporation Sound volume control device, sound volume control method, and sound volume control program
CN102883244B (zh) * 2011-07-25 2015-09-02 开曼群岛威睿电通股份有限公司 声震防护的装置及方法
US8954322B2 (en) 2011-07-25 2015-02-10 Via Telecom Co., Ltd. Acoustic shock protection device and method thereof
CN102883244A (zh) * 2011-07-25 2013-01-16 美商威睿电通公司 声震防护的装置及方法
JP2013162517A (ja) * 2012-02-01 2013-08-19 Harman Becker Automotive Systems Gmbh 信号音量に基いた信号利得の適合時のピーク検出
US10090817B2 (en) 2012-04-12 2018-10-02 Dolby Laboratories Licensing Corporation System and method for leveling loudness variation in an audio signal
JP2015516762A (ja) * 2012-04-12 2015-06-11 ドルビー ラボラトリーズ ライセンシング コーポレイション オーディオ信号におけるラウドネス変化をレベリングするシステム及び方法
US9806688B2 (en) 2012-04-12 2017-10-31 Dolby Laboratories Licensing Corporation System and method for leveling loudness variation in an audio signal
US9960742B2 (en) 2012-04-12 2018-05-01 Dolby Laboratories Licensing Corporation System and method for leveling loudness variation in an audio signal
JP2013223130A (ja) * 2012-04-17 2013-10-28 Nec Engineering Ltd ラウドネス調整装置、ラウドネス調整方法、及びプログラム
JP2016514856A (ja) * 2013-03-21 2016-05-23 インテレクチュアル ディスカバリー カンパニー リミテッド オーディオ信号大きさの制御方法及び装置
JP2016520854A (ja) * 2013-03-21 2016-07-14 インテレクチュアル ディスカバリー カンパニー リミテッド オーディオ信号大きさの制御方法及び装置
JP2014219470A (ja) * 2013-05-02 2014-11-20 ヤマハ株式会社 音声処理装置及びプログラム
JP2017506038A (ja) * 2014-01-30 2017-02-23 ホアウェイ・テクノロジーズ・カンパニー・リミテッド オーディオ信号を圧縮するためのオーディオ圧縮システム
JP2019511888A (ja) * 2016-04-12 2019-04-25 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 個々のサウンド領域を提供するための装置および方法
JP2021132385A (ja) * 2016-04-12 2021-09-09 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 個々のサウンド領域を提供するための装置および方法
CN109817189A (zh) * 2018-12-29 2019-05-28 深圳市蔚科电子科技开发有限公司 音频信号的调节方法、音效调节设备及系统
CN109817189B (zh) * 2018-12-29 2023-09-08 珠海市蔚科科技开发有限公司 音频信号的调节方法、音效调节设备及系统

Also Published As

Publication number Publication date
JP5236006B2 (ja) 2013-07-17
JPWO2010044439A1 (ja) 2012-03-15
EP2352225A1 (en) 2011-08-03
CN102257728B (zh) 2014-11-26
US20110255712A1 (en) 2011-10-20
CN102257728A (zh) 2011-11-23
US8787595B2 (en) 2014-07-22

Similar Documents

Publication Publication Date Title
JP5236006B2 (ja) 音声信号調整装置及び音声信号調整方法
US8615094B2 (en) Automatic level control circuit
US9093968B2 (en) Sound reproducing apparatus, sound reproducing method, and recording medium
US9584918B2 (en) Dynamic volume control and multi-spatial processing protection
US20160210983A1 (en) Method and electronic device
US8345893B2 (en) Sound volume controller
JP2006524968A (ja) 映画館における音量及び圧縮の制御
EP1709734A1 (en) System for audio signal processing
JP2008504783A (ja) 音声信号のラウドネスを自動的に調整する方法及びシステム
CN112534717B (zh) 响应于反馈的多声道音频增强、解码及渲染
CN110600062B (zh) 混音方法、装置和终端设备
US20160381468A1 (en) Method for compressing the dynamics in an audio signal
WO2006051586A1 (ja) 音響電子回路及びその音量調節方法
JP2020510328A (ja) 進化したサラウンド処理を有する設定可能なマルチバンドコンプレッサーアーキテクチャー
KR102505773B1 (ko) 다중 대역 제한기 모드 및 잡음 보상 방법
KR102483222B1 (ko) 오디오 시스템 및 그 제어 방법
JP2021528909A (ja) 圧縮フィードバックに応答するオーディオ増強
JP3627189B2 (ja) 音響電子回路の音量調節方法
JP2012070024A (ja) 音声ダイナミックレンジコントロール装置
JPH05145991A (ja) 低音域特性補正回路
US11343635B2 (en) Stereo audio
US20240121562A1 (en) Hearing loss amplification that amplifies speech and noise subsignals differently
JP2009200777A (ja) オーディオ信号の利得制御装置および利得制御方法
JP2011066604A (ja) 音量制御装置
TWI491277B (zh) 動態音量控制和多空間處理保護(二)

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 200980151666.4

Country of ref document: CN

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 09820617

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2010533920

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 2009820617

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 13124826

Country of ref document: US