JP4206409B2 - Audio processing apparatus, method thereof, program, and recording medium recording the program - Google Patents

Audio processing apparatus, method thereof, program, and recording medium recording the program Download PDF

Info

Publication number
JP4206409B2
JP4206409B2 JP2006073434A JP2006073434A JP4206409B2 JP 4206409 B2 JP4206409 B2 JP 4206409B2 JP 2006073434 A JP2006073434 A JP 2006073434A JP 2006073434 A JP2006073434 A JP 2006073434A JP 4206409 B2 JP4206409 B2 JP 4206409B2
Authority
JP
Japan
Prior art keywords
amplitude
determination
group
signal
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2006073434A
Other languages
Japanese (ja)
Other versions
JP2007251676A (en
Inventor
末廣 島内
暁 江村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2006073434A priority Critical patent/JP4206409B2/en
Publication of JP2007251676A publication Critical patent/JP2007251676A/en
Application granted granted Critical
Publication of JP4206409B2 publication Critical patent/JP4206409B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To attain acceleration of a reaction speed by suppressing or intensifying an input signal in accordance with a change in the character of the relevant signal. <P>SOLUTION: The input signal is converted into a discrete frequency domain signal x(&omega;n) for each frame and divided into a plurality of groups so as to include one or more signals, an average root AX of total power sums of input signals within the frame is determined, an amplitude average AHm of signals within the group is determined for each group, and magnitudes of a first target amplitude TX and AX are compared. If AX is greater, a first standardized average value AHm&times;TX/AX is determined and the magnitude of the standardized average value is compared with that of amplitudes ¾x(&omega;n)¾ of signals in that group. If ¾x(&omega;n)¾ is greater, a first compression function is applied to that amplitude and the signal is output after the amplitude is suppressed to become closer to TX. If ¾x(&omega;n)¾ is not greater, the signal is output while keeping its amplitude as it is, and the entire output signal is converted into a time domain signal. <P>COPYRIGHT: (C)2007,JPO&amp;INPIT

Description

この発明はディジタル化された入力信号のダイナミックレンジを所望の範囲に圧縮する音声処理装置、その方法、プログラム、及びそのプログラムを記録した記録媒体に関する。 The present invention relates to an audio processing apparatus for compressing a dynamic range of a digitized input signal to a desired range, a method and a program thereof, and a recording medium on which the program is recorded.

通信会議や補聴器システムなどにおいて、スピーカなどに対する再生ボリューム(音声調整量)を一定に保ったままでも、再生される音声内容が容易に理解できるようにするために、再生すべき音声信号を入力信号とし、その入力信号のダイナミックレンジを圧縮し、一定の音量範囲に納まるように処理して出力することにより、スピーカなどで再生させる音声処理方法がある。
例えば、従来、リミッタやコンプレッサと呼ばれる手法では、予め定義された非線形圧縮関数に基づき、一定の大きさ以上の音声信号を入力すると、その大きさが強制的に抑圧された信号を出力する。これらの技術は、抑圧量が大きくなるに従い、音声の聴感上の歪みが増大する問題がある。「非特許文献1」に示されるように、信号を複数の周波数帯域に分割または、変換し、それぞれの周波数帯域ごとに異なる圧縮関数を適用すれば、上記の歪みの問題を低減できることが期待される。「非特許文献1」に示される手法では、周波数帯域ごとに予め与えられた固定の圧縮関数を持つが、それら圧縮関数には、各周波数帯域に変換された入力信号そのものではなく、それら各離散周波数領域信号の振幅の時間平均値などが入力として与えられる。これより得られる圧縮された振幅の平均時間値と、圧縮関数適用前の振幅の時間平均値の比を、各周波数帯域ごとに計算し、これらの比を各離散周波数領域信号に乗じることで、各周波数帯域における圧縮処理を完了させる。これら各周波数帯域ごとに圧縮処理された信号は、周波数合成処理を施され、最終的な出力信号となる。
T.Schneider and R.Brennan,“A multichannel compression atrategy for a digital hearing aid”,1997 IEEE International Conference on Acoustics,Speech,and Signal Processing(ICASSP−97),vol.1,pp.411−414,April 1997
In teleconferences and hearing aid systems, the audio signal to be played is used as an input signal so that the audio content to be played can be easily understood even if the playback volume (sound adjustment amount) for the speaker is kept constant. In addition, there is an audio processing method in which the dynamic range of the input signal is compressed, processed so as to fall within a certain volume range, and output by a speaker or the like.
For example, conventionally, in a technique called a limiter or a compressor, when an audio signal having a certain level or more is input based on a predefined nonlinear compression function, a signal whose size is forcibly suppressed is output. These techniques have the problem that the distortion in the audibility of the sound increases as the amount of suppression increases. As shown in “Non-patent Document 1,” it is expected that the above-described distortion problem can be reduced by dividing or converting a signal into a plurality of frequency bands and applying different compression functions for each frequency band. The The technique disclosed in “Non-patent Document 1” has a fixed compression function given in advance for each frequency band, but these compression functions include not the input signal itself converted into each frequency band but each of these discrete functions. The time average value of the amplitude of the frequency domain signal is given as an input. By calculating the ratio between the average time value of the compressed amplitude obtained from this and the time average value of the amplitude before applying the compression function for each frequency band, and multiplying these discrete frequency domain signals by these ratios, The compression process in each frequency band is completed. The signals compressed for each frequency band are subjected to frequency synthesis processing and become final output signals.
T.A. Schneider and R.M. Brennan, “A multichannel compression attribution for a digital healing aid”, 1997 IEEE International Conference on Acoustics, Speech, and Signal Processing 97 (IC). 1, pp. 411-414, April 1997

「非特許文献1」に示される手法は、周波数帯域を細かく分割・変換するほど、よりきめの細かい品質の高い処理の実現が期待される反面、各離散周波数領域信号と元の入力信号の振幅の相関関係が複雑となり、各周波数帯域ごとに固定的に与えられる圧縮関数では、信号の性質の変化に柔軟に対応できず、ある性質の信号を入力した場合、品質高く圧縮できるが、他の性質の信号を入力した場合では、必ずしも、同等な品質で圧縮できないなどの問題が生じる。ここで、信号の性質の違いとは、例えば、音声の母音部分など周期性の高い信号と1音声の子音部分など、周波数成分が広範囲に分布する信号の違いなどを含む。   Although the technique shown in “Non-patent Document 1” is expected to realize finer and higher quality processing as the frequency band is divided and converted more finely, the amplitude of each discrete frequency domain signal and the original input signal is expected. The compression function given by each frequency band is complex and the compression function that is given fixedly for each frequency band cannot flexibly cope with changes in the signal properties. When a signal with a certain property is input, it can be compressed with high quality. When a signal having a characteristic is input, there is a problem that the signal cannot always be compressed with an equivalent quality. Here, the difference in signal characteristics includes, for example, a difference in signals having a wide range of frequency components such as a highly periodic signal such as a vowel part of speech and a consonant part of one speech.

また、各周波数帯域の圧縮関数の入力として、離散周波数領域信号の振幅の時間平均値が適用されるため、時間平均に必要な時定数に応じて、反応速度の遅れが生じる問題がある。   In addition, since the time average value of the amplitude of the discrete frequency domain signal is applied as the input of the compression function of each frequency band, there is a problem in that the reaction rate is delayed according to the time constant required for the time average.

離散時間の入力信号をフレームごとに離散周波数領域信号に変換し、上記離散周波数領域信号を、少なくとも1つのグループは複数の離散周波数領域信号を含むように複数のグループに分割し、上記フレーム内の入力信号の電力総和の平方根を求め、上記各分割されたグループごとに、そのグループ内の離散周波数領域信号の振幅平均を求め、圧縮処理後の期待される所望の第1の目標振幅と上記電力総和の平方根との値の大小を比較する第1の判定をし、上記第1の判定により上記電力総和の平方根の方が大であることを示す信号が入力された場合、上記第1の目標振幅と上記電力総和の平方根との比で、グループごとの振幅平均値を正規化して、第1の規格化平均値を求め、各グループごとに、上記第1の規格化平均値とそのグループの各上記離散周波数領域信号の振幅の大小を比較する第2の判定をし、上記第2の判定が、上記離散周波数領域信号の振幅の方が大であれば、その振幅に対し、出力信号が上記第1の目標振幅に近づくように抑圧する第1の圧縮関数を第1圧縮関数演算部で適用し、上記第2の判定部の判定が、上記離散周波数領域信号の振幅の方が大でなければ、その離散周波数領域信号をそのまま出力し、各グループごとに出力された離散周波数領域信号の全体を時間領域信号に変換する。   A discrete-time input signal is converted into a discrete frequency domain signal for each frame, and the discrete frequency domain signal is divided into a plurality of groups so that at least one group includes a plurality of discrete frequency domain signals. The square root of the total power of the input signal is obtained, and for each of the divided groups, the average amplitude of the discrete frequency domain signals in the group is obtained, and the desired desired first target amplitude after compression processing and the power When the first determination is made to compare the value of the square root of the sum, and when the signal indicating that the square root of the power sum is larger is input by the first determination, the first target The amplitude average value for each group is normalized by the ratio of the amplitude and the square root of the power sum to obtain a first normalized average value. For each group, the first normalized average value and the group's A second determination comparing the magnitudes of the amplitudes of the discrete frequency domain signals is made. If the amplitude of the discrete frequency domain signals is greater than the second judgment, the output signal is compared to the amplitude. A first compression function that suppresses the first target amplitude so as to approach the first target amplitude is applied by the first compression function calculation unit, and the determination by the second determination unit must be greater in amplitude of the discrete frequency domain signal. For example, the discrete frequency domain signal is output as it is, and the entire discrete frequency domain signal output for each group is converted into a time domain signal.

以上の構成によれば、入力信号が離散周波数領域信号に変換することにより、反応速度の向上を図ることが出来、また離散周波数領域信号をグループごとに分割し、そのグループごとの当該信号の性質に応じた圧縮関数により抑圧または強調することにより、安定したダイナミックレンジの圧縮が可能となる。   According to the above configuration, the response speed can be improved by converting the input signal into a discrete frequency domain signal, and the discrete frequency domain signal is divided into groups, and the characteristics of the signal for each group are divided. Stable or dynamic range compression is possible by suppressing or emphasizing with a compression function corresponding to.

実施例1
図1にこの発明の実施例1を示す。入力信号x(t)が周波数領域変換部2に入力されると、定時間(フレーム)、例えば入力信号x(t)のサンプリング周波数が16kHzの場合、サンプル数が256や512ごとに、短時間フーリエ変換(FFT)などにより、ω1〜ωNまでのN個の周波数に対応するN個の離散周波数領域信号、x(ω1)、...、x(ωN)に変換される。ただし、入力信号は一定周期でサンプリングされ、各サンプルがディジタル値に変換されたディジタル信号であり、Nは整数とする。N個の離散周波数領域信号x(ω1)、...、x(ωN)は電力総和平方根計算部4とグループ帯域分割部6に入力される。
Example 1
FIG. 1 shows a first embodiment of the present invention. When the input signal x (t) is input to the frequency domain conversion unit 2, a fixed time (frame), for example, when the sampling frequency of the input signal x (t) is 16 kHz, the number of samples is short for every 256 or 512. N discrete frequency domain signals corresponding to N frequencies from ω1 to ωN, such as x (ω1),. . . , X (ωN). However, the input signal is a digital signal sampled at a constant period and each sample is converted to a digital value, and N is an integer. N discrete frequency domain signals x (ω1),. . . , X (ωN) are input to the power sum square root calculation unit 4 and the group band division unit 6.

グループ帯域分割部6で、離散周波数領域信号は周波数番号1〜Nについて順に、M個のグループに分割される。ただし、MはNより小さく、1以上の整数とする。グループの分割の方法については、例えば、周波数について等分割するか、もしくは、低い周波数グループは比較的細かく、高い周波数領域は比較的粗く分割するなどの方法が考えられる。また、1つのグループに1つの離散周波数領域信号のみ含まれるグループが存在しても良いが、2つ以上の離散周波数領域信号を含むグループが最低1つは存在するものとする。例えば、1kHzごとに等分割する。離散周波数領域信号x(ω1)、...、x(ωN)は各分割グループごとに、グループ振幅平均計算部8m、第1の圧縮関数制御部10m、第1の圧縮関数適用部12mに入力される。ただしmは1〜Mまでの整数とする。   In the group band dividing unit 6, the discrete frequency domain signals are divided into M groups in order for the frequency numbers 1 to N. However, M is smaller than N and is an integer of 1 or more. As a method of dividing the group, for example, a method of dividing the frequency equally or a method of dividing the low frequency group relatively finely and the high frequency region relatively coarsely can be considered. Further, a group including only one discrete frequency domain signal may exist in one group, but it is assumed that at least one group including two or more discrete frequency domain signals exists. For example, equal division is performed every 1 kHz. Discrete frequency domain signals x (ω1),. . . , X (ωN) is input to the group amplitude average calculation unit 8m, the first compression function control unit 10m, and the first compression function application unit 12m for each divided group. However, m is an integer from 1 to M.

一方、電力総和平方根計算部4で、x(ω1)、...、x(ωN)の電力の総和の平方根AXを算出し、電力の総和の平方根AXは各グループごとの第1の圧縮関数制御部10mと第1の圧縮関数適用部12mに入力される。なお、電力総和平方根計算部4では図1中に破線で示すように、入力信号x(t)を入力し、そのフレームの対象サンプルの電力の総和の平方根の計算をしてもよい。各グループごとに、グループ振幅平均計算部8mで、そのグループ中の離散周波数領域信号の振幅平均AHmを計算する。振幅平均AHmはそれぞれ対応する圧縮関数制御部10mと圧縮関数適用部12mに入力される。入力部14から、入力信号に対して、圧縮処理後の期待される所望の振幅(以下、第1の目標振幅)TXが入力され、第1の目標振幅TXは、各グループごとの第1の圧縮関数制御部10mと第1の圧縮関数適用部12mに入力される。第1の目標振幅TXの値は、この装置が適用されるシステムのスピーカや出力増幅器のダイナミックレンジなどにより決定され、信号歪みが生じないような値が選定される。   On the other hand, in the power sum square root calculation unit 4, x (ω1),. . . , X (ωN), and the square root AX of the sum of powers is input to the first compression function controller 10m and the first compression function application unit 12m for each group. The power sum square root calculation unit 4 may input the input signal x (t) as shown by a broken line in FIG. 1 and calculate the square root of the sum of the powers of the target samples in the frame. For each group, the group amplitude average calculation unit 8m calculates the average amplitude AHm of the discrete frequency domain signals in the group. The amplitude average AHm is input to the corresponding compression function control unit 10m and compression function application unit 12m, respectively. An expected desired amplitude after compression processing (hereinafter referred to as a first target amplitude) TX is input to the input signal from the input unit 14, and the first target amplitude TX is the first target amplitude for each group. The data is input to the compression function control unit 10m and the first compression function application unit 12m. The value of the first target amplitude TX is determined by the dynamic range of the speaker or output amplifier of the system to which this apparatus is applied, and a value that does not cause signal distortion is selected.

図2に第1の圧縮関数制御部10mと第1の圧縮関数適用部12mの詳細例と、これに関連する部分の図を示す。第1の圧縮関数制御部10mは、振幅絶対値化部101m、第2の判定部102m、第1の規格化平均値計算部104m、により構成され、
第1の圧縮関数適用部12mは切替スイッチ106m、第1の圧縮関数演算部130m、位相付与部126m、位相計算部128mにより構成され、
入力部14はTX入力部1400とα入力部1402により構成される。
電力総和平方根計算部4よりの電力総和の平方根AXと、TX入力部1400よりの第1の目標振幅TXと、グループ振幅平均計算部8mよりグループ内の離散周波数領域信号の振幅平均AHmがそれぞれ、第1の規格化平均値計算部104mに入力され、第1の規格化平均値計算部104mで、AHm・TX/AXを計算することにより、第1の規格化平均値が計算され、第2の判定部102mに入力される。各グループの振幅平均値AHmは第1の目標振幅TXと電力総和平方根AXとの比TX/AXにより規格化される。
FIG. 2 shows a detailed example of the first compression function control unit 10m and the first compression function application unit 12m, and a diagram of parts related thereto. The first compression function control unit 10m includes an amplitude absolute value conversion unit 101m, a second determination unit 102m, and a first normalized average value calculation unit 104m.
The first compression function application unit 12m includes a changeover switch 106m, a first compression function calculation unit 130m, a phase applying unit 126m, and a phase calculation unit 128m.
The input unit 14 includes a TX input unit 1400 and an α input unit 1402.
The square root AX of the power sum from the power sum square root calculation unit 4, the first target amplitude TX from the TX input unit 1400, and the amplitude average AHm of the discrete frequency domain signals in the group from the group amplitude average calculation unit 8m, respectively. The first normalized average value is input to the first normalized average value calculation unit 104m, and the first normalized average value calculation unit 104m calculates AHm · TX / AX to calculate the first normalized average value. Is input to the determination unit 102m. The amplitude average value AHm of each group is normalized by the ratio TX / AX of the first target amplitude TX and the power sum square root AX.

一方、入力されたそのグループの離散周波数領域信号x(ωn)が振幅絶対値化部101m、位相計算部128mに入力される。振幅絶対値化部101mで離散周波数領域信号x(ωn)の振幅|x(ωn)|が求められ、第2の判定部102mと、切替スイッチ106mに入力される。第2の判定部102mで|x(ωn)|とAHm・TX/AXの値の大小が比較される。振幅|x(ωn)|の方が大であれば、第2の判定部102mの出力により切替スイッチ106mが固定接点1062m側に切り替えられ、振幅|x(ωn)|の方が大でなければ、固定接点1061m側に切り替えられる。固定接点1062m側に切り替えられた場合、離散周波数領域信号の振幅x(ωn)に第1の圧縮関数が第1の圧縮関数演算部130mで適用される。第1の圧縮関数は例えば、次式で表せる。   On the other hand, the input discrete frequency domain signal x (ωn) of the group is input to the amplitude absolute value converting unit 101m and the phase calculating unit 128m. The amplitude | x (ωn) | of the discrete frequency domain signal x (ωn) is obtained by the amplitude absolute value converting unit 101m and input to the second determination unit 102m and the changeover switch 106m. The second determination unit 102m compares | x (ωn) | with the magnitude of the values of AHm · TX / AX. If the amplitude | x (ωn) | is larger, the changeover switch 106m is switched to the fixed contact 1062m side by the output of the second determination unit 102m, and the amplitude | x (ωn) | is not larger. , Switching to the fixed contact 1061m side. When switched to the fixed contact 1062m side, the first compression function calculation unit 130m applies the first compression function to the amplitude x (ωn) of the discrete frequency domain signal. The first compression function can be expressed by the following equation, for example.

α|x(ωn)|+(1−α)AHm・TX/AX
ここでαはα入力部1402より入力され、抑圧の程度を決定する0から1の範囲の実数であり、小さな値を与えるほど、大きく抑圧されることになる。なお、αは0.2〜0.5であることが望ましい。なお、この圧縮関数の演算に利用するため、第1の規格化平均値計算部104mで計算されたAHm・TX/AXが第1の圧縮関数演算部130mに入力される。その演算結果は位相付与部126mに入力される。固定接点1061mより振幅|x(ωn)|は位相付与部126mに直接入力される。
α | x (ωn) | + (1-α) AHm · TX / AX
Here, α is input from the α input unit 1402 and is a real number ranging from 0 to 1 that determines the degree of suppression. The smaller the value, the greater the suppression. Α is preferably 0.2 to 0.5. Note that AHm · TX / AX calculated by the first normalized average value calculation unit 104m is input to the first compression function calculation unit 130m to be used for calculation of the compression function. The calculation result is input to the phase applying unit 126m. The amplitude | x (ωn) | is directly input to the phase applying unit 126m from the fixed contact 1061m.

つまり、第1の圧縮関数適用部12mではそのグループの各離散周波数領域信号の振幅|x(ωn)|に対し、以下の(式1)の制御を行う。
(a)|x(ωn)|>AHm・TX/AXのとき
Fm(|x(ωn)|)=α|x(ωn)|+(1−α)AHm・TX/AX
(b)それ以外のとき
Fm(|x(ωn)|)=|x(ωn)| (式1)
つまり、第1の圧縮関数制御部10mではグループごとのその各離散周波数領域信号の振幅がそのグループの平均振幅AHmに基づき抑圧するか否かの判定が行われており、その判定結果により、第1の圧縮関数適用部12mで、振幅|x(ωn)|に対して抑圧するか、そのままにするかの制御が行われる。
That is, the first compression function application unit 12m performs the following control (Equation 1) for the amplitude | x (ωn) | of each discrete frequency domain signal of the group.
When (a) | x (ωn) |> AHm · TX / AX, Fm (| x (ωn) |) = α | x (ωn) | + (1-α) AHm · TX / AX
(B) Otherwise, Fm (| x (ωn) |) = | x (ωn) | (Formula 1)
That is, the first compression function control unit 10m determines whether or not the amplitude of each discrete frequency domain signal for each group is suppressed based on the average amplitude AHm of the group. 1 compression function application unit 12m controls whether the amplitude | x (ωn) | is suppressed or left as it is.

グループmの離散周波数領域信号x(ωn)は、位相計算部128mに入力される。位相計算部128mで、x(ωn)の位相∠x(ωn)が計算され、この計算結果∠x(ωn)が位相付与部126mに入力される。位相付与部126mで、Y(ωn)=Fm(|x(ωn)|)・∠x(ωn)が計算され、第1の圧縮関数適用部12mから出力され、時間領域変換部16に入力される。
なお、位相付与部126m、位相計算部128mを特に設けることなく、(式1)の演算において、いずれの場合にもx(ωn)/|x(ωn)|を乗算させたものを時間領域変換部16へ出力するようにしてもよい。各グループの第1の圧縮関数適用部12mの出力を、時間領域変換部16で例えば、短時間逆フーリエ変換などで、時間領域信号に変換されて、出力される。
The discrete frequency domain signal x (ωn) of the group m is input to the phase calculation unit 128m. The phase calculation unit 128m calculates the phase ∠x (ωn) of x (ωn), and the calculation result ∠x (ωn) is input to the phase applying unit 126m. In the phase applying unit 126m, Y (ωn) = Fm (| x (ωn) |) · で x (ωn) is calculated, output from the first compression function applying unit 12m, and input to the time domain converting unit 16. The
In addition, in the calculation of (Expression 1), x (ωn) / | x (ωn) | is multiplied in any case in the calculation of (Equation 1) without providing the phase adding unit 126m and the phase calculating unit 128m. The data may be output to the unit 16. The output of the first compression function application unit 12m of each group is converted into a time domain signal by the time domain conversion unit 16 by, for example, a short time inverse Fourier transform, and is output.

この実施例1により、入力信号x(t)を短時間フーリエ変換などにより、周波数成分ごとの信号に変換し、それら各離散周波数領域信号のグループにまとめ、各グループ固有の性質を有する第1の圧縮関数を与える。このとき、第1の圧縮関数は、各グループの離散周波数領域信号x(ωn)の瞬時の振幅|x(ωn)|が規格化平均値AHm・TX/AXより大きい場合のみ、対応する離散周波数領域信号x(ωn)の振幅|x(ωn)|を抑圧する。これにより、入力信号が第1の目標振幅よりも大きな振幅を持っている場合、各グループの平均振幅によって捉えられる入力信号のマクロ的な周波数特性に応じ、各グループの圧縮基準が瞬時に自動的に決定される。   According to the first embodiment, the input signal x (t) is converted into a signal for each frequency component by a short-time Fourier transform or the like, and is grouped into a group of each discrete frequency domain signal. Gives the compression function. At this time, the first compression function has a corresponding discrete frequency only when the instantaneous amplitude | x (ωn) | of the discrete frequency domain signal x (ωn) of each group is larger than the normalized average value AHm · TX / AX. The amplitude | x (ωn) | of the region signal x (ωn) is suppressed. Thereby, when the input signal has an amplitude larger than the first target amplitude, the compression standard of each group is automatically and instantaneously according to the macro frequency characteristics of the input signal captured by the average amplitude of each group. To be determined.

なお、図1中に破線で示すように、電力総和平方根AXと第1の目標振幅TXとの大小を第1の判定部136で比較判定し、TX>AXと判定されると、その判定出力で、スイッチ112をオンにして、当該短時間フーリエ変換区間の入力信号をそのまま出力する。また、例えば、第1の判定部136でTX>AXでないと判定されると、各グループの第1の圧縮関数制御部10mの動作を禁止する構成にしてもよい。
実施例2
次にこの発明の実施例2を説明する。
As indicated by a broken line in FIG. 1, the first determination unit 136 compares and determines the magnitude of the power sum square root AX and the first target amplitude TX. When TX> AX is determined, the determination output is obtained. Then, the switch 112 is turned on, and the input signal in the short-time Fourier transform section is output as it is. Further, for example, when the first determination unit 136 determines that TX> AX is not satisfied, the operation of the first compression function control unit 10m of each group may be prohibited.
Example 2
Next, a second embodiment of the present invention will be described.

実施例1では、第1の目標振幅TXより、電力総和の平方根、つまり、入力信号の振幅平均の推定値AXが大きい場合は、入力信号の振幅を抑圧した。しかし、TX>AXの場合は、振幅抑圧処理は行われていない。この実施例2では、TX以下の第2の目標振幅DXを予め決め、DX>AXの場合に入力信号を強調してダイナミックレンジを更に圧縮する。
先に述べたように第1の判定部136で電力総和平方根計算部4よりの電力総和の平方根AXと、入力部14よりの所望の振幅TXの大小を比較し、TX<AXを満たすフレームについては、第1の実施例で説明した第1の圧縮関数による抑圧する。実施例2では、TX<AXを満たさないフレームについて、強調したい所望振幅(以下第2の目標振幅)DXを定め、第2の目標振幅に近づくよう、入力信号を強調して、ダイナミックレンジをさらに圧縮する。
In the first embodiment, when the square root of the power sum, that is, the estimated average value AX of the amplitude of the input signal is larger than the first target amplitude TX, the amplitude of the input signal is suppressed. However, when TX> AX, the amplitude suppression process is not performed. In the second embodiment, the second target amplitude DX equal to or lower than TX is determined in advance, and when DX> AX, the input signal is emphasized to further compress the dynamic range.
As described above, the first determination unit 136 compares the square root AX of the power sum from the power sum square root calculation unit 4 with the magnitude of the desired amplitude TX from the input unit 14, and the frame satisfies TX <AX. Are suppressed by the first compression function described in the first embodiment. In the second embodiment, for a frame that does not satisfy TX <AX, a desired amplitude (hereinafter referred to as a second target amplitude) DX to be emphasized is determined, and the input signal is enhanced so as to approach the second target amplitude to further increase the dynamic range. Compress.

図3に実施例2の具体的構成例を示す。図1を用いて説明した実施例1と比べて、第1の圧縮関数制御部10mと第1の圧縮関数適用部12mの具体的構成が一部変更され、第2の圧縮関数制御部135mと第2の圧縮関数適用部125mとなっている。また同一機能構成部分には同一参照番号をつける。
第1の圧縮判定部134の判定がTX>AXの場合、このことを示す判定結果出力が第2の圧縮関数制御部135mに入力される。
図4に第2の圧縮関数制御部135mと第2の圧縮関数適用部125mの詳細例と、これに関連する部分の図を示す。同一機能構成部分には同一参照番号をつける。
FIG. 3 shows a specific configuration example of the second embodiment. Compared to the first embodiment described with reference to FIG. 1, the specific configurations of the first compression function control unit 10 m and the first compression function application unit 12 m are partially changed, and the second compression function control unit 135 m The second compression function application unit 125m is provided. The same reference numerals are assigned to the same functional components.
When the determination of the first compression determination unit 134 is TX> AX, a determination result output indicating this is input to the second compression function control unit 135m.
FIG. 4 shows a detailed example of the second compression function control unit 135m and the second compression function application unit 125m, and a diagram of parts related thereto. The same reference numerals are assigned to the same functional components.

第1の圧縮判定部134は第1の判定部136と第3の判定部137により構成され、第2の圧縮関数適用部125mは切替スイッチ108m、切替スイッチ107m、第2の圧縮関数演算部132m、位相付与部126m、位相計算部128mにより構成され、入力部14はTX入力部1400、DX入力部1404、α入力部1402、β入力部1406により構成され、第2の圧縮関数制御部135mは第4の判定部138mで構成されている。
まず第1の判定部136は電力総和平方根計算部4よりの電力総和の平方根AXとTX入力部1400よりの所望の振幅TXと値の大小を比較し、この結果が(1)AX≦DX(2)DX<AX≦TX(3)TX<AXの3状態を判定する3状態判定回路144に入力される。
The first compression determination unit 134 includes a first determination unit 136 and a third determination unit 137, and the second compression function application unit 125m includes a changeover switch 108m, a changeover switch 107m, and a second compression function calculation unit 132m. The phase adding unit 126m and the phase calculating unit 128m. The input unit 14 includes a TX input unit 1400, a DX input unit 1404, an α input unit 1402, and a β input unit 1406. The second compression function control unit 135m It is comprised by the 4th determination part 138m.
First, the first determination unit 136 compares the square root AX of the power sum from the power sum square root calculation unit 4 with the desired amplitude TX from the TX input unit 1400 and the magnitude of the value, and the result is (1) AX ≦ DX ( 2) DX <AX ≦ TX (3) Input to the three-state determination circuit 144 that determines three states of TX <AX.

DX入力部1404より入力された第2の目標振幅DXは第3の判定部137と第2の圧縮関数演算部132mに入力される。第3の判定部137は電力総和平方根計算部4よりの電力総和の平方根AXと第2の目標振幅DXとの値の大小を比較し、この結果が3状態判定回路144に入力される。ただしDX≦TXであり、DXはTXの約2分の1程度が好ましい。3状態判定回路144の出力が(1)の場合、全てのグループの切替スイッチ108mが固定接点1082m側に切り替えられ、(3)の場合は、固定接点1081mに切り替えられる。また、(2)の場合は、入力信号は抑圧されずに、出力される。固定接点1081m側に切り替えられた場合は、振幅絶対値化部101mよりの対応グループmの各離散周波数領域信号の振幅|x(ωn)|が第1の圧縮関数適用部12m内の切替スイッチ106mの固定接点1061mへ供給される。つまりこの場合は振幅|x(ωn)|は抑圧圧縮、強調圧縮されることはない。   The second target amplitude DX input from the DX input unit 1404 is input to the third determination unit 137 and the second compression function calculation unit 132m. The third determination unit 137 compares the values of the square root AX of the power sum from the power sum square root calculation unit 4 and the second target amplitude DX, and the result is input to the three-state determination circuit 144. However, DX ≦ TX, and DX is preferably about one-half of TX. When the output of the three-state determination circuit 144 is (1), the selector switches 108m of all groups are switched to the fixed contact 1082m side, and in the case of (3), the switches are switched to the fixed contact 1081m. In the case of (2), the input signal is output without being suppressed. When switched to the fixed contact 1081m side, the amplitude | x (ωn) | of each discrete frequency domain signal of the corresponding group m from the amplitude absolute value converting unit 101m is changed to the changeover switch 106m in the first compression function applying unit 12m. To the fixed contact 1061m. That is, in this case, the amplitude | x (ωn) | is not subjected to suppression compression or enhancement compression.

第4の判定部138mでは、グループ振幅平均計算部8mよりの振幅平均AHmと振幅絶対値化部101mよりの振幅|x(ωn)|との大小が比較され、振幅|x(ωn)|の方が大きい場合、切替スイッチ107mが、固定接点1072m側に切り替えられ、振幅|x(ωn)|の方が大きくない場合、固定接点1071m側に切り替えられる。切替スイッチが1072mに切り替えられている場合、すなわち、DX>AX、|x(ωn)|>AHm、を満たす場合は、離散周波数領域信号の振幅|x(ωn)|は第2の圧縮関数演算部132mで、第2の圧縮関数が適用される。第2の圧縮関数は例えば、次式で表せる。   In the fourth determination unit 138m, the magnitude of the amplitude average AHm from the group amplitude average calculation unit 8m and the amplitude | x (ωn) | from the amplitude absolute value conversion unit 101m are compared, and the amplitude | x (ωn) | If it is larger, the changeover switch 107m is switched to the fixed contact 1072m side, and if the amplitude | x (ωn) | is not larger, it is switched to the fixed contact 1071m side. When the changeover switch is switched to 1072 m, that is, when DX> AX and | x (ωn) |> AHm are satisfied, the amplitude | x (ωn) | of the discrete frequency domain signal is calculated by the second compression function calculation. In part 132m, the second compression function is applied. For example, the second compression function can be expressed by the following equation.

β|x(ωn)|+(1−β)AHm・DX/AX
ここで、βはβ入力部1406より入力され、βは強調の程度を決定する0〜1の範囲の実数であり、小さな値を与えるほど、入力された振幅|x(ωn)|と比べ、より大きく強調される。なお、βは0.2〜0.5であることが望ましい。その演算結果は位相付与部126mに入力される。固定接点1071mより位相付与部126mに入力され、切替スイッチ107mが固定接点1071m側に接続されている場合は、振幅|x(ωn)|は位相付与部126mへ直接入力される。
β | x (ωn) | + (1-β) AHm · DX / AX
Here, β is input from the β input unit 1406, β is a real number in the range of 0 to 1 that determines the degree of emphasis, and the smaller the value, the larger the input amplitude | x (ωn) | Greater emphasis. Note that β is preferably 0.2 to 0.5. The calculation result is input to the phase applying unit 126m. When the fixed contact 1071m is input to the phase applying unit 126m and the changeover switch 107m is connected to the fixed contact 1071m side, the amplitude | x (ωn) | is directly input to the phase applying unit 126m.

つまり、第2の圧縮関数適用部125mでは、そのグループの各離散周波数領域信号の振幅|x(ωn)|に対し、以下に示す(式2)で制御を行う。
(a)|x(ωn)|>AHmのとき
Fm(|x(ωn)|)=β|x(ωn)|+(1−β)AHm・DX/AX
(b)それ以外のとき
Fm(|x(ωn)|)=|x(ωn)| (式2)
つまり、第2の圧縮関数制御部135mではグループごとのその各離散周波数領域信号の振幅がそのグループの平均振幅AHmに基づき強調するか否かの判定が行われており、その判定結果により、第2の圧縮関数適用部125mで、振幅|x(ωn)|に対して強調するか、そのままにするかの制御が行われる。
That is, the second compression function application unit 125m controls the amplitude | x (ωn) | of each discrete frequency domain signal of the group by the following (Equation 2).
When (a) | x (ωn) |> AHm, Fm (| x (ωn) |) = β | x (ωn) | + (1-β) AHm · DX / AX
(B) Otherwise, Fm (| x (ωn) |) = | x (ωn) | (Formula 2)
That is, the second compression function control unit 135m determines whether or not the amplitude of each discrete frequency domain signal for each group is enhanced based on the average amplitude AHm of the group. The compression function applying unit 125m 2 controls whether the amplitude | x (ωn) | is emphasized or left as it is.

第2の圧縮関数適用部125mでのその後の圧縮は実施例1と同様に強調処理された信号もそのままの信号にも位相∠x(ωn)が付与されて、時間領域変換部16に入力される。
図5AにAX>TXを満たすフレームについての(式1)による抑圧処理の特性を示し、図5BにAX>TXを満たさないフレームについての(式2)による強調処理の特性を示す。図5(A)、図5(B)とも、は縦軸を出力されるFm(|x(ωn)|)とし、横軸を入力される|x(ωn)|とする。
Subsequent compression in the second compression function application unit 125m is performed by adding the phase ∠x (ωn) to the signal subjected to enhancement processing as it is in the same manner as in the first embodiment and is input to the time domain conversion unit 16. The
FIG. 5A shows the characteristics of the suppression process according to (Expression 1) for a frame satisfying AX> TX, and FIG. 5B shows the characteristics of the enhancement process according to (Expression 2) for a frame not satisfying AX> TX. In both FIGS. 5A and 5B, the vertical axis is Fm (| x (ωn) |) that is output, and the horizontal axis is | x (ωn) | that is input.

図5(A)において、上述の(式1)により、|x(ωn)|>AHm・TX/AXの領域(図5(A)中で抑圧領域と示している)では、
Fm(|x(ωn)|)=α|x(ωn)|+(1−α)AHm・TX/AXにより抑圧されており、|x(ωn)|≦AHm・TX/AXでは、
Fm(|x(ωn)|)=|x(ωn)|となるので何ら抑圧されていない。
図5(B)において、上述の(式2)により|x(ωn)|>AHmの領域(図5(B)では強調領域と示している)では、
Fm(|x(ωn)|)=β|x(ωn)|+(1−β)AHm・DX/AX
により強調されており、|x(ωn)|≦|AHmでは、
Fm(|x(ωn)|)=|x(ωn)|となるので何ら強調されていない。
図5(A)において、(式1)による抑圧処理においてはTX/AXで規格化された規格化平均値AHm・TX/AXを|x(ωn)|についての抑圧の下限値としているが、(式2)による強調においては、強調の下限値をAHmにより、与えている。これは、信号を抑圧する場合は、要求される抑圧の程度により、AHmより小さい信号も抑圧する必要が生じるのに対し、強調する場合には、平均値AHmより小さい信号の中に含まれると考えられる雑音成分などの不要な増幅を避ける意図がある。また図5(B)に示す(式2)の特性において、
|x(ωn)|>AHm・TX/AXの範囲では、逆に抑圧する効果を与えてしまうが、第1の目標振幅TXを第2の目標振幅DXと近い値に選んだ場合は、逆に(式1)の特性との連続性が保たれることになる。
In FIG. 5A, according to the above (Equation 1), in the region of | x (ωn) |> AHm · TX / AX (shown as the suppression region in FIG. 5A),
Fm (| x (ωn) |) = α | x (ωn) | + (1-α) AHm · TX / AX is suppressed, and | x (ωn) | ≦ AHm · TX / AX,
Since Fm (| x (ωn) |) = | x (ωn) |, no suppression is performed.
In FIG. 5B, in the region of | x (ωn) |> AHm (shown as an emphasized region in FIG. 5B) according to the above (Equation 2),
Fm (| x (ωn) |) = β | x (ωn) | + (1-β) AHm · DX / AX
And | x (ωn) | ≦ | AHm,
Since Fm (| x (ωn) |) = | x (ωn) |, it is not emphasized at all.
In FIG. 5A, in the suppression processing according to (Equation 1), the normalized average value AHm · TX / AX normalized by TX / AX is set as the lower limit value of suppression for | x (ωn) | In the emphasis by (Expression 2), the lower limit value of emphasis is given by AHm. When suppressing a signal, it is necessary to suppress a signal smaller than AHm depending on the required degree of suppression. On the other hand, when emphasizing, it is included in a signal smaller than the average value AHm. The intention is to avoid unnecessary amplification such as possible noise components. In the characteristic of (Equation 2) shown in FIG.
In the range of | x (ωn) |> AHm · TX / AX, the effect of suppressing the reverse is provided. However, when the first target amplitude TX is selected to be close to the second target amplitude DX, the reverse is achieved. Therefore, continuity with the characteristic of (Equation 1) is maintained.

また図3中の第2の圧縮関数制御部135mに雑音レベル推定部142mを具備してもよい。この場合、例えば、図4中の第2の圧縮関数制御部135m内に破線で示すように、雑音レベル推定部142mが設けられ、更に、第5の判定部140m、も設けられる。グループごとに周波数領域信号x(ωn)は雑音レベル推定部142mに入力され、強調不要な雑音成分の大きさの最大値もしくは平均値に1より大きい定数を乗算した雑音レベルNLmが推定され、この雑音レベルNLmは第5の判定部140mに入力される。第5の判定部140mでは各対応グループごとにグループ振幅平均計算部8mよりの振幅平均AHmと雑音レベルNLmとの値の大小が比較される。第5の判定部140mよりの比較結果により、振幅平均AHmと雑音レベルNLmの大きい方の値が第4の判定部138mに入力され、第4の判定部138mではこの入力された大きい方の値と振幅|x(ωn)|との比較が行われる。このようにすれば、雑音成分の望ましくない強調をより確実に抑えることができる。   Moreover, the noise level estimation part 142m may be provided in the 2nd compression function control part 135m in FIG. In this case, for example, as indicated by a broken line in the second compression function control unit 135m in FIG. 4, a noise level estimation unit 142m is provided, and further, a fifth determination unit 140m is also provided. The frequency domain signal x (ωn) is input to the noise level estimation unit 142m for each group, and the noise level NLm obtained by multiplying the maximum value or the average value of the noise components that do not require enhancement by a constant larger than 1 is estimated. The noise level NLm is input to the fifth determination unit 140m. The fifth determination unit 140m compares the magnitudes of the amplitude average AHm and the noise level NLm from the group amplitude average calculation unit 8m for each corresponding group. Based on the comparison result from the fifth determination unit 140m, the larger value of the amplitude average AHm and the noise level NLm is input to the fourth determination unit 138m, and the input larger value is input to the fourth determination unit 138m. And the amplitude | x (ωn) |. In this way, unwanted enhancement of noise components can be more reliably suppressed.

実施例3
次にこの発明の実施例3を説明する。実施例1、2は入力信号の振幅値を電力総和平方根により算出しているため、インパルス性信号のように、瞬間的な振幅は大きくても、エネルギーの小さい信号を効果的に抑圧できない。この実施例3では、周波数領域に変換されたパルス性信号が各周波数において、ほぼ等しい振幅を有する性質に着目し、例えば、図6に示すように構成する。全体のブロック構成としては、実施例1とほぼ同様であるが、第2の圧縮判定部147を設け、また第3の圧縮関数制御部145m、第3の圧縮関数適用部153mにおける処理内容が異なる。フレームごとに、入力信号がインパルス性信号であるか否かを判定し、インパルス性信号であるフレームについて、実施例3では以下の処理を行う。
Example 3
Next, a third embodiment of the present invention will be described. In the first and second embodiments, the amplitude value of the input signal is calculated by the square root of the sum of power, and thus a signal with low energy cannot be effectively suppressed even if the instantaneous amplitude is large, such as an impulsive signal. In the third embodiment, attention is paid to the property that the pulse signal converted into the frequency domain has substantially the same amplitude at each frequency, and is configured as shown in FIG. 6, for example. The overall block configuration is substantially the same as in the first embodiment, but the second compression determination unit 147 is provided, and the processing contents in the third compression function control unit 145m and the third compression function application unit 153m are different. . For each frame, it is determined whether or not the input signal is an impulsive signal, and the following processing is performed in the third embodiment for a frame that is an impulsive signal.

図7に第3の圧縮関数制御部145m、第3の圧縮関数適用部153mの詳細、その他関連のある部分を示す。第3の圧縮関数制御部145mは振幅絶対値化部101m、第2の規格化平均値計算部148m、第6の判定部152mにより構成され、第3の圧縮関数適用部153mは切替スイッチ110m、第3の圧縮関数演算部154m、位相付与部126m、位相計算部128mにより構成されている。なお、図6、図7に関して、実施例1と2と同一機能構成部分には同一参照番号をつける。
離散周波数領域信号x(ωn)は第2の圧縮判定部147(インパルス性信号判定部)と位相計算部128mと振幅絶対値化部101mに入力される。第2の圧縮判定部147でこのフレームがインパルス性信号であるか否かが判定され、その判定結果は、第6の判定部152mに入力される。また、グループ振幅平均計算部8mよりの平均振幅AHmが第2の規格化平均値計算部148mに入力され、電力総和平方根計算部4よりの電力総和の平方根AXとPX入力部1408よりのインパルス性信号に対する圧縮処理後の期待振幅(以下第3の目標振幅)PXがそれぞれ、第2の規格化平均値計算部148mと第2の圧縮判定部147に入力される。なお、第3の目標振幅PXは第1の目標振幅TXの1/10程度であることが望ましい。
FIG. 7 shows details of the third compression function control unit 145m, the third compression function application unit 153m, and other related parts. The third compression function control unit 145m includes an amplitude absolute value conversion unit 101m, a second normalized average value calculation unit 148m, and a sixth determination unit 152m. The third compression function application unit 153m includes a changeover switch 110m, A third compression function calculation unit 154m, a phase applying unit 126m, and a phase calculation unit 128m are included. 6 and 7, the same reference numerals are assigned to the same functional components as those in the first and second embodiments.
The discrete frequency domain signal x (ωn) is input to the second compression determination unit 147 (impulsive signal determination unit), the phase calculation unit 128m, and the amplitude absolute value conversion unit 101m. The second compression determination unit 147 determines whether or not this frame is an impulsive signal, and the determination result is input to the sixth determination unit 152m. Further, the average amplitude AHm from the group amplitude average calculation unit 8m is input to the second normalized average value calculation unit 148m, and the square root AX of the power sum from the power sum square root calculation unit 4 and the impulsiveness from the PX input unit 1408 An expected amplitude (hereinafter, third target amplitude) PX after compression processing on the signal is input to the second normalized average value calculation unit 148m and the second compression determination unit 147, respectively. The third target amplitude PX is desirably about 1/10 of the first target amplitude TX.

第2の規格化平均値計算部148mで、第2の規格化平均値AHm・PX/AXが計算され、第6の判定部152mに入力される。第6の判定部152mでは、第2の圧縮判定部(インパルス性信号判定部)147よりの判定結果がインパルス性信号である場合に、振幅|x(ωn)|と第2の規格化平均値AHm・PX/AXの値の大小が比較される。
振幅絶対値化部101mで、振幅|x(ωn)|が求められ、切替スイッチ110mと第6の判定部152mに入力される。
第6の判定部152mの判定結果が|x(ωn)|>AHm・PX/AXの場合は、切替スイッチ110mを固定接点1102mに切り替え、|x(ωn)|>AHm・PX/AXでない場合は、切替スイッチ110mを固定接点1101mに切り替える。
The second normalized average value calculation unit 148m calculates the second normalized average value AHm · PX / AX and inputs it to the sixth determination unit 152m. In the sixth determination unit 152m, when the determination result from the second compression determination unit (impulsive signal determination unit) 147 is an impulse signal, the amplitude | x (ωn) | and the second normalized average value AHm · PX / AX values are compared in magnitude.
The amplitude | x (ωn) | is obtained by the amplitude absolute value converting unit 101m and input to the changeover switch 110m and the sixth determining unit 152m.
When the determination result of the sixth determination unit 152m is | x (ωn) |> AHm · PX / AX, the changeover switch 110m is switched to the fixed contact 1102m, and | x (ωn) |> AHm · PX / AX is not satisfied Switches the changeover switch 110m to the fixed contact 1101m.

切替スイッチ110mが固定接点1102mに切り替えられている場合に振幅|x(ωn)|に対してγ|x(ωn)|+(1−γ)AHm・PX/AXが第3の圧縮関数演算部154mで演算される。なおγはγ入力部1410により入力されるものであり、γ=0.2〜0.5であることが好ましい。一方、切替スイッチ110mが固定接点1101mに切り替えられている場合は、振幅|x(ωn)|はそのままとされる。
つまり、第3の圧縮関数適用部153mでは、そのグループの各離散周波数領域信号の振幅|x(ωn)|に対し、以下に示す(式3)で制御を行う。
(a)|x(ωn)|>AHm・PX/AXのとき
Fm(|x(ωn)|)=γ|x(ωn)|+(1−γ)AHm・PX/AX
(b)それ以外のとき
Fm(|x(ωn)|)=|x(ωn)| (式3)
つまり、第3の圧縮関数制御部ではグループごとのその各離散周波数領域信号の振幅がそのグループの第2規格化平均値AHm・PX/AXに基づき抑圧するか否かの判定が行われており、その判定結果により、第3の圧縮関数適用部153mで、振幅|x(ωn)|に対して抑圧するか、そのままにするかの制御が行われる。
When the changeover switch 110m is switched to the fixed contact 1102m, γ | x (ωn) | + (1-γ) AHm · PX / AX is the third compression function calculation unit with respect to the amplitude | x (ωn) | It is calculated at 154m. Note that γ is input by the γ input unit 1410, and preferably γ = 0.2 to 0.5. On the other hand, when the changeover switch 110m is switched to the fixed contact 1101m, the amplitude | x (ωn) | is left as it is.
That is, the third compression function application unit 153m controls the amplitude | x (ωn) | of each discrete frequency domain signal of the group by the following (Equation 3).
When (a) | x (ωn) |> AHm · PX / AX, Fm (| x (ωn) |) = γ | x (ωn) | + (1-γ) AHm · PX / AX
(B) Otherwise, Fm (| x (ωn) |) = | x (ωn) | (Formula 3)
That is, the third compression function controller determines whether or not the amplitude of each discrete frequency domain signal for each group is suppressed based on the second normalized average value AHm · PX / AX of the group. Based on the determination result, the third compression function applying unit 153m controls whether the amplitude | x (ωn) | is suppressed or left as it is.

これら処理された振幅Fm(|x(ωn)|)に対し、実施例1、2と同様に位相∠x(ωn)を付与して、時間領域変換部16に入力する。なお、位相∠x(ωn)の付与は、x(ωn)/|x(ωn)|をFm(|x(ωn)|)に乗算して行っても良い。このことは実施例2についても同様である。
図8に第2の圧縮判定部147の具体的構成例を示す。第2の圧縮判定部147は例えば、全体振幅平均算出部1440、全体最大振幅検出部1442、第7の判定部1445、第8の判定部1444、アンド回路1446により構成されている。
A phase ∠x (ωn) is given to the processed amplitude Fm (| x (ωn) |) in the same manner as in the first and second embodiments, and is input to the time domain conversion unit 16. The phase ∠x (ωn) may be given by multiplying x (ωn) / | x (ωn) | by Fm (| x (ωn) |). The same applies to the second embodiment.
FIG. 8 shows a specific configuration example of the second compression determination unit 147. The second compression determination unit 147 includes, for example, an overall amplitude average calculation unit 1440, an overall maximum amplitude detection unit 1442, a seventh determination unit 1445, an eighth determination unit 1444, and an AND circuit 1446.

電力総和平方根計算部4よりの電力総和の平方根AXとPX入力部1408よりの第3の目標振幅PXが第7の判定部1445に入力され、電力総和の平方根AXと第3の目標振幅PXの値の大小が判定される。この判定結果がアンド回路1446に入力される、
また、全帯域の離散周波数領域信号x(ωn)が全体振幅平均算出部1440と全体最大振幅検出部1442に入力され、全体振幅平均算出部1440で、全帯域の離散周波数領域信号x(ωn)の振幅平均x(ωn)が算出され、全体最大振幅検出部1442で、全帯域の離散周波数領域信号x(ωn)の最大振幅x(ωn)が算出される。振幅平均x(ωn)と最大振幅x(ωn)がそれぞれ、第8の判定部1444に入力され、第8の判定部1444で振幅平均x(ωn)と最大振幅x(ωn)の差が所定の範囲内に収まる場合、例えば、振幅平均x(ωn)が最大振幅x(ωn)の定数ε倍よりも大きい場合で、かつ第7の判定部1445で、PX<AXと判定されれば第2の圧縮判定部147はインパルス性信号であると判定する。なお、定数εは0〜1の実数であり、例えば約0.9であることが望ましい。なお、当該フレームの全サンプルの振幅を平均して振幅平均x(ωn)としてもよい。
The square root AX of the power sum from the power sum square root calculation unit 4 and the third target amplitude PX from the PX input unit 1408 are input to the seventh determination unit 1445, and the square root AX of the power sum and the third target amplitude PX The magnitude of the value is determined. The determination result is input to the AND circuit 1446.
Also, the discrete frequency domain signal x (ωn) of the entire band is input to the overall amplitude average calculating unit 1440 and the overall maximum amplitude detecting unit 1442, and the overall amplitude average calculating unit 1440 performs the discrete frequency domain signal x (ωn) of the entire band. The average amplitude x (ωn) A is calculated, and the maximum maximum amplitude detection unit 1442 calculates the maximum amplitude x (ωn) M of the discrete frequency domain signal x (ωn) of the entire band. The amplitude average x (ωn) A and the maximum amplitude x (ωn) M are respectively input to the eighth determination unit 1444, and the eighth determination unit 1444 uses the amplitude average x (ωn) A and the maximum amplitude x (ωn) M. Is within a predetermined range, for example, when the amplitude average x (ωn) A is larger than the constant amplitude ε times the maximum amplitude x (ωn) M , and the seventh determination unit 1445 determines that PX <AX If determined, the second compression determination unit 147 determines that the signal is an impulsive signal. The constant ε is a real number from 0 to 1, and is preferably about 0.9, for example. The amplitudes of all samples in the frame may be averaged to obtain an amplitude average x (ωn) A.

実施例3により、インパルス性信号のように時間波形の振幅が時間的に過大であるにもかかわらず、周波数領域に変換後、各周波数に分散してしまうため、上記の実施例1の実施のみでは、十分な抑圧が困難な場合においても、抑圧を可能とする効果を得ることが出来る。この実施例3をまず適用することにより、実施例1のみでは十分な抑圧が困難な場合において、抑圧が可能である。
実施例3を理解しやすいように、図6、図7について、独立的に記載した。しかし実施例3は実際には、実施例1、実施例2と共に併用することが好ましい。この場合の実施例3の処理の流れを、図9を参照しながら説明する。まず第2の圧縮判定部147で、インパルス性信号であるか否かを判定し(S20)、インパルス性信号であれば、当該フレームについては上述のように第3の圧縮関数適用部153mにより、(式3)で処理し、(S22)、時間領域変換部16へ出力する。一方ステップS20でインパルス性信号でないと判定されたフレームについては、第1の判定部136により電力総和の平方根AXと第1の目標振幅TXの大小を判定し(S24)、AX>TXの場合は第1の圧縮関数適用部12mにより、(式1)で処理し(S26)、時間領域変換部16へ出力する。一方、ステップS24でAX>TXが成り立たないフレームについては、第3の判定部137で第2の目標振幅DXと電力総和の平方根AXの大小を判定し(S28)、DX>AXであるならば、そのフレームに対し、第2の圧縮関数適用部125mにより(式2)で処理し(S30)、時間領域変換部16へ出力する。S28でDX>AXでないフレームについては、全グループの離散周波数領域信号を時間領域変換部16へそのまま出力する(S32)。
Although the amplitude of the time waveform is excessive in time as in the case of the impulsive signal according to the third embodiment, it is dispersed into each frequency after being converted into the frequency domain, so only the implementation of the first embodiment described above. Then, even when sufficient suppression is difficult, an effect of enabling suppression can be obtained. By applying the third embodiment first, it is possible to perform the suppression in the case where it is difficult to sufficiently suppress the first embodiment alone.
For easy understanding of Example 3, FIGS. 6 and 7 are described independently. However, in practice, Example 3 is preferably used in combination with Example 1 and Example 2. The processing flow of the third embodiment in this case will be described with reference to FIG. First, the second compression determination unit 147 determines whether or not the signal is an impulsive signal (S20). If the signal is an impulsive signal, the third compression function applying unit 153m as described above for the frame, Processing is performed using (Expression 3) (S22), and output to the time domain conversion unit 16. On the other hand, for the frame determined not to be an impulsive signal in step S20, the first determination unit 136 determines the magnitude of the square root AX of the power sum and the first target amplitude TX (S24), and if AX> TX. The first compression function application unit 12m performs processing according to (Expression 1) (S26) and outputs the result to the time domain conversion unit 16. On the other hand, for frames in which AX> TX does not hold in step S24, the third determination unit 137 determines the magnitude of the second target amplitude DX and the square root AX of the power sum (S28), and if DX> AX. The frame is processed by (Expression 2) by the second compression function application unit 125m (S30) and output to the time domain conversion unit 16. For frames that are not DX> AX in S28, the discrete frequency domain signals of all groups are output as they are to the time domain transform unit 16 (S32).

また、ステップS20でインパルス性信号でないと判定されたフレームについては、以下の順序も考えられる。つまり、図9中に破線ブロックB内に示すように、第1の圧縮判定部134で第2の目標振幅DXと電力総和の平方根AXの大小をそれぞれ判定し(S34)、DX>AXを満たすフレームについて、第2の圧縮関数適用部125mで処理して(S36)時間領域変換部16へ出力する。ステップS34でDX>AXを満たさないフレームについては、第1の判定部136で、第1の目標振幅TXと電力総和の平方根AXの大小を判定し(S38)、AX>TXを満たすフレームについては第1の圧縮関数適用部12mにより処理して(S40)、時間領域変換部16へ出力する。ステップS38でAX>TXを満たさないフレームについては、時間領域変換部16にそのまま出力される(S42)。   Moreover, the following order is also considered about the frame determined not to be an impulsive signal in step S20. That is, as shown in the broken line block B in FIG. 9, the first compression determination unit 134 determines the magnitude of the second target amplitude DX and the square root AX of the power sum (S34), and satisfies DX> AX. The frame is processed by the second compression function application unit 125m (S36) and output to the time domain conversion unit 16. For frames that do not satisfy DX> AX in step S34, the first determination unit 136 determines the magnitude of the first target amplitude TX and the square root AX of the power sum (S38), and for frames that satisfy AX> TX. Processing is performed by the first compression function application unit 12m (S40), and the result is output to the time domain conversion unit 16. Frames that do not satisfy AX> TX in step S38 are output to the time domain conversion unit 16 as they are (S42).

また、実施例3を実施する場合、図10に示す処理手順も考えられる。予め第2の目標振幅DXと第3の目標振幅PXの大小を比較し、PX≧DXを満たす場合は、第1の圧縮判定部134で、第2の目標振幅DXと電力総和の平方根AXの大小をそれぞれ判定し(S46)、DX>AXを満たすフレームについて、第2の圧縮関数適用部125mで処理して(S58)、時間領域変換部16へ出力する。
一方、ステップS46でDX>AXを満たさないフレームについては、第2の圧縮判定部147でインパルス性信号であるか否かを判定する(S48)。インパルス性信号であれば、そのフレームに対し第3の圧縮関数適用部153mで処理して(S54)、時間領域変換部16に入力される。ステップS48でインパルス性信号でないと判定されると、第1の判定部136で第1の目標振幅TXと電力総和の平方根AXの大小を判定し、AX>TXと判定されれば、そのフレームに対し、第1の圧縮関数適用部12mで処理して(S56)、時間領域変換部16へ出力する。ステップS50でAX>TXでないと判定されたフレームについては、時間領域変換部16にそのまま出力される(S52)。
Moreover, when Example 3 is implemented, the process sequence shown in FIG. 10 can also be considered. The second target amplitude DX and the third target amplitude PX are compared in advance, and when PX ≧ DX is satisfied, the first compression determination unit 134 determines whether the second target amplitude DX and the square root AX of the power sum are Each frame is determined (S46), and a frame satisfying DX> AX is processed by the second compression function application unit 125m (S58) and output to the time domain conversion unit 16.
On the other hand, for a frame that does not satisfy DX> AX in step S46, the second compression determination unit 147 determines whether or not it is an impulsive signal (S48). If it is an impulsive signal, the frame is processed by the third compression function application unit 153m (S54) and input to the time domain conversion unit 16. If it is determined in step S48 that the signal is not an impulsive signal, the first determination unit 136 determines the magnitude of the first target amplitude TX and the square root AX of the power sum, and if it is determined that AX> TX, On the other hand, the first compression function application unit 12m performs processing (S56) and outputs the result to the time domain conversion unit 16. Frames determined not to have AX> TX in step S50 are output to the time domain conversion unit 16 as they are (S52).

この発明の実施例1の構成例を示すブロック図。1 is a block diagram showing a configuration example of Embodiment 1 of the present invention. この発明の実施例1の第1の圧縮関数制御部10mと第1の圧縮関数適用部12mの詳細例と、これに関連する部分のブロック図。FIG. 3 is a detailed example of a first compression function control unit 10m and a first compression function application unit 12m according to the first embodiment of the present invention, and a block diagram of parts related thereto. この発明の実施例2の構成例を示すブロック図。The block diagram which shows the structural example of Example 2 of this invention. この発明の実施例2の第2の圧縮関数適用部125mと第2の圧縮関数制御部135mの詳細例と、これに関連する部分のブロック図。The detailed example of the 2nd compression function application part 125m and the 2nd compression function control part 135m of Example 2 of this invention, and the block diagram of the part relevant to this. (A)は第1の圧縮関数適用部12mによる(式1)の圧縮関数による特性であり、(B)は第2の圧縮関数適用部125mによる(式2)の圧縮関数による特性である。(A) is the characteristic by the compression function of (Formula 1) by the 1st compression function application part 12m, (B) is the characteristic by the compression function of (Formula 2) by the 2nd compression function application part 125m. この発明の実施例3の構成例を示すブロック図。The block diagram which shows the structural example of Example 3 of this invention. この発明の実施例3の第3の圧縮関数適用部153mと第3の圧縮関数制御部145mの詳細例と、これに関連する部分のブロック図。The detailed example of the 3rd compression function application part 153m of Example 3 of this invention and the 3rd compression function control part 145m, and the block diagram of the part relevant to this. 実施例3の第2の圧縮判定部147の具体的構成例。9 shows a specific configuration example of a second compression determination unit 147 according to the third embodiment. 実施例1〜3を組み合わせて使用する際のフローチャート図。The flowchart figure at the time of using combining Examples 1-3. 実施例1〜3を組み合わせて使用する際の他のフローチャート図。The other flowchart figure at the time of using combining Examples 1-3.

Claims (12)

離散時間の入力信号をフレームごとに離散周波数領域信号に変換する周波数領域変換部と、
上記離散周波数領域信号を、少なくとも1つのグループは複数の離散周波数領域信号を含むように複数のグループに分割するグループ分割部と、
上記フレーム内の入力信号の電力総和の平方根を求める電力総和平方根計算部と、
上記各分割されたグループごとに、そのグループ内の離散周波数領域信号の振幅平均を求めるグループ振幅平均計算部と、
圧縮処理後の期待される所望の第1の目標振幅と上記電力総和の平方根との値の大小を比較する第1の判定部と、
上記第1の判定部より上記電力総和の平方根の方が大であることを示す信号が入力され、上記第1の目標振幅と上記電力総和の平方根との比で、グループごとの振幅平均値を正規化して、第1の規格化平均値計算部で第1の規格化平均値を求め、
各グループごとに、上記第1の規格化平均値とそのグループの各上記離散周波数領域信号の振幅の大小を第2の判定部により比較する第1の圧縮関数制御部と、
上記第2の判定部の判定が、上記離散周波数領域信号の振幅の方が大であれば、その振幅に対し、予め決められた第1の圧縮関数を第1の圧縮関数演算部で適用して、上記第1の目標振幅に近づくように、抑圧して、出力し、上記第2の判定部の判定が、上記離散周波数領域信号の振幅の方が大でなければ、その離散周波数領域信号をそのまま出力する、グループごとの第1の圧縮関数適用部と、
上記各グループごとの第1の圧縮関数適用部より出力された離散周波数領域信号の全体を時間領域信号に変換する時間領域変換部と、
を有することを特徴とする音声処理装置。
A frequency domain transform unit for transforming a discrete time input signal into a discrete frequency domain signal for each frame;
A group divider that divides the discrete frequency domain signal into a plurality of groups such that at least one group includes a plurality of discrete frequency domain signals;
A power sum square root calculation unit for obtaining the square root of the power sum of the input signals in the frame;
For each of the divided groups, a group amplitude average calculation unit that calculates an amplitude average of discrete frequency domain signals in the group;
A first determination unit that compares magnitudes of values of an expected desired first target amplitude after compression processing and the square root of the power sum;
A signal indicating that the square root of the power sum is larger than that of the first determination unit, and an amplitude average value for each group is calculated by a ratio between the first target amplitude and the square root of the power sum. Normalize and obtain the first normalized average value by the first normalized average value calculation unit,
For each group, a first compression function control unit that compares the first normalized average value and the amplitude of each discrete frequency domain signal of the group by a second determination unit;
If the second determination unit determines that the amplitude of the discrete frequency domain signal is larger, the first compression function calculation unit applies a predetermined first compression function to the amplitude. If the second determination unit determines that the amplitude of the discrete frequency domain signal is not larger, the discrete frequency domain signal is suppressed so as to approach the first target amplitude. A first compression function application unit for each group,
A time domain transforming unit that transforms the entire discrete frequency domain signal output from the first compression function applying unit for each group into a time domain signal;
A speech processing apparatus comprising:
請求項1記載の音声処理装置において、
上記第1の判定部よりの上記電力総和の平方根の方が大でないことを示す信号が入力され、
入力された強調したい所望振幅(以下第2の目標振幅という)と上記電力総和平方根との大小を第3の判定部で比較する第1の圧縮判定部と、
各グループの振幅平均値と対応グループの各周波数信号の振幅の大小を第4の判定部で比較する第2の圧縮関数制御部と、
上記第1の判定部の判定が上記第1の目標振幅の方が大のとき、かつ上記第3の判定部の判定が上記第2の目標振幅が大であり、かつ上記第4の判定部の判定が周波数信号の振幅の方が大であれば、
その振幅に対し、予め決められた第2の圧縮関数を第2の圧縮関数演算部で適用して、上記第2の目標振幅に近づくように、強調して上記時間領域変換部へ出力し、
上記第4の判定部の判定が各周波数信号の振幅の方が大でないと判定すれば、その振幅をそのまま、上記時間領域変換部へ出力する第2の圧縮関数適用部を備えることを特徴とする音声処理装置。
The speech processing apparatus according to claim 1, wherein
A signal indicating that the square root of the total power from the first determination unit is not larger is input,
A first compression determination unit that compares the input desired amplitude to be emphasized (hereinafter referred to as a second target amplitude) and the power sum square root with a third determination unit;
A second compression function control unit that compares the amplitude average value of each group and the amplitude of each frequency signal of the corresponding group by a fourth determination unit;
When the determination by the first determination unit is greater in the first target amplitude, the determination by the third determination unit is greater in the second target amplitude, and the fourth determination unit If the amplitude of the frequency signal is greater than
Applying a predetermined second compression function to the amplitude in the second compression function calculation unit, emphasizing it so as to approach the second target amplitude, and outputting it to the time domain conversion unit,
If the determination of the fourth determination unit determines that the amplitude of each frequency signal is not greater, the second compression function application unit outputs the amplitude as it is to the time domain conversion unit. Voice processing device.
請求項2記載の音声処理装置において、
上記第2の圧縮関数制御部は、各グループごとに雑音レベルの最大値または平均値に1より大きい定数を乗算した値を推定する雑音成分推定部と、
上記雑音レベルと上記グループ振幅平均値とを比較する第5の判定部とを備え、
上記第5の判定部が雑音レベルの方が大きいと判定すると、上記グループ振幅平均値に代えて、上記雑音レベルを用いることを特徴とする音声処理装置。
The speech processing apparatus according to claim 2, wherein
The second compression function control unit is configured to estimate a noise component estimation unit that estimates a value obtained by multiplying a maximum value or an average value of noise levels by a constant larger than 1 for each group;
A fifth determination unit that compares the noise level and the group amplitude average value;
If the fifth determination unit determines that the noise level is higher, the speech processing apparatus uses the noise level instead of the group amplitude average value.
請求項1〜3のいずれかに記載の音声処理装置において、
上記入力信号がインパルス性信号か否かをフレームごとに判定する第2の圧縮判定部と、
上記第2の圧縮判定部により、上記離散周波数領域信号がインパルス性信号と判定されると、上記第1の圧縮関数制御部の動作を停止し、そのフレームの各グループごとに上記インパルス性信号に対する圧縮処理後の所望の振幅(第3の目標振幅という)と上記電力総和の平方根との比で、そのグループの振幅平均値を正規化して、第2の規格化平均値計算部で第2の規格化平均値を求め、
各グループごとに、上記第2の規格化平均値とそのグループの各上記離散周波数領域信号の振幅との大小を第6の判定部で比較する第3の圧縮関数制御部と、
上記第6の判定部の判定が上記振幅のほうが大であれば、その離散周波数領域信号に対し、第3の関数演算部により第3の圧縮関数を適用して、上記第3の所望振値に近づくように、抑圧して、上記時間領域変換部へ出力し、上記第6の判定部の判定が上記振幅のほうが大でなければ、その離散周波数領域信号をそのまま上記時間領域変換部へ出力する第3の圧縮関数適用部と、
を有することを特徴とする音声処理装置。
The speech processing apparatus according to any one of claims 1 to 3,
A second compression determination unit that determines for each frame whether or not the input signal is an impulsive signal;
When the second compression determination unit determines that the discrete frequency domain signal is an impulsive signal, the operation of the first compression function control unit is stopped, and for each group of the frame, The ratio of the desired amplitude after compression processing (referred to as the third target amplitude) and the square root of the power sum is normalized, and the second normalized average value calculation unit calculates the second amplitude average value. Find the normalized average value,
For each group, a third compression function control unit that compares the second normalized average value and the amplitude of each discrete frequency domain signal of the group with a sixth determination unit;
If the determination by the sixth determination unit is greater in the amplitude, a third compression function is applied to the discrete frequency domain signal by a third function calculation unit, and the third desired value is obtained. To the time domain conversion unit, and output to the time domain conversion unit. If the determination by the sixth determination unit is not larger than the amplitude, the discrete frequency domain signal is output to the time domain conversion unit as it is. A third compression function application unit that
A speech processing apparatus comprising:
請求項4記載の音声処理装置において、
上記第2の圧縮判定部は、
上記第3の目標振幅と上記電力総和の平方根との大小を比較する第7の判定部と、
当該フレームの入力信号の振幅平均値を算出する全体振幅平均算出部と、
上記離散周波数領域信号の全周波数に対する最大振幅を検出する全体最大振幅検出部と、
上記全体振幅平均値と上記最大振幅の差が予め決められた範囲内か否かを判定する第8の判定部とで構成され、
上記第7の判定部で上記電力総和の平方根の方が大であり、かつ上記第8の判定部で上記範囲内に収まれば当該フレームの入力信号は、インパルス性信号であると判定することを特徴とする音声処理装置。
The speech processing apparatus according to claim 4, wherein
The second compression determination unit
A seventh determination unit that compares the third target amplitude and the square root of the power sum;
An overall amplitude average calculator for calculating an average amplitude of the input signal of the frame;
An overall maximum amplitude detector for detecting a maximum amplitude for all frequencies of the discrete frequency domain signal;
An eighth determination unit that determines whether the difference between the overall average amplitude value and the maximum amplitude is within a predetermined range;
If the square root of the power sum is larger in the seventh determination unit and falls within the range in the eighth determination unit, it is determined that the input signal of the frame is an impulsive signal. A voice processing device.
離散時間の入力信号をフレームごとに離散周波数領域信号に変換する周波数変換手順と、
上記離散周波数領域信号を、少なくとも1つのグループは複数の離散周波数領域信号を含むように複数のグループに分割するグループ分割手順と、
上記フレーム内の入力信号の電力総和の平方根を求める電力総和平方根計算手順と、
上記各分割されたグループごとに、そのグループ内の離散周波数領域信号の振幅平均を求めるグループ振幅平均計算手順と、
圧縮処理後の期待される所望の第1の目標振幅と上記電力総和の平均との値の大小を比較する第1の判定手順と、
上記第1の判定手順の判定が上記電力総和の平方根の方が大であり、上記所望の第1の目標振幅と上記電力総和の平方根との比で、グループごとの振幅平均値を正規化して、第1の規格化平均値を求め、
各グループごとに、上記第1の規格化平均値とそのグループの各上記離散周波数領域信号の振幅の大小を比較する第2の判定手順と、
上記第2の判定手順の判定結果が、上記離散周波数領域信号の振幅の方が大であれば、その振幅に対し、予め決められた第1の圧縮関数を適用して、上記第1の目標振幅に近づくように、抑圧し、上記第2の判定手順の判定が、上記離散周波数領域信号の振幅の方が大でなければ、その離散周波数領域信号をそのままとする第1の圧縮関数適用手順と、
上記各グループごとの第1の圧縮関数適用手順により処理された離散周波数領域信号の全体を時間領域信号に変換する時間領域変換手順と、
を有することを特徴とする音声処理方法。
A frequency conversion procedure for converting a discrete time input signal into a discrete frequency domain signal for each frame;
A group division procedure for dividing the discrete frequency domain signal into a plurality of groups so that at least one group includes a plurality of discrete frequency domain signals;
A power sum square root calculation procedure for obtaining the square root of the power sum of the input signals in the frame;
For each of the divided groups, a group amplitude average calculation procedure for calculating the average amplitude of the discrete frequency domain signals in the group;
A first determination procedure for comparing the magnitude of a value of an expected desired first target amplitude after the compression processing and the average of the power sum;
In the determination of the first determination procedure, the square root of the power sum is larger, and the average amplitude value for each group is normalized by the ratio of the desired first target amplitude and the square root of the power sum. Find the first normalized average value,
For each group, a second determination procedure that compares the first normalized average value with the amplitude of each discrete frequency domain signal of the group;
If the determination result of the second determination procedure indicates that the amplitude of the discrete frequency domain signal is larger, a predetermined first compression function is applied to the amplitude to determine the first target. A first compression function application procedure that suppresses the amplitude so as to approach the amplitude and leaves the discrete frequency domain signal as it is if the determination of the second determination procedure is not greater than the amplitude of the discrete frequency domain signal. When,
A time domain conversion procedure for converting the entire discrete frequency domain signal processed by the first compression function application procedure for each group into a time domain signal;
A voice processing method characterized by comprising:
請求項6記載の音声処理方法において、
入力された強調したい所望振幅(以下第2の目標振幅という)と上記電力総和平方根との大小を比較する第3の判定手順と、
各グループの振幅平均値と対応グループの各周波数信号の振幅の大小を比較する第4の判定手順と、
上記第1の判定手順の判定結果が上記第1の目標振幅の方が大のとき、上記第3の判定手順の判定結果が上記第2の目標振幅が大であり、かつ上記第4の判定手順の判定結果が上記周波数信号の振幅の方が大であれば、
その振幅に対し、予め決められた第2の圧縮関数を適用して、上記第2の目標振幅に近づくように、強調し、
上記第4の判定手順の判定結果が対応グループの各周波数信号の振幅の方が大でないと判定すれば、その振幅をそのままとする第2の圧縮関数適用手順と、
上記グループごとの上記第2の圧縮関数適用手順により処理された離散周波数領域信号の全体を時間領域信号に変換する手順とを有することを特徴とする音声処理方法。
The voice processing method according to claim 6.
A third determination procedure for comparing the magnitude of the input desired amplitude to be emphasized (hereinafter referred to as a second target amplitude) and the total square root of the power;
A fourth determination procedure for comparing the amplitude average value of each group with the amplitude of each frequency signal of the corresponding group;
When the determination result of the first determination procedure is larger than the first target amplitude, the determination result of the third determination procedure is that the second target amplitude is large, and the fourth determination is performed. If the result of the procedure is greater than the amplitude of the frequency signal,
Applying a predetermined second compression function to the amplitude to emphasize the amplitude so as to approach the second target amplitude,
If the determination result of the fourth determination procedure determines that the amplitude of each frequency signal in the corresponding group is not greater, a second compression function application procedure that leaves the amplitude as it is;
And a procedure of converting the entire discrete frequency domain signal processed by the second compression function application procedure for each group into a time domain signal.
請求項7記載の音声処理方法において、
各グループごとに雑音レベルの最大値または平均値に1より大きい定数を乗算した値を推定する雑音成分推定手順と、
上記雑音レベルと上記グループ振幅平均値とを比較する第5の判定手順と、を有し、
上記第5の判定手順の判定結果が雑音レベルの方が大きいと判定すると、上記第4の判定手順は、上記グループ振幅平均値に代えて、上記雑音レベルを用いることを特徴とする音声処理方法。
The voice processing method according to claim 7,
A noise component estimation procedure for estimating a value obtained by multiplying a maximum value or an average value of noise levels by a constant larger than 1 for each group;
A fifth determination procedure for comparing the noise level with the group amplitude average value,
If the determination result of the fifth determination procedure determines that the noise level is larger, the fourth determination procedure uses the noise level instead of the group amplitude average value. .
請求項6〜8のいずれかに記載の音声処理方法において、
上記入力信号がインパルス性信号か否かをフレームごとに判定する第2の圧縮判定手順と、
上記第2の圧縮判定手順により、上記離散周波数領域信号がインパルス性信号と判定されると、上記第1の圧縮関数適用手順を行わず、そのフレームの各グループごとに上記インパルス性信号に対する圧縮処理後の所望の振幅(第3の目標振幅という)と上記電力総和の平方根との比で、そのグループの振幅平均値を正規化して、第2の規格化平均値を求め、
各グループごとに、上記第2の規格化平均値とそのグループの各上記離散周波数領域信号の振幅との大小を比較する第6の判定手順と、
上記第6の判定手順の判定結果が上記振幅のほうが大であれば、その離散周波数領域信号に対し、第3の関数演算部により第3の圧縮関数を適用して、上記第3の所望振値に近づくように、抑圧し、上記第6の判定手順の判定結果が上記振幅のほうが大でなければ、その離散周波数領域信号をそのままとする第3の圧縮関数適用手順と、
上記各グループごとの第3の圧縮関数適用手順により処理された離散周波数領域信号の全体を時間領域信号に変換する手順と、
を有することを特徴とする音声処理方法。
The voice processing method according to any one of claims 6 to 8,
A second compression determination procedure for determining whether or not the input signal is an impulsive signal for each frame;
When the discrete frequency domain signal is determined to be an impulsive signal by the second compression determination procedure, the compression processing for the impulsive signal is performed for each group of the frame without performing the first compression function application procedure. The ratio of the later desired amplitude (referred to as the third target amplitude) and the square root of the power sum is normalized to obtain the second normalized average value.
For each group, a sixth determination procedure for comparing the magnitude of the second normalized average value and the amplitude of each discrete frequency domain signal of the group;
If the determination result of the sixth determination procedure is larger than the amplitude, a third compression function is applied to the discrete frequency domain signal by the third function calculation unit, and the third desired vibration is applied. A third compression function application procedure that suppresses the value so as to approach the value and leaves the discrete frequency domain signal as it is if the determination result of the sixth determination procedure is not greater than the amplitude;
A procedure for converting the entire discrete frequency domain signal processed by the third compression function application procedure for each group into a time domain signal;
A voice processing method characterized by comprising:
請求項9記載の音声処理方法において、
上記第2の圧縮判定手順は、
上記第3の目標振幅と上記電力総和の平方根との大小を比較する第7の判定手順と、
当該フレームの入力信号の振幅平均値を算出する全体振幅平均算出手順と、
上記離散周波数領域信号の全周波数に対する最大振幅を検出する全体最大振幅検出手順と、
上記全体振幅平均値と上記最大振幅の差が予め決められた範囲内か否かを判定する第8の判定手順とを有し、
上記第7の判定手順の判定結果が上記電力総和の平方根の方が大であり、かつ上記第8の判定手順の判定結果が予め決められた範囲内に収まるフレームの入力信号は、インパルス性信号であると判定することを特徴とする音声処理方法。
The voice processing method according to claim 9.
The second compression determination procedure is as follows.
A seventh determination procedure for comparing the magnitudes of the third target amplitude and the square root of the power sum;
An overall amplitude average calculation procedure for calculating an average amplitude value of the input signal of the frame;
An overall maximum amplitude detection procedure for detecting a maximum amplitude for all frequencies of the discrete frequency domain signal;
An eighth determination procedure for determining whether or not the difference between the overall amplitude average value and the maximum amplitude is within a predetermined range;
The input signal of the frame in which the determination result of the seventh determination procedure is larger in the square root of the total power and the determination result of the eighth determination procedure is within a predetermined range is an impulse signal A speech processing method characterized by determining that
請求項6〜10のいずれかに記載の音声処理方法の各手順をコンピュータに実行させるための音声処理プログラム。   A voice processing program for causing a computer to execute each procedure of the voice processing method according to claim 6. 請求項11に記載の音声処理プログラムを記録したコンピュータ読み取り可能な記録媒体。


The computer-readable recording medium which recorded the audio | voice processing program of Claim 11.


JP2006073434A 2006-03-16 2006-03-16 Audio processing apparatus, method thereof, program, and recording medium recording the program Active JP4206409B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006073434A JP4206409B2 (en) 2006-03-16 2006-03-16 Audio processing apparatus, method thereof, program, and recording medium recording the program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006073434A JP4206409B2 (en) 2006-03-16 2006-03-16 Audio processing apparatus, method thereof, program, and recording medium recording the program

Publications (2)

Publication Number Publication Date
JP2007251676A JP2007251676A (en) 2007-09-27
JP4206409B2 true JP4206409B2 (en) 2009-01-14

Family

ID=38595494

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006073434A Active JP4206409B2 (en) 2006-03-16 2006-03-16 Audio processing apparatus, method thereof, program, and recording medium recording the program

Country Status (1)

Country Link
JP (1) JP4206409B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5136378B2 (en) * 2008-12-09 2013-02-06 富士通株式会社 Sound processing method
CN117095685B (en) * 2023-10-19 2023-12-19 深圳市新移科技有限公司 Concurrent department platform terminal equipment and control method thereof

Also Published As

Publication number Publication date
JP2007251676A (en) 2007-09-27

Similar Documents

Publication Publication Date Title
JP6136995B2 (en) Noise reduction device
JP5898534B2 (en) Acoustic signal processing apparatus and acoustic signal processing method
JP5598536B2 (en) Bandwidth expansion device and bandwidth expansion method
JP2001134287A (en) Noise suppressing device
JP6401521B2 (en) Signal processing apparatus and signal processing method
JP2006222867A (en) Acoustic signal processing device and method thereof
JP2011244232A (en) Microphone array apparatus and program executed by the same
US9478235B2 (en) Voice signal processing device and voice signal processing method
EP3748989A1 (en) Vibration output apparatus and vibration output program
JP5034734B2 (en) Sound processing apparatus and program
JP2006243644A (en) Method for reducing noise, device, program, and recording medium
JP6305694B2 (en) Signal processing apparatus and signal processing method
WO2019160006A1 (en) Howling suppression device, method therefor, and program
JP4206409B2 (en) Audio processing apparatus, method thereof, program, and recording medium recording the program
JP5086442B2 (en) Noise suppression method and apparatus
US9697848B2 (en) Noise suppression device and method of noise suppression
JP2008072600A (en) Acoustic signal processing apparatus, acoustic signal processing program, and acoustic signal processing method
JP2014102317A (en) Noise elimination device, noise elimination method, and program
US20180158447A1 (en) Acoustic environment understanding in machine-human speech communication
JP2006121188A (en) Howling suppressing apparatus
JP2006126841A (en) Periodic signal enhancement system
JP6371376B2 (en) Acoustic apparatus and signal processing method
JP2012100117A (en) Acoustic processing apparatus and method
JP6506424B2 (en) Acoustic device, missing band estimation device, signal processing method, and frequency band estimation device
JP6314803B2 (en) Signal processing apparatus, signal processing method, and program

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080901

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081007

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081020

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111024

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4206409

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111024

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121024

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121024

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131024

Year of fee payment: 5

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350