JPH05291971A - Signal processor - Google Patents

Signal processor

Info

Publication number
JPH05291971A
JPH05291971A JP4067291A JP6729192A JPH05291971A JP H05291971 A JPH05291971 A JP H05291971A JP 4067291 A JP4067291 A JP 4067291A JP 6729192 A JP6729192 A JP 6729192A JP H05291971 A JPH05291971 A JP H05291971A
Authority
JP
Japan
Prior art keywords
signal
filter
frequency
noise
frequency range
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4067291A
Other languages
Japanese (ja)
Inventor
Glop Daniel
ダニエル・グロープ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GS SYST Inc
Original Assignee
GS SYST Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GS SYST Inc filed Critical GS SYST Inc
Priority to JP4067291A priority Critical patent/JPH05291971A/en
Publication of JPH05291971A publication Critical patent/JPH05291971A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE: To obtain a signal processor which can reduce noise from conversation signals containing the noise. CONSTITUTION: A signal processor uses artificial intelligence 250 which can decide the adjustment of a filter subsystem 120 by distinguishing noise and conversation in the spectrum of input signals y(t) to which conversation signals s(t) and noise signals n(t) are added. The intelligence 250 decides that a part where the envelope abruptly changes indicates conversation and the remaining part indicates the frequency distribution of a noise output by checking the power of the frequency spectrum of input signals or pattern of an envelope function. The signal processor performs the above signal processing on all spectra or at every frequency band regardless of the presence/absence of the maximum value of the spectra.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】この発明は、ノイズを低減する装
置に関し、更に詳しくは、ノイズ混入の会話信号からノ
イズを低減する装置に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a device for reducing noise, and more particularly to a device for reducing noise from a speech signal containing noise.

【0002】[0002]

【従来の技術】米国特許第4,025,721号又は第4,185,168
号明細書に記載されたような会話に混ざるノイズを低減
するための従来の単一マイク装置は、会話とノイズとの
総和である入力信号のエンベロープ又は平均電力の最小
値の確認と、会話の中断又はノイズのみが存在する時間
と思われるその最小値での入力信号のパラメータの決定
とを提供し、これらのパラメータはノイズパラメータで
あると決定された。
2. Description of the Related Art U.S. Pat. No. 4,025,721 or 4,185,168
A conventional single microphone device for reducing noise mixed into speech as described in the specification is to check the minimum value of the envelope or average power of the input signal, which is the sum of speech and noise, and And the determination of the parameters of the input signal at its minimum value, which is considered to be the time when only interruptions or noise are present, these parameters were determined to be noise parameters.

【0003】[0003]

【発明が解決しようとする課題】これらの従来技術は以
上のように、使用の適用範囲及び実現態様の両方におい
て限定され、これらはバンドパスフィルタのアナログ配
列の使用に限定されるという問題点があった。この発明
は上記のような問題点を解決するためになされたもので
ある。
As mentioned above, these prior arts are limited both in the scope of their use and in the mode of realization, and they are limited to the use of analog arrays of bandpass filters. there were. The present invention has been made to solve the above problems.

【0004】[0004]

【課題を解決するための手段】この発明に係る信号処理
装置は、会話信号にノイズ信号が加算された入力信号に
応答して決定制御パラメータ信号を出力する決定及び制
御手段と、入力信号を選択的に濾波し、決定制御パラメ
ータ信号及び入力信号に応答してノイズを低減し、もっ
てノイズが低減された入力信号に相当するフィルタ出力
信号を供給するフィルタ手段とを備え、決定及び制御手
段が、入力信号からその周波数成分を導出して各周波数
成分の出力信号を供給する周波数サブシステム手段と、
周波数成分の出力信号に応答して各周波数成分の電力成
分を導出するエネルギサブシステム手段と、エネルギサ
ブシステム手段に応答して、定義された閾値レートより
速いレートで変化する急速な時間変動を入力信号がいつ
有するかを決定する比較器手段と、比較器手段、エネル
ギサブシステム手段、及び入力信号に応答して、入力信
号の定義された閾値レートより速いレートで変化してい
ると決定された急速な時間変動を選択的に除去して残余
出力信号を供給するパターン分類サブシステム手段とを
備え、変動が周波数成分に対する会話信号の電力成分の
時間にわたる変動を表わし、残余出力信号が周波数成分
に対するノイズ信号の電力成分に対応し、異なる周波数
成分での残余出力信号が決定制御パラメータ信号を構成
するものである。
A signal processing apparatus according to the present invention selects a selection and control means for outputting a decision control parameter signal in response to an input signal in which a noise signal is added to a conversation signal, and an input signal. Filter means for reducing noise in response to the decision control parameter signal and the input signal to provide a filter output signal corresponding to the noise reduced input signal, the decision and control means comprising: Frequency subsystem means for deriving the frequency component from the input signal and supplying the output signal of each frequency component,
Energy subsystem means for deriving a power component of each frequency component in response to an output signal of the frequency component, and inputting, in response to the energy subsystem means, a rapid time variation that changes at a rate faster than a defined threshold rate. A comparator means for determining when the signal has, and in response to the comparator means, the energy subsystem means, and the input signal, determined to be changing at a rate faster than a defined threshold rate of the input signal Pattern classification subsystem means for selectively removing rapid temporal fluctuations to provide a residual output signal, the fluctuations representing fluctuations in the power component of the speech signal with respect to the frequency component over time, and the residual output signal with respect to the frequency component. The residual output signals corresponding to the power components of the noise signal and having different frequency components constitute the decision control parameter signal.

【0005】[0005]

【作用】この発明によれば、ノイズ混入の会話信号から
ノイズを低減するための信号処理装置が提供される。こ
の発明の信号処理装置は人工知能を用い、この人工知能
は、入力信号の周波数スペクトルの電力パターン関数又
はエンベロープパターン関数を調べることによって、会
話とノイズとの和の入力信号のスペクトル内のノイズ及
び会話を区別することにより、フィルタサブシステムの
調整に対して決定可能であり、そのエンベロープの急速
な変化部分が会話を示すことを決定し、これに反して残
余部分がノイズ電力の周波数分布であると決定され、一
方、スペクトルの最大値が存在する場所を無視して、全
体のスペクトル又はその周波数帯域を調べる。
According to the present invention, there is provided a signal processing device for reducing noise from a speech signal mixed with noise. The signal processing apparatus of the present invention uses artificial intelligence, which examines the power pattern function or envelope pattern function of the frequency spectrum of the input signal to find noise and noise in the spectrum of the input signal that is the sum of speech and noise. By distinguishing between conversations, it is decidable for the tuning of the filter subsystem, where the rapidly changing part of its envelope determines that it represents a conversation, while the rest is the frequency distribution of noise power. While ignoring where the maximum of the spectrum is, examine the entire spectrum or its frequency band.

【0006】この発明の他の実施例においては、傾斜検
索処理を適用して装置出力信号内の或る会話的特徴の増
大を試みることにより、フィルタに増分調整を提供する
フィードバックループが組み込まれている。この発明の
信号処理装置は、入力信号の関数の最小値又は会話の中
断を考慮する必要がない。代わりに、この発明の信号処
理装置は、会話及びノイズの入力信号のエンベロープパ
ターンが入力される人工知能システムを用いる。その
後、この発明の信号処理装置は、このエンベロープ信号
から、固定された時間ウィンドウの間エンベロープの急
速に変化する変動を濾波する。
In another embodiment of the invention, a feedback loop is provided which provides incremental adjustment to the filter by applying a gradient search process to attempt to increase certain interactive features in the device output signal. There is. The signal processing device according to the invention does not have to take into account the minimum value of the function of the input signal or the interruption of the conversation. Instead, the signal processor of the present invention uses an artificial intelligence system into which the envelope pattern of the speech and noise input signal is input. The signal processor of the present invention then filters from this envelope signal the rapidly changing variations of the envelope during a fixed time window.

【0007】[0007]

【実施例】この発明は、図面に関連した詳細な説明を参
照することにより、更に良く理解されるだろう。この発
明の信号処理装置は、入力信号の関数の最小値又は会話
の中断を考慮する必要がない。代わりにこの発明の信号
処理装置は、会話及びノイズ(図1参照)の入力信号のエ
ンベロープパターンが入力される人工知能システムを用
いる。この入力信号即ち到来信号は、図2について更に
説明されている。この発明の信号処理装置は、このエン
ベロープ信号から、固定された時間ウィンドウの間エン
ベロープの急速に変化する変動を濾波する。これらの急
速に変化する変動は、図3について更に説明されている
ように必ずしも最大値ではない。
The invention will be better understood by reference to the detailed description in connection with the drawings. The signal processing device according to the invention does not have to take into account the minimum value of the function of the input signal or the interruption of the conversation. Instead, the signal processing apparatus of the present invention uses an artificial intelligence system to which the envelope patterns of the input signals of speech and noise (see FIG. 1) are input. This input or incoming signal is further described with respect to FIG. From this envelope signal, the signal processor of the present invention filters the rapidly changing variations of the envelope during a fixed time window. These rapidly changing variations are not necessarily maxima, as further explained with respect to FIG.

【0008】急速に変化する変動は、或る所定の時間閾
値の持続時間以下だけ継続する変動である。入力信号の
エンベロープは、種々の周波数帯域で評価される。又は
代わりに、総合入力信号の離散フーリエ変換(DFT: D
escrete Fourier transform)のエンベロープが評価され
る。所定の時間閾値の持続時間は、多帯域の場合の周波
数が異なるために異なるか又はFFT(DFT)である。
人工知能システムは、その後、このように濾波された入
力信号のエンベロープのエンベロープレベルを決定し、
適切な帯域にわたる、又はDFTで考慮された分離周波
数にわたる、ノイズのスペクトルレベルを表わす。
Rapidly changing fluctuations are those that last less than or equal to the duration of a certain predetermined time threshold. The envelope of the input signal is evaluated in various frequency bands. Alternatively, the Discrete Fourier Transform (DFT: D
The envelope of the escrete Fourier transform) is evaluated. The duration of the predetermined time threshold is different or FFT (DFT) due to different frequencies in case of multiple bands.
The artificial intelligence system then determines the envelope level of the envelope of the input signal thus filtered,
It represents the spectral level of noise over the appropriate band or over the separation frequencies considered in the DFT.

【0009】入力信号は、信号エンベロープから構成さ
れてもよく、又は同時に、多数の帯域又はスペクトルレ
ベルに対する多数のエンベロープから構成されてもよ
い。会話の各要素、即ち音韻は、異なる周波数でのエネ
ルギを有する。これらの周波数は、米国ボルチモア(Balt
imore)所在のウィリアムズ(Williams)及びウィルキンス
(Wilkins)出版社により1977年に出版された、ダブリュ
・アール・ホドキン(W.R.Hodkin)及びアール・ダブリュ
・スキンナ(R.W.Skinner)共著による「聴覚補助評価及
び聴覚的再評価における使用」と題された本におけるよ
うに、よく引用されている。
The input signal may consist of signal envelopes or, at the same time, of multiple envelopes for multiple bands or spectral levels. Each element of speech, the phoneme, has energy at different frequencies. These frequencies are in the Baltimore (Balt
imore) Williams and Wilkins
(Wilkins) in a book titled `` Use in Hearing Aid Assessment and Auditory Reassessment, '' published in 1977 by W Hodkin and R W Skinner. As such, it is often quoted.

【0010】音声会話に対応する低周波(好適な実施例
では約1.2kHz以下)の音韻が、非音声会話に対応する高
周波(好適な実施例では約1.2kHz以上)の音韻(約3〜30m
秒という比較的短い持続時間を有する)よりも極めて長
い持続時間(約40〜150m秒)を有するという事実により、
異なる所定の時間閾値の持続時間は、異なる周波数帯域
で用いられる。
A low frequency (about 1.2 kHz or less in the preferred embodiment) phoneme corresponding to a voice conversation is a high frequency (about 1.2 kHz or more in the preferred embodiment) phoneme (about 3 to 30 m) corresponding to a non-voice conversation.
Due to the fact that it has a much longer duration (about 40-150 ms) than a relatively short duration of seconds)
Different predetermined time threshold durations are used in different frequency bands.

【0011】好適な実施例のために選ばれた低周波及び
高周波の遷移点は、それぞれ1200Hz以下及び1200Hz以
上である。択一的に、例えば、800、1000又は1500Hz等
の他の遷移点は選ばれ得る。又、各々が個別且つ隔離さ
れた所定の時間閾値の持続時間を有する多数の遷移点又
は下位遷移点が選ばれ得る。
The low and high frequency transition points selected for the preferred embodiment are below 1200 Hz and above 1200 Hz, respectively. Alternatively, other transition points may be chosen, for example 800, 1000 or 1500 Hz. Also, multiple transition points or sub-transition points may be chosen, each having an individual and isolated predetermined time threshold duration.

【0012】好適な実施例において、所定の時間閾値の
持続時間は、音声会話に対応する低周波(1200Hz以下)
の音韻に対して約120m秒である。この所定の時間閾値の
持続時間は100〜150m秒の範囲内であり得る。好適な実
施例において、所定の時間閾値の持続時間は、非音声会
話に対応する高周波(1200Hz以上)の音韻に対して約40m
秒である。この所定の時間閾値の持続時間は25〜40m秒
の範囲内であり得る。
In the preferred embodiment, the duration of the predetermined time threshold is low frequency (below 1200 Hz) corresponding to voice conversation.
It is about 120 ms for the phoneme of. The duration of this predetermined time threshold may be in the range 100-150 ms. In the preferred embodiment, the predetermined time threshold duration is about 40 m for high frequency (1200 Hz and above) phonemes corresponding to non-voice conversations.
Seconds. The duration of this predetermined time threshold can be in the range of 25-40 ms.

【0013】従って、各所定の時間閾値の持続時間より
短く継続するそれらの急速に変化する変動は、この発明
の信号処理装置により会話と考慮される。一方、各所定
の時間閾値の持続時間より長く継続するそれらの急速に
変化する変動は、この発明の信号処理装置によりノイズ
と考慮される。
Accordingly, those rapidly changing variations that last less than the duration of each predetermined time threshold are considered speech by the signal processing apparatus of the present invention. On the other hand, those rapidly changing variations that last longer than the duration of each predetermined time threshold are considered noise by the signal processing device of the present invention.

【0014】この発明の信号処理装置は、異なる周波数
又は周波数帯域での入力信号エンベロープ内の過去の変
動が、1つの会話から次の会話への時間進行と共に時間
内で急速に動く入力信号の会話成分のエンベロープであ
る、という事実を証明する。又、入力信号は、いかなる
人間言語のいかなる通常会話においても、1つの音韻か
ら次の音韻へと周波数が異なり、一方、この発明の信号
処理装置により除かれるべきノイズは、その周波数位置
のまわりでそのようなレートで現れず、或る周波数又は
低いレートでの周波数帯域で周波数位置及び強度が変化
するものと考えられる。
The signal processing apparatus of the present invention is characterized in that the past fluctuations in the input signal envelope at different frequencies or frequency bands move rapidly in time with the progress of time from one conversation to the next. Prove the fact that it is an envelope of ingredients. Also, the input signal will differ in frequency from one phoneme to the next in any normal conversation of any human language, while the noise to be removed by the signal processor of the invention will be around that frequency location. It is considered that the frequency position and intensity do not appear at such a rate but change in a frequency band at a certain frequency or a low rate.

【0015】一旦、入力信号のノイズ成分の周波数内容
が、上記エンベロープ濾波により決定されると、人工知
能サブシステム(図1のコントローラサブシステム250を
参照)は、4つの状態のうちの1つを認識するだろう。
即ち、(イ)ノイズ無し(或るレベル3より低いレベルのノ
イズ)、(ロ)ホワイトノイズ(人工知能の認識器サブシス
テム内に格納されたように異なる周波数又は周波数帯域
での閾値レベルパラメータに関して実質的に平坦なスペ
クトルを有するノイズ)、(ハ)バブルノイズ(即ち、幾
人かの話し手の音韻を混合して形成されたエンベロープ
成分が或る周波数位置において単一の話し手の会話によ
るエンベロープ成分よりも長く続くようなバックグラン
ドで、幾人かの話し手の同時会話によるノイズ)、及
び、(ニ)上記(イ)〜(ハ)以外のノイズ(即ち、1つ又はい
くつかの周波数範囲でピークとなるがバブルノイズでは
ないノイズ)の4つのカテゴリである。
Once the frequency content of the noise component of the input signal has been determined by the envelope filtering described above, the artificial intelligence subsystem (see controller subsystem 250 in FIG. 1) can assume one of four states. Will recognize.
That is, (a) no noise (noise lower than a certain level 3), (b) white noise (with respect to threshold level parameters at different frequencies or frequency bands as stored in the artificial intelligence recognizer subsystem). Noise having a substantially flat spectrum), (c) bubble noise (that is, an envelope component formed by mixing the phonemes of several speakers is an envelope component of a single speaker's conversation at a certain frequency position) In the background that lasts longer than the above, noise due to simultaneous conversation by several speakers) and (d) noise other than (a) to (c) above (i.e., in one or several frequency ranges). There are four categories: noise that is peak but not bubble noise.

【0016】上記4つのカテゴリ(イ)〜(ニ)を区別する
と、人工知能システムは、フィルタサブシステム230に
より入力信号を濾波するためのそれぞれの態様を選択す
る。その態様は各分類(イ)〜(ニ)毎に異なる。
Distinguishing the above four categories (a)-(d), the artificial intelligence system selects respective modes for filtering the input signal by the filter subsystem 230. The mode differs for each classification (a) to (d).

【0017】分類(イ)に対して、このフィルタはバイパ
スされる。分類(ロ)に対して、フィルタは、ノイズの影
響が最小となる間、会話明瞭性が最大となるように平均
会話状態に適応するように設定される。これは、スペク
トルの最低周波数及び最高周波数の帯域又は端部、即ち
約400Hz以下及び約2.6kHz以上を抑制(ノッチング)す
ることになる。分類(ハ)に対して、フィルタは、ほとん
どのバブルエネルギが集中する低周波を抑制(ノッチア
ウト)するように設定される。
For classification (a), this filter is bypassed. For classification (b), the filter is set to adapt to the average speech state such that speech intelligibility is maximized while noise effects are minimal. This will suppress (notch) the lowest or highest frequency bands or edges of the spectrum, ie below about 400 Hz and above about 2.6 kHz. For classification (c), the filter is set to suppress (notch out) the low frequencies where most of the bubble energy is concentrated.

【0018】分類(ニ)に対して、フィルタは、濾波後の
エンベロープが最大となる周波数ベースを抑制(ノッチ
アウト)し、エンベロープがまだ比較的高い帯域を適度
に抑制するように設定される一方、まだ(対数)総合周波
数の少なくとも約1/2を確保する。更に、会話明瞭性が
高周波(2000kHz)において非常に集中されることに注目
すれば、抑制されるべきノイズが約1500Hzより低い周
波数にあることを人工知能システムが決定したときに、
約2000Hz以上の帯域は(10〜15dBまで)増大される。
For classification (d), the filter is set so as to suppress (notch out) the frequency base where the envelope after filtering is maximum, and moderately suppress the band where the envelope is still relatively high. , Still reserve at least about 1/2 of the (logarithmic) total frequency. Furthermore, noting that speech intelligibility is highly concentrated at high frequencies (2000 kHz), when the artificial intelligence system determines that the noise to be suppressed is at frequencies below about 1500 Hz,
Bands above about 2000 Hz (up to 10-15 dB) are increased.

【0019】1つの好適な実施例において、フィルタサ
ブシステム230は、バンドパスフィルタの配列である。あ
るいは、フィルタサブシステム230は、マイクロコンピュ
ータシステム、デジタル信号処理装置、又はFFT(高速
フーリエ変換)やDFT(離散フーリエ変換)IC又は装
置により同等に実現可能であろう。事実、この発明の全
体の信号処理装置即ち決定及び制御チャネル20並びにフ
ィルタチャネル10の両方は、単一のマイクロプロセッサ
又はDSPに基づく装置として実現される。ここで、マ
イクロプロセッサは、入力信号のエンベロープパラメー
タを格納し、各成分を分析し、各成分に対するそれぞれ
のゲインを計算し、そして、格納されたパラメータに応
答し且つこの発明の教えに従って、各成分に対するゲイ
ンを調整して最適化を行う。
In one preferred embodiment, the filter subsystem 230 is an array of bandpass filters. Alternatively, the filter subsystem 230 could equally be implemented by a microcomputer system, digital signal processor, or FFT (Fast Fourier Transform) or DFT (Discrete Fourier Transform) IC or device. In fact, both the entire signal processing device of the present invention, the decision and control channel 20 and the filter channel 10, are implemented as a single microprocessor or DSP based device. Here, the microprocessor stores the envelope parameters of the input signal, analyzes each component, calculates a respective gain for each component, and responds to the stored parameters and in accordance with the teachings of the present invention, each component. Optimization is performed by adjusting the gain for.

【0020】この発明の信号処理装置の他の実施例(図
4参照)では、上記ノイズ低減装置にフィードバックチ
ャネル30(図5参照)が組み込まれており、フィードバッ
クチャネル30は、会話成分s(t)を高周波部分及び低周波
部分に分けるために、鋭いカットオフ周波数を有するハ
イパスフィルタ及びローパスフィルタに基づく音声及び
非音声弁別器を用いる。ノイズ低減装置の全ての出力信
号s〜(t)(図4及び図5参照)は、フィードバックチャネ
ル30に入力され、フィードバックチャネル30は、装置の
出力信号を調べて実質的に会話であるかどうかを決定す
る。そのため、会話の音声音韻及び非音声音韻のそれぞ
れの周波数内容及び持続時間の両方において、会話の音
声及び非音声構造の会話特徴の存在を調べるのである。
In another embodiment of the signal processing device of the present invention (see FIG. 4), a feedback channel 30 (see FIG. 5) is incorporated in the noise reduction device, and the feedback channel 30 includes the speech component s (t ) Is divided into a high-frequency part and a low-frequency part by using a voice and non-voice discriminator based on a high-pass filter and a low-pass filter having a sharp cutoff frequency. All the output signals s ~ (t) of the noise reduction device (see Fig. 4 and Fig. 5) are input to the feedback channel 30, and the feedback channel 30 examines the output signal of the device to see if it is substantially conversational. To decide. Therefore, the presence of speech features of the speech and non-speech structure of the conversation is examined, both in the frequency content and duration of the phonetic and non-speech phonology of the conversation, respectively.

【0021】その結果、時間ウィンドウ(約100〜150m秒
のオーダ)にわたって、出力信号s(t)が周波数内容及び関
連する持続時間の上記特徴をもっていないこと、即ち、
低周波の音声音韻が約50m秒〜150m秒だけ継続すること
を上記弁別器が決定した場合には、Qで示される高周波
(非音声)の内部信号が所定の時間間隔Tw内の持続時間
Tqにわたって生成される。尚、比率Tq/TwはRqで示
される。次に、傾斜検索の実行又は回路がフィードバッ
クチャネル30内に組み込まれ、図4又は図5のようなメ
イン装置のフィルタサブシステム(フィルタチャネル)10
のゲインパラメータをいくつかの所定の強制的範囲内の
値に変えて、Rqを低減、即ちs(t)の会話的特徴を強調
し、従って装置の出力端子において更にノイズのないs
(t)を得る。
As a result, the output signal s (t) does not have the above characteristics of frequency content and associated duration over a time window (of the order of 100 to 150 msec), ie:
If the discriminator determines that the low-frequency phoneme continues for approximately 50 ms to 150 ms, then the high frequency indicated by Q
An (non-voice) internal signal is generated for a duration Tq within a predetermined time interval Tw. The ratio Tq / Tw is represented by Rq. Then, a gradient search implementation or circuit is incorporated into the feedback channel 30 to filter the main system filter subsystem (filter channel) 10 as in FIG. 4 or 5.
Of the gain parameter of s (t) is changed to a value within some predetermined compulsory range to reduce Rq, that is, to emphasize the interactive features of s (t), and thus to add more noise-free s at the output of the device.
get (t).

【0022】図1に戻ると、フィードバックチャネル30
の無いこの発明の信号処理装置の電気的なブロック図が
示されている。図1のような会話処理用の人工知能パタ
ーン認識式ノイズ低減装置は、入力信号y(t)105に応答
する信号処理装置である。入力信号y(t)105は、会話信号
s(t)とノイズ信号n(t)との和からなり、会話信号s(t)と
ノイズ信号n(t)とを受信源100で加算することにより得
られる。信号処理装置は、フィルタチャネル10並びに決
定及び制御チャネル20を備え、その各々に入力信号y(t)
105が入力される。
Returning to FIG. 1, the feedback channel 30
There is shown an electrical block diagram of the signal processing apparatus of the present invention without. The artificial intelligence pattern recognition noise reduction device for conversation processing as shown in FIG. 1 is a signal processing device that responds to an input signal y (t) 105. The input signal y (t) 105 is the conversation signal
It consists of the sum of s (t) and the noise signal n (t), and is obtained by adding the speech signal s (t) and the noise signal n (t) at the receiving source 100. The signal processor comprises a filter channel 10 and a decision and control channel 20, to each of which the input signal y (t)
105 is input.

【0023】決定及び制御チャネル20は、入力信号y(t)1
05に応答して決定制御パラメータ信号260を出力するた
めの手段を提供する。決定及び制御チャネル20は、周波
数サブシステム210と、エネルギサブシステム220と、フ
ィルタサブシステム230、パターン分類サブシステム240
及びコントローラサブシステム250からなるパターン分
類システムと、を更に備えている。
The decision and control channel 20 receives the input signal y (t) 1
Means are provided for outputting a decision control parameter signal 260 in response to 05. The decision and control channel 20 includes a frequency subsystem 210, an energy subsystem 220, a filter subsystem 230, and a pattern classification subsystem 240.
And a pattern classification system comprising a controller subsystem 250.

【0024】周波数サブシステム210は、入力信号の周波
数成分を導出して各周波数成分の出力信号[y(f1),y
(f2),…y(fn)]を供給するための手段を提供する。エネ
ルギサブシステム220は、上記周波数成分の出力信号に
応答して、各周波数成分に対するエネルギ成分[||y(f1)|
|,||y(f2)||,…||y(fn)||]を導出する手段を提供す
る。ここで、||y(fn)||は、各周波数成分の大きさの絶対
値を示す。エネルギサブシステム220は、電力分析器を提
供し、DFT電力分析器、FFT分析器、平滑回路を有す
る二乗回路、等の種々の異なる方法で実施され得る。
The frequency subsystem 210 derives the frequency component of the input signal and outputs the output signal [y (f 1 ), y of each frequency component.
It provides a means for supplying (f 2 ), ... y (fn)]. The energy subsystem 220 is responsive to the output signal of the frequency components to generate energy components [|| y (f 1 ) |
, || y (f 2 ) ||, ... || y (fn) ||] is provided. Here, || y (fn) || indicates the absolute value of the magnitude of each frequency component. Energy subsystem 220 provides a power analyzer and may be implemented in a variety of different ways, such as a DFT power analyzer, an FFT analyzer, a squaring circuit with a smoothing circuit, and so on.

【0025】パターン分類システムは、||y||内の時間変
動ピークを濾波するためのフィルタサブシステム230と、
その周波数分布からノイズを分類するためのパターン分
類サブシステム240と、この発明の教えに従う人工知能形
式のパターン認識決定を用いて種々の周波数でのゲイン
調整を決定(ゲインベクトルを設定、又は、フィルタのパ
ラメータを設定)するためのコントローラサブシステム2
50と、を備えたものとして、図1に示される。
The pattern classification system includes a filter subsystem 230 for filtering time-varying peaks in || y ||
A pattern classification subsystem 240 for classifying noise from its frequency distribution and an artificial intelligence form of pattern recognition decision in accordance with the teachings of the present invention are used to determine gain adjustments at various frequencies (set gain vector, or filter Controller subsystem 2 for setting the parameters of
1 and as shown in FIG.

【0026】パターン分類システムは、入力信号の定義
された閾値レートより速いレートで変化していると決定
された速い(又は急速に変化する)時間変動を選択的に除
去して、変動が各周波数成分に対する会話信号電力の変
動を表わす残余出力信号を供給するための手段を提供す
る。ここで、残余出力信号は、各周波数成分に対するノ
イズ信号電力に対応し、異なる周波数成分での出力信号
は、決定制御パラメータ信号260を構成する。
The pattern classification system selectively removes fast (or rapidly changing) time variations that are determined to be changing at a rate that is faster than a defined threshold rate of the input signal, so that the variation is at each frequency. Means are provided for providing a residual output signal representative of variations in speech signal power with respect to the components. Here, the residual output signal corresponds to the noise signal power for each frequency component, and the output signals at different frequency components constitute the decision control parameter signal 260.

【0027】フィルタチャネル10は、周波数サブシステ
ム110と、多数の周波数帯域で別々のゲイン制御を提供す
るゲインベクトルサブシステム120と、を更に備えてい
る。ゲインベクトルサブシステム120は、フィルタチャネ
ル10内のフィルタサブシステムとして作用する。
The filter channel 10 further comprises a frequency subsystem 110 and a gain vector subsystem 120 that provides separate gain control over multiple frequency bands. Gain vector subsystem 120 acts as a filter subsystem within filter channel 10.

【0028】周波数サブシステム110は、入力信号の周波
数成分を導出して各周波数成分の出力信号[y(f1),y
(f2),…y(fn)]を供給するための手段を提供する。
The frequency subsystem 110 derives the frequency component of the input signal and outputs the output signal [y (f 1 ), y of each frequency component.
It provides a means for supplying (f 2 ), ... y (fn)].

【0029】フィルタチャネル10は、入力信号y(t)105を
選択的に濾波することにより、決定制御パラメータ信号
260及び入力信号105に応答してノイズを低減し、ノイズ
が低減された入力信号に対応するフィルタ出力信号s〜
(t)140を供給するための手段を提供する。
The filter channel 10 includes a decision control parameter signal by selectively filtering the input signal y (t) 105.
Noise reduction in response to 260 and the input signal 105 and corresponding to the noise reduced input signal
(t) Provide a means for supplying 140.

【0030】フィルタチャネル10のゲインベクトルサブ
システム120は、各周波数成分に対する周波数応答を選択
的に変えるように、決定制御パラメータ信号260に応答し
て周波数サブシステム110の出力信号y(fn)のゲインパラ
メータを調整するための手段を提供する。
The gain vector subsystem 120 of the filter channel 10 is responsive to the decision control parameter signal 260 to selectively change the frequency response for each frequency component, and the gain of the output signal y (fn) of the frequency subsystem 110. It provides a means for adjusting the parameters.

【0031】急速な時間変動は、会話の周波数スペクト
ルの全体又はその一部を含む周波数範囲にわたって決定
され得る。急速な時間変動は、会話の周波数スペクトル
内の周波数帯域を含む各周波数範囲にわたって決定され
得る。定義された閾値レートは、処理されている特殊な
周波数成分と関連する。エネルギ関数は、各周波数成分
のサンプル変動として決定され得る。
Rapid time variations can be determined over a frequency range that includes all or part of the speech frequency spectrum. Rapid time variations can be determined over each frequency range, including frequency bands within the frequency spectrum of speech. The defined threshold rate is associated with the particular frequency component being processed. The energy function may be determined as the sample variation of each frequency component.

【0032】入力信号の周波数成分は、入力信号の離散
フーリエ変換(DFT)パラメータであり得る。又、決定
及び制御チャネル20は、入力信号に応答して入力信号に
対するDFTパラメータを選択的に出力するDFT分析
器サブシステム即ち周波数サブシステム210を備え得
る。
The frequency component of the input signal can be a discrete Fourier transform (DFT) parameter of the input signal. The decision and control channel 20 may also include a DFT analyzer subsystem or frequency subsystem 210 that selectively outputs DFT parameters for the input signal in response to the input signal.

【0033】あるいは、入力信号の周波数成分は、入力
信号に応答するバンドパスフィルタの配列を備えたサブ
システムによって決定され得る。バンドパスフィルタの
この配列は、決定及び制御チャネル20の周波数成分出力
信号を同時に生成する。ここで周波数サブシステム110
の代わりに、各バンドパスフィルタからの出力信号は、
続いて、各周波数帯域に対するゲインベクトルサブシス
テム120の各ゲイン要素を介して、フィルタチャネル10
にも通過される。ここで、ゲイン値は、決定制御パラメ
ータ信号260に応答して決定される。
Alternatively, the frequency components of the input signal can be determined by the subsystem with an array of bandpass filters responsive to the input signal. This array of bandpass filters simultaneously produces the frequency component output signals of the decision and control channel 20. Where frequency subsystem 110
Instead of, the output signal from each bandpass filter is
The filter channel 10 is then routed through each gain element of the gain vector subsystem 120 for each frequency band.
Is also passed. Here, the gain value is determined in response to the decision control parameter signal 260.

【0034】フィルタチャネル10のゲインベクトルサブ
システム120のゲインは、好適な実施例において、決定及
び制御チャネル20内の人工知能のコントローラサブシス
テム250に応答して決定される。1つのモードにおい
て、このコントローラサブシステム250は、考慮される周
波数範囲の最高端及び最低端のゲインが抑制されるホワ
イトノイズ制御モードを動作させる決定に対して、ノイ
ズ電力がいつ実質的に応答するかを決定する。好適な実
施例において、考慮される周波数範囲の最高端及び最低
端のゲインは、0.1(−20dB)以下のゲイン設定まで抑制
される。
The gain of the gain vector subsystem 120 of the filter channel 10 is determined in the preferred embodiment in response to an artificial intelligence controller subsystem 250 in the decision and control channel 20. In one mode, the controller subsystem 250 causes the noise power to substantially respond to the decision to operate the white noise control mode where the gains at the high and low ends of the frequency range considered are suppressed. Decide In the preferred embodiment, the gains at the highest and lowest ends of the frequency range considered are suppressed to gain settings below 0.1 (-20 dB).

【0035】他のモードにおいて、コントローラサブシ
ステム250は、バブルノイズモードを動作させる。ここ
で、決定及び制御チャネル20によって決定されるノイズ
電力がほぼ1000Hzまでの周波数に対する周波数範囲の
低端で実質的に高く、且つ同時に、周波数範囲の高端で
のノイズ電力が0でないと決定され、上記高周波範囲で
の電力変動が通常会話に関連する所定レートより非常に
高いレートで起きるために決定されるという決定に応答
して、フィルタの低周波範囲は強く抑制され、これに反
して高周波範囲はわずかに強調される。
In another mode, the controller subsystem 250 operates in bubble noise mode. Where the noise power determined by the decision and control channel 20 is substantially higher at the low end of the frequency range for frequencies up to approximately 1000 Hz, and at the same time the noise power at the high end of the frequency range is determined to be non-zero, In response to the determination that power fluctuations in the high frequency range are determined to occur at a rate much higher than the predetermined rate normally associated with speech, the low frequency range of the filter is strongly suppressed, while the high frequency range is suppressed. Is slightly emphasized.

【0036】決定及び制御チャネル20は、コントローラ
サブシステム250を介して決定制御パラメータ信号260を
出力する。このとき、例えば、所定の最高周波数以下に
位置する周波数範囲でのノイズ電力のほとんどが実質的
に高いと決定され、その周波数以上で所定の閾値レベル
より低いわずかのノイズ電力が存在するという、決定及
び制御チャネル20による決定に応答して、高い周波数の
ゲインが実質的に上昇され、これに反して、ノイズが存
在するフィルタの低周波範囲が強く抑制される。ここ
で、決定及び制御チャネル20のコントローラサブシステ
ム250は、ノイズが低周波ノイズであると決定する。
The decision and control channel 20 outputs a decision control parameter signal 260 via the controller subsystem 250. At this time, for example, it is determined that most of the noise power in the frequency range located below the predetermined highest frequency is substantially high, and there is a small amount of noise power above that frequency that is lower than the predetermined threshold level. And in response to the decision by the control channel 20, the high frequency gain is substantially increased, whereas the low frequency range of the noisy filter is strongly suppressed. Here, the controller subsystem 250 of the decision and control channel 20 determines that the noise is low frequency noise.

【0037】図2は入力信号及びその成分部分を示す。
人間の耳又はマイク等の音声受信器100は、到来する会話
信号s(t)とノイズ信号n(t)との総和を提供する。音声受
信器100からの出力信号は、到来信号即ち入力信号y(t)1
05であり、y(t)=s(t)+n(t)である。
FIG. 2 shows the input signal and its component parts.
A voice receiver 100, such as the human ear or microphone, provides the sum of the incoming speech signal s (t) and the noise signal n (t). The output signal from the voice receiver 100 is the incoming signal or input signal y (t) 1.
05, and y (t) = s (t) + n (t).

【0038】図3のA〜Dは、異なる時間での入力信号
y(t)のエンベロープの周波数分布を示し、入力信号の電
力パターンに応じて会話とノイズとを識別する。図3の
A〜Dは、次々の時刻t1、t2、t3及びt4における入力信
号y(t)のエンベロープの周波数分布をそれぞれ示す。
図3のA〜Dは、位置X1において急速に変化する変動
(ピーク)が、全ての時刻t1〜t4で安定しており、従っ
て、ノイズ電力であることを示し、これに反して、
2、X3及びX4におけるピークが短く残り(時刻サンプ
ルにわたって繰り返さない)、会話音韻の電力であるこ
とを示している。
3A to 3D show input signals at different times.
The frequency distribution of the envelope of y (t) is shown, and speech and noise are identified according to the power pattern of the input signal. 3A to 3D respectively show the frequency distribution of the envelope of the input signal y (t) at the successive times t 1 , t 2 , t 3 and t 4 .
3A to 3D show fluctuations that change rapidly at the position X 1 .
(Peak) is stable at all times t 1 to t 4 and therefore shows noise power, which, by contrast,
The peaks at X 2 , X 3 and X 4 remain short (do not repeat over time samples), indicating the power of speech phonology.

【0039】図4は図1の信号処理装置の電気的なブロ
ック図であり、決定及び制御チャネル20並びにフィルタ
チャネル10の入力端子に印加される入力信号y(t)105を
供給する音声受信器100を示する共に、ゲイン制御設定
値Giをフィルタチャネル10に印加している決定及び制
御チャネル20の決定制御パラメータ信号260、並びにフィ
ードバックチャネル30の付加を示す。
FIG. 4 is an electrical block diagram of the signal processing apparatus of FIG. 1, which is an audio receiver which provides an input signal y (t) 105 applied to the input terminals of the decision and control channel 20 and the filter channel 10. Shown as 100 is the decision control parameter signal 260 of the decision and control channel 20 applying the gain control setpoint Gi to the filter channel 10 and the addition of the feedback channel 30.

【0040】フィードバックチャネル30は、その入力端
子に印加される装置出力信号s〜(t)140を有し、フィルタ
チャネル10のゲイン設定値に対して適応変動を提供する
フィードバックチャネル30及びフィルタチャネル10の両
方にフィードバック信号として印加される出力信号〜G
iを供給する。
The feedback channel 30 has a device output signal s˜ (t) 140 applied to its input terminal and provides an adaptive variation with respect to the gain setting of the filter channel 10 and the feedback channel 30. An output signal applied as a feedback signal to both
supply i.

【0041】図5は図4のフィードバックチャネル30の
電気的なブロック図である。フィードバックチャネル30
は、バンドパスフィルタサブシステム410と、決定サブシ
ステム440と、傾斜検索サブシステム450とを備えてい
る。バンドパスフィルタサブシステム410は、ハイパス
(HP)フィルタ420と、ローパス(LP)フィルタ430とを
備えている。装置出力信号s〜(t)140は、ハイパスフィ
ルタ420及びローパスフィルタ430の各入力端子に印加さ
れる。
FIG. 5 is an electrical block diagram of the feedback channel 30 of FIG. Feedback channel 30
Includes a bandpass filter subsystem 410, a decision subsystem 440, and a gradient search subsystem 450. The bandpass filter subsystem 410 is a highpass
An (HP) filter 420 and a low pass (LP) filter 430 are provided. The device output signals s to (t) 140 are applied to the respective input terminals of the high pass filter 420 and the low pass filter 430.

【0042】上述したように、ハイパスフィルタ420は、
非有声の会話音韻(UV)の検出に応答した出力信号を供
給し、一方、ローパスフィルタ430は、有声の会話音韻
(V)の検出に応答した出力信号を供給する。UV及びV
の出力信号は、決定サブシステム440の入力端子に印加
され、決定サブシステム440は、この発明の教えに従
い、有声及び非有声の音韻に対応したV及びUVの各出
力信号の持続の決定に応答して出力信号Qを供給する。
出力信号Qは、傾斜検索サブシステム450の入力端子に印
加され、傾斜検索サブシステム450は、この発明の教え
に従い、フィルタチャネル10のゲイン設定値を変化させ
るための信号を提供する出力信号〜Gi460を供給する。
As mentioned above, the high pass filter 420 is
The low pass filter 430 provides an output signal responsive to the detection of unvoiced speech phoneme (UV), while the low pass filter 430 provides a voiced speech phoneme.
An output signal is supplied in response to the detection of (V). UV and V
Output signal is applied to an input terminal of the decision subsystem 440, which, in accordance with the teachings of the present invention, responds to the determination of the duration of each V and UV output signal corresponding to voiced and unvoiced phonemes. And output signal Q is supplied.
The output signal Q is applied to the input terminals of the slope search subsystem 450, which in accordance with the teachings of the present invention, provides an output signal ~ G i460 that provides a signal for varying the gain setting of the filter channel 10. To supply.

【0043】出力信号〜Gi460は、フィードバック信号
として、傾斜検索サブシステム450にも印加される。又、
ランダム初期設定パラメータ〜Gi(o)452の初期設定値
は、別の初期入力信号として傾斜検索サブシステム450
に供給される。
The output signal ~ G i460 is also applied to the gradient search subsystem 450 as a feedback signal. or,
Random initialization parameters ~ Gi (o) 452 initialization values are used as another initial input signal for the gradient search subsystem 450.
Is supplied to.

【0044】ここでは、種々の特定された実施例につい
て説明してきたが、異なる他の実施例がこの発明の教え
に従って実現可能であることは当業者により理解される
だろう。従って、この発明の範囲は、開示された実施例
に限定されることを意味することはなく、添付された特
許請求の範囲により定義される。
Although various specific embodiments have been described herein, it will be appreciated by those skilled in the art that other different embodiments can be implemented in accordance with the teachings of the present invention. Accordingly, the scope of the invention is not meant to be limited to the disclosed embodiments, but rather is defined by the appended claims.

【0045】[0045]

【発明の効果】以上のようにこの発明によれば、会話と
ノイズとが加算された入力信号のスペクトル内のノイズ
及び会話を区別してフィルタサブシステムの調整決定可
能な人工知能を用い、周波数スペクトルの電力又はエン
ベロープ関数のパターンを調べて、エンベロープの急速
に変化する部分は会話を示すものと決定し、残余部分は
ノイズ電力の周波数分布であると決定し、スペクトルの
最大値の有無にかかわらずスペクトル全体又は周波数帯
域毎に行うようにしたので、ノイズ混入の会話信号から
ノイズを低減する信号処理装置を得ることができる。
As described above, according to the present invention, the noise in the spectrum of the input signal in which the speech and the noise are added and the speech are distinguished from each other by using the artificial intelligence capable of adjusting and deciding the filter subsystem to determine the frequency spectrum. Of the power or envelope function of the envelope to determine that the rapidly changing part of the envelope is indicative of speech, and the remaining part is the frequency distribution of the noise power, with or without the maximum of the spectrum. Since the processing is performed for the entire spectrum or for each frequency band, it is possible to obtain a signal processing device that reduces noise from a conversation signal containing noise.

【0046】又、この発明によれば、装置の出力信号内
の或る会話的特徴を増大させるために、傾斜検索処理を
用いることによりフィルタに対して増分調整を提供する
フィードバックループを組み込み、入力信号の関数の最
小値即ち会話の中断を考慮することを必要とせずに、入
力信号のエンベロープパターンが入力される人工知能に
より、固定された時間ウィンドウの間の急速な変動をフ
ィルタで取り出すようにしたので、ノイズ混入の会話信
号からノイズを低減する信号処理装置を得ることができ
る。
The invention also incorporates a feedback loop that provides incremental adjustments to the filter by using a gradient search process to augment certain interactive features in the output signal of the device. Artificial intelligence into which the envelope pattern of the input signal is input allows to filter out rapid fluctuations during a fixed time window without having to consider the minimum of the function of the signal, i.e. the interruption of the conversation. Therefore, it is possible to obtain a signal processing device that reduces noise from a conversation signal mixed with noise.

【図面の簡単な説明】[Brief description of drawings]

【図1】フィードバックを除いたこの発明の信号処理装
置を示す電気的なブロック図である。
FIG. 1 is an electrical block diagram showing a signal processing device of the present invention without feedback.

【図2】入力信号及びその成分部分を示す説明図であ
る。
FIG. 2 is an explanatory diagram showing an input signal and its component parts.

【図3】次々の時刻での入力信号のエンベロープを示す
波形図である。
FIG. 3 is a waveform diagram showing an envelope of an input signal at successive times.

【図4】フィードバックチャネルを付加した図1の信号
処理装置を示す電気的なブロック図である。
FIG. 4 is an electrical block diagram showing the signal processing apparatus of FIG. 1 with a feedback channel added.

【図5】図4のフィードバックチャネルを示す電気的な
ブロック図である。
5 is an electrical block diagram illustrating the feedback channel of FIG.

【符号の説明】[Explanation of symbols]

10 フィルタチャネル 20 決定及び制御チャネル 30 フィードバックチャネル 105、y(t) 入力信号 110、210 周波数サブシステム 120 ゲインベクトルサブシステム 140 フィルタ出力信号 220 エネルギサブシステム 250 コントローラサブシステム 260 決定制御パラメータ信号 410 バンドパスフィルタサブシステム 420 ハイパスフィルタ 430 ローパスフィルタ 440 決定サブシステム 450 傾斜検索サブシステム 460、Gi ゲイン制御設定値 s(t) 会話信号 n(t) ノイズ信号 10 Filter channel 20 Decision and control channel 30 Feedback channel 105, y (t) input signal 110, 210 Frequency subsystem 120 Gain vector subsystem 140 Filter output signal 220 Energy subsystem 250 Controller subsystem 260 Decision control parameter signal 410 Bandpass Filter subsystem 420 High-pass filter 430 Low-pass filter 440 Decision subsystem 450 Gradient search subsystem 460, Gi Gain control setpoint s (t) Speech signal n (t) Noise signal

Claims (22)

【特許請求の範囲】[Claims] 【請求項1】 会話信号にノイズ信号が加算された入力
信号に応答して決定制御パラメータ信号を出力する決定
及び制御手段と、 前記入力信号を選択的に濾波し、前記決定制御パラメー
タ信号及び前記入力信号に応答して前記ノイズを低減し
て、前記ノイズが低減された入力信号に相当するフィル
タ出力信号を供給するフィルタ手段と、 を備え、 前記決定及び制御手段は、 前記入力信号からその周波数成分を導出して各周波数成
分の出力信号を供給する周波数サブシステム手段と、 前記周波数成分の出力信号に応答して前記各周波数成分
の電力成分を導出するエネルギサブシステム手段と、 前記エネルギサブシステム手段に応答して、定義された
閾値レートより速いレートで変化する急速な時間変動を
前記入力信号がいつ有するかを決定する比較器手段と、 前記比較器手段、前記エネルギサブシステム手段、及び
前記入力信号に応答して、前記入力信号の前記定義され
た閾値レートより速いレートで変化していると決定され
た前記急速な時間変動を選択的に除去して残余出力信号
を供給するパターン分類サブシステム手段と、 を備え、 前記変動は、前記周波数成分に対する前記会話信号の電
力成分の時間にわたる変動を表わし、前記残余出力信号
は、前記周波数成分に対する前記ノイズ信号の電力成分
に対応し、異なる周波数成分での前記残余出力信号は、
前記決定制御パラメータ信号を構成する信号処理装置。
1. A decision and control means for outputting a decision control parameter signal in response to an input signal in which a noise signal is added to a conversation signal, and the decision control parameter signal and the decision control parameter signal for selectively filtering the input signal. Filter means for reducing the noise in response to an input signal and supplying a filter output signal corresponding to the noise-reduced input signal, wherein the determining and controlling means determines the frequency from the input signal. Frequency subsystem means for deriving a component to supply an output signal of each frequency component; energy subsystem means for deriving a power component of each frequency component in response to the output signal of the frequency component; and the energy subsystem. Responsive to the means for determining when the input signal has rapid time variations that change at a rate faster than a defined threshold rate A comparator means, the comparator means, the energy subsystem means, and the rapid rate determined to be responsive to the input signal at a rate faster than the defined threshold rate of the input signal. Pattern classification subsystem means for selectively removing a time variation to provide a residual output signal, said variation representing a variation over time of a power component of said speech signal with respect to said frequency component, said residual output The signal corresponds to the power component of the noise signal with respect to the frequency component, and the residual output signal at different frequency components is
A signal processing device that constitutes the decision control parameter signal.
【請求項2】 前記フィルタ手段は、 前記決定制御パラメータ信号に応答して、前記フィルタ
手段のゲインパラメータを調整し、各周波数成分に対す
る前記フィルタ手段の周波数応答を選択的に変える調整
手段を更に備え、 前記調整手段は、各周波数成分に対する前記残余出力信
号に応答して各周波数成分に対する前記ゲインパラメー
タを調整する請求項1の信号処理装置。
2. The filter means further comprises adjusting means for adjusting a gain parameter of the filter means in response to the decision control parameter signal to selectively change the frequency response of the filter means for each frequency component. The signal processing device according to claim 1, wherein the adjusting unit adjusts the gain parameter for each frequency component in response to the residual output signal for each frequency component.
【請求項3】 急速な時間変動は、全ての周波数成分を
含む会話の周波数スペクトルを含む周波数範囲にわたっ
て決定される請求項1の信号処理装置。
3. The signal processing device according to claim 1, wherein the rapid time variation is determined over a frequency range including a frequency spectrum of a conversation including all frequency components.
【請求項4】 前記電力成分は、前記入力信号の二乗の
個別の時間サンプルの有限の総和として各周波数成分で
決定される請求項1の信号処理装置。
4. The signal processing apparatus of claim 1, wherein the power component is determined at each frequency component as a finite sum of squared individual time samples of the input signal.
【請求項5】 前記入力信号の周波数成分は、前記入力
信号の離散フーリエ変換(DFT)の変換パラメータであ
り、前記決定及び制御手段は、前記入力信号に応答して
前記入力信号に対する前記DFTパラメータを選択的に
出力するDFT分析器サブシステムを更に備えた請求項
1の信号処理装置。
5. The frequency component of the input signal is a transform parameter of a discrete Fourier transform (DFT) of the input signal, and the determining and controlling means is responsive to the input signal, the DFT parameter for the input signal. The signal processing apparatus according to claim 1, further comprising a DFT analyzer subsystem that selectively outputs the signal.
【請求項6】 前記周波数サブシステム手段は、前記入
力信3号に応答するバンドパスフィルタの配列を備えた
請求項1の信号処理装置。
6. The signal processing apparatus of claim 1, wherein the frequency subsystem means comprises an array of bandpass filters responsive to the input signal No. 3.
【請求項7】 前記バンドパスフィルタの配列は、前記
決定及び制御手段の前記周波数成分の出力信号を同時に
生成し、各バンドパスフィルタからの前記出力信号は、
続いて、各周波数帯域に対するそれぞれのゲイン要素を
介して前記フィルタ手段に通され、ゲイン値は、前記決
定制御パラメータ信号に応答して決定される請求項6の
信号処理装置。
7. The array of bandpass filters simultaneously generates output signals of the frequency components of the decision and control means, the output signals from each bandpass filter comprising:
7. A signal processing apparatus as claimed in claim 6, which is subsequently passed through the filter means via respective gain elements for each frequency band, the gain value being determined in response to the decision control parameter signal.
【請求項8】 急速な時間変動は、100Hz〜10,000Hzの
周波数帯域を各々が含む周波数範囲にわたって決定され
る請求項1の信号処理装置。
8. The signal processing apparatus according to claim 1, wherein the rapid time variation is determined over a frequency range each including a frequency band of 100 Hz to 10,000 Hz.
【請求項9】 前記フィルタ手段のゲインパラメータ
は、前記決定及び制御手段内の人工知能サブシステム手
段に応答して決定され、前記決定及び制御手段は、考慮
された全周波数範囲にわたってノイズ電力がいつ実質的
に等しくなるかを決定し且つ前記決定に応答してホワイ
トノイズ制御モードを動作させ、前記考慮された周波数
範囲の最高端及び最低端のゲインパラメータが抑制され
る請求項2の信号処理装置。
9. The gain parameter of the filter means is determined in response to an artificial intelligence subsystem means in the decision and control means, the decision and control means determining when the noise power is over the entire frequency range considered. 3. The signal processing apparatus according to claim 2, wherein the gain parameters at the highest end and the lowest end of the considered frequency range are suppressed by determining whether they are substantially equal and operating a white noise control mode in response to the determination. ..
【請求項10】 決定及び制御手段により決定されたノ
イズ電力が、約1000Hzまでの周波数に対する周波数範
囲の低端で実質的に高く、同時に、前記ノイズ電力が前
記周波数範囲の高端で0でないと決定され、前記高周波
範囲での電力成分の変動が通常の会話に関連した所定の
変化速度よりも極めて急速であると決定されたことに応
答して、 前記決定制御手段はバブルノイズモードを動作させ、フ
ィルタの少なくとも1つの低周波範囲が強く抑制され、
前記フィルタの少なくとも1つの高周波範囲が増幅され
る請求項1の信号処理装置。
10. The noise power determined by the determining and controlling means is substantially high at the low end of the frequency range for frequencies up to about 1000 Hz, and at the same time the noise power is determined to be non-zero at the high end of the frequency range. And in response to the change in the power component in the high frequency range being determined to be significantly faster than a predetermined rate of change associated with normal speech, the decision control means activates a bubble noise mode, At least one low frequency range of the filter is strongly suppressed,
The signal processing device according to claim 1, wherein at least one high frequency range of the filter is amplified.
【請求項11】 前記決定及び制御手段は、高い周波数
成分でのゲインパラメータが実質的に増幅されるように
前記決定制御パラメータ信号を出力し、ノイズのほとん
どの電力成分が所定の最大周波数以下に位置するという
前記決定及び制御手段による決定に応答して、低い周波
数成分でのゲインパラメータは強く抑制され、前記決定
及び制御手段は、前記ノイズが低周波ノイズであること
を決定する請求項2の信号処理装置。
11. The decision and control means outputs the decision control parameter signal so that a gain parameter in a high frequency component is substantially amplified, and most of power components of noise fall below a predetermined maximum frequency. 3. In response to the decision by the determining and controlling means to be located, the gain parameter at low frequency components is strongly suppressed and the determining and controlling means determines that the noise is low frequency noise. Signal processing device.
【請求項12】 決定及び制御チャネルは、ノイズが高
周波ノイズであることを決定し、ノイズ電力成分が所定
の高周波範囲以上に存在するという決定に応答して、ノ
イズが存在する適切な周波数範囲を強く抑制する請求項
1の信号処理装置。
12. The decision and control channel determines that the noise is high frequency noise and, in response to the determination that the noise power component is above a predetermined high frequency range, determines an appropriate frequency range in which the noise is present. The signal processing device according to claim 1, wherein the signal processing device is strongly suppressed.
【請求項13】 前記ゲインパラメータの低減は1より
小さく低減され、そして、或る周波数範囲にわたる前記
フィルタ手段のゲインパラメータが抑制されるべきとき
に、1秒以下の時間間隔にわたって抑制は徐々に且つ円
滑に起こる請求項10の信号処理装置。
13. The reduction of the gain parameter is reduced to less than 1, and when the gain parameter of the filter means over a frequency range is to be suppressed, the suppression is gradual and over a time interval of 1 second or less. 11. The signal processing device of claim 10 that occurs smoothly.
【請求項14】 或る周波数範囲にわたる前記フィルタ
手段のゲインパラメータが増大されるべきときに、前記
増幅は、1秒以下の時間間隔にわたって徐々に実行され
る請求項11の信号処理装置。
14. The signal processing apparatus of claim 11, wherein the amplification is performed gradually over a time interval of 1 second or less when the gain parameter of the filter means over a frequency range is to be increased.
【請求項15】 前記決定及び制御手段は、前記ノイズ
電力が最大値となる周波数範囲を決定し、前記フィルタ
出力信号の低減は、前記決定された最大周波数範囲に対
して最高である請求項1の信号処理装置。
15. The determination and control means determines a frequency range in which the noise power has a maximum value, and the reduction of the filter output signal is the highest with respect to the determined maximum frequency range. Signal processing equipment.
【請求項16】 フィルタチャネルの出力信号を受信す
るように結合され、鋭いカットオフを有して所定の閾値
周波数以上の周波数で出力レベルを測定するためのハイ
パスサブフィルタ及びローパスサブフィルタを含む音声
及び非音声弁別回路を含むフィードバックチャネルと、 前記フィードバックチャネルに応答し、300m秒のオーダ
の所定の時間ウィンドウ(Tw)の間、前記ハイパスサブフ
ィルタ及び前記ローパスサブフィルタの各出力端子での
信号電力が、第2の所定時間間隔よりも長い時間の間所
定レベル以上のレベルで、ハイパスサブフィルタの周波
数範囲内でほとんど存在するという決定に応答して出力
信号Qを供給し、又、前記第1の時間ウィンドウTw以上
の間信号の電力が前記所定レベル以下に低下したと決定
するまで、前記第1の時間ウィンドウTwの終端まで前
記出力信号を供給し続ける決定サブシステムと、 を更に備え、 前記ローパスサブフィルタでの電力は、前記第2の所定
時間間隔より長い第3の所定時間の間第2の所定レベル
以上であるという決定に応答して、出力信号Qが出力さ
れ、 前記ハイパスサブフィルタ及び前記ローパスサブフィル
タの両方の電力レベルが閾値レベルと重複し且つ同時に
超過することに応答して、前記閾値レベル、時間ウィン
ドウでの前記ハイパスサブフィルタ及び前記ローパスサ
ブフィルタの両方の電力レベルの前記重複の持続時間中
にわたって出力信号Qが出力され、Tqで示されるレベル
Qの出力信号の持続時間とTwで示されるウィンドウの
長さとの比率、即ち比率Tq/Tw=Rqが各ウィンドウ
Tw毎に繰り返し計算され、フィルタ手段の周波数の各
範囲のゲインパラメータがわずかに変化し、これによ
り、Rqの変動と前記各パラメータの変動との傾斜比率が
計算されて、傾斜検索が傾斜検索フィードバックとして
役立ち、Rqを低減するためにフィルタ手段のゲインを修
正するように、Rqを低減する方向に帰納的な傾斜検索を
提供するが、フィルタチャネルのゲインの後者の変動
は、フィードバックチャネルを考慮することなく決定及
び制御手段により決定されたような各ゲイン値から所定
の百分率比率内に制限されてフィードバック訂正の影響
を制限し、第i番目の周波数範囲に対するゲインGi(但
し、iは連続する整数、i=1,2,…Nであり、Nは考慮
される周波数範囲の総数)とRqとの傾斜関係は、非常に
小さい増分を所定の時間間隔Tqにわたる種々のゲイン
に印加することにより、又、前のそのような時間間隔T
qにわたるRqとその変動を比較することにより更新さ
れ、時間間隔Tqは必ずしもTwと等しくなく、傾斜関数
は、 Rq/Gi ; i=1,2,…N で表わされ、時間間隔Tq(j)にわたる変動を表わすと、
j番目の整数の時間間隔jは、j=0,2,…で表わされる
請求項1の信号処理装置。
16. An audio signal coupled to receive an output signal of a filter channel, the audio signal including a high-pass sub-filter and a low-pass sub-filter having a sharp cutoff for measuring an output level at a frequency above a predetermined threshold frequency. And a feedback channel including a non-voice discrimination circuit, and signal power at each output terminal of the high-pass sub-filter and the low-pass sub-filter in response to the feedback channel during a predetermined time window (Tw) of the order of 300 msec. Provides an output signal Q in response to a determination that it is mostly within the frequency range of the high-pass sub-filter at a level above a predetermined level for a time longer than a second predetermined time interval, and said first signal Until it is determined that the power of the signal has dropped below the predetermined level during the time window Tw of A decision subsystem that continues to provide the output signal until the end of the time window Tw of, and the power at the low-pass sub-filter is at a second predetermined time period that is longer than the second predetermined time interval. An output signal Q is output in response to a determination that the power level of both the high-pass sub-filter and the low-pass sub-filter overlaps and simultaneously exceeds a threshold level, An output signal Q is output for the duration of the overlap of the threshold level, the power levels of both the high-pass sub-filter and the low-pass sub-filter in a time window, and the duration of the output signal of level Q, denoted by Tq, The ratio to the window length indicated by Tw, that is, the ratio Tq / Tw = Rq, is repeatedly calculated for each window Tw, The gain parameter in each range of frequency of the filter means is slightly changed, whereby the slope ratio between the variation of Rq and the variation of each parameter is calculated so that the slope search serves as slope search feedback and reduces Rq. In order to modify the gain of the filter means in order to provide a recursive slope search in the direction of reducing Rq, the latter variation of the gain of the filter channel is due to the decision and control means without consideration of the feedback channel. The influence of feedback correction is limited by limiting the gain value as determined within a predetermined percentage ratio, and the gain Gi for the i-th frequency range (where i is a continuous integer, i = 1, 2, ... N, where N is the total number of frequency ranges considered) and the slope relationship between Rq and various gays over very small increments over a given time interval Tq. By applying the, also, before such time interval T
Updated by comparing Rq over q and its variations, the time interval Tq is not necessarily equal to Tw, and the slope function is represented by Rq / Gi; i = 1,2, ... N and the time interval Tq (j ),
The signal processing device according to claim 1, wherein the j-th integer time interval j is represented by j = 0, 2 ,.
【請求項17】 Gi(j)で示される、j番目の時間間隔T
q(j)とその前の時間間隔Tq(j−1)との間のGiの訂正変
動Gi(j)は、帰納的な関係、 Gi(j)=B・Rq/Gi i=1,2,…N で与えられ、iは考慮される周波数範囲、Bは既定の係
数であり、jにわたる総和を表わすGi(j)は、フィー
ドバックチャネルを無視するときを考慮することなく、
決定及び制御手段により決定されたようなGjに関する
所定の閾値比率を超過しない請求項16の信号処理装置。
17. The j-th time interval T, denoted by Gi (j)
The correction variation Gi (j) of Gi between q (j) and the preceding time interval Tq (j−1) is a recursive relationship: Gi (j) = B · Rq / Gii = 1,2 , ... N, i is the frequency range to be considered, B is a predetermined coefficient, and Gi (j) representing the sum over j is not considered when ignoring the feedback channel,
17. The signal processing device according to claim 16, wherein a predetermined threshold ratio for Gj as determined by the determination and control means is not exceeded.
【請求項18】 低周波範囲の前記フィルタ出力信号の
低減は、ノイズ電力成分が所定の高周波範囲及び低周波
範囲の両方に存在するという決定及び制御手段の決定に
応答して、所定の高周波範囲の前記フィルタ出力信号よ
りも多大にされる請求項20の信号処理装置。
18. The reduction of the filter output signal in the low frequency range is responsive to the determination that the noise power component is present in both the predetermined high frequency range and the low frequency range and the determination of the control means. 21. The signal processing apparatus of claim 20, wherein the signal output apparatus is made larger than the filter output signal of.
【請求項19】 前記決定された範囲以外の周波数範囲
に対して、前記フィルタ出力信号の低減は前記最大の低
減よりも小さい請求項15の信号処理装置。
19. The signal processing device according to claim 15, wherein the reduction of the filter output signal is smaller than the maximum reduction for a frequency range other than the determined range.
【請求項20】 前記フィルタ出力信号の最大の低減
は、低い周波数に対して、より多大となる値である請求
項15の信号処理装置。
20. The signal processing device of claim 15, wherein the maximum reduction of the filter output signal is a greater value for low frequencies.
【請求項21】 ノイズ成分の分布がホワイトノイズで
あるという決定に応答して、前記会話信号に応答して前
記高周波範囲及び前記低周波範囲のみで前記フィルタ出
力信号を低減する手段を更に備えた請求項18の信号処理
装置。
21. Means for reducing the filter output signal only in the high frequency range and the low frequency range in response to the speech signal in response to determining that the distribution of the noise component is white noise. 19. The signal processing device according to claim 18.
【請求項22】 ノイズ成分の分布がバブルであるとい
う決定に応答して、前記会話信号に応答して前記低周波
範囲のみで前記フィルタ出力信号を低減する手段を更に
備えた請求項18の信号処理装置。
22. The signal of claim 18, further comprising means responsive to the determination that the distribution of the noise component is a bubble to reduce the filter output signal only in the low frequency range in response to the speech signal. Processing equipment.
JP4067291A 1992-03-25 1992-03-25 Signal processor Pending JPH05291971A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4067291A JPH05291971A (en) 1992-03-25 1992-03-25 Signal processor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4067291A JPH05291971A (en) 1992-03-25 1992-03-25 Signal processor

Publications (1)

Publication Number Publication Date
JPH05291971A true JPH05291971A (en) 1993-11-05

Family

ID=13340735

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4067291A Pending JPH05291971A (en) 1992-03-25 1992-03-25 Signal processor

Country Status (1)

Country Link
JP (1) JPH05291971A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010146711A1 (en) 2009-06-19 2010-12-23 富士通株式会社 Audio signal processing device and audio signal processing method

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010146711A1 (en) 2009-06-19 2010-12-23 富士通株式会社 Audio signal processing device and audio signal processing method
US8676571B2 (en) 2009-06-19 2014-03-18 Fujitsu Limited Audio signal processing system and audio signal processing method

Similar Documents

Publication Publication Date Title
US5097510A (en) Artificial intelligence pattern-recognition-based noise reduction system for speech processing
US10833644B2 (en) Audio control using auditory event detection
JP2962732B2 (en) Hearing aid signal processing system
US5832444A (en) Apparatus for dynamic range compression of an audio signal
KR100860805B1 (en) Voice enhancement system
JP4981123B2 (en) Calculation and adjustment of perceived volume and / or perceived spectral balance of audio signals
AU740951C (en) Method for Noise Reduction, Particularly in Hearing Aids
US8200499B2 (en) High-frequency bandwidth extension in the time domain
US9536536B2 (en) Adaptive equalization system
US7418379B2 (en) Circuit for improving the intelligibility of audio signals containing speech
JP2011141551A (en) System for improving speech intelligibility through high-frequency compression
US8199928B2 (en) System for processing an acoustic input signal to provide an output signal with reduced noise
CA2814434C (en) Adaptive equalization system
JPH05291971A (en) Signal processor
US5897614A (en) Method and apparatus for sibilant classification in a speech recognition system
JP3335389B2 (en) Voice recognition device
JPH07101853B2 (en) Noise reduction method
IL101155A (en) Artificial intelligence pattern-recognition based noise reduction system for speech processing
JP2022030448A (en) Masker sound control method and masker sound control device
JP2011071806A (en) Electronic device, and sound-volume control program for the same
WO2004059614A2 (en) A method and apparatus for enhancing the perceptual quality of synthesized speech signals

Legal Events

Date Code Title Description
FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 11

Free format text: PAYMENT UNTIL: 20090403

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 11

Free format text: PAYMENT UNTIL: 20090403

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 12

Free format text: PAYMENT UNTIL: 20100403

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110403

Year of fee payment: 13

EXPY Cancellation because of completion of term