JP2001202100A - 無音区間の指数的なエコーおよび雑音の低減化 - Google Patents

無音区間の指数的なエコーおよび雑音の低減化

Info

Publication number
JP2001202100A
JP2001202100A JP2000349077A JP2000349077A JP2001202100A JP 2001202100 A JP2001202100 A JP 2001202100A JP 2000349077 A JP2000349077 A JP 2000349077A JP 2000349077 A JP2000349077 A JP 2000349077A JP 2001202100 A JP2001202100 A JP 2001202100A
Authority
JP
Japan
Prior art keywords
signal
noise
echo
function
reduction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2000349077A
Other languages
English (en)
Inventor
Hans Juergen Matt
ハンス−ユルゲン・マツト
Michael Walker
ミヒヤエル・バルカー
Michael Maurer
ミヒヤエル・マウラー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alcatel CIT SA
Alcatel Lucent SAS
Original Assignee
Alcatel CIT SA
Alcatel SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alcatel CIT SA, Alcatel SA filed Critical Alcatel CIT SA
Publication of JP2001202100A publication Critical patent/JP2001202100A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02168Noise filtering characterised by the method used for estimating noise the estimation exclusively taking place during speech pauses

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Telephone Function (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

(57)【要約】 【課題】 TKシステムで、有用な音響信号を伝送する
ために、エコーおよび/または雑音信号を低減化する方
法を提供すること。 【解決手段】 無音区間が存在するとき、低減化が無音
区間の検出によって決定され、歪んだ有用な信号は、時
間依存制御信号a(t)または走査速度fT=1/T
の周期で繰り返す制御信号a(k)によって変更され
る。本方法は、有用な信号で音声信号が存在している
間、制御信号a(k)の振幅が、一定の所定振幅値c
に設定され、無音区間が始まるとき、制御信号a
(k)の振幅が、漸化式a(k+1)=a(k)
・β、β<1に従って1つのサンプル値から次へと継続
的に減衰されるような方法で、制御信号a(k)を変
動させることを特徴としている。無音区間の終了後、a
(k)が再度cに等しく設定される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】有用な音響信号、特に人間の
音声を伝送する通信システムにおいて、エコーおよび/
または雑音(ノイズ)信号を低減化する方法であって、
有用な信号および干渉信号の混合が音声信号を含有する
とき、または無音区間が存在するとき、無音検出によっ
て判定を行うこと、および、2入力乗算器を使用するこ
とで有用な信号の振幅を変動させることを含み、有用な
信号は、サンプリングレートf=1/Tでクロックさ
れた時間依存制御信号a(t)または制御信号a
(k)に応じて、一般にエコーおよび/または雑音信
号によって妨害され、ここで、k∈Νは、サンプルの数
を示し、Tは、1つのサンプルから次までの時間を示
す。
【0002】そのような方法は、例えばDE42299
12A1で知られている。
【0003】
【従来の技術】人々の間の自然な通信の際、基本的に
は、話される言葉の振幅は、自動的に音響環境に適合す
るようなる。しかし、遠隔地で話される通信では、話し
ている相手とは、同じ音響環境ではなく、さらに他の場
所の音響状態を認識してもいない。問題は、通信者の一
方が、自分の周囲の音響的な環境のためにかなり大きく
話さなければならないのに対し、通信者の他方は、音響
的に静かな環境にいて、低い振幅の音声信号で話してい
るときに、とりわけ急激に発生する。
【0004】他の問題は、TKチャンネルで「電気的な
原因」の何らかの雑音が発生し、これが有用な信号の背
景として副次的に伝送されることである。さらに、望ま
しくない背景の雑音(街路、工場、事務所、食堂、飛行
機騒音などからの雑音)を減衰させたり、完全にカット
することにも利点がある。電話中の快適さ向上するため
に、あらゆる種類の雑音をできる限り低くく抑えること
が一般に試みられている。
【0005】結局、TK通信でも、エコーと呼ばれるも
のが発生し、それは回線エコーとして2芯TKネットワ
ークに存在し、そのエコーは、例えば簡単に発生し、音
響的なエコーの形でTK端末の快適さを減少させる可能
性がある。
【0006】したがって、一般に音声信号および歪んだ
信号の混合の伝送では、雑音およびエコーなどの歪んだ
信号振幅をできる限り、減少させることが重要である。
【0007】雑音の低減化のための知られている方法
は、「スペクトルサブトラクション(spectral
subtraction)」と呼ばれるもので、それ
については、例えば1998年にドレスデンのITG
Technical Conference(ITGテ
クニカルコンフェレンス)のS.Gustafsson
およびP.Jax著の出版物「A new appro
ach to noise reduction ba
sed on auditory masking e
ffect(聴覚的マスキング効果ベースの雑音低減化
への新しいアプローチ)」で述べられている。これに
は、音響的マスキング閾値(例えば、MPEG標準によ
る)を考慮に入れるスペクトルの雑音低減化方法が含ま
れている。そのような方法の欠点は、前記音響的マスキ
ング閾値の判定が複雑なプロセスで、この方法に関連付
けられる動作すべてを実行することには、かなりの計算
の手間を必要とすることである。スペクトルサブトラク
ションでは、音声休止間の雑音が、最初に測定され、電
力密度スペクトルの形式でメモリに断続的に格納され
る。電力密度スペクトルは、フーリエ変換を介して得ら
れる。音声が発生するとき、格納された雑音スペクトル
は、実際に歪んだ音声スペクトルから「最良現行推定
値」として取り除かれ、ついで、同じ時間領域で逆変換
されることにより、このようにして歪んだ信号のための
雑音の低減化が行われる。
【0008】スペクトルサブトラクションの他の欠点
は、基本的に厳密ではない雑音推定、およびそれに続く
除去のプロセスによって、「音楽のトーン」として認識
可能な出力信号で、不具合が生じることである。さら
に、この知られている方法は、TK通信リンクのエコー
信号の排除には適してはいない。
【0009】上部に引用された参照でも述べられている
拡張されたスペクトル信号処理では、スペクトルサブト
ラクションを利用することで、雑音および音声自体のた
めの電力密度スペクトルが最初に推定される。これらの
部分的なスペクトルを知り、MPEG標準のルールの例
を利用することで、ついで人間の耳に対するスペクトル
の音響的マスキング閾値R(f)が計算される。雑音
および音声に対するこのマスキング閾値および推定のス
ペクトルを利用することで、ついで簡単なルールを適用
することで、音声の本質的なスペクトル部分をできる限
り変えないようにするフィルタ通過曲線H(f)が計算
され、一方雑音のスペクトル部分はできる限り減衰させ
る。
【0010】ついで、もともと歪んでいる音声は、この
フィルタを通すことのみを必要とし、そうすることで歪
んだ信号の雑音を低減化が行われる。この方法の利点
は、目下の歪んだ信号に「何も加えず、何も除かない」
こと、それによって、推定エラーは、ほとんど認知でき
ない程度になるか、または全くなくなる。この欠点は、
再度スペクトルの雑音除去のためのかなりの計算の手
間、およびエコー除去のために適応フィルタを上流に接
続する必要があることである。
【0011】知られているコンパンダでの方法では、前
記の引用した特許DE4229912A1の例でも述べ
られているように、雑音およびエコーの減衰の程度は、
定められた所定の変換関数に従って確立され、当該変換
関数は、とりわけ、微小な入力信号の場合においてさ
え、レベル低減化の効果がある。
【0012】コンパンダは、最初、音声信号を、事実
上、入力から出力まで一定の所与の(事前設定の)「通
常の音声信号レベル」(時々ノーマルラウドネスと呼ば
れる)で伝送する。
【0013】次に、例えば話し手がマイクに近すぎるた
めなどで入力信号が常に過大である場合、ダイナミック
コンプレッサは、通常の場合とほどんど同じ値にまで出
力レベルを絞る。それは、コンパンダでの実際の振幅
は、入力信号が大きくなるにつれ直線的に減少するため
である。この特性のおかげで、コンパンダシステムの出
力での音声は、入力の大きさの増減がどのようになるか
にかかわりなく、ほぼ一定のままである。
【0014】他方、通常よりも低いレベルの信号がコン
パンダの入力に送られる場合、信号はさらに減衰する。
それは、できる限り減衰させた形式で背景雑音のみを伝
送するために、振幅が削減されるからである。
【0015】したがってコンパンダは、通常レベルより
大きいまたは同等の音声信号レベル用のコンプレッサお
よび通常レベルより小さい信号レベル用のエキスパンダ
から構成されている。このため、エキスパンダでの振幅
の減衰がよりはっきりするために、入力レベルはより小
さくなる。
【0016】
【発明が解決しようとする課題】コンパンダでの解決策
の欠点は、知られているプロセスを実行するためにかな
りの計算の手間を必要とすることである。さらに、一方
で音声信号レベルを圧縮し、他方でそれを伸長すること
は、音声の大きさで変動を引き起こし、それは、しばし
ば、主観的に不満足なものとして認識され、すなわち、
聴覚的に不満足な印象を作り出す結果となるような音声
信号に変わってしまう。
【0017】本発明の目的は、対照的に、最初で述べた
特性を有する方法を提案するもので、複雑さが緩和さ
れ、経済性に優れたやり方が可能になり、大部分の計算
の手間なしで、さらにコンピュータメモリおよびデータ
記憶空間のための必要性が減少するというその方法によ
って、エコーおよび雑音減衰が、人間の耳に対してでき
るかぎり心地よい全体的な音響的な印象を作り出すため
の簡単な手段を使用して達成され、これはさらに好みに
よる個人の必要に適合するようにもすることができる。
【0018】
【課題を解決するための手段】本発明によれば、この目
的は、有用な信号中に音声信号が存在する場合に、制御
信号a(t)またはa(k)の振幅が一定の所定振
幅値cに設定され、無音区間が有用な信号で始まると
き、制御信号a(t)またはa(k)の振幅が、漸
化式 a(k+1)=a(k)・β、 β<1 に従って1つのサンプル値から次へと継続的に減衰さ
れ、無音区間の終了後、a (k)が再度cに戻るよ
うな方法で、制御信号a(t)またはa(k)を変
動させることで、効果的と同時に簡単な仕方で達成され
る。
【0019】これは、非常に簡単で、経済性に優れた方
法を提供し、これにより、好ましくは、無音区間の歪ん
だエコーおよび雑音信号を減衰させるので、歪みの低減
化に関して、驚くほどの良い品質を達成する。話自体を
している時間に、歪んでいる雑音は、少なくとも部分的
にマスキングされるので、人間の耳には、はっきりとは
認識できない程度になる。知られているコンパンダでの
方法により圧縮せずに行うことによって、元々の音声信
号は、変動はかなり減少するため、基本的に、回線の他
の端で、より良い音の音声信号が得られる。さらに、本
発明による方法は、コンパンダでの方法よりも計算能力
を必要とはしない、それは少なくとも圧縮が省かれてい
るためである。同様に、データ記憶およびコンピュータ
メモリのためのより少なくしか必要とはしないので、知
られている方法と比較して、このことは、本発明による
方法をより簡単で、より低価格なものとしている。
【0020】効果的な雑音の減衰を成し遂げるために、
無音区間で、伝送される信号電力は、コンパンダでの方
法の入力レベルに左右される減少とは異なり、時間指数
関数に従って減少する。このことで、すでにかなりの雑
音の減衰が成し遂げられ、さらに無音区間の際の雑音の
低減化で、大きな雑音の後に発生にする耳をつんざくよ
うな効果はかなり減少するので、聴取のためのストレス
は明らかに少なくなる。音声が再び始まるとき、耳はよ
り敏感に反応し、より正確に聴くことができる。
【0021】係数βが、継続的な時間低減化がおおよそ
人間の耳の知覚の時定数τに対応するように選択され
ることには利点がある。このことは、強烈な雑音の刺激
の後、人間の耳は、やがて時定数τで減衰する変動曲
線を下回る振幅になる強烈な音響的刺激の終了後、新し
い雑音の刺激を知覚しないことを意味している。したが
って、本発明による方法の一変形形態が好ましく、この
場合、係数βは、サンプリングレートf、時間定数τ
、事前定義された一定の係数cから、β=c・e
xp(−1/τ)で求められる。
【0022】人間の場合、時定数τ1は、50msから
150msの間、好ましくはτ≒65msになるよう
に選択される。
【0023】時定数τ1に従って正確に係数βを必要な
数にするためには、c=1を選択することが最良であ
る。
【0024】前述の反復公式による歪み信号の継続的な
指数的減衰が制限されていない場合、a(k)の値
は、kが増加するにつれ急速にかなり小さくなりゼロに
近づくことになる。しかし、このことは、常に望ましい
とはかぎらない、なぜならば、多くの場合、人々は、話
の合間の際、TK回線が突然「使えなくなってしまっ
た」または中断したという印象をさけることになるよう
な低いレベルの残留雑音を聞ききたがるからである。し
たがって、本発明による方法の一変形形態、それは、先
行する値a(k)がcより小さいまたは等しくなっ
た場合、無音区間および/またはエコー信号の存在部分
では、a(k+1)を、事前定義された定数値c
推定する形態が好ましい。
【0025】さらに、無音区間での信号レベルの低減化
の程度を、TKチャンネルの瞬間的状態に適合するよう
に構成することが望ましい。
【0026】例えば、雑音が、瞬時の雑音レベルNの関
数として、または信号対雑音の差S/Nのg(S/N)
の関数に応じる仕方で低減化されることが好ましい、し
かし、短時間のエコーは、より強力に低減化することが
でき、エコーが終了した後に、低減化状態を、雑音の低
減化に使用されるより小さな値に戻すことができる。
【0027】無音区間および/またはエコー信号の存在
部分で、a(k)≦cのために、ここでcは事前
定義された定数であるが、目下使用されている通話チャ
ンネルの雑音レベルNの電力値が継続的に測定および/
または推定されることと、目下の雑音レベルNに応じて
制御信号a(k+1)が、継続的にa(k+1)=
f(N)に従って調整されることとを特徴とする方法の
一変形形態を適用することは特に好ましい。
【0028】このようにして、雑音減衰の程度は、実際
に発生する雑音の電力Nの関数として自動的に制御さ
れ、所定および事前定義された方法に沿った電話チャン
ネルの瞬時の雑音値に適合されるように構成される。f
(N)の関数の選択によって、作り出される信号全体の
主観的な印象にも適合するようにすることができる。こ
の方法の変形形態の他の利点は、電話チャンネルの束の
場合、例えば、国際通話ステーション間で個々の各チャ
ンネルの雑音状態は、1つのチャンネルと別のチャンネ
ルとではかなり異なることも当然よく起きる可能性があ
るが、その状態の個々の調整、最適化を自動的に行うこ
とができることである。
【0029】所与の関数f(N)が、伝送される有用な
信号の信号レベルSの電力値と雑音レベルNの電力値の
比率S/Nに応じる関数g(S/N)であること、また
は、所与の関数f(N)が、前記比率の逆数に応ずる関
数g’(N/S)であることを特徴とする本発明による
方法の一変形形態が特に好ましい。実際の実現をより簡
単にするために、(S+N)/Nまたは(S+N)/S
の関数もまた使用することができる。
【0030】上述の方法の変形形態の利点は、電話チャ
ンネルの束の中の有用な信号レベルSが大きく変動する
場合、雑音の低減化のための適切な調整が常に行われる
ことになるということである。雑音の減衰が、逆数N/
Sに比例して制御される場合、関数g’(N/S)を、
ディジタル信号プロセッサ(DSP)に、例えば16ビ
ットの固定コンピュータワード長で、特に簡単なソフト
ウェアを使用することで容易に実装することができ、そ
れは、N/Sに対して、数値範囲0<N/S<1が、雑
音の低減化を制御するために主に関連があったりまたは
関係があるからである。
【0031】音響聴取テストは、S/N=0dBで、音
声が明らかに非常に歪むことを示しているので、自然な
響きの音声に関連した全体的音響的な印象が低下するこ
とを避けるべき場合、雑音は、5から10dBの間、好
ましくは6から8dBの間の限られた程度のfまたは
の値だけ低減化することができる。信号対雑音の比
率S/N<0dBのより不利な値の場合でさえ、さらに
他のいかなる雑音の低減化もただ全体的な印象を悪くす
るだけなので、fまたはgの値を保持することがで
きる。
【0032】これらの研究により、平均的なS/N値
で、雑音の低減化がより顕著である可能性がある。これ
においては、10から15dBの範囲に最大値がある。
雑音減衰fmaxまたはgmaxの値は、最大20から
30dBの間、好ましくは、約25dBであるべきであ
る。
【0033】S/N>40dBなどのとても良好な雑音
値では、0から3dBの間の最小の低減化で、伝送され
る音声の自然さができる限り保てるようにすべきであ
る。
【0034】音声の響きおよびその解読度は、関数f
(N)またはg(S/N)が、上述の3つの範囲を超え
て継続的な仕方で一貫している場合に、とりわけ良好
で、この場合、NまたはS(N)が急速に変動してもフ
ィルタリングで滑らかにすることができる。
【0035】これは、ハードウェアおよび/またはソフ
トウェアの観点からは、実現が比較的簡単である。それ
は、関数f(N)あるいはg(S/N)またはg’(N
/S)が、3つの前述の動作点間で、直線的な特性線部
分によって概算(部分的直線概算)されるからである。
【0036】本発明による方法のよりやや複雑で、しか
し結果がより良い音響図形である、そのような一変形形
態では、多項の関数を使用して、論じられた3つの範囲
の継続的な関数f(N)あるいはg(S/N)または
g’(N/S)を実装し、その結果、ねじれた鐘状の関
数のタイプとなる。
【0037】関数f(N)およびg(S/N)または
g’(N/S)の雑音レベルNの低減化が、人間の耳に
よって聴取可能なスペクトルの音響心理学的平均値に従
って、聴覚的に補われるように、選択される本発明によ
る方法の一変形形態は、特に好ましい。これでは、Sお
よび/またはNに対する値が、ただ瞬時の電力からのみ
ではなく、SまたはNそれぞれの加重されたスペクトル
の変動からも決定され、聞き取るために適する雑音の低
減化、すなわち心理的、聴覚的に心地よく響くものが得
られる関数を介して、包括的に達成される。聴覚的に心
地よく響く雑音の低減化は、簡単には測定できないの
で、広範な聴取テストですべての品質の評価が考慮に入
れられ、その後、評価段階(音声コーデックの場合と類
似)を得るために、その目的に最適の統計学的な方法
で、評価される。
【0038】良い雑音レベルの判定には、優れた無音区
間検出器が必要とされ、それによってのみ、人は、無音
区間で、しばしば実際にある雑音と音声の一部の混合が
まったくなく、ただ歪んだ雑音のみが存在していること
を確信することができるからである。
【0039】そのため、無音検出器(SPD)で、短時
間出力信号sam(x)、中時間出力信号mam
(x)、長時間出力信号lam(x)が、短時間レベル
推定器、中時間レベル推定器、長時間レベル推定器、そ
れぞれによって形成されることと、3つの出力信号、s
am(x)、mam(x)、lam(x)は、入力信号
xが純然たる雑音信号のとき、適する増幅率によって調
整が行われることで、大きさにおいてほぼ等しくなるこ
とと(この場合、sam(x)<mam(x)<lam
(x)である)、3つの出力信号、sam(x)、ma
m(x)、lam(x)が、比較器(コンパンダ)によ
り監視されることと、sam(x)とmam(x)の両
方が、最初、lam(x)よりも大きくなるとき、入力
信号xとして音声信号があると見なされ、一方sam
(x)および/またはmam(x)が、lam(x)よ
りも小さくなるときは、無音区間があると見なされるこ
ととを特徴とする方法の一変形形態が特に好ましい。
【0040】時間信号の種々の平均値の形成の比較的簡
単なこのタイプのおかげで、驚くほど良好に無音区間の
検出が、すでに成し遂げられており、しかもほんの少し
の計算の手間しか必要ではないのである。
【0041】この方法の変形形態の他の一発展形態で
は、無音区間の推定のために、3つの出力信号、sam
(x)、mam(x)、lam(x)が、様々な入力信
号xを持つ複数のシナリオで訓練されたニューラルネッ
トワークに送られる。ニューラルネットワークが、多数
の入力パラメータと望ましい出力値間の線形的および非
線形的な関係を描写することができることは利点とな
る。このための前提条件は、ニューラルネットワーク
が、最初に十分な量の入力値および関連付けられる出力
値で訓練されていることである。こうして、ニューラル
ネットワークは、様々な種類の歪んでいる雑音がある場
合の無音区間の検出のタスクのために、とりわけ良好に
適合される。
【0042】雑音信号の認識および低減化に加えて、エ
コー信号の存在も、検出および/または予測され、対応
するエコー信号を圧縮および減衰するようにすることは
好ましい。電話チャンネルで、雑音に加えてエコーも発
生するとき、これらは、基本的にエコーの所定の信号持
続時間τ、ならびにチャンネルの所定のエコーカップ
リングERLおよび戻りチャンネルのエコーを引き起こ
す信号強度ESによって予測することができる。この推
定は、放出される音声信号およびその瞬時の電力の関数
として、遅延するエコーのサイズが推定される方法で実
行することができる。各ケースで推定される各エコー信
号が、所定の短時間セグメント内で所定の閾値thrs
を超過したとき、このエコーの作用している信号が、さ
らに短時間の間、例えば上述の指数的減衰によって、エ
コー信号の本質的な低減化のための必要な値に、減衰さ
れることは好ましい。同様に、エコーが存在するとき、
コンパンダ特性曲線を、短時間の間、入力の大きさがよ
り大きい方向に置き換えることができ、エコーがなくな
ってしまうならば、元々の位置に戻ることができる。
【0043】制御信号a(k+1)が、a(k+
1)=h(N、S、ES、τ、ERL)に従って継続
的に調整され、h(N、S、ES、τ、ERL)が、
雑音レベルNの所定の関数、信号レベルS、話す側から
反対の方向への有用な信号ES、エコー信号の一定の遅
延τE、エコー信号振幅の減衰定数ERLである、この
方法の変形形態の他の一発展形態が特に好ましい。
【0044】聴覚に適する雑音の低減化を、雑音の低減
化とは別個のエコーの低減化と組み合わせることができ
ることには利点がある。このことは、電話チャンネルに
実際のところ背景雑音がないときに特に重要で、それ
は、そのときに雑音の減衰が無く、したがって発生する
エコー信号が妨害のない発呼側に到達する可能性がある
ためである。
【0045】エコーの減衰の制御から雑音の低減化の制
御を分離することは適切である。それは、雑音およびエ
コーは、お互いに無関係に発生し、典型的に全く異なる
物理的な影響が原因でもあるからである。しかし、通常
の低減化関数Rは、数学的に生成することができ、これ
は、雑音とエコーの両方に対する信号レベルの減衰を記
述する。すなわち、 R(S、N、ES、τ、ERL、thrs)〜g(S
/N)・d(ES、τ、ERL、thrs) ここで、g(S/N)は、前述の雑音の低減化で、
d(...)は、推定されるエコー信号が所定の閾値t
hrsを超えるとき、さらに別個に発生するエコーの減
衰を指している。
【0046】エコーの低減化の時間中に、人工雑音信号
が有用な信号に追加される方法の一変形形態には、特に
利点がある。
【0047】一定の雑音レベルでは、雑音の減衰も一定
である。音声のリズムで突然に付加的なエコーの低減化
が発生するならば、音声リズムで雑音の減衰(少なくと
も短時間のセグメントで)も生じることになる。このこ
とで、自然に聞こえない背景雑音がプラスされることに
なる。したがって、付加的なエコーの低減化が発生する
時に、通常の背景雑音とほぼ同じ大きさの適切な雑音発
生器からの合成雑音を、処理される信号に加えることに
は利点がある。このことで、聞き手に対する背景雑音が
可能な限り一定になる。
【0048】雑音発生器は、人工雑音信号が快いと音響
心理的に知覚される音響信号シーケンス(心地よい雑
音)を備えるように設計することができる。
【0049】しかし、合成による背景雑音の代わりに、
適切な強さでその前に発生している実際の背景雑音の1
区分を、エコー時間のセグメントの際に取り入れること
ができる。そのとき、追加される雑音は、その前の雑音
とは事実上差異はなく、したがって聞き手には歪んでい
るような音響的な変化がないことになる。
【0050】音響的マスキングの効果に雑音を加えるこ
と、ならびに雑音およびエコーの個別処理に対する処置
が、互いに正確にマッチングするとき、「難しい(エコ
ーに加えて雑音がある)」環境でさえ、音声の印象が快
いものとなる。
【0051】伝送される有用な信号がスペクトルサブト
ラクションによって決まる本発明による方法の一変形形
態も特に好ましい。音声休止中のその次のレベルの減衰
を伴うスペクトルサブトラクションの利点は、最初に、
スペクトルサブトラクションで歪んでいる雑音の一部
が、音声信号自体から除去され、この後にのみ、音声の
休止に、述べた仕方の雑音およびエコーがないことであ
る。主観的なテストでは、総括的にこの組み合わせで、
スペクトルサブトラクション単独よりもより良い聴取印
象になった。
【0052】結局、本発明による方法の他の特に利点の
ある一変形形態は、伝送される有用な信号が、人間の聞
き取り感覚に適合するように構成されたスペクトルフィ
ルタリングで決まることを定めている。ここでも、スペ
クトルサブトラクションで、雑音、音声、エコーの推定
が最初に実行され、ついで聴覚に適するマスキング閾値
が決定され、ついで音声部分には可能な限り歪みをなく
し、エコーおよび雑音部分が可能な限り大幅に圧縮され
るように、適切に調整された信号全体が伝送フィルタで
処理される。
【0053】無音区間のその次のレベルの減衰の組み合
わせで、聴取印象が一層さらに改善される。
【0054】本発明の範囲には、上述した本発明による
方法をサポートするサーバユニット、および本方法を実
装するためのコンピュータプログラムも含まれる。本方
法は、ハードウェア回路とコンピュータプログラムの形
式の両方で実現することができる。強力なDSP用の最
近のソフトウェアプログラミングが好ましく、それは新
しい知識および付加的な機能を、現存のハードウェアベ
ースでソフトウェアを変更することでより容易に実装す
ることができるからである。しかし、プロセスはハード
ウェアモジュール、例えばTK端末または電話としても
実装することができる。
【0055】本発明の他の利点は、記述および図面で明
らかになる。同様に先に述べた特徴、およびそれに続い
て示したあらゆるものは、各ケースで、単独でまたはあ
らゆる組み合わせていくつかを一緒に適用することがで
きる。示し、述べた実施形態は、限定的にではなく、む
しろ本発明を例示する例として理解されるべきである。
【0056】本発明が図面で例示され、例示実施形態に
関連してより詳細が説明されることになる。
【0057】
【発明の実施の形態】時間tおよびサンプル番号kの関
数として図1に示されている制御信号aは、音声信号
が検出される最初の区間T1の間、値c=1が保持さ
れる。時間セグメントT2の無音区間で、制御信号a
は、0よりわずかに大きい定数cに減少し、ついで音
声信号が区間T3の間に再開するとき、再び値c=1
(または幾分かほかの自由に選択可能な定数)に急激に
増加する。結果的に、音声区間T1およびT3の間、信
号全体において、歪んでいる信号の圧縮はなく(または
他の例ではわずかに)なり、その結果、音声信号は、可
能な限り変更なしで、妨害なく伝送される。区間T2の
無音区間で、エコーおよび雑音信号の最も効果的な圧縮
が、可能な限り迅速に(指数的に)実装されるが、本例
では、これらは0ではなくて、わずかな残留値cに減
衰することで、反対側で回線が「使用できない」という
印象を作り出すことを回避することができる。エコーが
発生するとき、減衰低下が c<c の残余値まで行われる。
【0058】図2は、無音区間検出器があり、上述の低
減化関数R(S、N、ES、τ、ERL、thrs)
に対応する雑音およびエコーの低減化のための仕組みの
機能上の方法を図で示したものである。
【0059】図3aから4bで示しているすべての曲線
について、S/N<0dB、すなわち背景雑音がとりわ
け大きいケースに対する関数値gまたはg’が、ほぼ6
dBに等しい雑音低減化の定数gに変更される。S/
N=0dBから開始して、信号対雑音の比率S/Nが徐
々に改善されるにつれ、雑音の低減化は増大して、S/
Nが約12dBで、最大gmax≒25dBにまで達す
る。S/N比がさらに増大する場合、雑音の低減化の程
度は、わすかな背景雑音が存在するときのために最終的
にゼロの方向に向かい、伝送される有用な信号に少しの
操作が行われることになる。
【図面の簡単な説明】
【図1】音声信号が存在するとき、無音区間、音声信号
が再開するときの制御信号aを示す図である。
【図2】制御される信号減衰のための仕組みのスキーマ
を示す図である。
【図3a】線形近似値の関数g(S/N)を示す図であ
る。
【図3b】対応する関数g’(N/S)を示す図であ
る。
【図4a】ねじれた鐘状の曲線の関数g(S/N)を示
す図である。
【図4b】対応する関数g’(N/S)を示す図であ
る。
【符号の説明】
T1、T3 音声区間 T2 無音区間 N 雑音 S 信号 E エコー ES 話す側から反対の方向への有用な信号 τ エコー信号の一定の遅延 ERL エコー信号振幅の減衰定数 SPD 無音検出器 S/N 信号対雑音の比率
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ミヒヤエル・マウラー ドイツ国、71336・バイブリンゲン、イ ム・ライズガー・28

Claims (23)

    【特許請求の範囲】
  1. 【請求項1】 有用な音響信号、特に人間の音声を伝送
    するために、通信システムにおいてエコーおよび/また
    は雑音信号を低減化する方法であり、 有用な信号および干渉信号の混合が音声信号を含有する
    とき、または、無音区間が存在するときを、無音検出に
    よって判定を行うステップと、 2入力乗算器を使用することで、有用な信号の振幅を変
    動させるステップとを含む方法であり、 有用な信号が、時間依存制御信号a(t)またはサン
    プリングレートf=1/Tでクロックされた制御信号
    (k)に応じて、一般にエコーおよび/または雑音
    信号によって妨害され、k∈Νが、サンプルの数を示
    し、Tが、1つのサンプルから次のサンプルまでの時間
    を示す方法であって、 有用な信号中に音声信号が存在する場合に、制御信号a
    (t)またはa(k)の振幅が、一定の所定振幅値
    に設定され、有用な信号の無音区間の初めから、制
    御信号a(t)またはa(k)の振幅が、漸化式 a(k+1)=a(k)・β、 β<1 に従って1つのサンプルから次のサンプルへと継続的に
    減衰し、無音区間の終了後、a(k)が、cに等し
    く設定されるように、制御信号a(t)またはa
    (k)が、変動することを特徴とする方法。
  2. 【請求項2】 係数βが、サンプリングレートf、時
    定数τ、事前定義された一定の係数cから、関係式 β=c・exp(−1/τ) に従って求められることを特徴とする請求項1に記載の
    方法。
  3. 【請求項3】 時定数τが、50msから150ms
    の間、好ましくはτ ≒65msになるように選択され
    ることを特徴とする請求項2に記載の方法。
  4. 【請求項4】 定数値cが、1と等しくなるように選
    択されることを特徴とする請求項1から3のいずれか一
    項に記載の方法。
  5. 【請求項5】 先行する値a(k)が、cより小さ
    いまたは等しくなった場合、無音区間および/またはエ
    コー信号の存在部分では、a(k+1)が、事前定義
    された定数値cであると推定することを特徴とする請
    求項1から4のいずれか一項に記載の方法。
  6. 【請求項6】 cを事前定義された定数とすると、無
    音区間および/またはエコー信号の存在部分で、a
    (k)≦cであるために、目下使用されている通話
    チャンネルの雑音レベルNの電力値が、継続的に測定お
    よび/または推定されることと、 f(N)をNの所定の関数とすると、目下の雑音レベル
    Nに応じて、制御信号a(k+1)が、継続的にa
    (k+1)=f(N)に従って、調整されることとを特
    徴とする請求項1から4のいずれか一項に記載の方法。
  7. 【請求項7】 所与の関数f(N)が、伝送される有用
    な信号の信号レベルSの電力値と雑音レベルNの電力値
    との比率S/Nに応じる関数g(S/N)であること、
    または、所与の関数f(N)が、前記比率の逆数に応ず
    る関数g’(N/S)であることを特徴とする請求項6
    に記載の方法。
  8. 【請求項8】 1/N<<1またはS/N=0dBの場
    合、関数f(N)またはg(S/N)が、それぞれ定数
    値f>0またはg>0で開始し、NまたはS/N=
    10dBから15dBの間で、好ましくはNまたはS/
    N≒12dBで、それぞれ範囲の最大fmaxまたはg
    maxに上昇し、それぞれ最小値f inまたはg
    minに、好ましくは0dBに減少し、 ここで、5dB≦f、g≦10dB、好ましくは、
    6dB≦f、g≦8dbであり、20dB≦f
    max、gmax≦30dB、好ましくは、fma
    max=25dBであることを特徴とする請求項7に
    記載の方法。
  9. 【請求項9】 関数f(N)またはg(S/N)が、少
    なくとも部分的に、好ましくはすべての部分で、線形的
    であることを特徴とする請求項6から8のいずれか一項
    に記載の方法。
  10. 【請求項10】 関数f(N)またはg(S/N)
    が、多項式から構成され、ねじれた鐘状の関数の曲線で
    あることを特徴とする請求項6から8のいずれか一項に
    記載の方法。
  11. 【請求項11】 雑音レベルNの低減化が、人間の耳に
    よって聴取可能なスペクトルの音響心理学的平均値に従
    って、聴覚的に補償されるように、関数f(N)および
    g(S/N)またはg’(N/S)が、選択されること
    を特徴とする請求項6から10のいずれか一項に記載の
    方法。
  12. 【請求項12】 雑音出力の認識および低減化に加え
    て、エコー信号の存在が、検出および/または予測さ
    れ、エコー信号が、圧縮および減衰されることを特徴と
    する請求項1から11のいずれか一項に記載の方法。
  13. 【請求項13】 制御信号a(k+1)が、a(k
    +1)=h(N、S、ES、τ、ERL)に従って継
    続的に調整され、 ここで、h(N、S、ES、τ、ERL)が、雑音レ
    ベルNの所定の関数、信号レベルS、話す側から反対の
    方向への有用な信号ES、エコー信号の一定の遅延
    τ、エコー信号振幅の減衰定数ERLであることを特
    徴とする請求項6から12のいずれか一項に記載の方
    法。
  14. 【請求項14】 雑音信号の低減化とエコー信号の低減
    化が、別々に制御されることを特徴とする請求項12に
    記載の方法。
  15. 【請求項15】 エコーの低減化の時間中に、人工雑音
    信号が、有用な信号に追加されることを特徴とする請求
    項12から14のいずれか一項に記載の方法。
  16. 【請求項16】 人工雑音信号が、快いと音響心理的に
    知覚される音響信号シーケンス、すなわち心地よい雑音
    を備えることを特徴とする請求項15に記載の方法。
  17. 【請求項17】 人工雑音信号が、目下の通話の際に事
    前に記録された雑音信号を備えることを特徴とする請求
    項15に記載の方法。
  18. 【請求項18】 無音検出器(SPD)で、短時間出力
    信号sam(x)、中時間出力信号mam(x)、長時
    間出力信号lam(x)が、それぞれ短時間レベル推定
    器、中時間レベル推定器、長時間レベル推定器によって
    形成されることと、 入力信号xが純然たる雑音信号のとき、sam(x)<
    mam(x)<lam(x)であるが、大きさにおいて
    ほぼ等しくなる適当な増幅率によって、3つの出力信
    号、sam(x)、mam(x)、lam(x)が調整
    が行われることと、 3つの出力信号、sam(x)、mam(x)、lam
    (x)が、比較器により監視されることと、 sam(x)とmam(x)の両方が、最初、lam
    (x)よりも大きくなるとき、入力信号xとして音声信
    号があると見なされ、一方sam(x)および/または
    mam(x)が、lam(x)よりも小さくなるとき
    は、無音区間があると見なされることとを特徴とする請
    求項1から17のいずれか一項に記載の方法。
  19. 【請求項19】 無音区間の推定のために、3つの出力
    信号、sam(x)、mam(x)、lam(x)が、
    様々な入力信号xを持つ複数のシナリオで訓練されたニ
    ューラルネットワークに送ることを特徴とする請求項1
    8に記載の方法。
  20. 【請求項20】 伝送される有用な信号が、スペクトル
    サブトラクションによって決まることを特徴とする請求
    項1から19のいずれか一項に記載の方法。
  21. 【請求項21】 伝送される有用な信号が、人間の聞き
    取り感覚に適合するように構成されたスペクトルフィル
    タリングで決まることを特徴とする請求項1から20の
    いずれか一項に記載の方法。
  22. 【請求項22】 請求項1から21のいずれか一項に記
    載の方法をサポートするサーバユニット。
  23. 【請求項23】 請求項1から21のいずれか一項に記
    載の方法を実行するコンピュータプログラム。
JP2000349077A 1999-11-27 2000-11-16 無音区間の指数的なエコーおよび雑音の低減化 Withdrawn JP2001202100A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE19957221.6 1999-11-27
DE19957221A DE19957221A1 (de) 1999-11-27 1999-11-27 Exponentielle Echo- und Geräuschabsenkung in Sprachpausen

Publications (1)

Publication Number Publication Date
JP2001202100A true JP2001202100A (ja) 2001-07-27

Family

ID=7930611

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000349077A Withdrawn JP2001202100A (ja) 1999-11-27 2000-11-16 無音区間の指数的なエコーおよび雑音の低減化

Country Status (6)

Country Link
US (1) US6999920B1 (ja)
EP (1) EP1103956B1 (ja)
JP (1) JP2001202100A (ja)
KR (1) KR20010051980A (ja)
AT (1) ATE297590T1 (ja)
DE (2) DE19957221A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006279684A (ja) * 2005-03-30 2006-10-12 Roland Corp ハウリング防止装置
US7698133B2 (en) 2004-12-10 2010-04-13 International Business Machines Corporation Noise reduction device

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10030926A1 (de) * 2000-06-24 2002-01-03 Alcatel Sa Störsignalabhängige adaptive Echounterdrückung
US7428223B2 (en) * 2001-09-26 2008-09-23 Siemens Corporation Method for background noise reduction and performance improvement in voice conferencing over packetized networks
DE10150519B4 (de) * 2001-10-12 2014-01-09 Hewlett-Packard Development Co., L.P. Verfahren und Anordnung zur Sprachverarbeitung
US7158572B2 (en) * 2002-02-14 2007-01-02 Tellabs Operations, Inc. Audio enhancement communication techniques
DE10216322B4 (de) * 2002-04-13 2004-07-15 Güttler, Gerhard, Prof. Dr. Stimmenkonverter
US7366295B2 (en) * 2003-08-14 2008-04-29 John David Patton Telephone signal generator and methods and devices using the same
US8394114B2 (en) * 2003-09-26 2013-03-12 Medtronic, Inc. Surgical connection apparatus and methods
US20060104460A1 (en) * 2004-11-18 2006-05-18 Motorola, Inc. Adaptive time-based noise suppression
US7599357B1 (en) * 2004-12-14 2009-10-06 At&T Corp. Method and apparatus for detecting and correcting electrical interference in a conference call
US7599719B2 (en) 2005-02-14 2009-10-06 John D. Patton Telephone and telephone accessory signal generator and methods and devices using the same
JP5065913B2 (ja) 2005-02-16 2012-11-07 株式会社日立ハイテクノロジーズ キャピラリ照明における屈折率整合
US8509450B2 (en) * 2010-08-23 2013-08-13 Cambridge Silicon Radio Limited Dynamic audibility enhancement
KR102413692B1 (ko) 2015-07-24 2022-06-27 삼성전자주식회사 음성 인식을 위한 음향 점수 계산 장치 및 방법, 음성 인식 장치 및 방법, 전자 장치
KR102192678B1 (ko) 2015-10-16 2020-12-17 삼성전자주식회사 음향 모델 입력 데이터의 정규화 장치 및 방법과, 음성 인식 장치
GB2551499B (en) * 2016-06-17 2021-05-12 Toshiba Kk A speech processing system and speech processing method
CN107274909A (zh) * 2017-06-16 2017-10-20 深圳市华域无线技术股份有限公司 一种语音识别中的主动式本机音频消除方法
CN111128213B (zh) * 2019-12-10 2022-09-27 展讯通信(上海)有限公司 一种分频段进行处理的噪声抑制方法及其系统

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US786760A (en) * 1904-06-15 1905-04-04 Hartshorn Bros Couch.
NL8000361A (nl) * 1980-01-21 1981-08-17 Philips Nv Inrichting en werkwijze voor het opwekken van een spraaksignaal.
JPS57212831A (en) * 1981-06-24 1982-12-27 Kokusai Denshin Denwa Co Ltd <Kdd> Echo controlling system
US4630304A (en) * 1985-07-01 1986-12-16 Motorola, Inc. Automatic background noise estimator for a noise suppression system
JP3080641B2 (ja) * 1990-07-24 2000-08-28 株式会社東芝 エコーキャンセラ
US5369711A (en) * 1990-08-31 1994-11-29 Bellsouth Corporation Automatic gain control for a headset
US5537509A (en) * 1990-12-06 1996-07-16 Hughes Electronics Comfort noise generation for digital communication systems
DE4229912A1 (de) * 1992-09-08 1994-03-10 Sel Alcatel Ag Verfahren zum Verbessern der Übertragungseigenschaften einer elektroakustischen Anlage
US5533133A (en) * 1993-03-26 1996-07-02 Hughes Aircraft Company Noise suppression in digital voice communications systems
JP3152171B2 (ja) * 1997-06-16 2001-04-03 日本電気株式会社 適応フィルタ及びステップサイズ制御方法及びプログラムを記録した記録媒体
US6549587B1 (en) * 1999-09-20 2003-04-15 Broadcom Corporation Voice and data exchange over a packet based network with timing recovery

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7698133B2 (en) 2004-12-10 2010-04-13 International Business Machines Corporation Noise reduction device
JP2006279684A (ja) * 2005-03-30 2006-10-12 Roland Corp ハウリング防止装置
JP4562573B2 (ja) * 2005-03-30 2010-10-13 ローランド株式会社 ハウリング防止装置

Also Published As

Publication number Publication date
EP1103956A3 (de) 2001-12-05
KR20010051980A (ko) 2001-06-25
ATE297590T1 (de) 2005-06-15
EP1103956A2 (de) 2001-05-30
US6999920B1 (en) 2006-02-14
DE50010504D1 (de) 2005-07-14
DE19957221A1 (de) 2001-05-31
EP1103956B1 (de) 2005-06-08

Similar Documents

Publication Publication Date Title
JP2001202100A (ja) 無音区間の指数的なエコーおよび雑音の低減化
US9361901B2 (en) Integrated speech intelligibility enhancement system and acoustic echo canceller
CA2527461C (en) Reverberation estimation and suppression system
US6801889B2 (en) Time-domain noise suppression
US20050018862A1 (en) Digital signal processing system and method for a telephony interface apparatus
JPH09503590A (ja) 会話の品質向上のための背景雑音の低減
Premananda et al. Speech enhancement algorithm to reduce the effect of background noise in mobile phones
US9837064B1 (en) Generating spectrally shaped sound signal based on sensitivity of human hearing and background noise level
JP4376793B2 (ja) 特に電話におけるエコーを抑制するための装置および方法
JP2001251652A (ja) エコーおよび/またはノイズを協働して低減するための方法
KR100742140B1 (ko) 이동전화 스피커와 마이크로폰 이득을 자동으로 조정하는방법 및 장치
EP3830823B1 (en) Forced gap insertion for pervasive listening
CN114303188A (zh) 针对机器感知预调节音频
RU2589298C1 (ru) Способ повышения разборчивости и информативности звуковых сигналов в шумовой обстановке
JPH09311696A (ja) 自動利得調整装置
US20020012429A1 (en) Interference-signal-dependent adaptive echo suppression
JP2001222299A (ja) 現行雑音レベルに適応した雑音抑圧
CA2394370A1 (en) Echo canceller in a communication system at a terminal
Gierlich et al. Background Noise Transmission and Comfort Noise Insertion: The Influence of Signal Processing on" Speech"-Quality in Complex Telecommunication Scenarios
AU2002318963B2 (en) Digital signal processing system and method for a telephony interface apparatus
Daniel et al. An experimental framework for the derivation of perceptually-optimal noise suppression functions
CN116547751A (zh) 针对遍布式聆听插入强制间隙
Gierlich et al. Conversational speech quality-the dominating parameters in VoIP systems
CN116547753A (zh) 机器学习辅助的空间噪声估计和抑制
Premananda et al. Dominant frequency enhancement of speech signal to improve intelligibility and quality

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20080205