JPH10513273A - スペクトル減算雑音抑止方法 - Google Patents

スペクトル減算雑音抑止方法

Info

Publication number
JPH10513273A
JPH10513273A JP8523454A JP52345496A JPH10513273A JP H10513273 A JPH10513273 A JP H10513273A JP 8523454 A JP8523454 A JP 8523454A JP 52345496 A JP52345496 A JP 52345496A JP H10513273 A JPH10513273 A JP H10513273A
Authority
JP
Japan
Prior art keywords
frame
noise
speech
psd
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
JP8523454A
Other languages
English (en)
Inventor
ペテル ハンデル
Original Assignee
テレフオンアクチーボラゲツト エル エム エリクソン
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テレフオンアクチーボラゲツト エル エム エリクソン filed Critical テレフオンアクチーボラゲツト エル エム エリクソン
Publication of JPH10513273A publication Critical patent/JPH10513273A/ja
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02168Noise filtering characterised by the method used for estimating noise the estimation exclusively taking place during speech pauses
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques

Abstract

(57)【要約】 フレーム・ベースのディジタル通信装置のスペクトル減算雑音抑止方法が記載されている。各フレームは所定数Nの音声サンプルを含み、これにより各フレームはN自由度を与える。本方法は、非音声フレームの背景雑音のパワー・スペク より実行される。各音声フレームは、自由度数をN以下に減少させるパラメータ・モデルにより近似される(120)。各音声フレームのパワー・スペクトル密

Description

【発明の詳細な説明】 スペクトル減算雑音抑止方法 技術分野 本発明はディジタル・フレームをベースにした通信システムの雑音抑止に関係 し、特にこのようなシステムのスペクトル減算雑音抑止に関係する。 発明の背景 音声信号処理の共通な問題は、その雑音測定からの音声信号の強化である。信 号チャネル(マイクロフォン)測定を基にした音声強化の1つの方法は、スペク トル減算技術[1]、[2]を適用した周波数領域でのフィルタ操作である。背景雑音 は長時間にわたって定常である(音声と比較して)という仮定のもとに、背景雑 音のモデルが音声活動のない時間間隔の間に通常評価される。次いで、音声活動 のあるデータ・フレームの間で、音声を強化するためこの評価雑音モデルが雑音 音声の評価モデルと共に使用される。スペクトル減算技術では、これらのモデル は古典的なFFT方法を使用して評価されるパワー・スペクトル密度(PSD) により伝統的に与えられる。 上述の技術のどれも、移動電話応用面での満足できる音声品質、すなわち、 1.ひずみのない音声出力 2.雑音レベルの十分な減少 3.うるさい人工音のない残留雑音 の出力信号を基本形式では提供出来ない。 特に、スペクトル減算方法は2を満足すると1を犯し、1を満足すると2を犯す ことが知られている。加えて、この方法はいわゆる音楽雑音を導入するため多く の場合で3が多かれ少なかれ犯されている。 スペクトル減算方法の上記の欠点は公知であり、文献には、特定の音声対雑音 シナリオに対して基本アルゴリズムのいくつかの特別な修正が出現している。し かしながら、一般的なシナリオで1−3を満足するスペクトル減算方法をいかに 設計するかという問題はいまだに未解決である。 雑音データから音声を強化する困難を強調するため、音声減算方法は入力デー タの評価モデルを使用したフィルタ操作をもとにしている事に注意されたい。こ の評価モデルが下にある「真の」モデルに近い場合、これは良好に動作する方法 である。しかしながら、音声の短時間定常性(10−40ms)と共に移動電話 応用面を取り囲む物理的真実(8000Hzのサンプリング周波数、雑音の0.5- 2.0 s定常性、等)のため、評価モデルは下にある真実から相当に異なりやすく 、従って、聴覚品質の低いフィルタ出力を生じる。 EP,A1,0 588 526 は高速フーリエ変換(FFT)又は線形予測コーディング( LPC)のどちらかによりスペクトル分析を実行する方法を記述している。 発明の要旨 本発明の目的は聴覚品質を犠牲にすることなく良好な雑音抑止を与えるスペク トル減算雑音抑止方法を提供することである。 この目的は特許請求の範囲第1 項の特徴により解決される。 図面の簡単な説明 本発明は、その更なる目的と利点と共に、以下の添付図面と共に行われる以下 の説明を参照して最も良く理解出来る。 図1は本発明の方法を実行するのに適したスペクトル減算雑音抑止装置のブロ ック線図である。 図2は図1の装置で使用される音声活動検出器(VAD)の状態線図である。 図3は音声フレームの2つの異なるパワー・スペクトル密度評価の線図である 。 図4は音声と背景雑音を含むサンプルした音声信号の時間線図である。 図5は従来技術によるスペクトル雑音抑止後の図3の信号の時間線図である。 図6は本発明によるスペクトル雑音抑止後の図3の信号の時間線図である。 図7は本発明の方法を図示する流れ図である。 望ましい実施例の詳細な説明 スペクトル減算技術 余分な雑音により劣化した音声のフレームを考える。 x(k)=s(k)+v(k) k=1,...,N (1) ここでx(k)、s(k)、v(k)は各々音声の雑音測定、音声及び雑音を表わし、Nはフ レーム中のサンプル数を表わす。 音声はフレームを通して定常であると仮定し、一方雑音は長期定常、すなわち いくつかのフレームにわたって定常であるものとする。v(k)が定常であるフレー ム数はτ≫1により表わされる。更に、音声活動は充分低いものと仮定し、従っ て雑音のモデルは音声活動のない期間に正確に評価可能であるものとする。 測定、音声、雑音のパワー・スペクトル密度(PSD)を各々Φx(ω)、Φ s(ω)、Φv(ω)で表わすと、 Φx(ω)=Φs(ω)+Φv(ω) (2) Φx(ω)とΦv(ω)が解ると、以下で簡単に復習する標準的なスペクトル減算方法 [2]参照、を用いて量Φs(ω)とs(k)が評価可能である。 ここでF(・)は何らかの線形変換、例えば離散フーリエ変換(DFT)を表わし 、H(ω)はω∈(0,2π)で実値偶関数で、0≦H(ω)≦1である。関数H( ω)はΦx(ω)とΦv(ω)に依存する。H(ω)は実値であるため、位相S (ω)=H(ω)X(ω)は劣化した音声の位相に等しい。実値H(ω)の使用は 人間の耳が位相の歪みに鈍いことからきている。 りH(ω)で置き換えられなければならない。音声の非定常性から、Φx(ω)は 単一フレームのデータから評価され、Φv(ω)は音声のないτフレームのデータ を使用して評価される。簡単のため、雑音の入った音声を含むフレームと雑音の みを含むフレームとを区別するために音声活動検出器(VAD)が利用可能であ るものとする。Φv(ω)は数フレームを通して平均化することにより音声のない 活動時に例えば以下を用いて評価される、 ある。スカラρ∈(0、1)はv(k)の仮定した定常性に関連して調整される。 τフレームの平均は大体次式で暗黙に与えられるρに対応する、 適切なPSD評価(背景雑音のスペクトル形に何ら先験的な仮定がないものとす る)は、 ここで「*」は複素共役を表わし、V(ω)=F(v(k))である。F(・)=FFT るバイアスのないPSD評価に漸近的に(N≫1)近づく、 本発明の方法を実行するのに適したスペクトル減算雑音抑止装置は図1にブロ ック形式で図示してある。マイクロフォン10から音声信号x(t)がA/D変換器 12に送られる。A/D変換器12はフレーム形式{x(k)}のディジタル化され た音声サンプルを変換ブロック14、例えばFFT(高速フーリエ変換)ブロック へ送り、このブロックは各フレームを対応する周波数変換フレーム{X(ω)} 換ブロック18により時間領域に変換される。結果は、雑音が抑止されたフレー エンコーダに送られる。音声コード化信号は次いで送信用のチャネル・エンコー ダと変調器に送られる(これらの要素は図示されていない)。 PSD評価器24で形成され、これらの評価の解析式が使用される。異なる式の 例が次の節の表2に与えられている。以下の説明の主要部分は入力フレーム PSD評価器24は音声活動検出器(VAD)26により制御され、これは入 力フレーム{x(k)}を使用してフレームが音声(S)又は背景雑音(B)のどちらを含 んでいるかを決定する。適当なVAD は[5]、[6]に説明されている。VAD は図2に図示する4状態を有するステート・マシンとして実装される。生成した 制御信号S/BはPSD評価器24に送られる。VAD26が音声(S)、状態 VAD26が非音声活動(B)、状態20、を指示している時、PSD評価器24 信号S/Bはまた音声減算ブロック16へも送られる。このようにしてブロッ ク16は音声及び非音声フレーム時に異なるフィルタを適用する。音声フレーム 声レベルと同じレベルまで減少させる定数H(0≦H≦1)である。このように して、認識雑音レベルは音声及び非音声フレームの両方の期間で同じになる。 式に従って後フィルタされる、 ることを意味している。 更に、信号S/Bは又音声エンコーダ22へも送られる。これにより音声と背 景音とで異なるコード化が可能となる。 PSD誤差解析 s(k)とv(k)に課された定常性の仮定が、雑音のない音声信号s(k)と比較して評 減算方法の解析技術を紹介する。これは、導入された偏差の精度に対する近似 式参照)の第1次近似をもとにしている。正確には、以下で、使用した方法(伝 達関数H(ω)の選択)により、又関係するPSD評価器の精度により、評価信号 SD誤差を以下で定義されるように考えるのが適当である、 ここで 差(周波数領域)を記述する誤差項であることに注意されたい。それゆえ、 択の要約は表2に与えられている。 定義により、H(ω)は区間0≦H(ω)≦1に属すが、これは表2の対応す る評価量には必ずしも真ではなく、それ故、実際には半波又は全波整流[1]を使 用する。 ここでΔx(ω)とΔv(ω)はE[Δx(ω)/Φx(ω)]2≪1とE[Δv(ω)/Φv(ω)]2 ≪1となるような0次のスタカスティック変数である。ここ及び以下の文章中で 記号E[・]は統計期待値を表わす。更に、雑音の相関時間がフレーム長に比べ て短い場合、1≠kに対して Δx(ω)とΔv(ω)が近似的に独立であることを意味している。そうでない場合、 雑音が強く相関している場合、Φv(ω)は周波数ω1、... 、ωnにある限定さ れた(≪N)数の(強大な)ピークを有しているものと仮定する。この時ω≠ω j j=1、... 、nと1≠kに対して ω≠ωj j=1、... 、nに対しても解析は成立する。 式(11)はペリオドグラムまたは平均化ペリオドグラムのような漸近的(N≫1) バイアスのないPSD評価器を使用したことを意味している。しかしながら、ブ ラックマン・ターキーPSD評価器のような漸近的にバイアスのあるPSD評価 器を使用して、(11)を以下と置き換えて同様の解析が成立する、 かつ ここで、Bx(ω)とBv(ω)はPSD評価器の漸近的バイアスを記述する決 定項である。 の完全な導出が次の節で与えられる。表1の他のスペクトル減算方法の同様な導 出は付録A−Gに与えられている。 (10)式と表2 からのHPS(ω)を(9)に代入し、テーラー級数展開 Δx(ω)とΔv(ω)は0 次スタカスティック変数である。従って、 そして 更に続けるため、一般的結果、すなわち、ある(多分周波数独立)変数γ(ω) する、 そして そして そして 析される)以下を与える: そして 共通の特徴 に依存することに注意されたい。例えば、Φv(ω)の平均化ペリオドグラムに対 しては、上記のバリアンス式に現れるγ=γx+γvの主要項はγxで、従って 、主要誤差源は雑音音声をもとにした単一フレームPSD評価である。 以上の事実から、スペクトル減算技術を改良するためには、γxの値を減少す ること(適切なPSD評価器を選択すること、すなわち可能な限り高性能の近似 的にバイアスのない評価器であること)と、「良好な」スペクトル減算技術を選 は、音声束の物理モデルを使用してγxの値を減少可能な点である(自由度数を N(フレーム中のサンプル数)からNより少ない値に減少させる)。s(k)は自動 ることは公知である。これが次の2節の主題である。 音声ARモデル 本発明の望ましい実施例では、s(k)は自動回帰(AR)仮定としてモデル化さ れる、 ここでA(q-1)は後方シフト演算子(q-1w(k)=w(k-1)等)のモーニック(先 頭係数が1)p次多項式で、 19w(k)はバリアンスσ2 wの白色零平均雑音である。一目見たところでは、AR モデルのみを考えるのは制限的であるように見える。しかしながら、音声モデル 化用にARモデルを使用することは、音声束の物理的モデル化から、そしてここ では更に重要なことであるが、評価モデルの精度について雑音音声からの物理的 制限の両方から動機付けられている。 音声信号処理では、フレーム長Nは、バリアンスを減少させ、さらにPSD評 価器の無バイアス性を保存するためフレーム内での平均化技術の適用を可能とす るのに充分大きくない。従って、例示式(12)の第1 項の効果を減少させるため音 声束の物理的モデル化が使用される。AR構造(17)がs(k)に課される。正確には 、 加えて、Φv(ω)もパラメータ・モデルにより記述される、 ここでB(q-1)、とC(q-1)は各々q次とr次の多項式で、(18)のA(q-1 ) と同様に定義される。簡単のため、(20)のパラメータ・モデルを以下の議論で使 用し、パラメータ・モデルのオーダーを評価する。しかしながら、他のモデルの 背景雑音も又可能であることを認識されたい。(19)と(20)を組み合せると、 より与えられる、 音声パラメータ評価 (17)-(18)のパラメータの評価は他の雑音が存在しない時には直接的である。 雑音のない場合には、(22)の右側の第2 項は消滅し、従って(21)は零極キャンセ ル後に(17)となる。 ここで、自動回帰方法をもとにしたPSD評価器を捜索する。この動機は4 項 目である。 ・自動相関方法は公知である。特に、評価パラメータは最小位相で、生成したフ ィルタの安定性を保証する。 ・レビンソン・アルゴリズムを使用し、方法は容易に実装でき、コンピュータの 複雑度は低い。 ・最適化処理は非線型最適化であり、何らかの初期化処理を陽的に必要とする。 自動相関方法は何も必要としない。 ・実用的な観点からは、劣化した音声と利用可能な時には各きれいな音声に同じ 評価処理を使用可能である場合が望ましい。言い換えると、評価方法は実際の動 作シナリオとは独立、すなわち音声対雑音比と独立であるべきである。 ARMAモデル((21)式のような)は無限次AR過程によりモデル化されるこ とは公知である。パラメータ評価用に有限数のデータが利用可能な場合、無限次 ARモデルは切り捨てられなければならない。ここで使用したモデルは、 立する。近似モデル(23)はそのPSDが近似的に等しい場合、雑音過程の音声に 近い、すなわち 音声束の物理的モデル化をもとにすると、p=deg(A(q-1))=10と考えるのが rが成立し、ここでp+rはΦx(ω)のピーク数と大体等しい。反対に、AR モデルを使用して雑音性の狭い帯域処理をモデル化するには、信頼出来るPSD 法はN≫100の時に実り多いことが期待できる。また、(22)から雑音スペクト ルをより平らにするにはNの小さな値を可能にすることが結論づけられる。pが 十分大きくなくとも、パラメータ的な方法はまともな結果を与えることが期待で きる。この理由は、パラメータ的な方法が、誤差バリアンスに関して、ペリオド グラムをもとにした方法より著しく正確なPSD評価を与え(典型的な例では、 バリアンスの比は1:8である、以下を参照)、これは出力のトーン雑音のよう な人工音を著しく減少させる。 パラメータPSD評価器は以下のように要約される。ARパラメータ{f1離散点)、 次いで、音声s(k)を強化するために表2の考えたスペクトル減算技術の内の一つ を使用する。 次に、パラメータPSD評価器のバリアンスの低次の近似(比パラメータ的な 方法に対して考えた(7)と同様)と、従って、雑音が白色であるという仮定の下 にs(k)のフーリエ級数展開を使用する。次いで、Φx(ω)の漸近的(データ数 れる、 である。 一例として、移動電話ハンドフリーな環境では、雑音は約0.5 sの間定常であ ると仮定するのが正当であり(8000Hzサンプリング速度でフレーム長N=256) 、 γx=1/8 となる。 図3は典型的な音声フレームに対するペリオドグラムPSD評価と本発明によ るパラメータPSD評価との間の差を図示する。この例では、N=256(256サン は対応するペリオドグラムPSD評価より非常に滑らかであることに注意された い。 図4は雑音背景での音声を含む5 秒間のサンプルされた音声信号を図示する。 図5は、高聴覚品質に優先度を与えたペリオドグラムPSD評価をもとにしたス ペクトル減算後の図4の信号を図示する。図6は本発明によるパラメータPSD 評価をもとにしたスペクトル減算後の図4の信号を図示する。 図5と図6を比較すると、著しい雑音抑止(10dBのオーダー)が本発明による 方法で得られる。(図1の説明に関連して上述したように、減少雑音レベルは音 声と非音声フレームの両方で同様である。)図6からは明らかでないその外の差 は、生成した音声信号が図5の音声信号より歪みが少ないことである。 全ての考えられる方法に対するPSD誤差のバイアスと誤差バリアンスに関す る理論的結果は表3に要約されている。 他の方法を選択することも可能である。適切な方法をいかに選択するかについ ては、少なくとも2つの基準が区別出来る。 法は低いバリアンスを有していることが望ましい。これは増大したバイアスなし では不可能であり、このバイアス項は、瞬間性低SNRで周波数域を抑止(増幅 しない)するためには、負の符号を有しなければならない(従って、(9)の である。 第2に、瞬間性高SNRに対しては、低い比率の音声歪みが望ましい。更にバ イアス項が主要な場合、これは正の符号を有しなければならない。ML、δPS 、PS、IPS及び(多分)WFが第1 の文章を満足する。バイアス項はMSE 式でMLとWFに対してのみ主要であり、バイアス項の符号はMLに対して正で 、WFに対しては負である。従って、ML、δPS、PS及びIPSがこの基準 を満足する。 アルゴリズム的な側面 この節では、図7を参照して本発明によるスペクトル減算方法の望ましい実施 例を説明する。 1.入力:x={x(k)|k=1、... 、N} 2.変数の設計 3.入力データの各フレームに対して実行する: (a)音声検出(段階110) VAD出力がst=21 又はst=22 に等しい場合変数Speechは真にセットされる 。st=20 の場合、Speechは偽にセットされる。VAD出力がst= 0に等しい場合 、アルゴリズムは再初期化されている。 (b)スペクトル評価 i 零平均調整入力データ{x(k)}に適用される自動相関方法を使用して、 (段階120) なければならない。最初に背景雑音に対して先験的な白色雑音過程を課している ことを意味する、例えば、0.25の因子、によりスケールされた第1フレームのペ えられる。 (b)スペクトル減算(段階150) ii 可能な後フィルタ操作、ミューティング、雑音下限調節。 iii (3)と零平均調節データ{x(k)}を使用して出力を計算。データ{x(k) }は実際のフレームの重なりに応じて窓操作される又はされない(非重なりフレ ームには矩形窓が使用され、50% 重なりにはハニング窓が使用される)。 以上の説明から、本発明は聴覚品質を犠牲にすることなく著しい雑音減少を実 施出来ることは明らかである。この改良は、音声と非音声フレームに使用される 別々のパワー・スペクトル評価方法により説明出来る。この方法は音声と非音声 (背景雑音)異なる特性を利用し、各パワー・スペクトル評価のバリアンスを最 小にする。 価方法、例えば各フレームの全てのNサンプルを使用する、FFTベースのペリ オドグラム評価により評価される。非音声フレームの全てのN自由度を保持する ことにより、広範囲の背景雑音がモデル化される。背景雑音は数フレームにわた って定常であると仮定しているため、いくつかの非音声フレームにわたってパワ パラメータ・パワー・スペクトル評価方法により評価される。この場合、音声フ レームの自由度数を(パラメータ・モデルのパラメータ数に)減少させるため音 声の特殊な特性が使用される。少ないパラメータをもとにしたモデルはパワー・ スペクトル評価のバリアンスを減少させる。音声はあるフレームでのみ定常であ ると仮定されるため、この方法は音声フレームに最適である。 添付の特許請求の範囲により定義される発明の要旨と範囲から逸脱することな く当業者により各種の修正と変更を本発明に加え得ることを理解すべきである。 付録A この第2の等式では、テーラー級数展開 更に、 (29)と(15)を組み合せて、 付録B この付録では、ウィーナー・フィルタ[2]をもとにした音声強化のPSD誤差 から導かれる。以下に注意して 計算によると、 (33)から、以下が導かれる。 及び 付録C 音声を未知の振幅と位相の決定論的波形により特徴づけると、最尤法(ML) スペクトル減算法は次式により定義される、 (11)を(36)に代入して、計算すると、 を使用した。これからPSD誤差を直截に計算出来る。(37)を(9)-(10)に代入し 、 (38)から、以下が成立する、 ここでは第2等式(2)を使用した。更に、 付録D 最後の等式には(2)を使用した。この場合、H(ω)は決定論的量であり、一方 この事実は一般に成り立たず、この節では、HPS(ω)の性能を改善するため データ独立な重み関数を導く。この目的のため、以下の形式のバリアンス式 を考える(PSに対してはξ=1でMSに対しては でγ=γx+γv)。変数γは使用したPSD評価方法にのみ依存し、伝達関数 の選択に依存する。この節では、 す、すなわち、 (42)で、G(ω)は一般的な重み関数である。更に続行する前に、重み関数G( ω)がデータ依存が可能な場合、一般的な範囲のスペクトル減算技術が発生し、 これは特殊な場合として多くの一般に使用される方法、例えば、 G(ω)による(42)の最適化はG(ω)の形式に非常に依存しているため、この 事実はしかしながら、殆ど興味がない。従って、データ依存重み関数を使用する 方法は、この場合一般的な結果が導かれないため一つづつ解析しなければならな い。 (42)を最小化するためには、直接的な計算により 2乗PSD誤差の期待値を取り、(41)を使用すると次式が与えられる、 式(44)はG(ω)の2次式で、解析的に最小化可能である。その結果は、 SDと変数γに依存する。上記したように、(45)中の未知PSDを対応する評価 と直接置き換えて、生成した修正PS方法が(42)を最小化する最適なものである 不確定性を考慮に入れて、修正PS方法は標準PSより「良好に」実行すると期 待できる。以上の考慮から、この修正PS方法は改良パワー減算(IPS)と表わ される。付録EでIPS法を解析する前に、以下の注意が必要である。 瞬間性高SNR(Φs(ω)/Φv(ω)≫1のようなω)に対しては、(45)から PSの性能に(非常に)近いと結論可能である。反対に、瞬間性低 そして ても、(46)-(47)は近似的にも正しいとは結論出来ない。 付録E 義されるものとし、そのΦv(ω)とΦx(ω)を対応する評価量により置き換える。 以下が示される、 これは(43)と比較可能である。明らかに、 そして 高SNRに対しては、Φs(ω)/Φv(ω)≫1であり、(49)-(50)に何らかの洞察が 得られる。この場合、以下が示される、 そして (51)と(52)の無視した項はO((Φv(ω)/Φs(ω))2)のオーダーである。従って、 既に記載したように、IPSの性能は高SNRではPSの性能と同様である。反 そして (53)-(54)を対応するPSの結果(13)と(16)と比較すると、瞬間性低SNRでは のバリアンスを著しく減少させる。明らかに、IPSとPSバリアンスの比は その間の比は9に等しいことに注意されたい。 付録F 最適減算因子δを有するPS パワー減算方法のしばしば考えられる修正は、以下を考える、 ここでδ(ω)は多分周波数依存関数である。特に、ある定数δ>1に対してδ (ω)=δであると、この方法は過剰減算のパワー減算としてしばしば参照される 。この修正は雑音レベルを著しく減少させ、トーン人工音を減少させる。加えて 、これは著しく音声を歪ませ、これはこの修正を高品質音声強化には無用のもの としている。この事は(55)からδ≫1の時に容易に解る。従って、適度な低い音 声対雑音比(ω領域)に対して、ルート記号下の式は非常にしばしば負となり、 整流素子がそれ故これを零にセットし(半波整流)、このことはSNRが高い周 波数帯のみが(3)の出力信号s(k)に現れることを意味する。比線形整流素子のた め、本解析技術はこの場合直截には適用可能でなく、かつδ>1は貧弱な聴覚品 質の出力を生じるためこの修正はこれ以上研究しない。 しかしながら、興味ある場合は、δ(ω)1の時で、以下の発見的議論から 見て取れる。前述したように、Φx(ω)とΦv(ω)が正確に既知の時、2乗PSD 誤差を最小化するという意味で(55)のδ(ω)=1は最適である。反対に、Φx( ω)とΦv(ω)が完全に未知の時、すなわちその評価が利用不能の時、最大 δ=0で(55)の使用に対応する。上記両極端から、未知数Φx(ω)とΦv(ω)を 更に、経験量では、PSD誤差と同様の平均スペクトル歪み改良をMSの減算 因子と関連して実験的に研究した。いくつかの実験をもとに、最適の減算因子は 0.5 から0.9 の間の区間にあるべきであることが望ましいと結論された。 この場合のPSD誤差を陽的に与えると、 2乗PSD誤差の期待値を取ると、 ここで(41)を使用した。式(57)はδ(ω)の2 次式で、解析的に最小化可能であ とを意味する。 1の使用は、入力から出力信号への音声対雑音比改良が小さいことを意味する。 在するかどうかの疑問が生じる。付録Gで、その方法を導出する(δIPSと表 わす)。 付録G この付録では、ある定数δ(0δ1)に対して が2乗PSD誤差を最小にするようなデータ独立な重み関数G(ω)を探す、(4 2)参照。直接的な計算により、 2乗PSD誤差の期待値は以下に与えられる、 第2等号のβは以下により与えられる、 δ=1 に対して、上記の(61)-(62)はIPS方法(45)に帰着し、δ=0に対して は、標準PSに帰着する。(61)-(62)中のΦs(ω)とΦv(ω)をその対応する評 はδIPSと表わされる方法を生じる。δIPS方法の解析はIPS方法の解析 と同様であるが、多大の努力と面倒な直接計算を必要とし、それ故省略する。
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,DE, DK,ES,FR,GB,GR,IE,IT,LU,M C,NL,PT,SE),OA(BF,BJ,CF,CG ,CI,CM,GA,GN,ML,MR,NE,SN, TD,TG),AP(KE,LS,MW,SD,SZ,U G),AM,AT,AU,BB,BG,BR,BY,C A,CH,CN,CZ,DE,DK,EE,ES,FI ,GB,GE,HU,IS,JP,KE,KG,KP, KR,KZ,LK,LR,LT,LU,LV,MD,M G,MN,MW,MX,NO,NZ,PL,PT,RO ,RU,SD,SE,SG,SI,SK,TJ,TM, TT,UA,UG,US,UZ,VN 【要約の続き】 より実行される。各音声フレームは、自由度数をN以下 に減少させるパラメータ・モデルにより近似される(1 20)。各音声フレームのパワー・スペクトル密

Claims (1)

  1. 【特許請求の範囲】 1.フレーム・ベースのディジタル通信装置のスペクトル減算雑音抑止方法に おいて、各フレームは所定数Nの音声サンプルを含み、これにより各フレームは 自由度数をN以下に減少させるパラメータ・モデルにより各音声フレームを近 似する段階と、 近似パラメータ・モデルをもとにしたパラメータ・パワー・スペクトル評価方 階と、 非パラメータ・パワー・スペクトル評価方法により各非音声フレームのパワー を特徴とするフレーム・ベースのディジタル通信装置のスペクトル減算雑音抑止 方法。 2.特許請求の範囲第1項記載の方法において、前記近似パラメータ・モデル は自動回帰(AR)モデルである方法。 3.特許請求の範囲第2項記載の方法において、前記自動回帰(AR)モデル は近似的に√Nのオーダーである方法。 4.特許請求の範囲第3項記載の方法において、前記自動回帰(AR)モデル は近似的に10のオーダーである方法。 5.特許請求の範囲第3項記載の方法において、次式によるスペクトル減算関 7.特許請求の範囲第5項又は第6項記載の方法において、δ(ω)が定数 1である方法。 が次式による方法。 9.特許請求の範囲第3項記載の方法において、スペクトル減算関数H(ω) が次式による方法。 10.特許請求の範囲第3項記載の方法において、スペクトル減算関数H(ω) が次式による方法。
JP8523454A 1995-01-30 1996-01-12 スペクトル減算雑音抑止方法 Ceased JPH10513273A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
SE9500321-6 1995-01-30
SE9500321A SE505156C2 (sv) 1995-01-30 1995-01-30 Förfarande för bullerundertryckning genom spektral subtraktion
PCT/SE1996/000024 WO1996024128A1 (en) 1995-01-30 1996-01-12 Spectral subtraction noise suppression method

Publications (1)

Publication Number Publication Date
JPH10513273A true JPH10513273A (ja) 1998-12-15

Family

ID=20397011

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8523454A Ceased JPH10513273A (ja) 1995-01-30 1996-01-12 スペクトル減算雑音抑止方法

Country Status (14)

Country Link
US (1) US5943429A (ja)
EP (1) EP0807305B1 (ja)
JP (1) JPH10513273A (ja)
KR (1) KR100365300B1 (ja)
CN (1) CN1110034C (ja)
AU (1) AU696152B2 (ja)
BR (1) BR9606860A (ja)
CA (1) CA2210490C (ja)
DE (1) DE69606978T2 (ja)
ES (1) ES2145429T3 (ja)
FI (1) FI973142A (ja)
RU (1) RU2145737C1 (ja)
SE (1) SE505156C2 (ja)
WO (1) WO1996024128A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013539998A (ja) * 2010-09-21 2013-10-31 コルティカル ダイナミクス リミテッド 複合脳機能モニタリング・表示システム

Families Citing this family (213)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1326479B2 (en) * 1997-04-16 2018-05-23 Emma Mixed Signal C.V. Method and apparatus for noise reduction, particularly in hearing aids
FR2764469B1 (fr) * 1997-06-09 2002-07-12 France Telecom Procede et dispositif de traitement optimise d'un signal perturbateur lors d'une prise de son
AU8102198A (en) * 1997-07-01 1999-01-25 Partran Aps A method of noise reduction in speech signals and an apparatus for performing the method
DE19747885B4 (de) * 1997-10-30 2009-04-23 Harman Becker Automotive Systems Gmbh Verfahren zur Reduktion von Störungen akustischer Signale mittels der adaptiven Filter-Methode der spektralen Subtraktion
FR2771542B1 (fr) * 1997-11-21 2000-02-11 Sextant Avionique Procede de filtrage frequentiel applique au debruitage de signaux sonores mettant en oeuvre un filtre de wiener
US6070137A (en) * 1998-01-07 2000-05-30 Ericsson Inc. Integrated frequency-domain voice coding using an adaptive spectral enhancement filter
US6415253B1 (en) * 1998-02-20 2002-07-02 Meta-C Corporation Method and apparatus for enhancing noise-corrupted speech
AU721270B2 (en) * 1998-03-30 2000-06-29 Mitsubishi Denki Kabushiki Kaisha Noise reduction apparatus and noise reduction method
US6717991B1 (en) 1998-05-27 2004-04-06 Telefonaktiebolaget Lm Ericsson (Publ) System and method for dual microphone signal noise reduction using spectral subtraction
US6182042B1 (en) * 1998-07-07 2001-01-30 Creative Technology Ltd. Sound modification employing spectral warping techniques
US6453285B1 (en) * 1998-08-21 2002-09-17 Polycom, Inc. Speech activity detector for use in noise reduction system, and methods therefor
US6351731B1 (en) 1998-08-21 2002-02-26 Polycom, Inc. Adaptive filter featuring spectral gain smoothing and variable noise multiplier for noise reduction, and method therefor
US6122610A (en) * 1998-09-23 2000-09-19 Verance Corporation Noise suppression for low bitrate speech coder
US6400310B1 (en) 1998-10-22 2002-06-04 Washington University Method and apparatus for a tunable high-resolution spectral estimator
EP2085028A1 (en) * 1998-11-09 2009-08-05 Xinde Li Processing low signal-to-noise ratio signals
US6343268B1 (en) * 1998-12-01 2002-01-29 Siemens Corporation Research, Inc. Estimator of independent sources from degenerate mixtures
US6289309B1 (en) 1998-12-16 2001-09-11 Sarnoff Corporation Noise spectrum tracking for speech enhancement
EP1141950B1 (en) * 1998-12-18 2003-05-14 Telefonaktiebolaget L M Ericsson (Publ) Noise suppression in a mobile communications system
EP1748426A3 (en) * 1999-01-07 2007-02-21 Tellabs Operations, Inc. Method and apparatus for adaptively suppressing noise
CA2358203A1 (en) 1999-01-07 2000-07-13 Tellabs Operations, Inc. Method and apparatus for adaptively suppressing noise
US6453291B1 (en) * 1999-02-04 2002-09-17 Motorola, Inc. Apparatus and method for voice activity detection in a communication system
US6496795B1 (en) * 1999-05-05 2002-12-17 Microsoft Corporation Modulated complex lapped transform for integrated signal enhancement and coding
FR2794322B1 (fr) * 1999-05-27 2001-06-22 Sagem Procede de suppression de bruit
US6314394B1 (en) * 1999-05-27 2001-11-06 Lear Corporation Adaptive signal separation system and method
FR2794323B1 (fr) * 1999-05-27 2002-02-15 Sagem Procede de suppression de bruit
US6480824B2 (en) 1999-06-04 2002-11-12 Telefonaktiebolaget L M Ericsson (Publ) Method and apparatus for canceling noise in a microphone communications path using an electrical equivalence reference signal
DE19935808A1 (de) * 1999-07-29 2001-02-08 Ericsson Telefon Ab L M Echounterdrückungseinrichtung zum Unterdrücken von Echos in einer Sender/Empfänger-Einheit
SE514875C2 (sv) 1999-09-07 2001-05-07 Ericsson Telefon Ab L M Förfarande och anordning för konstruktion av digitala filter
US6876991B1 (en) 1999-11-08 2005-04-05 Collaborative Decision Platforms, Llc. System, method and computer program product for a collaborative decision platform
FI19992453A (fi) * 1999-11-15 2001-05-16 Nokia Mobile Phones Ltd Kohinanvaimennus
US6804640B1 (en) * 2000-02-29 2004-10-12 Nuance Communications Signal noise reduction using magnitude-domain spectral subtraction
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US6766292B1 (en) * 2000-03-28 2004-07-20 Tellabs Operations, Inc. Relative noise ratio weighting techniques for adaptive noise cancellation
US6674795B1 (en) * 2000-04-04 2004-01-06 Nortel Networks Limited System, device and method for time-domain equalizer training using an auto-regressive moving average model
US6711558B1 (en) * 2000-04-07 2004-03-23 Washington University Associative database scanning and information retrieval
US8095508B2 (en) * 2000-04-07 2012-01-10 Washington University Intelligent data storage and processing using FPGA devices
US7139743B2 (en) 2000-04-07 2006-11-21 Washington University Associative database scanning and information retrieval using FPGA devices
US7225001B1 (en) 2000-04-24 2007-05-29 Telefonaktiebolaget Lm Ericsson (Publ) System and method for distributed noise suppression
JP2003533723A (ja) * 2000-05-17 2003-11-11 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ符号化
DE10053948A1 (de) * 2000-10-31 2002-05-16 Siemens Ag Verfahren zum Vermeiden von Kommunikations-Kollisionen zwischen Co-existierenden PLC-Systemen bei der Nutzung eines allen PLC-Systemen gemeinsamen physikalischen Übertragungsmediums und Anordnung zur Durchführung des Verfahrens
US6463408B1 (en) * 2000-11-22 2002-10-08 Ericsson, Inc. Systems and methods for improving power spectral estimation of speech signals
US6885735B2 (en) * 2001-03-29 2005-04-26 Intellisist, Llc System and method for transmitting voice input from a remote location over a wireless data channel
US8175886B2 (en) 2001-03-29 2012-05-08 Intellisist, Inc. Determination of signal-processing approach based on signal destination characteristics
US20020143611A1 (en) * 2001-03-29 2002-10-03 Gilad Odinak Vehicle parking validation system and method
US20050065779A1 (en) * 2001-03-29 2005-03-24 Gilad Odinak Comprehensive multiple feature telematics system
USRE46109E1 (en) * 2001-03-29 2016-08-16 Lg Electronics Inc. Vehicle navigation system and method
US6487494B2 (en) * 2001-03-29 2002-11-26 Wingcast, Llc System and method for reducing the amount of repetitive data sent by a server to a client for vehicle navigation
US20030046069A1 (en) * 2001-08-28 2003-03-06 Vergin Julien Rivarol Noise reduction system and method
US7716330B2 (en) 2001-10-19 2010-05-11 Global Velocity, Inc. System and method for controlling transmission of data packets over an information network
US6813589B2 (en) * 2001-11-29 2004-11-02 Wavecrest Corporation Method and apparatus for determining system response characteristics
US7315623B2 (en) * 2001-12-04 2008-01-01 Harman Becker Automotive Systems Gmbh Method for supressing surrounding noise in a hands-free device and hands-free device
US7116745B2 (en) * 2002-04-17 2006-10-03 Intellon Corporation Block oriented digital communication system and method
AU2003248523A1 (en) 2002-05-16 2003-12-02 Intellisist, Llc System and method for dynamically configuring wireless network geographic coverage or service levels
US7093023B2 (en) * 2002-05-21 2006-08-15 Washington University Methods, systems, and devices using reprogrammable hardware for high-speed processing of streaming data to find a redefinable pattern and respond thereto
US7711844B2 (en) 2002-08-15 2010-05-04 Washington University Of St. Louis TCP-splitter: reliable packet monitoring methods and apparatus for high speed networks
US20040078199A1 (en) * 2002-08-20 2004-04-22 Hanoh Kremer Method for auditory based noise reduction and an apparatus for auditory based noise reduction
US10572824B2 (en) 2003-05-23 2020-02-25 Ip Reservoir, Llc System and method for low latency multi-functional pipeline with correlation logic and selectively activated/deactivated pipelined data processing engines
AU2004290281A1 (en) 2003-05-23 2005-05-26 Washington University Intelligent data storage and processing using FPGA devices
DE102004001863A1 (de) * 2004-01-13 2005-08-11 Siemens Ag Verfahren und Vorrichtung zur Bearbeitung eines Sprachsignals
US7602785B2 (en) 2004-02-09 2009-10-13 Washington University Method and system for performing longest prefix matching for network address lookup using bloom filters
CN100466671C (zh) * 2004-05-14 2009-03-04 华为技术有限公司 语音切换方法及其装置
US7454332B2 (en) * 2004-06-15 2008-11-18 Microsoft Corporation Gain constrained noise suppression
ES2349718T3 (es) * 2004-09-16 2011-01-10 France Telecom Procedimiento de tratamiento de señales acústicas ruidosas y dispositivo para la realización del procedimiento.
WO2006082636A1 (ja) * 2005-02-02 2006-08-10 Fujitsu Limited 信号処理方法および信号処理装置
KR100657948B1 (ko) * 2005-02-03 2006-12-14 삼성전자주식회사 음성향상장치 및 방법
JP4765461B2 (ja) * 2005-07-27 2011-09-07 日本電気株式会社 雑音抑圧システムと方法及びプログラム
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US7702629B2 (en) * 2005-12-02 2010-04-20 Exegy Incorporated Method and device for high performance regular expression pattern matching
US8345890B2 (en) 2006-01-05 2013-01-01 Audience, Inc. System and method for utilizing inter-microphone level differences for speech enhancement
US7954114B2 (en) 2006-01-26 2011-05-31 Exegy Incorporated Firmware socket module for FPGA-based pipeline processing
US8194880B2 (en) 2006-01-30 2012-06-05 Audience, Inc. System and method for utilizing omni-directional microphones for speech enhancement
US9185487B2 (en) * 2006-01-30 2015-11-10 Audience, Inc. System and method for providing noise suppression utilizing null processing noise subtraction
US8204252B1 (en) 2006-10-10 2012-06-19 Audience, Inc. System and method for providing close microphone adaptive array processing
US8744844B2 (en) * 2007-07-06 2014-06-03 Audience, Inc. System and method for adaptive intelligent noise suppression
US8112247B2 (en) * 2006-03-24 2012-02-07 International Business Machines Corporation Resource adaptive spectrum estimation of streaming data
US7636703B2 (en) * 2006-05-02 2009-12-22 Exegy Incorporated Method and apparatus for approximate pattern matching
US8849231B1 (en) 2007-08-08 2014-09-30 Audience, Inc. System and method for adaptive power control
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US8150065B2 (en) 2006-05-25 2012-04-03 Audience, Inc. System and method for processing an audio signal
US8204253B1 (en) 2008-06-30 2012-06-19 Audience, Inc. Self calibration of audio device
US8934641B2 (en) 2006-05-25 2015-01-13 Audience, Inc. Systems and methods for reconstructing decomposed audio signals
US7840482B2 (en) 2006-06-19 2010-11-23 Exegy Incorporated Method and system for high speed options pricing
US7921046B2 (en) 2006-06-19 2011-04-05 Exegy Incorporated High speed processing of financial information using FPGA devices
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US7660793B2 (en) 2006-11-13 2010-02-09 Exegy Incorporated Method and system for high performance integration, processing and searching of structured and unstructured data using coprocessors
US8326819B2 (en) 2006-11-13 2012-12-04 Exegy Incorporated Method and system for high performance data metatagging and data indexing using coprocessors
US8259926B1 (en) 2007-02-23 2012-09-04 Audience, Inc. System and method for 2-channel and 3-channel acoustic echo cancellation
US7912567B2 (en) * 2007-03-07 2011-03-22 Audiocodes Ltd. Noise suppressor
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US20080312916A1 (en) * 2007-06-15 2008-12-18 Mr. Alon Konchitsky Receiver Intelligibility Enhancement System
US20090027648A1 (en) * 2007-07-25 2009-01-29 Asml Netherlands B.V. Method of reducing noise in an original signal, and signal processing device therefor
US8189766B1 (en) 2007-07-26 2012-05-29 Audience, Inc. System and method for blind subband acoustic echo cancellation postfiltering
US8046219B2 (en) * 2007-10-18 2011-10-25 Motorola Mobility, Inc. Robust two microphone noise suppression system
US8143620B1 (en) 2007-12-21 2012-03-27 Audience, Inc. System and method for adaptive classification of audio sources
US8180064B1 (en) 2007-12-21 2012-05-15 Audience, Inc. System and method for providing voice equalization
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8194882B2 (en) 2008-02-29 2012-06-05 Audience, Inc. System and method for providing single microphone noise suppression fallback
US8355511B2 (en) 2008-03-18 2013-01-15 Audience, Inc. System and method for envelope-based acoustic echo cancellation
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US8374986B2 (en) 2008-05-15 2013-02-12 Exegy Incorporated Method and system for accelerated stream processing
US8521530B1 (en) 2008-06-30 2013-08-27 Audience, Inc. System and method for enhancing a monaural audio signal
US8774423B1 (en) 2008-06-30 2014-07-08 Audience, Inc. System and method for controlling adaptivity of signal modification using a phantom coefficient
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
JP5871619B2 (ja) 2008-12-15 2016-03-01 アイ・ピー・リザブワー・エル・エル・シー 金融市場深度データの高速処理のための方法および装置
EP2368322A1 (en) * 2008-12-18 2011-09-28 Telefonaktiebolaget L M Ericsson (publ) Systems and methods for filtering a signal
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10706373B2 (en) 2011-06-03 2020-07-07 Apple Inc. Performing actions associated with task items that represent tasks to perform
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
CN101609480B (zh) * 2009-07-13 2011-03-30 清华大学 基于广域测量类噪声信号的电力系统节点间相位关系辨识方法
US8600743B2 (en) * 2010-01-06 2013-12-03 Apple Inc. Noise profile determination for voice-related feature
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US9008329B1 (en) 2010-01-26 2015-04-14 Audience, Inc. Noise reduction using multi-feature cluster tracker
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
US8924204B2 (en) * 2010-11-12 2014-12-30 Broadcom Corporation Method and apparatus for wind noise detection and suppression using multiple microphones
WO2012079041A1 (en) 2010-12-09 2012-06-14 Exegy Incorporated Method and apparatus for managing orders in financial markets
US9264804B2 (en) 2010-12-29 2016-02-16 Telefonaktiebolaget L M Ericsson (Publ) Noise suppressing method and a noise suppressor for applying the noise suppressing method
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8903722B2 (en) * 2011-08-29 2014-12-02 Intel Mobile Communications GmbH Noise reduction for dual-microphone communication devices
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US10121196B2 (en) 2012-03-27 2018-11-06 Ip Reservoir, Llc Offload processing of data packets containing financial market data
US9990393B2 (en) 2012-03-27 2018-06-05 Ip Reservoir, Llc Intelligent feed switch
US11436672B2 (en) 2012-03-27 2022-09-06 Exegy Incorporated Intelligent switch for processing financial market data
US10650452B2 (en) 2012-03-27 2020-05-12 Ip Reservoir, Llc Offload processing of data packets
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
US9633097B2 (en) 2012-10-23 2017-04-25 Ip Reservoir, Llc Method and apparatus for record pivoting to accelerate processing of data fields
CA2887022C (en) 2012-10-23 2021-05-04 Ip Reservoir, Llc Method and apparatus for accelerated format translation of data in a delimited data format
US9633093B2 (en) 2012-10-23 2017-04-25 Ip Reservoir, Llc Method and apparatus for accelerated format translation of data in a delimited data format
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
KR101959188B1 (ko) 2013-06-09 2019-07-02 애플 인크. 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
WO2015164639A1 (en) 2014-04-23 2015-10-29 Ip Reservoir, Llc Method and apparatus for accelerated data translation
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9966065B2 (en) 2014-05-30 2018-05-08 Apple Inc. Multi-command single utterance input method
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
DE112015003945T5 (de) 2014-08-28 2017-05-11 Knowles Electronics, Llc Mehrquellen-Rauschunterdrückung
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
RU2593384C2 (ru) * 2014-12-24 2016-08-10 Федеральное государственное бюджетное учреждение науки "Морской гидрофизический институт РАН" Способ дистанционного определения характеристик морской поверхности
RU2580796C1 (ru) * 2015-03-02 2016-04-10 Государственное казенное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФСО России) Способ (варианты) фильтрации зашумленного речевого сигнала в условиях сложной помеховой обстановки
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
DK3118851T3 (da) * 2015-07-01 2021-02-22 Oticon As Forbedring af støjende tale baseret på statistiske tale- og støjmodeller
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10942943B2 (en) 2015-10-29 2021-03-09 Ip Reservoir, Llc Dynamic field data translation to support high performance stream data processing
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
EP3560135A4 (en) 2016-12-22 2020-08-05 IP Reservoir, LLC PIPELINES INTENDED FOR AUTOMATIC ACCELERATED LEARNING BY EQUIPMENT
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
US10481831B2 (en) * 2017-10-02 2019-11-19 Nuance Communications, Inc. System and method for combined non-linear and late echo suppression
CN111508514A (zh) * 2020-04-10 2020-08-07 江苏科技大学 基于补偿相位谱的单通道语音增强算法

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4410763A (en) * 1981-06-09 1983-10-18 Northern Telecom Limited Speech detector
US4630305A (en) * 1985-07-01 1986-12-16 Motorola, Inc. Automatic gain selector for a noise suppression system
US4630304A (en) * 1985-07-01 1986-12-16 Motorola, Inc. Automatic background noise estimator for a noise suppression system
US4628529A (en) * 1985-07-01 1986-12-09 Motorola, Inc. Noise suppression system
US4811404A (en) * 1987-10-01 1989-03-07 Motorola, Inc. Noise suppression system
GB8801014D0 (en) * 1988-01-18 1988-02-17 British Telecomm Noise reduction
US5155760A (en) * 1991-06-26 1992-10-13 At&T Bell Laboratories Voice messaging system with voice activated prompt interrupt
FR2687496B1 (fr) * 1992-02-18 1994-04-01 Alcatel Radiotelephone Procede de reduction de bruit acoustique dans un signal de parole.
FI100154B (fi) * 1992-09-17 1997-09-30 Nokia Mobile Phones Ltd Menetelmä ja järjestelmä kohinan vaimentamiseksi
US5742927A (en) * 1993-02-12 1998-04-21 British Telecommunications Public Limited Company Noise reduction apparatus using spectral subtraction or scaling and signal attenuation between formant regions
US5432859A (en) * 1993-02-23 1995-07-11 Novatel Communications Ltd. Noise-reduction system
JP3270866B2 (ja) * 1993-03-23 2002-04-02 ソニー株式会社 雑音除去方法および雑音除去装置
JPH07129195A (ja) * 1993-11-05 1995-05-19 Nec Corp 音声復号化装置
JPH08506434A (ja) * 1993-11-30 1996-07-09 エイ・ティ・アンド・ティ・コーポレーション 通信システムにおける伝送ノイズ低減
US5544250A (en) * 1994-07-18 1996-08-06 Motorola Noise suppression system and method therefor
JP2964879B2 (ja) * 1994-08-22 1999-10-18 日本電気株式会社 ポストフィルタ
US5727072A (en) * 1995-02-24 1998-03-10 Nynex Science & Technology Use of noise segmentation for noise cancellation
JP3591068B2 (ja) * 1995-06-30 2004-11-17 ソニー株式会社 音声信号の雑音低減方法
US5659622A (en) * 1995-11-13 1997-08-19 Motorola, Inc. Method and apparatus for suppressing noise in a communication system
US5794199A (en) * 1996-01-29 1998-08-11 Texas Instruments Incorporated Method and system for improved discontinuous speech transmission

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013539998A (ja) * 2010-09-21 2013-10-31 コルティカル ダイナミクス リミテッド 複合脳機能モニタリング・表示システム

Also Published As

Publication number Publication date
KR19980701735A (ko) 1998-06-25
SE9500321D0 (sv) 1995-01-30
CN1169788A (zh) 1998-01-07
AU4636996A (en) 1996-08-21
WO1996024128A1 (en) 1996-08-08
CN1110034C (zh) 2003-05-28
KR100365300B1 (ko) 2003-03-15
EP0807305A1 (en) 1997-11-19
AU696152B2 (en) 1998-09-03
CA2210490C (en) 2005-03-29
FI973142A0 (fi) 1997-07-29
DE69606978D1 (de) 2000-04-13
ES2145429T3 (es) 2000-07-01
EP0807305B1 (en) 2000-03-08
SE9500321L (sv) 1996-07-31
SE505156C2 (sv) 1997-07-07
DE69606978T2 (de) 2000-07-20
US5943429A (en) 1999-08-24
CA2210490A1 (en) 1996-08-08
FI973142A (fi) 1997-09-30
BR9606860A (pt) 1997-11-25
RU2145737C1 (ru) 2000-02-20

Similar Documents

Publication Publication Date Title
JPH10513273A (ja) スペクトル減算雑音抑止方法
US20200265857A1 (en) Speech enhancement method and apparatus, device and storage mediem
KR101120679B1 (ko) 이득-제한된 잡음 억제
KR100310030B1 (ko) 노이지음성파라미터강화방법및장치
KR100330230B1 (ko) 잡음 억제 방법 및 장치
KR101266894B1 (ko) 특성 추출을 사용하여 음성 향상을 위한 오디오 신호를 프로세싱하기 위한 장치 및 방법
US7313518B2 (en) Noise reduction method and device using two pass filtering
RU2329550C2 (ru) Способ и устройство для улучшения речевого сигнала в присутствии фонового шума
JP5452655B2 (ja) 音声状態モデルを使用したマルチセンサ音声高品質化
KR100304666B1 (ko) 음성 향상 방법
CN111128213B (zh) 一种分频段进行处理的噪声抑制方法及其系统
US7957964B2 (en) Apparatus and methods for noise suppression in sound signals
CN108172231A (zh) 一种基于卡尔曼滤波的去混响方法及系统
WO2006123721A1 (ja) 雑音抑圧方法およびその装置
JP4127792B2 (ja) 音声強化デバイス
Nelke Wind noise reduction: signal processing concepts
BR112014009647B1 (pt) Aparelho de atenuação do ruído e método de atenuação do ruído
Tiwari et al. Speech enhancement using noise estimation with dynamic quantile tracking
EP1635331A1 (en) Method for estimating a signal to noise ratio
US11004463B2 (en) Speech processing method, apparatus, and non-transitory computer-readable storage medium for storing a computer program for pitch frequency detection based upon a learned value
US10062392B2 (en) Method and device for estimating a dereverberated signal
US20160005418A1 (en) Signal processor and method therefor
Meddah et al. Speech enhancement using Rao–Blackwellized particle filtering of complex DFT coefficients
JP2014150367A (ja) エコー抑圧ゲイン推定方法とそれを用いたエコー消去装置とプログラム
US20240005937A1 (en) Audio signal processing method and system for enhancing a bone-conducted audio signal using a machine learning model

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060214

A313 Final decision of rejection without a dissenting response from the applicant

Free format text: JAPANESE INTERMEDIATE CODE: A313

Effective date: 20060703

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060808