JP2003510665A - 適応フィルタリングアルゴリズムを用いるデエッサーのための装置および方法 - Google Patents

適応フィルタリングアルゴリズムを用いるデエッサーのための装置および方法

Info

Publication number
JP2003510665A
JP2003510665A JP2001527479A JP2001527479A JP2003510665A JP 2003510665 A JP2003510665 A JP 2003510665A JP 2001527479 A JP2001527479 A JP 2001527479A JP 2001527479 A JP2001527479 A JP 2001527479A JP 2003510665 A JP2003510665 A JP 2003510665A
Authority
JP
Japan
Prior art keywords
signal
undesired
input signal
filter
sub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
JP2001527479A
Other languages
English (en)
Inventor
ジェイソン フラックス,
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Gibson Guitar Corp
Original Assignee
Gibson Guitar Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Gibson Guitar Corp filed Critical Gibson Guitar Corp
Publication of JP2003510665A publication Critical patent/JP2003510665A/ja
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Multimedia (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Filters That Use Time-Delay Elements (AREA)
  • Networks Using Active Elements (AREA)
  • Image Processing (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Abstract

(57)【要約】 非所望部分すなわちノイズ部分(118)を有する入力信号(110)からの出力オーディオ信号のリアルタイム作成のための方法および装置である。当該システムは、適応検出フィルタ(120)を用いることにより入力信号の前記非所望部分(118)を検出して、前記入力信号の前記非所望部分を低減する。前記非所望部分の低減は、非所望信号の圧縮、前記信号の前記非所望部分の引き算、または前記非所望部分が、もはや検出されなくなるまで、出力信号を削除すること、によって行なわれる(126)。該システムは、とりわけ、シビラントのような高周波数で且つ高振幅の音を発見すべく設計される。

Description

【発明の詳細な説明】
【0001】 (技術分野) 本発明は、概して入力オーディオ信号からのノイズ部分すなわち非所望信号部
分の除去に関する。より詳細には、この発明は、増幅器、楽器、およびそれに類
似したものに用いるための英語における発音された文字「s」の音のノイズ部分
の除去に属する。
【0002】 (背景技術) オーディオすなわち音響システムについての典型的な問題は、信号フィードバ
ックに結びつく高ピッチのスクリーチ音である。例として、マイクロフォンの傍
で増幅システムを通して聴衆に対して語りかける人を考慮されたい。マイクロフ
ォンは、その人のスピーチ(言葉)をピックアップ(採取)して、音波をアナロ
グオーディオ信号に変換する。このアナログオーディオ信号は、それから、増幅
器に伝送されて、スピーカーシステムに送られる。高振幅、高周波数の信号がス
ピーカーに送信されると、この信号は、マイクロフォンによってピックアップさ
れて、それから増幅器を介して伝送され、スピーカーに戻される。この循環性パ
ターンは、継続し、そして結果として生ずる音は、通常の場合は、フィードバッ
クに結びつく高ピッチのスクリーチ音である。このフィードバックループは、話
し言葉における「エス」音によって引き起こされ得る。この「エス」音は、シビ
ラントとしても知られている。
【0003】 従来技術は、言語音は、有声音、摩擦音、および破裂音の3つの別個のクラス
、に系統立てられ得る。この分類は、刺激の形態に基づいている。声道内のいく
つかの点において狭搾を形成し、そして乱流を生じさせるべく充分に高い速度に
おいて前記狭搾を通して空気を押し進めることは、無声摩擦音を生じさせる。
【0004】 無声摩擦音は、概して本質的に高周波数である。この言語音のクラスにシビラ
ントが含まれる。シビラントは、「エス」音として一般的に知られている。シビ
ラントは、主として1kHzを超える鋭い振幅上昇を有する高周波成分から構成
されている。エネルギーの大部分は、4kHzから10kHzの領域内に収まっ
ている。
【0005】 シビラントの高周波数高振幅の性質は、オーディオ設備においてしばしば重大
な問題を引き起こし得る。問題は、ライブ音、レコーディング、および放送を含
むオーディオ工学技術の全ての分野において発生する。特定の問題は、増幅器の
クリッピングおよびFM音声伝送におけるオーバーモジュレーションを含んでい
る。
【0006】 シビラントにより引き起こされる問題を解決する過去の方法は、圧縮およびイ
コライゼーション(EQ)を含んでいる。これらの方法は、限定された応用には
適しているが、もしもこれらの解法が選択的に使用されなければ、それらは、オ
ーディオ信号の不必要な処理を引き起こし得る。
【0007】 シビラントにより引き起こされる問題に対するこれらの過去の解法の一例は、
周波数依存圧縮、すなわちデエッサーとして一般に知られているもの、を用いる
ことである。大抵のデエッサーは、シビラント周波数帯域におけるいかなる音も
圧縮を生じさせるようにセットアップされた、サイドチェーン付きイコライザー
(EQ)を有する圧縮器からなっている。これらのプロセッサーは、概して有効
であるが、EQによって検出されるシビラント周波数帯域内に生ずる、シンバル
のような、他の信号をも圧縮してしまう。
【0008】 過去の研究においては、いかなるダイナミックな処理も生ずる前にシビラント
を最初に検出するために検出フィルタが用いられている。検出のためのこれらの
従来技術アルゴリズムは、リアルタイムで行なうことがあまりに計算的に困難で
あり、いずれもハードウェアベースでなされている。
【0009】 この発明は、リアルタイム処理にてシビラントを検出し且つ除去するためのデ
ィジタル適応技法をもたらす。この発明は、望ましくないシビラント信号を検出
し、そして入力信号の修正を望まれない信号部分に制限するためのディジタルア
ルゴリズムを提供する。したがって、本発明は、該非所望信号を認識し且つフィ
ルタするための検出および推定の両方のフィルタの使用法を教示する。
【0010】 (発明の開示) 本発明は、非所望信号すなわちノイズ部分を有する入力信号からクリーン出力
オーディオ信号のリアルタイム作成のための方法および装置を教示する。システ
ムは、高分解能適応検出フィルタを用いることにより入力信号の前記非所望部分
を検出し、そして該入力信号の前記非所望部分を低減する。前記非所望部分の低
減は、前記非所望信号の圧縮、前記信号の前記非所望部分の引き算、または前記
非所望部分が、もはや検出されなくなるまで、出力信号を削除すること、によっ
て行なわれる。該システムは、とりわけ、シビラントのような高周波数で且つ高
振幅の音を発見すべく設計される。
【0011】 本発明の一つの実施形態においては、非所望信号部分は、入力信号を非所望部
分の例と比較することにより検出される。この比較は、比較をあらわす類似性値
を生成するために使用される。もしも類似性値が予め設定された閾値を超えたな
らば、そのときは該システムは検出信号を出力するであろう。前記例は、異なる
音声パラメーターまたは年齢、性別、主たる言語、および地理的な方言の影響の
ような人間の話し言葉に影響を及ぼす他の要因に従って変化する多数の例を保持
する非所望信号データベースから選択されても良い。
【0012】 該比較は、到来するデータストリームを非所望信号部分のモデルすなわち例に
対して比較する高分解能検出フィルタを用いて行なわれる。
【0013】 一つの実施形態においては、システムは、通常は、非所望部分に結びつく限定
された周波数領域を圧縮することによって非所望信号部分を低減する。信号修正
ユニットは、周波数領域を選択的に取り扱う周波数圧縮を行なう。該システムは
、また、適応ノイズキャンセル推定フィルタによって非所望部分の周波数領域を
フィルタリングすることによって非所望部分を低減するための第2の方法も許容
する。非所望信号部分を低減するための第3の方法は、入力信号から部分推定値
を引き算することによる。これらの方法は、信号から、シビラントすなわち非所
望部分を部分的なまたは完全な除去のために使用され得る。
【0014】 他の実施形態においては、非所望信号部分検出装置は、コンピュータープログ
ラムを動作させるためのコンピューターシステムを利用する。前記プログラムは
、シビラントデータベースから選択された非所望信号例を使用する。代案として
、前記非所望信号例は、入力音声特性によって、信号発生器を用いて生成されて
も良く、そのため該信号発生器が処理のためのシビラント例を作成するであろう
。前記非所望信号例は、それから信号比較器において用いられ、該信号比較器で
は、該非所望信号と入力信号とのリアルタイム比較が類似性値を生成するために
使用される。前記類似性値は、前記非所望信号部分と前記入力信号との間の類似
性をあらわす。閾値検出器は、前記類似性値を閾値レベルに対して比較し、そし
て前記類似性値が前記閾値を超えたときに修正信号を生成する。それから、信号
修正ユニットは、修正信号が検出されたときに、前記入力信号を修正する。
【0015】 シビラントすなわち非所望信号例は、非所望信号のデータベースから選択され
ても良い。前記非所望信号は、入力信号の既知の特性に基づいて選択されても良
い。したがって、シビラント例は、多数の音声の物理的特性を表し得る。このや
り方において、前記シビラント例は、前記入力信号を作成する人の音声特性に従
って選択され得る。
【0016】 (発明を実施するための最良の形態) この発明は、非所望すなわちノイズ信号部分を有する入力信号からの出力オー
ディオ信号のリアルタイム作成のための方法、システム、および装置を開示する
。入力オーディオ信号は、音響音声信号のディジタル信号表現である。前記オー
ディオ信号は、非所望高振幅高周波数部分を含んでいる。高振幅、高周波数部分
は、音響音声デバイスにおける装備問題、共鳴信号、またはフィードバック信号
を引き起こし得るシビラント信号に類似した信号である。当該システムは、高分
解能適応検出フィルタを利用することによって、この入力オーディオ信号の非所
望部分を検出し、そして入力信号の非所望部分を低減する。前記非所望部分の低
減は、前記非所望信号の圧縮、前記信号の前記非所望部分の引き算、または前記
非所望部分が、もはや検出されなくなるまで、出力信号を削除すること、によっ
て行なわれる。該システムは、とりわけ、音響音声増幅デバイスにおけるフィー
ドバック効果を低減するために、シビラントまたは他の高周波数で且つ高振幅の
音を発見するように設計される。
【0017】 信号およびノイズ 推計学的な信号およびノイズ処理からなるリニアフィルタリングシステムは、
次の式
【数1】
【数2】 によって表現され得る。
【0018】 この発明の解説の目的のために、式1における入力信号r(t)は、「But
it’s possible」という文である。前記入力信号r(t)のグラ
フが、図1に示されている。この入力信号におけるノイズは、「It’s」にお
ける「s」および「possible」における「ss」からなっている。この
ノイズは、図2に示されたような「s」の時間領域表現においても見られ得る。
【0019】 シビランスは、人間の話し言葉における自然発生であるので、「s」音をもっ
ていない入力信号を得ることは不可能である。したがって、前記「エス」音の非
所望ノイズ部分を含まない現実的な入力信号を得ることはできない。この理由の
ために、我々は、図2に示されるようなノイズ信号s(t)の推定を用いる。本
発明は、200の個人からの実際のシビラントサンプルをスムージングすること
により作成され、非所望部分例としても知られる、シビラント例を用いる。各人
物はシビラントを話し、そしてそのシビラントは記録され且つ他の個人からのシ
ビラント信号と組み合わされる。これらのシビラントの組み合わせは、スムーズ
シビラントとして知られるシビラントノイズについて矛盾のない信号ベースを結
果として生ずる。実際のシビラント例を利用するための代案として、非所望信号
例は、信号発生器を用い、そして適切な特性を入力することによって、生成され
ても良く、そのため前記信号発生器は、処理のためのシビラント例を作成するで
あろう。非所望部分例のために信号発生器を利用することによって、異なる信号
が、異なる話し言葉および音声の特徴について生成され得る。前記発生器は、話
者の年齢、性別、そして物理的特性のような事項を含む異なる入力パラメーター
を前記発生器が利用するためにセットアップされ得て、そのため、該信号発生器
がシビラントの異なるタイプまたはスタイルに適応し得る。選択された非所望シ
ビラント部分は、それから話者の音声または物理的特性に従って選択されても良
い。我々は、非所望信号部分の例を得たからには、この非所望部分が、入力信号
内において検出されるはずである。
【0020】 検出フィルタ オーディオ信号において一般的な関心のある問題は、ノイズ中の信号または信
号中のノイズの検出である。マッチトフィルタ、高分解能フィルタ、および反転
フィルタの3つの一般的な検出フィルタがある。これらは、式3−マッチトフィ
ルタ、式4−高分解能フィルタ、そして式5−反転フィルタにおいて数学的に示
されている。
【数3】
【数4】
【数5】
【0021】 式3は、マッチト検出フィルタを示しており、そしてそれは、古典的検出フィ
ルタとしても知られている。マッチト検出フィルタは、信号またはノイズが検出
されたときには、ナローパルスを送出する。マッチト検出フィルタは、信号位相
とは逆の、位相を導入する。それゆえ、期待される信号と類似する全ての信号の
出力スペクトル成分は、同位相となるであろう。このことは、信号が生じたとき
にナローパルスを生じさせる。
【0022】 式5は、反転検出フィルタを示している。反転検出フィルタは、検出フィルタ
のうち最も単純なものである。信号のみが、そしてノイズなしに、印加されたと
きに、インパルスが出力される。式6が満足されない限り、大きな誤差が、この
フィルタ内に導入される。
【数6】
【0023】 前記マッチト検出フィルタおよび前記反転フィルタと対照的に、式4に示され
る高分解能検出フィルタは、最も有用なフィルタである。それは、s(t)+n
(t)と同様な信号が印加されたときに、ナローパルスを出力する。高分解能検
出フィルタは、非相関ウィーナー推定フィルタと組み合わされた反転検出フィル
タである。
【0024】 推定フィルタ 推定フィルタは、適応フィルタの他の共通の形態である。フィルタを最適化す
るために、出力誤差は最小化されるべきである。このことは積分二乗誤差を解析
することによって達成される。
【数7】
【0025】 但し、e(t)=d(t)−c(t)。この式において、d(t)は、望まし
い信号であり、そしてc(t)−h(t)r(t)は、該フィルタの出力である
。これは、式8として示される周波数領域式に操作され且つ変換されても良い。
【数8】
【0026】 もしも、式1および式2が仮定されると、そのときは式8は、結果として相関
ウィーナー推定フィルタとなる。
【数9】 予想オペランドE{}は、統計的最適フィルタを得るために使用される。
【0027】 もしも、信号およびノイズが、非相関であり、そして式9においてゼロ平均を
持てば、そのときは、伝達関数は、減小し非相関ウィーナー推定フィルタとなる
。このことは、式10に示されている。
【数10】 もしも、前記入力が、高いSNRを有していれば、該フィルタは、1に収束する
し、もしもそれが非常に低いならば、それは1/|N(jω)|に収束する。
【0028】 フィルタ分類 前節において論じられた検出および推定フィルタは、全て信号およびノイズの
演繹的知識を仮定している。不幸なことに、これらはめったに利用できない。
【0029】 理想的なフィルタは、クラス1:信号およびノイズが既知;クラス2:信号ま
たはノイズが既知;クラス3:信号およびノイズが未知の3つのクラスに分けら
れる。クラス2およびクラス3においては、スペクトル推定が使用されるべきで
ある。式11および式12を用いれば、クラス2の推定がなされ得る。
【数11】
【数12】
【0030】 クラス3のフィルタは、信号推定を達成するためにスムージングまたは周波数
領域の平均化を用いる。式13は、可能性のある信号推定を示している。
【数13】
【0031】 先に述べたように、我々は、演繹的に我々の信号を知らない。それゆえ、クラ
ス2のアルゴリズムが、このプロセッサにおいて使用されるであろう。
【0032】 アルゴリズム デエッサーが達成される多くの既製品は、実際まさしく圧縮器である。多くの
ケースにおいて、高周波イコライゼーションブーストは、圧縮器の利得低減制御
回路に挿入され、シビラント範囲の周波数が圧縮を生じる。先の節において、我
々は、これらのシステムにおける明白な欠陥を議論した。
【0033】 我々の問題を解決するための一つの方法は、適応検出フィルタを用いることで
あり、そしてシビランスが生じたときに信号を圧縮するのみとすることである。
周波数領域において圧縮をすることが良いことではあるが、それによって、我々
は、シビラントが生じた周波数帯域に対し我々のダイナミックな処理を限定し得
る。ブロック図は、図3に示される。このアルゴリズムは、ブロック処理が行な
われるであろうことを仮定している。
【0034】 高分解能検出フィルタを使用することは、図4における出力を生成する。本発
明が何故閾値検出器を利用するかは、図4から非常に明白である。定期的に生起
する低レベルスパイクは、入力信号に含まれるバックグラウンドノイズである。
このバックグラウンドノイズは、非所望信号例に結びつくフィードバックまたは
他の問題を生じさせるには充分でない。それゆえ、入力信号は、バックグラウン
ドノイズに結びつけられるこの低レベル信号の効果を低減するために修正される
必要はない。また、検出フィルタが、信号と非所望部分との間の比較の類似性に
従った振幅を有するパルスを出力する方法も図4に示されている。このように、
検出信号は、どの位多量の信号が存在するかに相関する振幅を持つであろう。こ
の例においては、非所望信号部分を検出し、且つシステムの問題を生じない低振
幅信号を無視するために0.07または−23dBの閾値が、使用された。いか
なる検出フィルタもこれらの信号を作成するのに使用され得るけれども、この応
用については、高分解能検出フィルタが他のフィルタを超えて有効であることが
分った。したがって、検出信号出力の振幅は、非所望信号部分の影響を低減する
ために入力信号が修正されるべきときに制御すべく閾値検出器によって処理され
る。
【0035】 図3は、閾値検出によって制御されるスイッチを示している。もしも、シビラ
ントすなわち非所望信号部分が検出されると、周波数領域の圧縮が作動状態とな
る。この文献のために、計算を単純化するために4kHzと10kHzの間に限
定された構成が用いられている。この圧縮の効果は、図5に示されている。図1
に示された入力信号に対して比較されたときに「s」信号がどれだけ低減されて
いるかに留意されたい。さらに精巧な圧縮アルゴリズムが結果をより一層改善し
得ることも想像される。
【0036】 先に説明された信号圧縮のための代替的な方法が、入力信号からシビラントを
完全に推定するために使用され得る。理想的なフィルタはシビラント音を完全に
除去してしまい、そしてそのことは真に我々が必要とすることではないので、こ
のことは、実際の例においては完全に望ましいわけではない。しかしながら、説
明的な目的で、この機能を実行するためのアルゴリズムが、図6に示されている
【0037】 圧縮アルゴリズムを利用する代わりに、この方法は、非所望信号部分を推定す
るためにアクティブノイズ制御(ANC)推定フィルタを利用している。この推
定値は、それから非所望信号部分の影響を除去または顕著に低減するために入力
信号から引き算される。
【0038】 この例においては、相関ウィーナーANCフィルタが使用されている。これは
式14に示されている。ANC推定フィルタは、本質的に1−Hestに等しい
【数14】
【0039】 このシステムの出力は、ノイズを完全には除去しないが、その振幅を相当量低
下させる。このことは、式15に示されたように信号推定において使用されるス
ケーリングファクタkにほとんど依存している。
【数15】 このファクターは、推定することが困難である。保証するために、クラス3の標
準(分母)が使用され得る。
【0040】 パフォーマンス計測 使用される信号の性質は、信号の演繹的な知識を我々が持つことを許容しない
。この理由のために、正常なパフォーマンス計測は、実際に適用され得ない。こ
の問題を解決するために、ノイズ対ノイズ比が作成された。シビランスを含む信
号r(t)の選択は、既知のノイズn(t)と比較される。これは原信号に対し
てなされ、そしてここに2つのアルゴリズムが定義される。その公式は、式16
に示される。
【数16】 ここで、Σは、m=1からNである。その結果は以下に示される。
【表1】
【0041】 NNRが望まれるように低下することは明白である。このことは、オリジナル
に対して比較されたノイズエネルギーが低下することを我々に教えてくれる。も
しも、シビラントノイズの一般的な推定が使用されることとなるならば、このア
ルゴリズムはさらに一層良好に実行されるであろうと思われる。最も効果的な技
法が、使用されている極度に限定的な構成に帰属する圧縮アルゴリズムを用いて
見出された。
【0042】 実施形態 図面の図6は、ディジタル入力オーディオ信号110における非所望信号を検
出するために使用される信号検出および処理装置100の概念図を示している。
本発明のこの実施形態は、マイクロフォン112およびアナログ−ディジタルコ
ンバータ114によって生成されるようなディジタル入力信号110を受ける。
この入力信号は、それから、出力オーディオ信号116を作成すべく非所望信号
部分の影響を除去または減小させるために処理される。非所望信号部分は、検出
フィルタ120によって非所望部分の例118に対して入力信号110を比較す
ることによって検出される。この比較は、比較をあらわす類似性値を生成するた
めに用いられる。もしも、閾値検出器122が、予め設定された閾値を前記類似
性値が超えることを発見したら、そのときは、該閾値検出器122は、修正信号
124を出力するであろう。この修正信号124は、出力信号116を作成する
ために入力信号の非所望部分の影響を低減する非所望部分低減器126を付勢す
る。この非所望部分低減器は、信号修正ユニット126としても知られる。この
出力信号116は、それからディジタル−アナログコンバータ128によってア
ナログ信号に戻し変換され、そしてスピーカーを駆動すべく増幅器130によっ
て増幅される。この方法においては、全体の処理においてフィードバックの効果
を低減するための低減された非所望信号部分を有する音波131が生成される。
【0043】 図6に示されるように、シビラント例118としても知られる、非所望信号部
分118は、多数の例118を保持する非所望信号データベースから選択されて
も良い。例118は、異なる音声パラメーター、または、年齢、性別、主たる言
語、および地理的または方言の影響のような人間の話し言葉に影響する他のファ
クター、に従って変化する。
【0044】 検出フィルタ120によって行なわれる検出フィルタ比較は、非所望信号部分
のモデルすなわち例118に対して到来するデータ信号110ストリームを比較
する高分解能検出フィルタを用いて行なわれる。
【0045】 非所望部分低減器126は、通常非所望部分に結びつけられる限定された周波
数領域を圧縮することにより、非所望信号部分を低減する。このように、低減器
126は、周波数領域を選択的に取り扱うであろう周波数圧縮を行なう。シビラ
ントの影響を低減するために有効な周波数領域は、4kHzと10khzの間の
周波数を含むように選択され得る。したがって、信号修正ユニット126は、周
波数領域を選択的に取り扱う周波数圧縮を行なう。
【0046】 圧縮に対する代案は、非所望部分を低減するための第2の方法を利用すること
により信号修正ユニット126における実施について提供される。この第2の方
法は、入力信号110から非所望部分の周波数領域をフィルタリングすることに
よって非所望部分を低減する。第3の方法は、非所望信号部分がもはや検出され
なくなるまで出力信号をオフにスイッチングすることによって利用され得る。し
かしながら、この方法は、ここに説明された音声処理の例については最高である
と思われる。これらの方法は、信号110からシビラントすなわち非所望部分の
部分的なまたは完全な除去のために使用され得る。
【0047】 他の実施形態において、信号装置100は、コンピュータープログラムを動作
させるためのコンピューターシステムを利用する。該プログラムは、シビラント
データベースから選択される非所望信号例118を使用する。前記非所望信号例
は、それから、非所望信号例118と入力信号110のリアルタイム比較が類似
性値121を生成するために使用される信号比較器120としても知られている
検出フィルタ120に使用される。類似性値121は、非所望信号部分118と
入力信号110の間の類似性をあらわす。閾値検出器122は、前記類似性値を
閾値レベルに対して比較し、そして類似性値121が前記閾値を超えたときに修
正信号124を生成する。信号修正ユニット126は、それから、修正信号12
4が検出されたときに、入力信号110を修正する。
【0048】 シビラントすなわち非所望信号例118は、非所望信号のデータベース134
から選択されても良い。非所望信号例118は、入力信号110の既知の特性に
基づいて選択されても良い。このように、シビラント例118は、多数の音声の
物理的特性の代表となり得る。この方法において、シビラント例118は、入力
信号110を作成している人の音声特性に従って選択されて良い。
【0049】 以下の、マットラブ言語で書かれた、コンピュータープログラムは、前記シビ
ラント検出およびフィルタリングを行なうためにプログラムされたアルゴリズム
を説明している。このプログラムは、フィルタリングアルゴリズムが利用されて
いるので、説明的な目的のために含められた、圧縮アルゴリズムも含んでいるが
、「%」シンボルで行を始めることによりプログラムの動作を書き出されている
【0050】 前記プログラムは、変数を初期化し、且つ信号を通すためのループをセットア
ップすることによって始めている。システムは、既知の長さの信号を通すべくプ
ログラムされているが、しかしながら、これが既知の長さの一定の入力ストリー
ムを進行させるように容易に修正され得ることも想像される。
【0051】 高分解能検出フィルタは、それから滑らかなシビラントとマッチするものを見
付けるべく入力信号上で進行される。類似性値は、それから、入力信号とマッチ
するものの間のマッチの相対的なレベルを割り当てる。この類似性値は、それか
ら、それが閾値を超えたかどうかを判定すべく監視され、そして閾値を超える類
似性値に応答して検出信号が生成される。もしも、この類似性が、閾値を超える
と、そのときは該システムは、非所望信号部分をフィルタ除去するであろう。随
意的な圧縮フィルタも示されている。このシステムは、それから信号の次のセク
ションを処理するためにリセットする。
【0052】 ここに示されるように、信号処理のために適応フィルタを使用することに著し
い能力がある。非常に少ない演繹的情報によって、我々は、信号をフィルタする
ことができ、そのような方法で、ノイズを検出し且つそれをフィルタリングアウ
トする。ここに論じられたアルゴリズムは、現存する技術に対して極端な改善を
生み出すために使用され得る。検出フィルタを利用することによって、ダイナミ
ック処理の量が、入力信号にシビラント信号が存在するときに効力を生ずるのみ
とするように、低減され得る。このように、適応フィルタは非常に有用であり、
そしてオーディオ技術におけるそれらの使用は、無限であることは明らかである
【0053】 したがって、適法フィルタリングアルゴリズムを使用するデエッサーのための
新規で且つ有用な装置および方法の本発明の特定の実施形態についてのみ説明さ
れているけれども、そのような言及が、ここで特許請求の範囲内に記載した通り
のことを除きこの発明の範囲において限定として解釈されることを意図するもの
ではない。
【図面の簡単な説明】
【図1】 図1は、「But it’s possible」という文についての入力信
号のグラフである。
【図2】 図2は、「s」音の時間領域表現である。
【図3】 図3は、圧縮アルゴリズムのブロック図である。
【図4】 図4は、高分解能検出フィルタの出力のグラフである。
【図5】 図5は、入力信号への検出および圧縮アルゴリズムの結果のグラフである。
【図6】 図6は、検出および推定アルゴリズムのブロック図である。
【図7】 図7は、非所望信号部分の影響を低減するために使用される信号処理装置のブ
ロック図である。
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),OA(BF,BJ ,CF,CG,CI,CM,GA,GN,GW,ML, MR,NE,SN,TD,TG),AP(GH,GM,K E,LS,MW,MZ,SD,SL,SZ,TZ,UG ,ZW),EA(AM,AZ,BY,KG,KZ,MD, RU,TJ,TM),AE,AG,AL,AM,AT, AU,AZ,BA,BB,BG,BR,BY,BZ,C H,CN,CR,CU,CZ,DE,DK,DM,DZ ,EE,ES,FI,GB,GD,GE,GH,GM, HR,HU,ID,IL,IN,IS,JP,KE,K G,KP,KR,KZ,LC,LK,LR,LS,LT ,LU,LV,MA,MD,MG,MK,MN,MW, MX,MZ,NO,NZ,PL,PT,RO,RU,S D,SE,SG,SI,SK,SL,TJ,TM,TR ,TT,TZ,UA,UG,UZ,VN,YU,ZA, ZW

Claims (26)

    【特許請求の範囲】
  1. 【請求項1】 非所望部分を有する入力信号から出力音響信号のリアルタイ
    ム作成のための方法であって、 高分解能検出フィルタによって前記入力信号の前記非所望部分を検出すること
    と、 一旦前記非所望部分が検出されると、前記出力信号を形成すべく前記入力信号
    の前記非所望部分を低減することと を具備する方法。
  2. 【請求項2】 前記非所望部分は、高周波数および高振幅により特徴付けら
    れる請求項1に記載の方法。
  3. 【請求項3】 前記非所望部分は、シビラントである請求項1に記載の方法
  4. 【請求項4】 上述における検出することは、 非所望部分例を提供することと、 前記入力信号と前記非所望部分例とを比較することと、 前記比較をあらわす類似性値を生成することと、 前記類似性値が閾値を超えるときに検出信号を出力することと を具備する請求項1に記載の方法。
  5. 【請求項5】 上述における提供することは、 データベースに複数の部分例を提供することと、 前記非所望部分例として使用するために、前記複数から一つの部分例を選択す
    ることと を有する請求項4に記載の方法。
  6. 【請求項6】 前記複数の部分例は、異なる音声パラメーターについての複
    数のシビラントを含む請求項5に記載の方法。
  7. 【請求項7】 前記比較することは、高速フーリエ変換および高分解能検出
    フィルタを用いる請求項5に記載の方法。
  8. 【請求項8】 前記低減することは、前記入力信号を圧縮することを含む請
    求項1に記載の方法。
  9. 【請求項9】 前記圧縮することは、前記非所望部分の周波数領域に限定さ
    れる請求項8に記載の方法。
  10. 【請求項10】 前記低減することは、前記非所望部分の周波数領域をフィ
    ルタリングすることを含む請求項1に記載の方法。
  11. 【請求項11】 前記低減することは、前記入力信号から部分推定を引き算
    することを含む請求項1に記載の方法。
  12. 【請求項12】 入力信号における非所望信号部分を検出するための装置で
    あって、 非所望信号部分例を含む非所望信号部分データベースと、 前記入力信号と前記非所望信号部分例とを比較し且つ前記非所望信号部分と前
    記入力信号との間の類似性をあらわす類似性値を生成するための信号比較器と、 前記類似性値を閾値と比較し且つ修正信号を生成するための閾値検出器と、 前記修正信号の生成時に前記信号を修正するための信号修正ユニットと を具備する装置。
  13. 【請求項13】 前記非所望信号部分データベースは、複数の非所望信号部
    分例を含む請求項12に記載の装置。
  14. 【請求項14】 前記非所望信号部分例は、前記複数から前記入力信号の特
    性に基づいて選択される請求項12に記載の装置。
  15. 【請求項15】 前記複数の非所望信号部分例は、音声の物理的特性を代表
    している請求項12に記載の装置。
  16. 【請求項16】 前記比較器は、フィルタである請求項12に記載の装置。
  17. 【請求項17】 前記フィルタは、高分解能検出フィルタである請求項12
    に記載の装置。
  18. 【請求項18】 前記信号比較器は、前記入力信号と前記非所望信号部分と
    を比較するための なる式で特徴付けられる高分解能検出フィルタを用いる請求項12に記載の装置
  19. 【請求項19】 前記閾値は、ほぼ23dBである請求項12に記載の装置
  20. 【請求項20】 前記信号修正ユニットは、スイッチを含む請求項12に記
    載の装置。
  21. 【請求項21】 前記信号修正ユニットは、周波数圧縮を行なう請求項12
    に記載の装置。
  22. 【請求項22】 前記周波数圧縮は、周波数領域を選択的に取り扱う請求項
    12に記載の装置。
  23. 【請求項23】 前記周波数領域は、4kHzから10kHzの間である請
    求項12に記載の装置。
  24. 【請求項24】 前記フィルタは、適応ノイズキャンセル推定フィルタであ
    る請求項12に記載の装置。
  25. 【請求項25】 前記信号修正ユニットは、前記信号から非所望信号部分推
    定値を引き算する請求項12に記載の装置。
  26. 【請求項26】 前記非所望信号部分は、前記信号から完全に除去される請
    求項12に記載の装置。
JP2001527479A 1999-09-27 2000-09-27 適応フィルタリングアルゴリズムを用いるデエッサーのための装置および方法 Ceased JP2003510665A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US15622499P 1999-09-27 1999-09-27
US60/156,224 1999-09-27
US09/430,433 1999-10-29
US09/430,433 US6373953B1 (en) 1999-09-27 1999-10-29 Apparatus and method for De-esser using adaptive filtering algorithms
PCT/US2000/026571 WO2001024416A1 (en) 1999-09-27 2000-09-27 Apparatus and method for de-esser using adaptive filtering algorithms

Publications (1)

Publication Number Publication Date
JP2003510665A true JP2003510665A (ja) 2003-03-18

Family

ID=26852983

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001527479A Ceased JP2003510665A (ja) 1999-09-27 2000-09-27 適応フィルタリングアルゴリズムを用いるデエッサーのための装置および方法

Country Status (8)

Country Link
US (1) US6373953B1 (ja)
EP (1) EP1216527B1 (ja)
JP (1) JP2003510665A (ja)
AT (1) ATE352135T1 (ja)
AU (1) AU7987200A (ja)
CA (1) CA2321225C (ja)
DE (1) DE60033039T2 (ja)
WO (1) WO2001024416A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6717537B1 (en) * 2001-06-26 2004-04-06 Sonic Innovations, Inc. Method and apparatus for minimizing latency in digital signal processing systems
US20080002832A1 (en) * 2006-06-29 2008-01-03 Taiwan Semiconductor Manufacturing Co., Ltd. Methods of detecting an abnormal operation of processing apparatus and systems thereof
EP2649742A4 (en) * 2010-12-07 2014-07-02 Empire Technology Dev Llc DIFFERENCES OF DIGITAL AUDIO IMPRESSIONS FOR MEASURING EXPERIENCE QUALITY FROM END TO END
WO2012128679A1 (en) * 2011-03-21 2012-09-27 Telefonaktiebolaget L M Ericsson (Publ) Method and arrangement for damping dominant frequencies in an audio signal
US9502050B2 (en) 2012-06-10 2016-11-22 Nuance Communications, Inc. Noise dependent signal processing for in-car communication systems with multiple acoustic zones
CN104737475B (zh) 2012-06-10 2016-12-14 纽昂斯通讯公司 针对具有多个声学区域的车载通信系统的风噪声检测
US9805738B2 (en) 2012-09-04 2017-10-31 Nuance Communications, Inc. Formant dependent speech signal enhancement
US9613633B2 (en) 2012-10-30 2017-04-04 Nuance Communications, Inc. Speech enhancement
EP3038106B1 (en) 2014-12-24 2017-10-18 Nxp B.V. Audio signal enhancement
US10867620B2 (en) * 2016-06-22 2020-12-15 Dolby Laboratories Licensing Corporation Sibilance detection and mitigation

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100189961B1 (ko) 1992-04-09 1999-06-01 윤종용 잡음 제거 장치
US5574791A (en) 1994-06-15 1996-11-12 Akg Acoustics, Incorporated Combined de-esser and high-frequency enhancer using single pair of level detectors
JP3039342B2 (ja) 1995-11-13 2000-05-08 富士ゼロックス株式会社 画像形成装置の消音装置および消音方法
EP0798947A1 (de) 1996-03-27 1997-10-01 Siemens Audiologische Technik GmbH Verfahren und Schaltung zur Verarbeitung von Daten, insbesondere Signaldaten in einem digitalen programmierbaren Hörgerät

Also Published As

Publication number Publication date
DE60033039T2 (de) 2007-11-15
CA2321225A1 (en) 2001-03-27
DE60033039D1 (de) 2007-03-08
AU7987200A (en) 2001-04-30
CA2321225C (en) 2005-04-26
US6373953B1 (en) 2002-04-16
EP1216527A4 (en) 2005-06-29
ATE352135T1 (de) 2007-02-15
EP1216527A1 (en) 2002-06-26
EP1216527B1 (en) 2007-01-17
WO2001024416A1 (en) 2001-04-05

Similar Documents

Publication Publication Date Title
US7620546B2 (en) Isolating speech signals utilizing neural networks
JP4764995B2 (ja) 雑音を含む音響信号の高品質化
JP5666444B2 (ja) 特徴抽出を使用してスピーチ強調のためにオーディオ信号を処理する装置及び方法
US10614827B1 (en) System and method for speech enhancement using dynamic noise profile estimation
JP2002537585A (ja) 音声およびアコースティック信号の有声音化励起を特徴付けて、音声からアコースティック・ノイズを除去し、音声を合成するシステムおよび方法
JP2007523374A (ja) 自動音声認識器のためのトレーニングデータを生成する方法およびシステム
JPH10509256A (ja) ピッチ操作器を使用する音声信号の変換方法
Jangjit et al. A new wavelet denoising method for noise threshold
CN106601265B (zh) 一种消除毫米波生物雷达语音中噪声的方法
JP2003510665A (ja) 適応フィルタリングアルゴリズムを用いるデエッサーのための装置および方法
JP2003532162A (ja) 雑音に影響された音声の認識のためのロバストなパラメータ
CN113744715A (zh) 声码器语音合成方法、装置、计算机设备及存储介质
CN112185405B (zh) 一种基于差分运算和联合字典学习的骨导语音增强方法
JP2021152623A (ja) 信号処理装置、信号処理方法およびプログラム
Shraddha et al. Noise cancellation and noise reduction techniques: A review
JP3916834B2 (ja) 雑音が付加された周期波形の基本周期あるいは基本周波数の抽出方法
JP2004274234A (ja) 音響信号の残響除去方法、装置、及び音響信号の残響除去プログラム、そのプログラムを記録した記録媒体
WO2020208926A1 (ja) 信号処理装置、信号処理方法及びプログラム
Tomchuk Spectral masking in MFCC calculation for noisy speech
Mehta et al. Robust front-end and back-end processing for feature extraction for Hindi speech recognition
Muhsina et al. Signal enhancement of source separation techniques
Zorila et al. On the Quality and Intelligibility of Noisy Speech Processed for Near-End Listening Enhancement.
Kumar et al. Noise Reduction Algorithm for Speech Enhancement
Le Roux et al. Single channel speech and background segregation through harmonic-temporal clustering
KR100468817B1 (ko) 잡음 처리 기능을 갖춘 음성 인식 장치 및 음성 인식 방법

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040601

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20040830

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20041013

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041125

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050118

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050517

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20050524

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20050722

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080430

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080508

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080602

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080605

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080626

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080704

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080805

A045 Written measure of dismissal of application [lapsed due to lack of payment]

Free format text: JAPANESE INTERMEDIATE CODE: A045

Effective date: 20090310