JP2003510665A - 適応フィルタリングアルゴリズムを用いるデエッサーのための装置および方法 - Google Patents
適応フィルタリングアルゴリズムを用いるデエッサーのための装置および方法Info
- Publication number
- JP2003510665A JP2003510665A JP2001527479A JP2001527479A JP2003510665A JP 2003510665 A JP2003510665 A JP 2003510665A JP 2001527479 A JP2001527479 A JP 2001527479A JP 2001527479 A JP2001527479 A JP 2001527479A JP 2003510665 A JP2003510665 A JP 2003510665A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- undesired
- input signal
- filter
- sub
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 230000003044 adaptive effect Effects 0.000 title claims abstract description 10
- 238000001914 filtration Methods 0.000 title claims description 8
- 238000004422 calculation algorithm Methods 0.000 title description 20
- 238000001514 detection method Methods 0.000 claims abstract description 49
- 230000006835 compression Effects 0.000 claims abstract description 24
- 238000007906 compression Methods 0.000 claims abstract description 24
- 238000012986 modification Methods 0.000 claims description 10
- 230000004048 modification Effects 0.000 claims description 10
- 238000012937 correction Methods 0.000 claims description 4
- 238000004519 manufacturing process Methods 0.000 claims description 3
- 230000005236 sound signal Effects 0.000 abstract description 14
- 230000009467 reduction Effects 0.000 abstract description 4
- 238000012545 processing Methods 0.000 description 13
- 230000000694 effects Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 5
- 239000003638 chemical reducing agent Substances 0.000 description 4
- 238000004590 computer program Methods 0.000 description 3
- 230000003321 amplification Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Multimedia (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Filters That Use Time-Delay Elements (AREA)
- Networks Using Active Elements (AREA)
- Image Processing (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
Abstract
Description
分の除去に関する。より詳細には、この発明は、増幅器、楽器、およびそれに類
似したものに用いるための英語における発音された文字「s」の音のノイズ部分
の除去に属する。
ックに結びつく高ピッチのスクリーチ音である。例として、マイクロフォンの傍
で増幅システムを通して聴衆に対して語りかける人を考慮されたい。マイクロフ
ォンは、その人のスピーチ(言葉)をピックアップ(採取)して、音波をアナロ
グオーディオ信号に変換する。このアナログオーディオ信号は、それから、増幅
器に伝送されて、スピーカーシステムに送られる。高振幅、高周波数の信号がス
ピーカーに送信されると、この信号は、マイクロフォンによってピックアップさ
れて、それから増幅器を介して伝送され、スピーカーに戻される。この循環性パ
ターンは、継続し、そして結果として生ずる音は、通常の場合は、フィードバッ
クに結びつく高ピッチのスクリーチ音である。このフィードバックループは、話
し言葉における「エス」音によって引き起こされ得る。この「エス」音は、シビ
ラントとしても知られている。
、に系統立てられ得る。この分類は、刺激の形態に基づいている。声道内のいく
つかの点において狭搾を形成し、そして乱流を生じさせるべく充分に高い速度に
おいて前記狭搾を通して空気を押し進めることは、無声摩擦音を生じさせる。
ントが含まれる。シビラントは、「エス」音として一般的に知られている。シビ
ラントは、主として1kHzを超える鋭い振幅上昇を有する高周波成分から構成
されている。エネルギーの大部分は、4kHzから10kHzの領域内に収まっ
ている。
な問題を引き起こし得る。問題は、ライブ音、レコーディング、および放送を含
むオーディオ工学技術の全ての分野において発生する。特定の問題は、増幅器の
クリッピングおよびFM音声伝送におけるオーバーモジュレーションを含んでい
る。
コライゼーション(EQ)を含んでいる。これらの方法は、限定された応用には
適しているが、もしもこれらの解法が選択的に使用されなければ、それらは、オ
ーディオ信号の不必要な処理を引き起こし得る。
周波数依存圧縮、すなわちデエッサーとして一般に知られているもの、を用いる
ことである。大抵のデエッサーは、シビラント周波数帯域におけるいかなる音も
圧縮を生じさせるようにセットアップされた、サイドチェーン付きイコライザー
(EQ)を有する圧縮器からなっている。これらのプロセッサーは、概して有効
であるが、EQによって検出されるシビラント周波数帯域内に生ずる、シンバル
のような、他の信号をも圧縮してしまう。
を最初に検出するために検出フィルタが用いられている。検出のためのこれらの
従来技術アルゴリズムは、リアルタイムで行なうことがあまりに計算的に困難で
あり、いずれもハードウェアベースでなされている。
ィジタル適応技法をもたらす。この発明は、望ましくないシビラント信号を検出
し、そして入力信号の修正を望まれない信号部分に制限するためのディジタルア
ルゴリズムを提供する。したがって、本発明は、該非所望信号を認識し且つフィ
ルタするための検出および推定の両方のフィルタの使用法を教示する。
オーディオ信号のリアルタイム作成のための方法および装置を教示する。システ
ムは、高分解能適応検出フィルタを用いることにより入力信号の前記非所望部分
を検出し、そして該入力信号の前記非所望部分を低減する。前記非所望部分の低
減は、前記非所望信号の圧縮、前記信号の前記非所望部分の引き算、または前記
非所望部分が、もはや検出されなくなるまで、出力信号を削除すること、によっ
て行なわれる。該システムは、とりわけ、シビラントのような高周波数で且つ高
振幅の音を発見すべく設計される。
分の例と比較することにより検出される。この比較は、比較をあらわす類似性値
を生成するために使用される。もしも類似性値が予め設定された閾値を超えたな
らば、そのときは該システムは検出信号を出力するであろう。前記例は、異なる
音声パラメーターまたは年齢、性別、主たる言語、および地理的な方言の影響の
ような人間の話し言葉に影響を及ぼす他の要因に従って変化する多数の例を保持
する非所望信号データベースから選択されても良い。
対して比較する高分解能検出フィルタを用いて行なわれる。
された周波数領域を圧縮することによって非所望信号部分を低減する。信号修正
ユニットは、周波数領域を選択的に取り扱う周波数圧縮を行なう。該システムは
、また、適応ノイズキャンセル推定フィルタによって非所望部分の周波数領域を
フィルタリングすることによって非所望部分を低減するための第2の方法も許容
する。非所望信号部分を低減するための第3の方法は、入力信号から部分推定値
を引き算することによる。これらの方法は、信号から、シビラントすなわち非所
望部分を部分的なまたは完全な除去のために使用され得る。
ラムを動作させるためのコンピューターシステムを利用する。前記プログラムは
、シビラントデータベースから選択された非所望信号例を使用する。代案として
、前記非所望信号例は、入力音声特性によって、信号発生器を用いて生成されて
も良く、そのため該信号発生器が処理のためのシビラント例を作成するであろう
。前記非所望信号例は、それから信号比較器において用いられ、該信号比較器で
は、該非所望信号と入力信号とのリアルタイム比較が類似性値を生成するために
使用される。前記類似性値は、前記非所望信号部分と前記入力信号との間の類似
性をあらわす。閾値検出器は、前記類似性値を閾値レベルに対して比較し、そし
て前記類似性値が前記閾値を超えたときに修正信号を生成する。それから、信号
修正ユニットは、修正信号が検出されたときに、前記入力信号を修正する。
ても良い。前記非所望信号は、入力信号の既知の特性に基づいて選択されても良
い。したがって、シビラント例は、多数の音声の物理的特性を表し得る。このや
り方において、前記シビラント例は、前記入力信号を作成する人の音声特性に従
って選択され得る。
ディオ信号のリアルタイム作成のための方法、システム、および装置を開示する
。入力オーディオ信号は、音響音声信号のディジタル信号表現である。前記オー
ディオ信号は、非所望高振幅高周波数部分を含んでいる。高振幅、高周波数部分
は、音響音声デバイスにおける装備問題、共鳴信号、またはフィードバック信号
を引き起こし得るシビラント信号に類似した信号である。当該システムは、高分
解能適応検出フィルタを利用することによって、この入力オーディオ信号の非所
望部分を検出し、そして入力信号の非所望部分を低減する。前記非所望部分の低
減は、前記非所望信号の圧縮、前記信号の前記非所望部分の引き算、または前記
非所望部分が、もはや検出されなくなるまで、出力信号を削除すること、によっ
て行なわれる。該システムは、とりわけ、音響音声増幅デバイスにおけるフィー
ドバック効果を低減するために、シビラントまたは他の高周波数で且つ高振幅の
音を発見するように設計される。
次の式
it’s possible」という文である。前記入力信号r(t)のグラ
フが、図1に示されている。この入力信号におけるノイズは、「It’s」にお
ける「s」および「possible」における「ss」からなっている。この
ノイズは、図2に示されたような「s」の時間領域表現においても見られ得る。
ていない入力信号を得ることは不可能である。したがって、前記「エス」音の非
所望ノイズ部分を含まない現実的な入力信号を得ることはできない。この理由の
ために、我々は、図2に示されるようなノイズ信号s(t)の推定を用いる。本
発明は、200の個人からの実際のシビラントサンプルをスムージングすること
により作成され、非所望部分例としても知られる、シビラント例を用いる。各人
物はシビラントを話し、そしてそのシビラントは記録され且つ他の個人からのシ
ビラント信号と組み合わされる。これらのシビラントの組み合わせは、スムーズ
シビラントとして知られるシビラントノイズについて矛盾のない信号ベースを結
果として生ずる。実際のシビラント例を利用するための代案として、非所望信号
例は、信号発生器を用い、そして適切な特性を入力することによって、生成され
ても良く、そのため前記信号発生器は、処理のためのシビラント例を作成するで
あろう。非所望部分例のために信号発生器を利用することによって、異なる信号
が、異なる話し言葉および音声の特徴について生成され得る。前記発生器は、話
者の年齢、性別、そして物理的特性のような事項を含む異なる入力パラメーター
を前記発生器が利用するためにセットアップされ得て、そのため、該信号発生器
がシビラントの異なるタイプまたはスタイルに適応し得る。選択された非所望シ
ビラント部分は、それから話者の音声または物理的特性に従って選択されても良
い。我々は、非所望信号部分の例を得たからには、この非所望部分が、入力信号
内において検出されるはずである。
号中のノイズの検出である。マッチトフィルタ、高分解能フィルタ、および反転
フィルタの3つの一般的な検出フィルタがある。これらは、式3−マッチトフィ
ルタ、式4−高分解能フィルタ、そして式5−反転フィルタにおいて数学的に示
されている。
ルタとしても知られている。マッチト検出フィルタは、信号またはノイズが検出
されたときには、ナローパルスを送出する。マッチト検出フィルタは、信号位相
とは逆の、位相を導入する。それゆえ、期待される信号と類似する全ての信号の
出力スペクトル成分は、同位相となるであろう。このことは、信号が生じたとき
にナローパルスを生じさせる。
のうち最も単純なものである。信号のみが、そしてノイズなしに、印加されたと
きに、インパルスが出力される。式6が満足されない限り、大きな誤差が、この
フィルタ内に導入される。
る高分解能検出フィルタは、最も有用なフィルタである。それは、s(t)+n
(t)と同様な信号が印加されたときに、ナローパルスを出力する。高分解能検
出フィルタは、非相関ウィーナー推定フィルタと組み合わされた反転検出フィル
タである。
るために、出力誤差は最小化されるべきである。このことは積分二乗誤差を解析
することによって達成される。
い信号であり、そしてc(t)−h(t)r(t)は、該フィルタの出力である
。これは、式8として示される周波数領域式に操作され且つ変換されても良い。
ウィーナー推定フィルタとなる。
持てば、そのときは、伝達関数は、減小し非相関ウィーナー推定フィルタとなる
。このことは、式10に示されている。
し、もしもそれが非常に低いならば、それは1/|N(jω)|2に収束する。
演繹的知識を仮定している。不幸なことに、これらはめったに利用できない。
たはノイズが既知;クラス3:信号およびノイズが未知の3つのクラスに分けら
れる。クラス2およびクラス3においては、スペクトル推定が使用されるべきで
ある。式11および式12を用いれば、クラス2の推定がなされ得る。
領域の平均化を用いる。式13は、可能性のある信号推定を示している。
ス2のアルゴリズムが、このプロセッサにおいて使用されるであろう。
ケースにおいて、高周波イコライゼーションブーストは、圧縮器の利得低減制御
回路に挿入され、シビラント範囲の周波数が圧縮を生じる。先の節において、我
々は、これらのシステムにおける明白な欠陥を議論した。
あり、そしてシビランスが生じたときに信号を圧縮するのみとすることである。
周波数領域において圧縮をすることが良いことではあるが、それによって、我々
は、シビラントが生じた周波数帯域に対し我々のダイナミックな処理を限定し得
る。ブロック図は、図3に示される。このアルゴリズムは、ブロック処理が行な
われるであろうことを仮定している。
明が何故閾値検出器を利用するかは、図4から非常に明白である。定期的に生起
する低レベルスパイクは、入力信号に含まれるバックグラウンドノイズである。
このバックグラウンドノイズは、非所望信号例に結びつくフィードバックまたは
他の問題を生じさせるには充分でない。それゆえ、入力信号は、バックグラウン
ドノイズに結びつけられるこの低レベル信号の効果を低減するために修正される
必要はない。また、検出フィルタが、信号と非所望部分との間の比較の類似性に
従った振幅を有するパルスを出力する方法も図4に示されている。このように、
検出信号は、どの位多量の信号が存在するかに相関する振幅を持つであろう。こ
の例においては、非所望信号部分を検出し、且つシステムの問題を生じない低振
幅信号を無視するために0.07または−23dBの閾値が、使用された。いか
なる検出フィルタもこれらの信号を作成するのに使用され得るけれども、この応
用については、高分解能検出フィルタが他のフィルタを超えて有効であることが
分った。したがって、検出信号出力の振幅は、非所望信号部分の影響を低減する
ために入力信号が修正されるべきときに制御すべく閾値検出器によって処理され
る。
ントすなわち非所望信号部分が検出されると、周波数領域の圧縮が作動状態とな
る。この文献のために、計算を単純化するために4kHzと10kHzの間に限
定された構成が用いられている。この圧縮の効果は、図5に示されている。図1
に示された入力信号に対して比較されたときに「s」信号がどれだけ低減されて
いるかに留意されたい。さらに精巧な圧縮アルゴリズムが結果をより一層改善し
得ることも想像される。
完全に推定するために使用され得る。理想的なフィルタはシビラント音を完全に
除去してしまい、そしてそのことは真に我々が必要とすることではないので、こ
のことは、実際の例においては完全に望ましいわけではない。しかしながら、説
明的な目的で、この機能を実行するためのアルゴリズムが、図6に示されている
。
るためにアクティブノイズ制御(ANC)推定フィルタを利用している。この推
定値は、それから非所望信号部分の影響を除去または顕著に低減するために入力
信号から引き算される。
式14に示されている。ANC推定フィルタは、本質的に1−Hestに等しい
。
下させる。このことは、式15に示されたように信号推定において使用されるス
ケーリングファクタkにほとんど依存している。
準(分母)が使用され得る。
。この理由のために、正常なパフォーマンス計測は、実際に適用され得ない。こ
の問題を解決するために、ノイズ対ノイズ比が作成された。シビランスを含む信
号r(t)の選択は、既知のノイズn(t)と比較される。これは原信号に対し
てなされ、そしてここに2つのアルゴリズムが定義される。その公式は、式16
に示される。
に対して比較されたノイズエネルギーが低下することを我々に教えてくれる。も
しも、シビラントノイズの一般的な推定が使用されることとなるならば、このア
ルゴリズムはさらに一層良好に実行されるであろうと思われる。最も効果的な技
法が、使用されている極度に限定的な構成に帰属する圧縮アルゴリズムを用いて
見出された。
出するために使用される信号検出および処理装置100の概念図を示している。
本発明のこの実施形態は、マイクロフォン112およびアナログ−ディジタルコ
ンバータ114によって生成されるようなディジタル入力信号110を受ける。
この入力信号は、それから、出力オーディオ信号116を作成すべく非所望信号
部分の影響を除去または減小させるために処理される。非所望信号部分は、検出
フィルタ120によって非所望部分の例118に対して入力信号110を比較す
ることによって検出される。この比較は、比較をあらわす類似性値を生成するた
めに用いられる。もしも、閾値検出器122が、予め設定された閾値を前記類似
性値が超えることを発見したら、そのときは、該閾値検出器122は、修正信号
124を出力するであろう。この修正信号124は、出力信号116を作成する
ために入力信号の非所望部分の影響を低減する非所望部分低減器126を付勢す
る。この非所望部分低減器は、信号修正ユニット126としても知られる。この
出力信号116は、それからディジタル−アナログコンバータ128によってア
ナログ信号に戻し変換され、そしてスピーカーを駆動すべく増幅器130によっ
て増幅される。この方法においては、全体の処理においてフィードバックの効果
を低減するための低減された非所望信号部分を有する音波131が生成される。
分118は、多数の例118を保持する非所望信号データベースから選択されて
も良い。例118は、異なる音声パラメーター、または、年齢、性別、主たる言
語、および地理的または方言の影響のような人間の話し言葉に影響する他のファ
クター、に従って変化する。
のモデルすなわち例118に対して到来するデータ信号110ストリームを比較
する高分解能検出フィルタを用いて行なわれる。
数領域を圧縮することにより、非所望信号部分を低減する。このように、低減器
126は、周波数領域を選択的に取り扱うであろう周波数圧縮を行なう。シビラ
ントの影響を低減するために有効な周波数領域は、4kHzと10khzの間の
周波数を含むように選択され得る。したがって、信号修正ユニット126は、周
波数領域を選択的に取り扱う周波数圧縮を行なう。
により信号修正ユニット126における実施について提供される。この第2の方
法は、入力信号110から非所望部分の周波数領域をフィルタリングすることに
よって非所望部分を低減する。第3の方法は、非所望信号部分がもはや検出され
なくなるまで出力信号をオフにスイッチングすることによって利用され得る。し
かしながら、この方法は、ここに説明された音声処理の例については最高である
と思われる。これらの方法は、信号110からシビラントすなわち非所望部分の
部分的なまたは完全な除去のために使用され得る。
させるためのコンピューターシステムを利用する。該プログラムは、シビラント
データベースから選択される非所望信号例118を使用する。前記非所望信号例
は、それから、非所望信号例118と入力信号110のリアルタイム比較が類似
性値121を生成するために使用される信号比較器120としても知られている
検出フィルタ120に使用される。類似性値121は、非所望信号部分118と
入力信号110の間の類似性をあらわす。閾値検出器122は、前記類似性値を
閾値レベルに対して比較し、そして類似性値121が前記閾値を超えたときに修
正信号124を生成する。信号修正ユニット126は、それから、修正信号12
4が検出されたときに、入力信号110を修正する。
から選択されても良い。非所望信号例118は、入力信号110の既知の特性に
基づいて選択されても良い。このように、シビラント例118は、多数の音声の
物理的特性の代表となり得る。この方法において、シビラント例118は、入力
信号110を作成している人の音声特性に従って選択されて良い。
ラント検出およびフィルタリングを行なうためにプログラムされたアルゴリズム
を説明している。このプログラムは、フィルタリングアルゴリズムが利用されて
いるので、説明的な目的のために含められた、圧縮アルゴリズムも含んでいるが
、「%」シンボルで行を始めることによりプログラムの動作を書き出されている
。
ップすることによって始めている。システムは、既知の長さの信号を通すべくプ
ログラムされているが、しかしながら、これが既知の長さの一定の入力ストリー
ムを進行させるように容易に修正され得ることも想像される。
付けるべく入力信号上で進行される。類似性値は、それから、入力信号とマッチ
するものの間のマッチの相対的なレベルを割り当てる。この類似性値は、それか
ら、それが閾値を超えたかどうかを判定すべく監視され、そして閾値を超える類
似性値に応答して検出信号が生成される。もしも、この類似性が、閾値を超える
と、そのときは該システムは、非所望信号部分をフィルタ除去するであろう。随
意的な圧縮フィルタも示されている。このシステムは、それから信号の次のセク
ションを処理するためにリセットする。
い能力がある。非常に少ない演繹的情報によって、我々は、信号をフィルタする
ことができ、そのような方法で、ノイズを検出し且つそれをフィルタリングアウ
トする。ここに論じられたアルゴリズムは、現存する技術に対して極端な改善を
生み出すために使用され得る。検出フィルタを利用することによって、ダイナミ
ック処理の量が、入力信号にシビラント信号が存在するときに効力を生ずるのみ
とするように、低減され得る。このように、適応フィルタは非常に有用であり、
そしてオーディオ技術におけるそれらの使用は、無限であることは明らかである
。
新規で且つ有用な装置および方法の本発明の特定の実施形態についてのみ説明さ
れているけれども、そのような言及が、ここで特許請求の範囲内に記載した通り
のことを除きこの発明の範囲において限定として解釈されることを意図するもの
ではない。
号のグラフである。
ロック図である。
Claims (26)
- 【請求項1】 非所望部分を有する入力信号から出力音響信号のリアルタイ
ム作成のための方法であって、 高分解能検出フィルタによって前記入力信号の前記非所望部分を検出すること
と、 一旦前記非所望部分が検出されると、前記出力信号を形成すべく前記入力信号
の前記非所望部分を低減することと を具備する方法。 - 【請求項2】 前記非所望部分は、高周波数および高振幅により特徴付けら
れる請求項1に記載の方法。 - 【請求項3】 前記非所望部分は、シビラントである請求項1に記載の方法
。 - 【請求項4】 上述における検出することは、 非所望部分例を提供することと、 前記入力信号と前記非所望部分例とを比較することと、 前記比較をあらわす類似性値を生成することと、 前記類似性値が閾値を超えるときに検出信号を出力することと を具備する請求項1に記載の方法。
- 【請求項5】 上述における提供することは、 データベースに複数の部分例を提供することと、 前記非所望部分例として使用するために、前記複数から一つの部分例を選択す
ることと を有する請求項4に記載の方法。 - 【請求項6】 前記複数の部分例は、異なる音声パラメーターについての複
数のシビラントを含む請求項5に記載の方法。 - 【請求項7】 前記比較することは、高速フーリエ変換および高分解能検出
フィルタを用いる請求項5に記載の方法。 - 【請求項8】 前記低減することは、前記入力信号を圧縮することを含む請
求項1に記載の方法。 - 【請求項9】 前記圧縮することは、前記非所望部分の周波数領域に限定さ
れる請求項8に記載の方法。 - 【請求項10】 前記低減することは、前記非所望部分の周波数領域をフィ
ルタリングすることを含む請求項1に記載の方法。 - 【請求項11】 前記低減することは、前記入力信号から部分推定を引き算
することを含む請求項1に記載の方法。 - 【請求項12】 入力信号における非所望信号部分を検出するための装置で
あって、 非所望信号部分例を含む非所望信号部分データベースと、 前記入力信号と前記非所望信号部分例とを比較し且つ前記非所望信号部分と前
記入力信号との間の類似性をあらわす類似性値を生成するための信号比較器と、 前記類似性値を閾値と比較し且つ修正信号を生成するための閾値検出器と、 前記修正信号の生成時に前記信号を修正するための信号修正ユニットと を具備する装置。 - 【請求項13】 前記非所望信号部分データベースは、複数の非所望信号部
分例を含む請求項12に記載の装置。 - 【請求項14】 前記非所望信号部分例は、前記複数から前記入力信号の特
性に基づいて選択される請求項12に記載の装置。 - 【請求項15】 前記複数の非所望信号部分例は、音声の物理的特性を代表
している請求項12に記載の装置。 - 【請求項16】 前記比較器は、フィルタである請求項12に記載の装置。
- 【請求項17】 前記フィルタは、高分解能検出フィルタである請求項12
に記載の装置。 - 【請求項18】 前記信号比較器は、前記入力信号と前記非所望信号部分と
を比較するための なる式で特徴付けられる高分解能検出フィルタを用いる請求項12に記載の装置
。 - 【請求項19】 前記閾値は、ほぼ23dBである請求項12に記載の装置
。 - 【請求項20】 前記信号修正ユニットは、スイッチを含む請求項12に記
載の装置。 - 【請求項21】 前記信号修正ユニットは、周波数圧縮を行なう請求項12
に記載の装置。 - 【請求項22】 前記周波数圧縮は、周波数領域を選択的に取り扱う請求項
12に記載の装置。 - 【請求項23】 前記周波数領域は、4kHzから10kHzの間である請
求項12に記載の装置。 - 【請求項24】 前記フィルタは、適応ノイズキャンセル推定フィルタであ
る請求項12に記載の装置。 - 【請求項25】 前記信号修正ユニットは、前記信号から非所望信号部分推
定値を引き算する請求項12に記載の装置。 - 【請求項26】 前記非所望信号部分は、前記信号から完全に除去される請
求項12に記載の装置。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15622499P | 1999-09-27 | 1999-09-27 | |
US60/156,224 | 1999-09-27 | ||
US09/430,433 | 1999-10-29 | ||
US09/430,433 US6373953B1 (en) | 1999-09-27 | 1999-10-29 | Apparatus and method for De-esser using adaptive filtering algorithms |
PCT/US2000/026571 WO2001024416A1 (en) | 1999-09-27 | 2000-09-27 | Apparatus and method for de-esser using adaptive filtering algorithms |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2003510665A true JP2003510665A (ja) | 2003-03-18 |
Family
ID=26852983
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001527479A Ceased JP2003510665A (ja) | 1999-09-27 | 2000-09-27 | 適応フィルタリングアルゴリズムを用いるデエッサーのための装置および方法 |
Country Status (8)
Country | Link |
---|---|
US (1) | US6373953B1 (ja) |
EP (1) | EP1216527B1 (ja) |
JP (1) | JP2003510665A (ja) |
AT (1) | ATE352135T1 (ja) |
AU (1) | AU7987200A (ja) |
CA (1) | CA2321225C (ja) |
DE (1) | DE60033039T2 (ja) |
WO (1) | WO2001024416A1 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6717537B1 (en) * | 2001-06-26 | 2004-04-06 | Sonic Innovations, Inc. | Method and apparatus for minimizing latency in digital signal processing systems |
US20080002832A1 (en) * | 2006-06-29 | 2008-01-03 | Taiwan Semiconductor Manufacturing Co., Ltd. | Methods of detecting an abnormal operation of processing apparatus and systems thereof |
EP2649742A4 (en) * | 2010-12-07 | 2014-07-02 | Empire Technology Dev Llc | DIFFERENCES OF DIGITAL AUDIO IMPRESSIONS FOR MEASURING EXPERIENCE QUALITY FROM END TO END |
WO2012128679A1 (en) * | 2011-03-21 | 2012-09-27 | Telefonaktiebolaget L M Ericsson (Publ) | Method and arrangement for damping dominant frequencies in an audio signal |
US9502050B2 (en) | 2012-06-10 | 2016-11-22 | Nuance Communications, Inc. | Noise dependent signal processing for in-car communication systems with multiple acoustic zones |
CN104737475B (zh) | 2012-06-10 | 2016-12-14 | 纽昂斯通讯公司 | 针对具有多个声学区域的车载通信系统的风噪声检测 |
US9805738B2 (en) | 2012-09-04 | 2017-10-31 | Nuance Communications, Inc. | Formant dependent speech signal enhancement |
US9613633B2 (en) | 2012-10-30 | 2017-04-04 | Nuance Communications, Inc. | Speech enhancement |
EP3038106B1 (en) | 2014-12-24 | 2017-10-18 | Nxp B.V. | Audio signal enhancement |
US10867620B2 (en) * | 2016-06-22 | 2020-12-15 | Dolby Laboratories Licensing Corporation | Sibilance detection and mitigation |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100189961B1 (ko) | 1992-04-09 | 1999-06-01 | 윤종용 | 잡음 제거 장치 |
US5574791A (en) | 1994-06-15 | 1996-11-12 | Akg Acoustics, Incorporated | Combined de-esser and high-frequency enhancer using single pair of level detectors |
JP3039342B2 (ja) | 1995-11-13 | 2000-05-08 | 富士ゼロックス株式会社 | 画像形成装置の消音装置および消音方法 |
EP0798947A1 (de) | 1996-03-27 | 1997-10-01 | Siemens Audiologische Technik GmbH | Verfahren und Schaltung zur Verarbeitung von Daten, insbesondere Signaldaten in einem digitalen programmierbaren Hörgerät |
-
1999
- 1999-10-29 US US09/430,433 patent/US6373953B1/en not_active Expired - Lifetime
-
2000
- 2000-09-27 CA CA002321225A patent/CA2321225C/en not_active Expired - Fee Related
- 2000-09-27 WO PCT/US2000/026571 patent/WO2001024416A1/en active IP Right Grant
- 2000-09-27 AU AU79872/00A patent/AU7987200A/en not_active Abandoned
- 2000-09-27 AT AT00970500T patent/ATE352135T1/de not_active IP Right Cessation
- 2000-09-27 EP EP00970500A patent/EP1216527B1/en not_active Expired - Lifetime
- 2000-09-27 JP JP2001527479A patent/JP2003510665A/ja not_active Ceased
- 2000-09-27 DE DE60033039T patent/DE60033039T2/de not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
DE60033039T2 (de) | 2007-11-15 |
CA2321225A1 (en) | 2001-03-27 |
DE60033039D1 (de) | 2007-03-08 |
AU7987200A (en) | 2001-04-30 |
CA2321225C (en) | 2005-04-26 |
US6373953B1 (en) | 2002-04-16 |
EP1216527A4 (en) | 2005-06-29 |
ATE352135T1 (de) | 2007-02-15 |
EP1216527A1 (en) | 2002-06-26 |
EP1216527B1 (en) | 2007-01-17 |
WO2001024416A1 (en) | 2001-04-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7620546B2 (en) | Isolating speech signals utilizing neural networks | |
JP4764995B2 (ja) | 雑音を含む音響信号の高品質化 | |
JP5666444B2 (ja) | 特徴抽出を使用してスピーチ強調のためにオーディオ信号を処理する装置及び方法 | |
US10614827B1 (en) | System and method for speech enhancement using dynamic noise profile estimation | |
JP2002537585A (ja) | 音声およびアコースティック信号の有声音化励起を特徴付けて、音声からアコースティック・ノイズを除去し、音声を合成するシステムおよび方法 | |
JP2007523374A (ja) | 自動音声認識器のためのトレーニングデータを生成する方法およびシステム | |
JPH10509256A (ja) | ピッチ操作器を使用する音声信号の変換方法 | |
Jangjit et al. | A new wavelet denoising method for noise threshold | |
CN106601265B (zh) | 一种消除毫米波生物雷达语音中噪声的方法 | |
JP2003510665A (ja) | 適応フィルタリングアルゴリズムを用いるデエッサーのための装置および方法 | |
JP2003532162A (ja) | 雑音に影響された音声の認識のためのロバストなパラメータ | |
CN113744715A (zh) | 声码器语音合成方法、装置、计算机设备及存储介质 | |
CN112185405B (zh) | 一种基于差分运算和联合字典学习的骨导语音增强方法 | |
JP2021152623A (ja) | 信号処理装置、信号処理方法およびプログラム | |
Shraddha et al. | Noise cancellation and noise reduction techniques: A review | |
JP3916834B2 (ja) | 雑音が付加された周期波形の基本周期あるいは基本周波数の抽出方法 | |
JP2004274234A (ja) | 音響信号の残響除去方法、装置、及び音響信号の残響除去プログラム、そのプログラムを記録した記録媒体 | |
WO2020208926A1 (ja) | 信号処理装置、信号処理方法及びプログラム | |
Tomchuk | Spectral masking in MFCC calculation for noisy speech | |
Mehta et al. | Robust front-end and back-end processing for feature extraction for Hindi speech recognition | |
Muhsina et al. | Signal enhancement of source separation techniques | |
Zorila et al. | On the Quality and Intelligibility of Noisy Speech Processed for Near-End Listening Enhancement. | |
Kumar et al. | Noise Reduction Algorithm for Speech Enhancement | |
Le Roux et al. | Single channel speech and background segregation through harmonic-temporal clustering | |
KR100468817B1 (ko) | 잡음 처리 기능을 갖춘 음성 인식 장치 및 음성 인식 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040601 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20040830 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20041013 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041125 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20050118 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050517 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20050524 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20050722 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20080430 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20080508 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20080602 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20080605 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20080626 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20080704 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080805 |
|
A045 | Written measure of dismissal of application [lapsed due to lack of payment] |
Free format text: JAPANESE INTERMEDIATE CODE: A045 Effective date: 20090310 |