JP2004512700A - 音響システムの入力信号におけるノイズ信号成分の除去方法、同方法の適用及び補聴器 - Google Patents
音響システムの入力信号におけるノイズ信号成分の除去方法、同方法の適用及び補聴器 Download PDFInfo
- Publication number
- JP2004512700A JP2004512700A JP2001547942A JP2001547942A JP2004512700A JP 2004512700 A JP2004512700 A JP 2004512700A JP 2001547942 A JP2001547942 A JP 2001547942A JP 2001547942 A JP2001547942 A JP 2001547942A JP 2004512700 A JP2004512700 A JP 2004512700A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- desired signal
- component
- noise
- evaluated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
本発明は、入力信号(ES)におけるノイズ信号成分(SS)を除去する方法に関する。信号分析段階(I)において、入力信号(ES)に含まれるノイズ信号成分(SS)と所望の信号(NS)を特徴化し、信号処理段階(II)において、前記信号分析段階(I)で得られた特徴に基づいて所望の信号(NS)又は評価された所望の信号(NS′)を決定又は生成する。前記ノイズ信号成分(SS)と所望の信号(NS)を含む信号成分の特徴化は、少くとも音声ベースの特徴(M1 〜Mj )の適用により実施される。また、本発明は、上記の方法の適用とこの方法により作動する補聴器に関する。
Description
【0001】
本発明は、音響システムの入力信号におけるノイズ信号成分を除去する方法、この方法の補聴装置への適用及び補聴装置に関する。
【0002】
補聴装置は、一般に聴力障害者により使用され、その聴力障害をできる限り補償することを基本目的とする。補聴装置の潜在的装着者は、強いノイズ干渉のある環境下においても補聴装置が満足に機能する時に、即ち、強いノイズ信号の存在下においても装着者が高い明白性をもって話し手の言葉を区別できる時に補聴装置の使用を受入れる。
【0003】
以下の説明において「補聴装置」なる語は、人の聴力障害を補正するために使用されるいわゆる補聴器並びにその他のラジオ装置のようなあらゆる音声伝達システムに適用されるものを意図している。
【0004】
ノイズ信号の存在下において補聴装置を用いて言葉の明瞭性を改善する3つの技術として、次のものがある:
第一のものは、いわゆる指向性マイクロホン技術を備えた補聴装置である。この技術は空間フィルタリングを実施し、これによって所望の信号方向以外の方向、例えば後方又は側方、からのノイズ干渉を最少化し又は除去することを可能とする。ビーム形成としても知られるこの方法は、補聴装置において少くとも2つのマイクロホンを必要とする。このような補聴装置の主たる不具合点の1つは、所望の信号と同じ方向から入射するノイズは低減できず、まして除去もできないことである。
【0005】
第二の既知のものは、目的とする所望の信号を好ましくはその信号の発生源において捕らえ、この信号を無線接続を介して送信装置から補聴装置における受信装置に直接伝送するものである。これにより、ノイズ信号は補聴装置に入ることを防止される。この技術は、音響装置産業においては周波数変調(FM)技術として知られるもので、補助装置として音源に配される送信装置及び補聴装置に組込まれる受信装置等を必要とし、このため補聴装置の使用者による取扱いが煩雑なものとなる。
【0006】
最後に第三のものは、補聴装置において、入力信号におけるノイズ信号成分を抑制し又は少くとも減衰させるために、又は入力信号に対応する所望の信号成分を増巾する(いわゆるノイズキャンセル技術)ために入力信号を処理する信号処理アルゴリズムを採用するものである。この方法においては、入力信号に含まれるノイズ信号成分をいくつかの周波数帯において評価し、これによって、明白な所望の信号を生成するために、補聴装置の入力信号からノイズ信号成分が除去される。この方法はまた、スペクトル除去として知られる。欧州特許EP−B1−0534837はこの方法を開示し、これにより満足すべき結果が得られている。しかしながら、スペクトル除去方法は、ノイズ信号成分が帯域的に限定され、かつ、静止している場合にのみ有効である。これ以外の例えば静止していないノイズ信号成分の場合には、所望の信号(即ち、静止していない音声信号)はノイズ信号成分から区別することができない。このような状況においては、スペクトル除去はうまく機能せず、ノイズ抑制がなされず、言葉の明瞭性は大きく減じられる。その上、スペクトル除去の実施が所望の信号の劣化を招くことがある。
【0007】
また、文献として次のものが引用される:
ベア(Bear)等の研究発表「聴覚神経障害者のためのノイズ中の言語のスペクトルコントラスト向上:明瞭性、品質及び応答時間に対する効果」(リハビリテーション研究開発誌30、49〜72ページ)。この研究は、スペクトルコントラストの向上が感覚的な信号品質の改善と聴取努力の軽減をもたらす一方、一般的に音声明瞭性の改善は得られないことを示している。また同じ関係における次の文献がある:即ち、フランク(Frank) 等の論文「音素圧縮の組合せによる補聴器におけるスペクトル向上の評価」(米国音響学会誌106、1452〜1464ページ)。
【0008】
また、完全のために次の文献が引用される:
・T.ベア(Bear)、B.C.J.ムーア(Moore) の「聴覚障害における周波数選 択性の減少の補償対策の評価」〔1997年、W.ジェステッド(Jesteadt)の 「聴覚神経障害のモデル化」、ローレンス・アールバウム・アソシエーテッド 出版、米国ニュージャージ州モーオー市〕;
・V.ホーマン(Hohmann) の「両耳信号パラメータの統計に基づく両耳ノイズ減 少及び部分モデル化」(補聴器研究国際会議、2000年、於米国タホ湖);
・米国特許5727072;
・N.ビラーグ(Virag) の「人の聴音システムのマスキング特性に基づく音声向 上」(ローザンヌ市連邦エコールポリテクニーク、1996年 Ph.D.論文);
・国際特許WO91/03042
従って、本発明は、ノイズ信号成分の除去を改善する方法を提供することを課題とする。
【0009】
この課題は、特許請求の範囲における請求項1に記載の方法により達成される。本発明の方法による好ましい形態並びに本発明の方法の適用及びこれによる補聴装置は、その他の請求項に記載されている。
【0010】
本発明による方法は、信号分析段階と信号処理段階を有し、任意の入力信号からの所望の信号の抽出、望まないノイズ信号成分の除去及び所望の信号成分の再生成を可能とする。この方法を音響環境内において適用することにより、ノイズ抑制の著しい改善を達成することができる。従来のノイズ除去に比べて、本発明の方法によれば所望の信号を損うことがなく、また、静止していないノイズを入力信号から除去することも可能である。なお、従来のノイズ抑制アルゴリズムによれば所望の信号を合成することは不可能である。
【0011】
以下において、実施の形態を示す図面を参照し、本発明をより詳細に説明する。
【0012】
図1のブロック線図は、信号分析段階Iと信号処理段階IIを含む本発明の方法を説明するものである。信号分析段階Iにおいて、音響システムに入射する入力信号ESは、通常ノイズ信号成分SSと所望の信号成分NSを含んでおり、この入力信号ESが以下に説明する音声ベースの原理により分析される。次いで、信号分析段階Iにおいて得られたノイズ信号成分SSと所望の信号成分NSに関わる情報を用いて、信号処理段階IIにおいてノイズ除去が実施される。ここにおいて、基本的に2つの実施方法が提案される。即ち、第一は、所望の信号成分NSを得るために望まないノイズ信号成分SSを入力信号ESから除去する、即ち、ノイズ信号成分SSを抑制し又は減衰させることである。第二のものは、合成によって所望の信号NSまたはNS′を生成することである。
【0013】
本発明の方法に関わる別の実施の形態においては、上記の2つの技術の双方、即ち、得られたノイズ信号成分SSの抑制と認識された所望の信号NS又はNS′の合成を組合せて実施する。
【0014】
入力信号を同様に信号分析段階において単に静止ないしは非静止の状態で調べる従来のノイズ抑制技術とは異なり、本発明の方法は、音声ベースの信号分析を基礎としている。この方法においては、入力信号ESから少くとも音声ベースの特徴の抽出が行われる。音声ベースの特徴は、例えば、音量、スペクトル形態(音質)、調波(harmonische) 構造(音調)、共通の立上り及び減衰時間(オンセット/オフセット)、コヒーレント振巾及び周波数変調、コヒーレント位相、インターオーラル(interaural 、耳間)実行時間及びレベル差、その他を含み、また、ここにいう抽出は単一の又はすべての特徴の抽出を含むことができる。音声の特徴に関わる定義及びその他の情報は、A.S.ブレグマン(Bregman) の「音声シーン(情景) 分析」(1990年MIT出版、ロンドン市ケンブリッジ)が引用される。なお、本発明の方法は、音声ベースの特徴の抽出に限定することなく、本発明の更なる好ましい局面として、音声ベースの特徴に加えて、純粋に技術ベースの特徴、例えばゼロクロスオーバ(ゼロ軸交差)率、時間的レベル変動、変調周波数変化、スペクトル重心(Schwerpunkt) 、振巾分析、その他を抽出することも可能である。
【0015】
1つの実施の形態においては、特徴抽出を時間信号又は互いに異なる周波数帯について実施する。この場合、聴音に適したフィルターバンク〔E.ツヴィッカー(Zwicker) 、H.ファストル(Fastl) の「音響心理学、事実とモデル化」(1999年シュプリンガー出版)参照〕又は技術ベースのフィルターバンク、例えば高速フーリエ変換(FFT)又はウェイブレット(wavelet) フィルターバンクが使用される。
【0016】
音声ベースの特徴であれ技術ベースの特徴であれ、決定された特徴を評価し、これにより、種々の信号成分SA1 〜SAn の認識及び区別を行う。即ち、この場合、信号成分SA1 〜SAn の一部が有用な所望の信号NS又は除去すべきノイズ信号SSを表わす。
【0017】
本発明の方法においては、以下において図2、図3を参照して説明するように、信号成分SA1 〜SAn における分離を2つの異なる方法によって実施する。
【0018】
図2は、信号分析段階Iにおける工程に関わる実施の形態を示すブロック線図である。この工程には互いに直列に接続された2つの装置、即ち、特徴抽出装置20とグループ化装置21が含まれる。
【0019】
特徴抽出装置20は、入力信号ESの特徴化のために、上述のように音声ベースの、また場合により技術ベースの特徴M1 〜Mj の抽出を実施する。これらの特徴M1 〜Mj は、次いでグループ化装置21において、前述のA.S.ブレグマン(Bregman) の「音声シーン分析」(1990年MIT出版、ロンドン市ケンブリッジ)に記載された原始グループ化方法によって分類、整理が行われる。基本的には既知のこの方法は、文脈不依存(kontext−unabhaengig) のものであり、種々の作用工程の連続的実施を基礎としている。即ち、入力信号ESは、抽出された特徴M1 〜Mj に基づいて種々の音源にマップ化された信号成分SA1 〜SAn に分類される。この方法はまた、ボトムアップ方法又はデータドライブ方法と称される。この点については、次の文献が引用される。即ち、G.ブラウン(Brown) 「計算による音声シーン分析:代表的方法」(1992年 Ph.D.論文、シェフィールド大学)、M.クック(Cooke) 「モデル化による音声処理分析及び系統化」(1993年 Ph.D.論文、シェフィールド大学)。
【0020】
図3は、別の実施の形態に関わるブロック線図である。ここにおいては、上述のA.S. ブレグマン(Bregman) 文献に詳述されたスキーム(Schema 、模式)ベースのグループ化方法が使用される。スキームベースのグループ化は文脈依存(kontext−abhaengig) のものであり、この方法はまたトップダウン方法又はプレディクション(予測)ドライブ方法と称される。この点に関して、次の文献が引用される。即ち、D.P.W.エリス(Ellis) 「プレディクションドライブ方法による計算音声シーン分析」(1996年 Ph.D.論文、マサチュセッツ工科大学) 。
【0021】
図3における信号分析段階Iにおいては、特徴抽出装置20及びグループ化装置21に加えて、仮説装置22が用いられる。図3の構成から明らかなように、作用工程には直列の接続が設けられている他、仮説装置22には所定の予測データV、更には抽出された特徴M1 〜Mj 及び信号成分SA1 〜SAn が入力され、これらの入力の考慮の結果として仮説Hが入力信号ESの特性上に生成される。この仮説Hに対応して、好ましくは特徴抽出装置20における特徴抽出と特徴M1 〜Mj のグループ化の双方がその時々の状況に適合させられる。つまり、仮説Hは、ボトムアップ分析により、かつ、所定の予測データVに基づいて、音声文脈上に創出される。仮説Hはまた、グループ化の文脈を決定する。仮説Hは、音響環境に関わる知識と予測並びにグループ化自体を基礎として形成される。従って、信号分析段階Iにおいて実施される工程は、もはや厳密には直列ではなく、フィードバック回路が設けられ、これによってその時々の状況に対する適合が可能とされる。
【0022】
本発明の方法に関わる上記の実施の形態において、例えば、所定の予測データVが話し方(音素)、典型的な音調周波数、話し方速度、音質周波数、等の点で既知である話し手の場合には、話し手に関して何らの情報も考慮されない場合に比較して、音声の明瞭性を実質的に改善することが可能となる。
【0023】
上述のいずれのグループ化の場合においても、本発明の方法によれば音声対象の形成、即ち、信号成分SA1 〜SAn の形成、のために、特徴M1 〜Mj に対してゲシュタルト(図形)理論の原理〔E.B.ゴールドシュタイン(Goldstein) 「知覚心理学」(1996年スペクトル学会誌)参照〕が適用される。この場合、特に以下のものが調べられる:
−連続性
−隣接性
−類似性
−共通的動態(Schicksal)
−密集性(Geschlossenheit) 、及び
−良好な移行性(Fortsetzung)
例えば、連続的でもなくかつ急激にも変化しない特徴は、特定の1つの信号源に属するべく分類される。類似の調波構造(音調)を有する時間連続的特徴は、スペクトル隣接性により分類され、同じ信号源にマップ化される。その他類似の特徴、例えば変調、レベル、スペクトル形態、等も個々の音声成分に応じてグループ化される。共通の立上り/減衰、コヒーレント変調、等の共通的動態も同様に、同じ信号成分に応じた所属に分類される。時間経過において密集性を採用することにより急激な変化の解釈を容易に行うことができるので、信号間隔によりそれぞれの事態又は音源を分離する。また、重なり成分はいくつかの音源として分類される。
【0024】
上記の説明の続きとして、「良好な移行性」も結果を得るために非常に有用であるということが言える。即ち、信号は通常その特性を突然に変えることはないので、緩慢な変化は同じ信号成分に分類される一方、急速な変化は新しい信号成分に帰せられる。
【0025】
抽出された特徴M1 〜Mj 自体について別のグループ化を実施することもできる。例えば、音量レベルを分析することにより、特定の信号成分が存在するか否かの決定を行うことが可能である。更に、一般的に種々の音声成分(信号成分)によりスペクトル形態が相異するので、これにより種々の音声対象の区別を実施することができる。検出された調波構造(音調)はそれ自体において、音調フィルタリングによって認識される音調信号成分に関して推論を実施することができる。ここにおいて音調フィルターの伝達関数は、例えば次のものとすることができる:
Hpitch (z)= 1−Z−k
但し、Z−kは音調周波数のサイクル長さを表わす。音調フィルタリングを実施することにより、音調信号成分をその他の信号成分から分離することが可能となる。
【0026】
コヒーレント変調を分析することにより、同じ時間パターンにおいて変調されたスペクトル成分をグループ化し、又は、これらのパターンが相異する場合はこれらのスペクトル成分を分離することが可能である。これにより、特に信号における互いに異なる言語成分を認識し、次いでこれを分離することができる。
【0027】
共通の立上り及び減衰経過を評価することにより、それぞれの周波数内容に応じてどの信号成分を同じ分類に帰属させるかを決定することが可能である。比較的大きな非同期振巾増加又は減少が互いに異なる信号成分を指示する。
【0028】
信号分析段階Iにおける個々の信号成分SA1 〜SAn の認識に続いて、信号処理段階IIにおいて本来のノイズ信号除去が実施される(図1)。
【0029】
本発明の方法に関わる1つの実施の形態においては、ノイズ信号成分の減少又は抑制をそのノイズ信号成分が現れる周波数帯において実施する。認識された所望の信号成分を増巾することによって同じ結果が得られる。従って、本発明において同じ課題を解決する範囲には、両方法の組合せ、即ち、ノイズ信号成分の減少又は抑制及び所望の信号成分の増巾、が含まれる。
【0030】
本発明の方法に関わる別の実施の形態においては、グループ化され、所望の信号として認識された信号成分は、信号処理段階IIの工程において、再結合される。
【0031】
本発明の方法に関わる更に別の実施の形態においては、得られた所望の信号NS又は評価された所望の信号NS′は、信号分析段階Iで得られた情報により再合成される。この点に関する好ましい実施の形態においては、調波構造分析(音調分析)によって、所望の信号の種々の基本周波数を抽出し、かつ、例えば音量又はLPC分析によって高調波(Oberwellen)のスペクトルレベルを決定する〔LPC分析については、S.ラウナー(Launer)の「聴覚神経障害者における音量知覚」(1995年論文、オルデンブルク大学)及びJ.R.デラー(Deller)、J.G.プローキス(Proakis) 、J.H.L.ハンセン(Hansen) の「言語信号の離散時間処理」(1993年マクミラン出版社)参照〕。これらの情報により、音調言語成分として完全に合成された信号を生成することができる。この実施の形態の更なる拡張として、所望の信号の増巾と所望の信号の合成の組合せを実施することが提案される。
【0032】
かくして本発明の方法は、信号分析段階Iと信号処理段階IIを有し、これにより任意の入力信号ESからそこに含まれる所望の信号NSを抽出すること、望まないノイズ成分SSを適切に除去すること及び所望の信号成分NSを再生成することを可能とする。これにより、周囲の音響環境に適合して大きく改善されたノイズ抑制を達成することができる。従来のノイズ除去方法に比べて本発明の方法により得られる所望の信号はマイナス効果を有しない。更に、本発明の方法によれば、静止していないノイズもまた入力信号ESから除去することが可能である。なお、従来のノイズ抑制アルゴリズムでは所望の信号の合成を実施することは不可能である。
【0033】
本発明の方法に関わる別の実施の形態においては、頭書に記載されたビーム形成のような方法と、ノイズ部分化及び抑制のための音響環境の分類による両耳評価及びこれに対応するプログラム選択の技術との組合せが用いられる。
【0034】
原始グループ化のみを実施する類似のノイズ除去技術として、次の2例が挙げられる;即ち、ウノキ(Unoki) 及びM.アカギ(Akagi) の「音声シーン分析によるノイズ信号からのノイズ抽出方法」(1999年「音声通信」27、261〜279ページ)及び国際特許WO00/01200。これらは共に、ノイズ抑制を若干の音声特徴の抽出と文脈不依存によるグループ化によって実施するのみである。一方、本発明により提供される解決法は、より完全かつより密接に音響システムに適用することができる。しかも、本発明による方法は、言語において所望の信号を求めることに限定されない。また、本発明による方法は、既知のすべての音響機構並びに技術ベースの特徴に利用することができる。更に、本発明による特徴抽出及びグループ化は必要に応じ及び/又は機会に応じて、文脈依存又は不依存により、また、予測データ依存又は不依存により実施することができる。
【図面の簡単な説明】
【図1】
本発明の方法を説明する略式ブロック線図。
【図2】
図1のブロック線図の一部に関わる実施の形態の略式ブロック線図。
【図3】
本発明の方法に関わる別の実施の形態のブロック線図。
本発明は、音響システムの入力信号におけるノイズ信号成分を除去する方法、この方法の補聴装置への適用及び補聴装置に関する。
【0002】
補聴装置は、一般に聴力障害者により使用され、その聴力障害をできる限り補償することを基本目的とする。補聴装置の潜在的装着者は、強いノイズ干渉のある環境下においても補聴装置が満足に機能する時に、即ち、強いノイズ信号の存在下においても装着者が高い明白性をもって話し手の言葉を区別できる時に補聴装置の使用を受入れる。
【0003】
以下の説明において「補聴装置」なる語は、人の聴力障害を補正するために使用されるいわゆる補聴器並びにその他のラジオ装置のようなあらゆる音声伝達システムに適用されるものを意図している。
【0004】
ノイズ信号の存在下において補聴装置を用いて言葉の明瞭性を改善する3つの技術として、次のものがある:
第一のものは、いわゆる指向性マイクロホン技術を備えた補聴装置である。この技術は空間フィルタリングを実施し、これによって所望の信号方向以外の方向、例えば後方又は側方、からのノイズ干渉を最少化し又は除去することを可能とする。ビーム形成としても知られるこの方法は、補聴装置において少くとも2つのマイクロホンを必要とする。このような補聴装置の主たる不具合点の1つは、所望の信号と同じ方向から入射するノイズは低減できず、まして除去もできないことである。
【0005】
第二の既知のものは、目的とする所望の信号を好ましくはその信号の発生源において捕らえ、この信号を無線接続を介して送信装置から補聴装置における受信装置に直接伝送するものである。これにより、ノイズ信号は補聴装置に入ることを防止される。この技術は、音響装置産業においては周波数変調(FM)技術として知られるもので、補助装置として音源に配される送信装置及び補聴装置に組込まれる受信装置等を必要とし、このため補聴装置の使用者による取扱いが煩雑なものとなる。
【0006】
最後に第三のものは、補聴装置において、入力信号におけるノイズ信号成分を抑制し又は少くとも減衰させるために、又は入力信号に対応する所望の信号成分を増巾する(いわゆるノイズキャンセル技術)ために入力信号を処理する信号処理アルゴリズムを採用するものである。この方法においては、入力信号に含まれるノイズ信号成分をいくつかの周波数帯において評価し、これによって、明白な所望の信号を生成するために、補聴装置の入力信号からノイズ信号成分が除去される。この方法はまた、スペクトル除去として知られる。欧州特許EP−B1−0534837はこの方法を開示し、これにより満足すべき結果が得られている。しかしながら、スペクトル除去方法は、ノイズ信号成分が帯域的に限定され、かつ、静止している場合にのみ有効である。これ以外の例えば静止していないノイズ信号成分の場合には、所望の信号(即ち、静止していない音声信号)はノイズ信号成分から区別することができない。このような状況においては、スペクトル除去はうまく機能せず、ノイズ抑制がなされず、言葉の明瞭性は大きく減じられる。その上、スペクトル除去の実施が所望の信号の劣化を招くことがある。
【0007】
また、文献として次のものが引用される:
ベア(Bear)等の研究発表「聴覚神経障害者のためのノイズ中の言語のスペクトルコントラスト向上:明瞭性、品質及び応答時間に対する効果」(リハビリテーション研究開発誌30、49〜72ページ)。この研究は、スペクトルコントラストの向上が感覚的な信号品質の改善と聴取努力の軽減をもたらす一方、一般的に音声明瞭性の改善は得られないことを示している。また同じ関係における次の文献がある:即ち、フランク(Frank) 等の論文「音素圧縮の組合せによる補聴器におけるスペクトル向上の評価」(米国音響学会誌106、1452〜1464ページ)。
【0008】
また、完全のために次の文献が引用される:
・T.ベア(Bear)、B.C.J.ムーア(Moore) の「聴覚障害における周波数選 択性の減少の補償対策の評価」〔1997年、W.ジェステッド(Jesteadt)の 「聴覚神経障害のモデル化」、ローレンス・アールバウム・アソシエーテッド 出版、米国ニュージャージ州モーオー市〕;
・V.ホーマン(Hohmann) の「両耳信号パラメータの統計に基づく両耳ノイズ減 少及び部分モデル化」(補聴器研究国際会議、2000年、於米国タホ湖);
・米国特許5727072;
・N.ビラーグ(Virag) の「人の聴音システムのマスキング特性に基づく音声向 上」(ローザンヌ市連邦エコールポリテクニーク、1996年 Ph.D.論文);
・国際特許WO91/03042
従って、本発明は、ノイズ信号成分の除去を改善する方法を提供することを課題とする。
【0009】
この課題は、特許請求の範囲における請求項1に記載の方法により達成される。本発明の方法による好ましい形態並びに本発明の方法の適用及びこれによる補聴装置は、その他の請求項に記載されている。
【0010】
本発明による方法は、信号分析段階と信号処理段階を有し、任意の入力信号からの所望の信号の抽出、望まないノイズ信号成分の除去及び所望の信号成分の再生成を可能とする。この方法を音響環境内において適用することにより、ノイズ抑制の著しい改善を達成することができる。従来のノイズ除去に比べて、本発明の方法によれば所望の信号を損うことがなく、また、静止していないノイズを入力信号から除去することも可能である。なお、従来のノイズ抑制アルゴリズムによれば所望の信号を合成することは不可能である。
【0011】
以下において、実施の形態を示す図面を参照し、本発明をより詳細に説明する。
【0012】
図1のブロック線図は、信号分析段階Iと信号処理段階IIを含む本発明の方法を説明するものである。信号分析段階Iにおいて、音響システムに入射する入力信号ESは、通常ノイズ信号成分SSと所望の信号成分NSを含んでおり、この入力信号ESが以下に説明する音声ベースの原理により分析される。次いで、信号分析段階Iにおいて得られたノイズ信号成分SSと所望の信号成分NSに関わる情報を用いて、信号処理段階IIにおいてノイズ除去が実施される。ここにおいて、基本的に2つの実施方法が提案される。即ち、第一は、所望の信号成分NSを得るために望まないノイズ信号成分SSを入力信号ESから除去する、即ち、ノイズ信号成分SSを抑制し又は減衰させることである。第二のものは、合成によって所望の信号NSまたはNS′を生成することである。
【0013】
本発明の方法に関わる別の実施の形態においては、上記の2つの技術の双方、即ち、得られたノイズ信号成分SSの抑制と認識された所望の信号NS又はNS′の合成を組合せて実施する。
【0014】
入力信号を同様に信号分析段階において単に静止ないしは非静止の状態で調べる従来のノイズ抑制技術とは異なり、本発明の方法は、音声ベースの信号分析を基礎としている。この方法においては、入力信号ESから少くとも音声ベースの特徴の抽出が行われる。音声ベースの特徴は、例えば、音量、スペクトル形態(音質)、調波(harmonische) 構造(音調)、共通の立上り及び減衰時間(オンセット/オフセット)、コヒーレント振巾及び周波数変調、コヒーレント位相、インターオーラル(interaural 、耳間)実行時間及びレベル差、その他を含み、また、ここにいう抽出は単一の又はすべての特徴の抽出を含むことができる。音声の特徴に関わる定義及びその他の情報は、A.S.ブレグマン(Bregman) の「音声シーン(情景) 分析」(1990年MIT出版、ロンドン市ケンブリッジ)が引用される。なお、本発明の方法は、音声ベースの特徴の抽出に限定することなく、本発明の更なる好ましい局面として、音声ベースの特徴に加えて、純粋に技術ベースの特徴、例えばゼロクロスオーバ(ゼロ軸交差)率、時間的レベル変動、変調周波数変化、スペクトル重心(Schwerpunkt) 、振巾分析、その他を抽出することも可能である。
【0015】
1つの実施の形態においては、特徴抽出を時間信号又は互いに異なる周波数帯について実施する。この場合、聴音に適したフィルターバンク〔E.ツヴィッカー(Zwicker) 、H.ファストル(Fastl) の「音響心理学、事実とモデル化」(1999年シュプリンガー出版)参照〕又は技術ベースのフィルターバンク、例えば高速フーリエ変換(FFT)又はウェイブレット(wavelet) フィルターバンクが使用される。
【0016】
音声ベースの特徴であれ技術ベースの特徴であれ、決定された特徴を評価し、これにより、種々の信号成分SA1 〜SAn の認識及び区別を行う。即ち、この場合、信号成分SA1 〜SAn の一部が有用な所望の信号NS又は除去すべきノイズ信号SSを表わす。
【0017】
本発明の方法においては、以下において図2、図3を参照して説明するように、信号成分SA1 〜SAn における分離を2つの異なる方法によって実施する。
【0018】
図2は、信号分析段階Iにおける工程に関わる実施の形態を示すブロック線図である。この工程には互いに直列に接続された2つの装置、即ち、特徴抽出装置20とグループ化装置21が含まれる。
【0019】
特徴抽出装置20は、入力信号ESの特徴化のために、上述のように音声ベースの、また場合により技術ベースの特徴M1 〜Mj の抽出を実施する。これらの特徴M1 〜Mj は、次いでグループ化装置21において、前述のA.S.ブレグマン(Bregman) の「音声シーン分析」(1990年MIT出版、ロンドン市ケンブリッジ)に記載された原始グループ化方法によって分類、整理が行われる。基本的には既知のこの方法は、文脈不依存(kontext−unabhaengig) のものであり、種々の作用工程の連続的実施を基礎としている。即ち、入力信号ESは、抽出された特徴M1 〜Mj に基づいて種々の音源にマップ化された信号成分SA1 〜SAn に分類される。この方法はまた、ボトムアップ方法又はデータドライブ方法と称される。この点については、次の文献が引用される。即ち、G.ブラウン(Brown) 「計算による音声シーン分析:代表的方法」(1992年 Ph.D.論文、シェフィールド大学)、M.クック(Cooke) 「モデル化による音声処理分析及び系統化」(1993年 Ph.D.論文、シェフィールド大学)。
【0020】
図3は、別の実施の形態に関わるブロック線図である。ここにおいては、上述のA.S. ブレグマン(Bregman) 文献に詳述されたスキーム(Schema 、模式)ベースのグループ化方法が使用される。スキームベースのグループ化は文脈依存(kontext−abhaengig) のものであり、この方法はまたトップダウン方法又はプレディクション(予測)ドライブ方法と称される。この点に関して、次の文献が引用される。即ち、D.P.W.エリス(Ellis) 「プレディクションドライブ方法による計算音声シーン分析」(1996年 Ph.D.論文、マサチュセッツ工科大学) 。
【0021】
図3における信号分析段階Iにおいては、特徴抽出装置20及びグループ化装置21に加えて、仮説装置22が用いられる。図3の構成から明らかなように、作用工程には直列の接続が設けられている他、仮説装置22には所定の予測データV、更には抽出された特徴M1 〜Mj 及び信号成分SA1 〜SAn が入力され、これらの入力の考慮の結果として仮説Hが入力信号ESの特性上に生成される。この仮説Hに対応して、好ましくは特徴抽出装置20における特徴抽出と特徴M1 〜Mj のグループ化の双方がその時々の状況に適合させられる。つまり、仮説Hは、ボトムアップ分析により、かつ、所定の予測データVに基づいて、音声文脈上に創出される。仮説Hはまた、グループ化の文脈を決定する。仮説Hは、音響環境に関わる知識と予測並びにグループ化自体を基礎として形成される。従って、信号分析段階Iにおいて実施される工程は、もはや厳密には直列ではなく、フィードバック回路が設けられ、これによってその時々の状況に対する適合が可能とされる。
【0022】
本発明の方法に関わる上記の実施の形態において、例えば、所定の予測データVが話し方(音素)、典型的な音調周波数、話し方速度、音質周波数、等の点で既知である話し手の場合には、話し手に関して何らの情報も考慮されない場合に比較して、音声の明瞭性を実質的に改善することが可能となる。
【0023】
上述のいずれのグループ化の場合においても、本発明の方法によれば音声対象の形成、即ち、信号成分SA1 〜SAn の形成、のために、特徴M1 〜Mj に対してゲシュタルト(図形)理論の原理〔E.B.ゴールドシュタイン(Goldstein) 「知覚心理学」(1996年スペクトル学会誌)参照〕が適用される。この場合、特に以下のものが調べられる:
−連続性
−隣接性
−類似性
−共通的動態(Schicksal)
−密集性(Geschlossenheit) 、及び
−良好な移行性(Fortsetzung)
例えば、連続的でもなくかつ急激にも変化しない特徴は、特定の1つの信号源に属するべく分類される。類似の調波構造(音調)を有する時間連続的特徴は、スペクトル隣接性により分類され、同じ信号源にマップ化される。その他類似の特徴、例えば変調、レベル、スペクトル形態、等も個々の音声成分に応じてグループ化される。共通の立上り/減衰、コヒーレント変調、等の共通的動態も同様に、同じ信号成分に応じた所属に分類される。時間経過において密集性を採用することにより急激な変化の解釈を容易に行うことができるので、信号間隔によりそれぞれの事態又は音源を分離する。また、重なり成分はいくつかの音源として分類される。
【0024】
上記の説明の続きとして、「良好な移行性」も結果を得るために非常に有用であるということが言える。即ち、信号は通常その特性を突然に変えることはないので、緩慢な変化は同じ信号成分に分類される一方、急速な変化は新しい信号成分に帰せられる。
【0025】
抽出された特徴M1 〜Mj 自体について別のグループ化を実施することもできる。例えば、音量レベルを分析することにより、特定の信号成分が存在するか否かの決定を行うことが可能である。更に、一般的に種々の音声成分(信号成分)によりスペクトル形態が相異するので、これにより種々の音声対象の区別を実施することができる。検出された調波構造(音調)はそれ自体において、音調フィルタリングによって認識される音調信号成分に関して推論を実施することができる。ここにおいて音調フィルターの伝達関数は、例えば次のものとすることができる:
Hpitch (z)= 1−Z−k
但し、Z−kは音調周波数のサイクル長さを表わす。音調フィルタリングを実施することにより、音調信号成分をその他の信号成分から分離することが可能となる。
【0026】
コヒーレント変調を分析することにより、同じ時間パターンにおいて変調されたスペクトル成分をグループ化し、又は、これらのパターンが相異する場合はこれらのスペクトル成分を分離することが可能である。これにより、特に信号における互いに異なる言語成分を認識し、次いでこれを分離することができる。
【0027】
共通の立上り及び減衰経過を評価することにより、それぞれの周波数内容に応じてどの信号成分を同じ分類に帰属させるかを決定することが可能である。比較的大きな非同期振巾増加又は減少が互いに異なる信号成分を指示する。
【0028】
信号分析段階Iにおける個々の信号成分SA1 〜SAn の認識に続いて、信号処理段階IIにおいて本来のノイズ信号除去が実施される(図1)。
【0029】
本発明の方法に関わる1つの実施の形態においては、ノイズ信号成分の減少又は抑制をそのノイズ信号成分が現れる周波数帯において実施する。認識された所望の信号成分を増巾することによって同じ結果が得られる。従って、本発明において同じ課題を解決する範囲には、両方法の組合せ、即ち、ノイズ信号成分の減少又は抑制及び所望の信号成分の増巾、が含まれる。
【0030】
本発明の方法に関わる別の実施の形態においては、グループ化され、所望の信号として認識された信号成分は、信号処理段階IIの工程において、再結合される。
【0031】
本発明の方法に関わる更に別の実施の形態においては、得られた所望の信号NS又は評価された所望の信号NS′は、信号分析段階Iで得られた情報により再合成される。この点に関する好ましい実施の形態においては、調波構造分析(音調分析)によって、所望の信号の種々の基本周波数を抽出し、かつ、例えば音量又はLPC分析によって高調波(Oberwellen)のスペクトルレベルを決定する〔LPC分析については、S.ラウナー(Launer)の「聴覚神経障害者における音量知覚」(1995年論文、オルデンブルク大学)及びJ.R.デラー(Deller)、J.G.プローキス(Proakis) 、J.H.L.ハンセン(Hansen) の「言語信号の離散時間処理」(1993年マクミラン出版社)参照〕。これらの情報により、音調言語成分として完全に合成された信号を生成することができる。この実施の形態の更なる拡張として、所望の信号の増巾と所望の信号の合成の組合せを実施することが提案される。
【0032】
かくして本発明の方法は、信号分析段階Iと信号処理段階IIを有し、これにより任意の入力信号ESからそこに含まれる所望の信号NSを抽出すること、望まないノイズ成分SSを適切に除去すること及び所望の信号成分NSを再生成することを可能とする。これにより、周囲の音響環境に適合して大きく改善されたノイズ抑制を達成することができる。従来のノイズ除去方法に比べて本発明の方法により得られる所望の信号はマイナス効果を有しない。更に、本発明の方法によれば、静止していないノイズもまた入力信号ESから除去することが可能である。なお、従来のノイズ抑制アルゴリズムでは所望の信号の合成を実施することは不可能である。
【0033】
本発明の方法に関わる別の実施の形態においては、頭書に記載されたビーム形成のような方法と、ノイズ部分化及び抑制のための音響環境の分類による両耳評価及びこれに対応するプログラム選択の技術との組合せが用いられる。
【0034】
原始グループ化のみを実施する類似のノイズ除去技術として、次の2例が挙げられる;即ち、ウノキ(Unoki) 及びM.アカギ(Akagi) の「音声シーン分析によるノイズ信号からのノイズ抽出方法」(1999年「音声通信」27、261〜279ページ)及び国際特許WO00/01200。これらは共に、ノイズ抑制を若干の音声特徴の抽出と文脈不依存によるグループ化によって実施するのみである。一方、本発明により提供される解決法は、より完全かつより密接に音響システムに適用することができる。しかも、本発明による方法は、言語において所望の信号を求めることに限定されない。また、本発明による方法は、既知のすべての音響機構並びに技術ベースの特徴に利用することができる。更に、本発明による特徴抽出及びグループ化は必要に応じ及び/又は機会に応じて、文脈依存又は不依存により、また、予測データ依存又は不依存により実施することができる。
【図面の簡単な説明】
【図1】
本発明の方法を説明する略式ブロック線図。
【図2】
図1のブロック線図の一部に関わる実施の形態の略式ブロック線図。
【図3】
本発明の方法に関わる別の実施の形態のブロック線図。
Claims (14)
- 入力信号(ES)におけるノイズ信号成分(SS)を除去する方法において、前記方法は、信号分析段階(I)において、前記入力信号(ES)に含まれる前記ノイズ信号成分(SS)と所望の信号(NS)を特徴化する工程と、信号処理段階(II)において、前記信号分析段階(I)において得られた特徴に基づいて前記所望の信号(NS)又は評価された所望の信号(NS′)を決定又は生成する工程を有し、かつ、前記ノイズ信号成分(SS)と所望の信号(NS)を含む信号成分の特徴化は、少くとも音声ベースの特徴(M1 〜Mj )の適用により実施してなることを特徴とする方法。
- 前記信号成分(SS、NS)の特徴化に適用される音声ベースの特徴(M1 〜Mj )は、次のもの、即ち、音量、スペクトル形態、調波構造、共通の立上り及び減衰時間、コヒーレント振巾及び周波数変調、コヒーレント位相、インターオーラル実行時間及びレベル差、の1つ又はそれ以上でなることを特徴とする請求項1記載の方法。
- 前記音声ベースの特徴(M1 〜Mj )は、互いに異なる周波数帯において決定してなることを特徴とする請求項1又は2記載の方法。
- 前記信号成分(SS、NS)の特徴化は、前記信号分析段階(I)で決定された特徴(M1 〜Mj )を原始グループ化方法によって評価してなることを特徴とする請求項1ないし3のいずれかに記載の方法。
- 前記信号成分(SS、NS)の特徴化は、前記信号分析段階(I)で決定された特徴(M1 〜Mj )をスキームベースのグループ化方法によって評価してなることを特徴とする請求項1ないし3のいずれかに記載の方法。
- 前記信号成分(SS、NS)の1つにおいてその特性に仮説を設定又は附与し、前記仮説を、決定された前記特徴(M1 〜Mj )のグループ化において考慮してなることを特徴とする請求項5記載の方法。
- 前記信号成分(SS、NS)の特徴化のために、前記音声ベースの特徴及び場合によりその他の特徴(M1 〜Mj )をゲシュタルト理論の原理によりグループ化してなることを特徴とする請求項5又は6記載の方法。
- ノイズ信号成分として認識された前記信号成分(SS)は抑制し、及び/又は所望の信号又は評価された所望の信号として認識された前記信号成分(NS、NS′)は増巾してなることを特徴とする請求項1ないし7のいずれかに記載の方法。
- 前記所望の信号(NS)又は評価された所望の信号(NS′)は、前記信号分析段階(I)において決定された特徴(M1 〜Mj )に基づいて、前記信号処理段階(II)において合成してなることを特徴とする請求項1ないし8のいずれかに記載の方法。
- 前記信号分析段階(I)における調波構造の分析により、前記所望の信号又は評価された所望の信号の信号成分(NS、NS′)の互いに異なる基本周波数を抽出し、特に音量又はLPC分析により、これらの信号成分(NS、NS′)の高調波のスペクトルレベルを決定し、かつ、前記スペクトルレベル及び高調波に基づいて音調言語成分における所望の信号を合成してなることを特徴とする請求項1ないし7のいずれかに記載の方法。
- 前記信号分析段階(I)における調波構造の分析により、前記所望の信号又は評価された所望の信号の信号成分(NS、NS′)の非音調成分を抽出し、特に音量又はLPC分析により、これらの信号成分(NS、NS′)のスペクトルレベルを決定し、かつ、ノイズ生成手段を用いて非音調言語成分における所望の信号を合成してなることを特徴とする請求項1ないし7のいずれかに記載の方法。
- 前記所望の信号(NS)又は評価された所望の信号(NS′)を増巾してなることを特徴とする請求項10又は11記載の方法。
- 請求項1ないし12のいずれかに記載の方法を補聴装置の操作に適用すること。
- 請求項1ないし12のいずれかに記載の方法により作動する補聴装置。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CH2001/000236 WO2001047335A2 (de) | 2001-04-11 | 2001-04-11 | Verfahren zur elimination von störsignalanteilen in einem eingangssignal eines auditorischen systems, anwendung des verfahrens und ein hörgerät |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004512700A true JP2004512700A (ja) | 2004-04-22 |
Family
ID=4358195
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001547942A Pending JP2004512700A (ja) | 2001-04-11 | 2001-04-11 | 音響システムの入力信号におけるノイズ信号成分の除去方法、同方法の適用及び補聴器 |
Country Status (4)
Country | Link |
---|---|
EP (1) | EP1380028A2 (ja) |
JP (1) | JP2004512700A (ja) |
AU (1) | AU2001246278B2 (ja) |
CA (1) | CA2409835A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101420960B1 (ko) | 2010-07-15 | 2014-07-18 | 비덱스 에이/에스 | 보청기 시스템에서의 신호 처리 방법 및 보청기 시스템 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4051331A (en) * | 1976-03-29 | 1977-09-27 | Brigham Young University | Speech coding hearing aid system utilizing formant frequency transformation |
US5651071A (en) * | 1993-09-17 | 1997-07-22 | Audiologic, Inc. | Noise reduction system for binaural hearing aid |
GB9813973D0 (en) * | 1998-06-30 | 1998-08-26 | Univ Stirling | Interactive directional hearing aid |
-
2001
- 2001-04-11 EP EP01919039A patent/EP1380028A2/de not_active Withdrawn
- 2001-04-11 CA CA002409835A patent/CA2409835A1/en not_active Abandoned
- 2001-04-11 AU AU2001246278A patent/AU2001246278B2/en not_active Ceased
- 2001-04-11 JP JP2001547942A patent/JP2004512700A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101420960B1 (ko) | 2010-07-15 | 2014-07-18 | 비덱스 에이/에스 | 보청기 시스템에서의 신호 처리 방법 및 보청기 시스템 |
Also Published As
Publication number | Publication date |
---|---|
CA2409835A1 (en) | 2002-11-20 |
AU2001246278B2 (en) | 2008-02-07 |
EP1380028A2 (de) | 2004-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8638961B2 (en) | Hearing aid algorithms | |
Levitt | Noise reduction in hearing aids: a review. | |
AU771444B2 (en) | Noise reduction apparatus and method | |
CN109065067A (zh) | 一种基于神经网络模型的会议终端语音降噪方法 | |
US20030185411A1 (en) | Single channel sound separation | |
US9886967B2 (en) | Systems and methods for speech extraction | |
AU2010204470A1 (en) | Automatic sound recognition based on binary time frequency units | |
Roman et al. | Pitch-based monaural segregation of reverberant speech | |
Itoh et al. | Environmental noise reduction based on speech/non-speech identification for hearing aids | |
US20020150264A1 (en) | Method for eliminating spurious signal components in an input signal of an auditory system, application of the method, and a hearing aid | |
Jamieson et al. | Evaluation of a speech enhancement strategy with normal-hearing and hearing-impaired listeners | |
Kulkarni et al. | A review of speech signal enhancement techniques | |
KR101850693B1 (ko) | 인-이어 마이크로폰을 갖는 이어셋의 대역폭 확장 장치 및 방법 | |
EP1216527B1 (en) | Apparatus and method for de-esser using adaptive filtering algorithms | |
CN111225317A (zh) | 一种回声消除方法 | |
Çolak et al. | A novel voice activity detection for multi-channel noise reduction | |
JP3916834B2 (ja) | 雑音が付加された周期波形の基本周期あるいは基本周波数の抽出方法 | |
CN109788410A (zh) | 一种抑制扬声器杂音的方法和装置 | |
JP2004512700A (ja) | 音響システムの入力信号におけるノイズ信号成分の除去方法、同方法の適用及び補聴器 | |
Sun et al. | An RNN-based speech enhancement method for a binaural hearing aid system | |
Maganti et al. | A perceptual masking approach for noise robust speech recognition | |
JPH07146700A (ja) | ピッチ強調方法および装置ならびに聴力補償装置 | |
Muhsina et al. | Signal enhancement of source separation techniques | |
JP5249431B2 (ja) | 信号経路を分離する方法及び電気喉頭を使用して音声を改良するための使用方法 | |
WO2022014359A1 (ja) | 信号処理装置、信号処理方法およびプログラム |