JP2008522511A - 適応可能な音声処理パラメータ用の方法及び装置 - Google Patents

適応可能な音声処理パラメータ用の方法及び装置 Download PDF

Info

Publication number
JP2008522511A
JP2008522511A JP2007543648A JP2007543648A JP2008522511A JP 2008522511 A JP2008522511 A JP 2008522511A JP 2007543648 A JP2007543648 A JP 2007543648A JP 2007543648 A JP2007543648 A JP 2007543648A JP 2008522511 A JP2008522511 A JP 2008522511A
Authority
JP
Japan
Prior art keywords
audio signal
computer program
gain
input audio
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007543648A
Other languages
English (en)
Inventor
ピーター・ジョン・ブレイミー
ボナー・ディクソン
ブレントン・ロバート・スティール
マーガレット・ジェーン・ステインバーグ
Original Assignee
ダイナミック ヒアリング ピーティーワイ リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ダイナミック ヒアリング ピーティーワイ リミテッド filed Critical ダイナミック ヒアリング ピーティーワイ リミテッド
Publication of JP2008522511A publication Critical patent/JP2008522511A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Control Of Amplification And Gain Control (AREA)

Abstract

入力音声信号(210)は、目標ダイナミックレンジ(910、920)を満たすために処理される。入力音声信号(210)に特有の少なくとも1つの利得が、入力音声信号(210)に適用され、処理済音声信号(214)を生成する。処理済音声信号のダイナミックレンジが測定され、また、目標ダイナミックレンジ(910、920)との測定ダイナミックレンジの整合が、決定される。利得は、少なくとも1つの入力音声信号固有パラメータに基づき調整され、目標ダイナミックレンジ(910、920)との処理済音声信号(214)のダイナミックレンジの整合を改善する。入力音声信号固有パラメータは、少なくとも1つの監視信号条件に応じて、適応可能である。

Description

本発明は、音声信号の特性を調整して、それぞれの目標レベルを満たすための音声信号の処理に関する。そのような音声信号処理は、補聴器音声信号処理、電気通信音声信号処理等の用途がある。
通常、音声用途用の音声の処理では、一般的に、20Hz乃至20kHz又はそのサブレンジであると見なされる音声帯域全体の目標ダイナミックレンジ内に入るように、音声信号を増幅又は調整する必要がある。目標ダイナミックレンジは、通常、人間のリスナーに対して各周波数において可聴及び快適の双方である強度範囲によって、処理の次段、即ち、信号がリスナーにとって最適化される所で決定される。
電話又は音声記録システム等の音声伝送システムの場合、目標ダイナミックレンジは、伝送ライン又は記憶媒体の動作ダイナミックレンジである。処理される音声信号の周波数成分の幾つか又は全ては、目標ダイナミックレンジの外側に入り得る。即ち、信号のダイナミックレンジと目標ダイナミックレンジとの間には、不整合があり得る。
人間のリスナーの場合、通常、目標ダイナミックレンジが、可聴周波数帯全体において、制御された状態で整合又は設定され、システム全体に対して、整合した音量又は所定の周波数応答を生成しなければならないという追加の要件がある。そのような所定の周波数応答は、一般的に、リスナーの快適度又は音声の品質を損なうことなく、音声音の了解度を最大化することを意図している。音楽音の場合、目標ダイナミックレンジ及び/又は周波数応答は、リスナーの好みによる特定の音又は高・低ピッチ音のバランスを実現するように選択し得る。
更に、各人間のリスナーの場合、目標ダイナミックレンジは、周波数全体に渡ってかなり変動し、また、特に、聴覚が正常に機能しないリスナーの場合、最小可聴しきい値と最大快適しきい値との間の範囲が狭いことがある。同様に、正常な聴覚のリスナーに使用可能な又は最適なダイナミックレンジは、周波数全体に渡ってかなり変動し、また、リスナーのダイナミックレンジの低い部分をマスクする周辺雑音がある場合、範囲が狭いことがある。
そのような問題に対処する簡単な解決策は、音声信号のダイナミックレンジと目標ダイナミックレンジとの重なり合いを最大化するように構成された線形増幅器/減衰器を用いることである。更なる改善は、異なる周波数において異なる量の利得を提供する音声プロセッサを設けて、各周波数帯における目標ダイナミックレンジとの出力信号の整合を最適化することである。後続の処理段は、出力ダイナミックレンジを、例えば、上端では、入力メカニズムの飽和によって、また、下端では、しきい値処理又は解像度制限によって切り捨て得る。しかしながら、信号が人間のリスナーへの出力用である場合、出力ダイナミックレンジ上端の何らかの切捨てが欠如すると、不快感、精神的外傷、又は聴覚系の損傷が生じ得る。これらの及び他の理由により、通常、最大電力出力レベル又は他の種類の制限メカニズムが、線形音声処理システムの出力に適用される。
上述した問題に対する更に複雑な解決策は、圧縮方式の使用を伴う。通常、圧縮は、出力ダイナミックレンジが、入力ダイナミックレンジより小さくなるように又はそれを基準として「圧縮される」ように、大きな利得を小さい音声に適用し、また、小さい利得を大きい音声に適用する。従って、圧縮は、非線形信号処理方式である。出力ダイナミックレンジに対する入力ダイナミックレンジの比は、圧縮比として知られている。圧縮パラメータは、図1の入出力関数110、120、130によって示すように、各周波数における固定入出力関数の観点で記述されることが多い。各入出力関数は、与えられた入力信号レベルに対して、音声プロセッサによって生成される出力レベルを規定する。
圧縮比は、入出力関数の勾配の逆数である。図1に示すように、入出力関数130は、1より小さい勾配を有し、従って、単純圧縮方式である。入出力関数110は、入出力関数の異なる部分で異なる勾配を有するが、それにもかかわらず、圧縮を提供すると言われる。線形増幅器は、圧縮を生ぜず、従って、勾配1の入出力関数120を有する。
そのような問題に対処する最も洗練された信号処理手法は、米国特許第6,731,767号に記載された適応ダイナミックレンジ最適化(ADRO)手法であり、その内容は、本明細書において引用・参照する。事前指定の利得又は利得圧縮プロファイルに焦点をあてるよりもむしろ、ADRO手法によって採用された解決策が、出力音声信号に望まれる目標ダイナミックレンジを定義し、また、目標ダイナミックレンジとの実際の出力ダイナミックレンジの緊密な整合を維持するために入力信号に適用される利得を調整する。ADRO信号プロセッサの出力レベルは、従って、固定パラメータによって定義された一組の処理規則によって拘束される。処理規則が満足される間、信号プロセッサは、線形増幅器として動作する。処理規則が満足されない場合、プロセッサによって適用される利得は、処理規則が満足されるまで、適応可能に変更される。
各周波数帯に対して、ADRO信号プロセッサは、パーセンタイル推定器の統計的な目安を選択することによって、目標ダイナミックレンジとの出力ダイナミックレンジの整合の精度を決定する。30番目のパーセンタイル推定器は、それ未満のレベルでは、測定期間の30%の間、出力信号がそのままであるレベルの測定値を提供する。信号が人間のリスナー用に処理されている場合、目標ダイナミックレンジの下端は、リスナーの可聴しきい値を決定することによって、予め規定される。30番目のパーセンタイル推定器が可聴しきい値未満である場合、利得は、ゆっくりと増加される。90番目のパーセンタイル推定器は、それ未満のレベルでは、測定期間の90%の間、出力信号がそのままであるレベルの測定値を提供する。再度、信号が人間のリスナー用に処理されている場合、目標ダイナミックレンジの上端は、リスナーの境界快適レベルを決定することによって、予め規定される。90番目のパーセンタイル推定器が境界快適レベルを超える場合、利得は、ゆっくりと低減される。30番目及び90番目のパーセンタイル推定器は、従って、出力ダイナミックレンジが目標ダイナミックレンジに如何に良く整合しているか決定するために用いられる。
ADROが人間のリスナーに適用される場合、更に2つの規則が、各周波数帯において課される。最大出力規則は、出力信号の大きさを固定最大出力限界と比較する。出力信号の大きさが固定最大出力限界より大きい場合、この大きさは、最大出力限界に合わせて上限が設けられる。最大利得規則は、この利得を固定最大利得限界と比較し、利得が固定最大利得限界を超過するのを防止する。
ADRO処理方式は、小さい音声の改善された可聴性、雑音がある状態と無い状態双方における音声の改善された了解度、及び線形増幅及び圧縮方式に対して向上された快適度及びリスナー嗜好を提供することを示している。ADRO処理方式は、各周波数帯における増幅器の利得を独立に適合させ、固定パラメータに基づき、最適なリスニング条件を提供する。
本明細書に含まれる文献、行為、材料、装置、物等のあらゆる議論は、本発明に単に文脈を提供することを目的とする。これらのいずれか又は全てが、従来技術の基礎を形成すること、又は、本発明に関連する分野において共通の一般的な知識であって、本出願の各請求項の優先日以前にそれが存在していたことを認めるものではない。
本明細書全体において、語「含まれる」又は派生語「含む」、「含んでいる」は、言及された要素、完全体もしくはステップ、又は要素、完全体もしくはステップのグループの包含を意味するが、他のあらゆる要素、完全体もしくはステップ、又は要素、完全体もしくはステップのグループの排除を意味しないものと理解されたい。
第1態様によれば、本発明は、目標ダイナミックレンジを満たすために少なくとも1つの入力音声信号を処理する方法を提供する。本方法には、
少なくとも1つの入力音声信号固有利得を少なくとも1つの入力音声信号に適用して、処理済音声信号を生成する段階と、
処理済音声信号のダイナミックレンジを測定する段階と、
目標ダイナミックレンジとの測定ダイナミックレンジの整合を決定する段階と、
少なくとも1つの入力音声信号固有パラメータに基づき、各入力音声信号固有利得を調整して、目標ダイナミックレンジとの処理済音声信号のダイナミックレンジの整合を改善する段階と、が含まれ、少なくとも1つの入力音声信号固有パラメータは、少なくとも1つの監視信号条件に応じて適応可能である。
第2態様によれば、本発明は、目標ダイナミックレンジを満たすために、少なくとも1つの入力音声信号を処理するための装置を提供する。本装置には、
少なくとも1つの入力音声信号固有利得を少なくとも1つの入力音声信号に適用して、処理済音声信号を生成するための利得段と、
処理済音声信号のダイナミックレンジを測定するための、また、目標ダイナミックレンジとの測定ダイナミックレンジの整合を決定するための分析器と、
少なくとも1つの入力音声信号固有パラメータに基づき、各入力音声信号固有利得を調整して、目標ダイナミックレンジとの処理済音声信号のダイナミックレンジの整合を改善するための利得コントローラと、が含まれ、少なくとも1つの入力音声信号固有パラメータは、少なくとも1つの監視信号条件に応じて適応可能である。
第3態様によれば、本発明は、目標ダイナミックレンジを満たすために、少なくとも1つの入力音声信号を処理するためのコンピュータプログラムを提供する。本コンピュータプログラムには、
少なくとも1つの入力音声信号固有利得を少なくとも1つの入力音声信号に適用して処理済音声信号を生成するためのコードと、
処理済音声信号のダイナミックレンジを測定するためのコードと、
目標ダイナミックレンジとの測定ダイナミックレンジの整合を決定するためのコードと、
少なくとも1つの入力音声信号固有パラメータに基づき、各入力音声信号固有利得を調整して、目標ダイナミックレンジとの処理済音声信号のダイナミックレンジの整合を改善するためのコードと、が含まれ、少なくとも1つの入力音声信号固有パラメータは、少なくとも1つの監視信号条件に応じて適応可能である。
第4態様によれば、本発明は、目標ダイナミックレンジを満たすために、少なくとも1つの入力音声信号を処理するための手順をコンピュータに実行させるコンピュータプログラムコード手段が含まれるコンピュータプログラム要素を提供する。本コンピュータプログラム要素には、
少なくとも1つの入力音声信号固有利得を少なくとも1つの入力音声信号に適用して、処理済音声信号を生成するためのコンピュータプログラムコード手段と、
処理済音声信号のダイナミックレンジを測定するためのコンピュータプログラムコード手段と、
目標ダイナミックレンジとの測定ダイナミックレンジの整合を決定するためのコンピュータプログラムコード手段と、
少なくとも1つの入力音声信号固有パラメータに基づき、各入力音声信号固有利得を調整して、目標ダイナミックレンジとの処理済音声信号のダイナミックレンジの整合を改善するためのコンピュータプログラムコード手段と、が含まれ、少なくとも1つの入力音声信号固有パラメータは、少なくとも1つの監視信号条件に応じて適応可能である。
少なくとも1つの入力音声信号には、マイクロホンから得られた音声信号又は伝送媒体から得られた音声信号等の、単一音声信号を含み得る。他の選択肢として、入力音声信号には、単一音声信号の変換を含み得る。
他の選択肢として、入力音声信号には、音声信号の一部及び/又は音声信号の一部の変換を含み得る。そのような実施形態では、複数の入力音声信号が、本発明に基づき処理され、各入力音声信号が、単一音声信号の固有部分に対応し得る。
少なくとも1つの入力音声信号には、制約された周波数帯内に入る音声信号の周波数成分だけが含まれるように、周波数領域フィルタ処理によって得られた音声信号の部分を含み得る。複数の周波数帯と1対1の対応関係を有する複数のそのような入力音声信号は、本発明に基づき処理し得る。
更に又は他の選択肢として、少なくとも1つの入力音声信号には、正弦波ベース関数変換等の周波数変換近似によって得られた音声信号の一部を含み得る。更に又は他の選択肢として、少なくとも1つの入力音声信号には、時間ドメイン処理によって得られた音声信号の一部を含み得る。更に又は他の選択肢として、少なくとも1つの入力音声信号には、ウェーブレット関数を用いることによって得られた音声信号の一部を含み得る。
1つの入力音声信号固有利得は、該又は各入力音声信号に適用し得る。他の選択肢として、複数の入力音声信号固有利得は、該又は各入力音声信号に適用し得る。
本発明の幾つかの実施形態において、監視信号条件には、測定ダイナミックレンジと目標ダイナミックレンジとの間の不整合の測定値を含み得る。そのような実施形態において、少なくとも1つの入力音声信号固有パラメータには、好適には、利得調整の利得スルーレートが含まれ、また、そのような実施形態には、更に、不整合が大きい場合、利得スルーレートが大きくなるように制御する段階と、また、不整合が小さい場合、利得スルーレートが小さくなるように制御する段階と、を含み得る。そのような実施形態は、不整合が大きい場合であっても、出力ダイナミックレンジと目標ダイナミックレンジとの間の不整合に応じて、入力音声信号固有利得の速い処理時間を提供する際に使用し得る。従って、そのような実施形態は、警報等の過度に大きい音声信号の速い抑制及び大きな不整合が無い状態での更なる測定利得の洗練の双方に対処し得る。
少なくとも1つの入力音声信号固有パラメータに利得スルーレートが含まれる実施形態において、利得を増大させるための利得スルーレートを、利得を減少させるためのスルーレートと異なるように制御し得る。例えば、利得を減少させるための利得スルーレートは、大きいことが許可され、他方、利得を増大させるための利得スルーレートは、適度な利得スルーレートに制限し得る。そのような実施形態は、ファクシミリ音又は警報等の音声衝撃信号を敏速に抑制し、他方、抑制された利得を増加し、例えば、静穏な信号期間中、過度の急速な利得増加を回避得る。
本発明の幾つかの実施形態において、少なくとも1つの監視信号条件には、周辺雑音信号条件を含み得る。周辺雑音信号条件は、音声プロセッサによって処理されるのと同じ信号から監視し得る。更に又は他の選択肢として、周辺雑音信号条件は、処理済音声信号のリスナーの環境において、少なくとも1つのマイクロホンから得られた少なくとも1つの他の信号から監視し得る。そのような実施形態において、少なくとも1つの入力音声信号固有パラメータには、目標可聴レベル及び目標快適レベルの内の1つ、好適には、双方を含み得る。
本発明の幾つかの実施形態において、監視信号条件には、ファクシミリ音、警報、大音声及び/又は他の種類の音声衝撃を検出するために、音声衝撃の存在を監視する段階を含み得る。そのような実施形態において、少なくとも1つの入力音声信号固有パラメータには、利得スルーレートを含み得るが、この場合、大きな利得低減スルーレートが、音声衝撃の存在の検出に応じて、利得低減のために課される。そのような実施形態において、少なくとも1つの入力音声信号固有パラメータには、更に、最大出力限界を含み得るが、この場合、最大出力限界は、音声衝撃の存在の検出に応じて低減される。
更なる本発明の実施形態において、利得は、対象信号が存在しない期間中、増加を防止し得る。更に、好適には、そのような本発明の実施形態には、対象信号が存在する期間及び対象信号が存在しない期間を決定するために、入力信号を監視する段階が含まれる。
少なくとも1つの監視信号条件に周辺雑音が含まれる本発明の実施形態において、少なくとも1つの入力音声信号の目標ダイナミックレンジは、周辺雑音に応じて、適応可能であり得る。そのような実施形態において、目標ダイナミックレンジの下端は、目標ダイナミックレンジを周辺雑音レベルより上に維持するために、周辺雑音レベルの増加に応じて、増大させ得る。更に又は他の選択肢として、そのような実施形態において、目標ダイナミックレンジの上端は、周辺雑音の増加に応じて、周辺雑音がある状態でリスナーの快適レベルの増加に対応する量だけ増大させ得る。そのような実施形態は、信号処理方式を提供する際、有利であり、これによって、目標ダイナミックレンジは、周辺雑音レベルの変動を許すように適応可能である。更に、そのような実施形態は、低周辺雑音状態より高周辺雑音状態において、リスナーの快適レベルが高いことが多いことを認識し、こうして、それに応じて、目標ダイナミックレンジを適合させる。
更に、少なくとも1つの監視信号条件に周辺雑音が含まれる本発明の実施形態において、少なくとも1つの高周波数帯の目標ダイナミックレンジは、好適には、少なくとも1つの低周波数帯の目標ダイナミックレンジより高く引き上げられる。そのような実施形態では、低周波数雑音が信号の高周波数成分の了解度に影響を及ぼすこと、通常、電話スピーカが大きい高周波数能力を有すること、通常、音量が増加するにつれて、音声が高周波数側にシフトすること、及びホス雑音の高周波数特性が認識される。
本発明の実施形態において、1つ又は複数の入力音声信号に関する1つ又は複数の以下のパラメータ、即ち、最大出力限界(1つ又は複数)、快適目標(1つ又は複数)、可聴目標(1つ又は複数)、背景雑音目標(1つ又は複数)、最大利得(1つ又は複数)、最小利得(1つ又は複数)、増加利得スルーレート(1つ又は複数)、減少利得スルーレート(1つ又は複数)、増加パーセンタイル推定スルーレート(1つ又は複数)、及び減少パーセンタイル推定スルーレート(1つ又は複数)は、少なくとも1つの監視信号条件に応じて適応可能であり得る。
本発明の幾つかの実施形態において、複数の入力音声信号を処理し得る。そのような実施形態において、第1入力音声信号の少なくとも1つの入力音声信号固有パラメータは、第2入力音声信号の少なくとも1つの入力音声信号固有パラメータとは異なり得る。例えば、本発明が、送信信号及び受信信号による電話システムにおいて実現される場合、受信信号の入力音声信号固有パラメータは、送信信号における周辺雑音に応じて制御し得る。本発明が、ステレオリスニング装置又は補聴器対において実現される場合、2つの信号の監視条件に応じて、少なくとも1つの入力音声信号固有パラメータを制御し得る。
本発明の好適な実施形態において、音声信号の複数の周波数帯は、本発明の方法に基づき、各々処理される。そのような実施形態において、音声信号は、好適には、早めに、フィルタバンクによって、複数の周波数帯に分割され個別に処理される。他の選択肢として、本発明は、音声信号の単一周波数帯において、例えば、音声信号が、単一帯域信号として処理される実施形態において、又は、信号の複数の帯域の1つだけが、本発明に基づき処理されるように望まれる実施形態において、適用し得る。例えば、ファクシミリ音周波数を包含する周波数帯は、本発明の処理が多帯域処理方式で適用される唯一の帯域であってよい。
本発明の実施形態は、米国特許第6,731,767号に記載されたADRO手法と共に適用し得る。しかしながら、本発明の実施形態は、信号が処理されてパラメータ定義目標ダイナミックレンジに整合される任意の音声処理手法と共に適用し得る。
句「音声信号」は、音声情報を伝達又は記憶する任意の信号を指すために本明細書で用いられ、また、電気的、光学的、電磁気的又はデジタル的に符号化された信号を含むことを認識されたい。
以下、添付図面を参照して、本発明の例について述べる。
図2Aは、本発明の第1実施形態に基づくADRO信号処理方式の少なくとも1つの信号処理パラメータを適応可能に変えるための監視信号条件の用途を示すブロック図である。入力音声信号210は、ADROプロセッサ212によって調整され、処理済音声信号214を生成する。ADROプロセッサ212は、処理済音声信号214から統計量を得て、216において、それらの統計量を適応パラメータプロセッサ218に渡す。更に、適応パラメータプロセッサ218は、第2入力信号220の信号条件を監視し、それに応じて処理パラメータを適合させ、222において、処理パラメータをADROプロセッサ212に渡す。
図2Bは、本発明の第2実施形態に基づくADRO信号処理方式の少なくとも1つの信号処理パラメータを適応可能に変えるための監視信号条件の用途を示すブロック図である。入力音声信号230は、ADROプロセッサ232によって調整され、処理済音声信号234を生成する。ADROプロセッサ232は、処理済音声信号234から統計量を得て、236において、それらの統計量を適応パラメータプロセッサ238に渡す。適応パラメータプロセッサ238は、更に、入力信号230の信号条件を監視し、それに応じて、処理パラメータを適合させ、240において、処理パラメータをADROプロセッサ232に渡す。
図2Cは、本発明の第3実施形態に基づくADRO信号処理方式の少なくとも1つの信号処理パラメータを適応可能に変えるための監視信号条件の用途を示すブロック図である。第1入力音声信号250は、第1ADROプロセッサ252によって調整され、第1処理済音声信号254を生成する。第1ADROプロセッサ252は、第1処理済音声信号254から統計量を得て、256において、それらの統計量を適応パラメータプロセッサ258に渡す。第2入力音声信号260は、第2ADROプロセッサ262によって調整され、第2処理済音声信号264を生成する。第2ADROプロセッサ262は、第2処理済音声信号264から統計量を得て、266において、それらの統計量を適応パラメータプロセッサ258に渡す。適応パラメータプロセッサ258は、各入力信号250及び260の少なくとも1つの信号条件を監視し、それに応じて、各ADROプロセッサ252、262用に処理パラメータを適合させる。従って、双方のADROプロセッサ252、262の適応可能なパラメータは、入力信号250、260のいずれか又は双方の監視信号条件によって影響され得る。268、270において、適合された処理パラメータは、それぞれ、ADROプロセッサ252、262に渡される。
図2Dは、本発明の第4実施形態に基づくADRO信号処理方式の少なくとも1つの信号処理パラメータを適応可能に変えるための監視信号条件の用途を示すブロック図である。本実施形態において、回線入力信号280は、ADROプロセッサ282によって調整される。ADROプロセッサ282は、適応パラメータ284によって制御される処理規則に基づき機能し、適応パラメータ284は、必要に応じて、適応パラメータプロセッサ286によって変更される。入力信号280は、ADROプロセッサ282によって処理され、ヘッドセット又は電話ハンドセットを用いるリスナー用のイヤホーン288において音響出力を生成する。
適応パラメータプロセッサ286は、回線入力280と、周辺雑音マイクロホン290等の二次供給源との双方から入力を受け取る。例えば、二重システムにおいて、周辺雑音マイクロホン信号292は、リスナーから音声信号を得るために用いられるヘッドセット又はハンドセット音声マイクロホンからであってよい。他の選択肢として、周辺雑音マイクロホン信号292は、リスナー近隣の音響環境を測定する他のマイクロホンからであってよい。また、適応パラメータプロセッサ286は、ADROプロセッサ282からの出力パーセンタイル推定値294等の統計量を用い得る。
図2Dの第4実施形態において、適応パラメータプロセッサ286は、マイクロホン信号292から得られた環境雑音の推定値に応じて、各帯域における快適度及び可聴性目標を適合させる。適応パラメータプロセッサ286は、更に、帯域毎にADRO利得スルーレートを適合させ、更に、回線入力信号280の特性に応じて、最大出力限界パラメータを適合させる。
図3Aは、本発明の第5実施形態の簡単なブロック図であるが、ここでは、音声処理装置300が、二重音声信号システムに用いられる。入力回線信号352は、ADROプロセッサ350によって処理され、スピーカ368用の処理済音声信号を生成する。イヤホーン368付近の周辺雑音は、マイクロホン311によって検出され、これは、音声信号の検出にも用い得る。適応パラメータプロセッサ310は、マイクロホン311からの信号312、入力回線信号352、及びADROプロセッサ350から330において渡された出力パーセンタイル推定値量等の統計量を監視する。そのような入力から、適応パラメータプロセッサは、処理パラメータを適合させ、これらは、340において、ADROプロセッサ350に渡される。
図3Bは、本発明の第5実施形態の更に詳細な概略図である。ADROプロセッサ350は、回線入力信号352を受け取り、これが、フィルタバンク分析器354によって処理され、多数の周波数帯に対応する多数の帯域信号に分割される。本実施形態において、フィルタバンク分析器354によって抽出されるような入力回線信号352の各帯域に適用できるパラメータは、適応可能である。可変利得が、増幅器356によって適用され、出力ダイナミックレンジを目標ダイナミックレンジに整合する。可変利得は、可変利得コントローラ358によって制御される。パーセンタイル推定器360は、増幅器356の出力信号のパーセンタイル推定値を得て、可変利得コントローラ358の利得制御を支援する。音量コントローラ362は、音量パラメータ及び最大出力レベルパラメータを増幅器362の出力信号に適用し、その後、フィルタバンク合成器364が、処理された各帯域信号を合成する。デジタル・アナログ変換器(DAC)366が、合成された信号をスピーカ368用に変換する。
適応パラメータプロセッサ310は、マイクロホン信号312の信号条件を監視し、ADROプロセッサ350によって回線入力信号352に適用された信号処理パラメータに影響を与える。適応パラメータプロセッサ310には、信号アクティビティ検出器314が含まれるが、これは、マイクロホン信号312を監視し、対象の信号が、マイクロホン信号312に存在するかどうか、又は、周辺雑音がマイクロホン信号312に存在する唯一の信号かどうか判断する。
適応パラメータプロセッサ310には、更に、環境雑音推定器316が含まれる。対象の信号がマイクロホン信号312に存在することを信号アクティビティ検出器314が示す場合、環境雑音推定器316の動作は、一時停止され、周辺雑音測定値が、非雑音信号によって破損されないことを保証し得る。環境雑音推定器316は、リスナーの近傍における環境雑音の特性を決定するために、マイクロホン信号312を監視する。そのような特性には、周辺又は環境雑音レベル、雑音ダイナミックレンジ、雑音変調、又はADRO目標レベルを適合させるために有用な他の特性の推定値を含み得る。そのような特性は、雑音信号全体に対して又は周波数もしくは変換領域フィルタバンク(図示せず)によって決定された雑音信号副成分に対して決定し得る。
更に、適応パラメータプロセッサ310には、適応目標プロセッサ318が含まれるが、これは、環境雑音推定器316によって生成された環境雑音の推定値に応じて、各帯域における快適度及び可聴性目標等のダイナミックレンジ目標パラメータを適合させる。出力誤差推定器320は、パーセンタイル推定器360によって得られたパーセンタイル推定値によって定義された出力ダイナミックレンジと、適応目標プロセッサ318によって制御される適応目標によって定義された目標ダイナミックレンジと、の間の不整合を測定することによって、出力誤差を決定する。
適応速度プロセッサ322は、可変利得コントローラ358のスルーレートを、特に、利得スルーレート及びパーセンタイル推定スルーレートを、制御する。図11を参照して更に詳細に述べるように、適応速度プロセッサ322によって課された利得スルーレートは、出力誤差推定器によって決定された出力誤差又は不整合がしきい値誤差レベルを超えない限り、せいぜい3dB/sであるように制御される。出力誤差又は不整合がしきい値誤差レベルを超える場合、利得スルーレートは、それ相応に大きくなるように許可される。
フィルタ信号アクティビティ検出器324が、フィルタバンク分析器354の出力を監視し、パーセンタイル推定器360によって得られた電流パーセンタイル推定値を参照して、対象信号が存在するかどうか又は雑音だけが存在するかどうか評価する。そして、そのような評価値は、適応利得及び/又は適応利得スルーレートに影響を与えるために用い得る。例えば、フィルタ信号アクティビティ検出器324が対象の信号が存在しないと判断する期間中、適応速度プロセッサ322は、利得の如何なる増加も防止し得る。そのような制御は、入力信号が再開する時間までに利得が過度になった場合のみ、入力信号の停止中、プロセッサ利得の増加を防止し得る。
図4は、図3の音声処理装置300における環境雑音推定器316としての用途に適する環境雑音推定器400の概略図である。マイクロホン410は、電力計算器430によって行われる|x|の電力計算の前に、一組の較正及び重み付けフィルタ420によってフィルタ処理される信号を得る。この電力計算の結果は、指定された時間期間における電力レベルを平均する加重漏洩積分器440への入力として用いられる。信号アクティビティ検出器450は、各時間期間において漏洩積分器440を制御するマイクロホン信号に関するアクティビティ情報を提供するために用いられる。この処理の結果は、環境雑音電力の推定値460である。信号アクティビティ検出器450を用いると、マイクロホン410を用いて、ヘッドセット装着者からの音声等の他の信号を測定し得る。信号アクティビティ検出器450は、背景雑音の真の測定値を表すマイクロホン信号と装着者の音声又は他の非雑音成分によってバイアスされる信号とを識別する。この識別は、識別結果を組み合わせるシステムを用いて、信号の個々の周波数副帯域、信号の全帯域、又は個々の周波数副帯域及び全帯域双方に対して実施し得る。
図5は、図3の音声処理装置300における信号アクティビティ検出器314及び図4の環境雑音推定器400における信号アクティビティ検出器450としての用途に適する信号アクティビティ検出器500の概略図である。信号アクティビティ検出器500は、入力信号510を受け取り、大きさ推定器520は、入力信号510の大きさ|x|を決定する。ADROそれ自体に用いられるものと同様な10番目のパーセンタイル推定器530及び90番目のパーセンタイル推定器540の出力は、550において合計され、変調推定値560を生成することによって、信号510の変調のレベルを決定するために用いられる。
アクティビティ推定器580は、50番目のパーセンタイル推定器570の出力及び変調推定値560を用いて、信号アクティビティレベル590を提供する。変調判断基準は、音声対雑音比(SNR)と、パーセンタイル推定差異によって測定された変調レベルとの間における良好に定義された関係に基づく。例えば、図6a及び6bは、ルックアップ表として用いて信号アクティビティを決定するのに適するそれぞれ250Hz及び1kHzに中心がある帯域で信号対雑音比(SNR)を変えるための目標ダイナミックレンジの上端と下端との間の差異の平均大きさのグラフである。図6a及び6bは、SNR(dB)の変化に伴う平均パーセンタイル推定差異の測定の結果を変調範囲(dB)として示す。これらの測定は、250Hz及び1000Hzに中心がある250Hz幅の周波数副帯域において、意味のない言葉及び音声形状の雑音(SSN)等の共通の雑音がある状態で男性及び女性音声の組合せに対して行われた。この種類の情報は、50番目のパーセンタイル測定値によって表される全信号レベル情報と組み合わせられ、マイクロホン信号510のSNR又は周辺雑音アクティビティの判断を行う。信号アクティビティ検出の他の具体例は、他の選択肢として用い得る。
図3の音声処理装置300の信号アクティビティ検出器314として実現された場合、信号アクティビティ検出器500の出力590は、環境雑音推定器316によって生成された雑音特性推定値が、非雑音信号によってバイアスされないように、環境雑音推定器316の更新を制御するために用いられる。環境雑音推定器400/316の最終雑音レベル推定値を出力する漏洩積分器440は、対象信号又は装着者音声信号が測定マイクロホン信号312/410に存在しないことを信号アクティビティ検出器500/314が示す時だけ更新される。他の選択肢として、漏洩積分器440は、信号アクティビティ検出器500/314によって提供された信号アクティビティレベルによって加重される量だけ更新し得る。
環境雑音推定目的のために測定されたマイクロホン信号410に最初に適用された較正及び重み付けフィルタ420は、信号のスペクトル内容を変更して、それを更に処理に適するように、及び/又は、マイクロホン特性を補正及び較正するように、用いられる。例えば、“A”加重応答のフィルタを用いて、正常な聴覚リスナーによって、より大きく感知される信号内周波数を強調し得る。他の例において、微分フィルタ(y[n]=x[n]−x[n−1])を用いて、高帯域通過応答を生成し、これによって、マイクロホン信号に通常存在するが環境雑音推定器400/316によって実施される雑音推定に関係のない低周波数雑音及び過渡現象を除去し得る。図7は、雑音推定に関係ない低周波数成分を除去するための微分フィルタの周波数応答を示す。
環境雑音推定器316の出力は、適応目標プロセッサ318によって用いられ、ADRO目標ダイナミックレンジを、特に、快適度目標、可聴性目標、及び最大出力限界パラメータを変更することによって、適合させる。そのようなパラメータ変更の主な目的は、大幅な雑音レベル変動にもかかわらず、了解度、可聴性、受信信号の快適度を維持することである。このパラメータ変更は、雑音と目標レベルとの間の単純な線形もしくは非線形の関係又は用途及び/又は個人的な好みに依存して、快適度、可聴性及び/又は了解度に対する優先順位を考慮するもっと複雑な関係に基づき得る。
図8は、ADROの固定パラメータバージョンと、本発明に基づく単純な適応パラメータバージョンにおける幾つかの特性とを比較する。図8aは、周辺雑音の変動に伴う目標ダイナミックレンジパラメータの変動を示す。適応パラメータには、各帯域における最大出力レベル(MOL)、快適度目標、及び可聴性目標が含まれる。周辺雑音しきい値未満では、目標ダイナミックレンジパラメータは、既知のADRO処理手法に基づき、一定に維持される。しかしながら、周辺雑音がしきい値を超えて増加するにつれて、快適度目標と可聴性目標パラメータとの間の差異が、減少するように、目標ダイナミックレンジパラメータが増加する。
通常、MOL及び快適レベルの増加は、かなりの周辺雑音がある状態で大きい雑音を処理するリスナーの能力が向上することで、許容可能である。可聴性目標パラメータの増加により、目標ダイナミックレンジは、周辺雑音が増加する場合でさえ、周辺雑音より大きく維持される。第2しきい値を超えると、目標ダイナミックレンジパラメータの更なる増加は、周辺雑音が更に増加しても、出力音声信号によるリスナーへの聴覚損傷を防止するために許されない。
図8bは、図8aのパラメータ変動に起因する音声レベルの変化を示す。図8cは、図8aのパラメータ変動に起因するSNRの変化を示す。SNRは、了解度にとって重要であり、図8cにおいて、本発明に基づき適応パラメータを提供すると、大部分の周辺雑音範囲に対して、SNRが高く維持されることが顕著である。図8dは、そのようなパラメータ変動に起因する改善された了解度を示し、図8eは、図8aのパラメータ変動に起因する周辺雑音がある状態で感知された出力音量の変化を示す。特に、図8eは、適応パラメータが、大部分の周辺雑音範囲に対して、可聴及び快適レベルの双方である出力信号を維持することを示す。
パラメータの変更は、全てのADRO処理チャネルにおいて共通に行い得る。又は、パラメータ適合が、各周波数帯もしくはフィルタバンクチャネルに対してカスタマイズされるように独立に行い得る。更に、パラメータ適合は、周波数帯又はフィルタバンク副帯域における雑音レベル又は雑音特性推定値等の帯域固有の特性に応じて、各周波数帯に対してカスタマイズし得る。そのような帯域固有のパラメータ適合によって、1つのADRO帯域における目標ダイナミックレンジ変動は、他の周波数における雑音に対するよりも共通のマスキング周波数における雑音特性に対して応答し得る。図9は、周辺雑音の増加に応じたパラメータの周波数依存変動を示す。
図9は、ADROプロセッサの全ての周波数帯における初期の可聴性目標910及び初期の快適レベル目標920を示すグラフである。そのような初期の目標は、初期の低周辺雑音レベルに応じて適用し得る。増加した周辺雑音レベルに応じて、各周波数帯の可聴性目標及び快適レベル目標は、周波数帯毎に様々に構成して、更新された可聴性目標930及び更新された快適レベル目標940のグラフを生成し得る。この場合、環境雑音レベルの増加に応じて、目標は、低い周波数と比較して、高い周波数において、より大きい範囲に増加される。
そのような周波数での変動は、マスキングの上方拡散、即ち、1つの周波数における聴覚の可聴しきい値が、高周波数よりも低周波数における干渉雑音成分の存在によって調整されることを提案する心理音響学における現象を認識する。即ち、雑音成分は、マスキング周波数以下よりもマスキング周波数以上で起こる信号をマスクする傾向がある。図10は、低レベル1010の狭帯域マスキング雑音及び高レベル1020の狭帯域マスキング雑音に対する周波数全体でのしきい値変動の代表的なパターンを示す。低周波数雑音は、高い周波数での可聴性をマスクする傾向があることから、低周波数と比較して、高周波数信号成分を増やすことによって更に多大な恩典を得ることができる。
更に、図9に示すパラメータの周波数可変適合は、周辺雑音の代表的なホススペクトルに基づく。この雑音のホススペクトルは、図11に示すが、周辺雑音の代表的なスペクトルを表し、IEEE269−2002「アナログ及びデジタル電話機、ハンドセット、及びヘッドセットの伝送性能を測定するための標準的方法」に定義されている。ホススペクトルは、音声と比較して異なる周波数強調を有し、従って、そのような環境における改善された了解度は、この固有のスペクトル特性を活用するように、周波数全体に渡って周辺雑音に対する適合をカスタマイズすることによって得られる。
図9に示すパラメータの周波数可変適合は、高くなった音声の音特性を更に認識する。自然な対面発話において、例えば、周辺雑音の増加に応じて、音声が高められる場合、話者は、通常、高い周波数が、通常のレベルでの発話に対して若干更に強調されるように話す。目標の調整において、この効果を再生することによって、環境雑音レベルが高い場合、信号に対する更に自然な音声を得ることができる。
更に、図9に示すパラメータの周波数可変適合は、通常の受信機応答能力を認識する。受信機又はスピーカからの音声出力のレベルが大きくなると、出力は、高い周波数より低い周波数で速く歪んだり、ハードウェア限界に達したりすることが多い。高い周波数より低い周波数をゆっくりと増加させることによって、了解度及び音声品質は、全周波数における目標が同じように大きくされる場合より、大きな周辺雑音レベル範囲に対して維持し得る。
また、各周波数帯において、快適レベル目標940と可聴性目標930(高周辺雑音)との間の差異は、快適レベル目標920と可聴性レベル目標910(低周辺雑音)との間の差異より小さい。一般的に、より高いレベルの周辺雑音に対する応答は、目標ダイナミックレンジを低減すること及び/又は入力ダイナミックレンジを圧縮することによって改善し得る。追加の可聴性は、信号を圧縮することによって又は快適度目標等の上限側に可聴性目標を引き上げることによって、快適度限界を超えることなく得られる。このことは、特に、より高い周波数(2kHzを超える)において、有用であり、この場合、出力レベルは、快適度又は最大出力限界に近く、また、雑音中での音声了解度に対するかなりの情報が依然として含まれる。
可聴性目標が快適度目標側に引き上げられる場合、ADROプロセッサは、快適度目標がアクティブではない信号の穏やかな期間において利得を大きくすることが更に多く、このため、これらの期間では、背景雑音に対して可聴性が改善される。この構成の場合、信号ダイナミックレンジは、短期間の間、最小に圧縮されたり又は歪んだりするが、長期的には、快適度目標にそむくことなく、改善された可聴性を有する。
他の選択肢として又は更に、信号のダイナミックレンジは、ADROプロセッサ規則の適用前に、例えば、信号ダイナミックレンジの下端を雑音ダイナミックレンジの中央又は上端に近づけることに基づき、直接圧縮し得る。これによって、任意の圧縮効果の時定数及び比は、ADROプロセッサ規則とは独立に設定し得るが、圧縮システムで通常用いられる利得変化の割合が大きくなるため、歪みが大きくなる。従って、このプロセスは、周辺雑音レベルが特に高い場合のように、信号の可聴性が、信号の音声品質より重要である場合にのみ、最も有用である。
更に、適応レートプロセッサ322は、監視信号条件に応じて、利得スルーレートに対する適応制御を提供することに留意されたい。本発明は、ADROの既存の具体例が、一定のスルーレートで、通常、1秒間当たり3dBで利得レベルを適合させることを認識している。このレートは、入力音声条件の変化又は変化率の大きさにかかわらず、全ての状況下で一定である。これが、音声における典型的な小入力変化に応じて、歪み及び利得レベルの「ポンピング」を確実に小さくするのに役立つ一方で、本発明は、そのような一定の低スルーレートによって、入力信号の変化が大きくなると必要になり得るものより遅い応答が生じることを認識している。従って、適応レートプロセッサ322は、急激な大きい入力信号変化に応じて、更に急速な利得スルーレートを提供するように構成し得る。例えば、適応レートプロセッサ322は、特に、静かな又は大きい音声環境に対する初期の応答等の補聴器始動時、更に急速な利得スルーレートを提供するように構成し得る。更に、適応レートプロセッサ322は、更に急速な利得スルーレートを提供するように構成し得るが、この場合、試験中又は後、極めて静かな初期の周辺試験レベルにより利得が最大化された後、集中的高出力が、さもなければ生じ得る。更に、適応レートプロセッサ322は、更に急速な利得スルーレートを提供して、警報又はファクシミリ音等の音響驚愕の供給源を抑制するように構成し得る。
適応レートプロセッサ322を実現する際、本発明は、以下の設計原理、即ち、特に、発話又は音楽における通常の条件中、スルーレートの不必要な増加を回避すること、レベル変化のきっかけを実質的に除去する又は過度に低減するほど高いスルーレートを回避すること、及び音声品質及び数値の安定性の理由により、「緩慢時定数」レート(例えば、最大20dB/秒)より速いスルーレートを回避すること、という原理を適用する。
一実施形態において、適応レートプロセッサには、目標ダイナミックレンジへの現出力ダイナミックレンジの「距離」の目安を用いて、スルーレートに対する調整を決定する非線形関数又はルックアップ表を含み得る。非線形関数は、相対的に小さい距離の場合(例えば、発話又は音楽中)、極めて小さい又は0であるが、条件が大幅に変化して距離が長くなると、大きくなる。そのような非線形項を含む利得スルーレート用のモデル化解析関数の幾つかの例は、以下のように与えられる。
これらの式において、kは、制御される信号又は信号の一部を識別する指標であり、|f(k)|は、「距離」メトリックであり、K、q及びMは、非線形応答を形成し配置する定数である。最小利得スルーレートの3dB/sが、これらの特定の式において、仮定されるが、利得スルーレートは、3dB/sより遅くしてよい。距離が極めて小さい場合、スルーレートが遅くなると、入力信号レベルが平衡にある時、利得が安定化することを保証することによって、音声品質をわずかに改善し得る。
出力信号ダイナミックレンジと目標ダイナミックレンジとの間の不整合の大きさを決定するために適用し得るサンプル「距離」メトリックには、ダイナミックレンジ目標とパーセンタイル推定値との間の差異の目安が含まれるが、これらは、システムにおける既存パラメータである。例えば、
上式において、Pk及びTkは、それぞれ、k番目の信号又は信号の一部用のパーセンタイル推定値及び目標値の組である。
これらの距離メトリックの時間的振舞いは、パーセンタイル推定値の相対的なステップレート毎に要求される。従って、最初の2つのメトリックは、非対称性応答を生じて、スルーレートが高速になり、利得を他方より一方向(アップ又はダウン)に変える傾向がある。第3及び第4メトリックは、これらの結果を平均して、更に対称のスルーレート応答を生成する。上記最終メトリックは、快適音声30番目パーセンタイル目標(T快適−25)で可聴性目標を置き換えて、平衡応答を提供し、平衡状態時、バイアスが小さくなる。
図12は、不整合の増加に伴う利得スルーレートの変動を示す。1210は、増加不整合に応じた固定利得スルーレートであり、他方、1220及び1230は、利得スルーレートに対する調整を決定するための2つの非線形関数である。実際、最大スルーレートを任意の時間に制限して、適応レートプロセッサにおけるオーバーシュート及び数値的安定性に関連する問題を回避することは、有用である。
図13Aは、固定利得スルーレートのADROによって処理された音声信号のスペクトル写真であり、この場合、約2kHzに中心がある警報が、約6.5秒で始まり、そして、約21秒で停止する。図13Bは、適応利得スルーレートのADROによって処理された際の同じ音声信号のスペクトル写真である。図13Cは、利得対時間のグラフであり、図13A及び13Bの信号時、2kHz周波数領域における利得に対する利得変動を示す。1310は、本発明に基づき適用された適応スルーレート下での警報周波数における利得のグラフであり、他方、1320は、固定利得スルーレート手法下での警報周波数における利得のグラフである。1330は、適応及び固定スルーレート手法双方の場合の、警報から離れた周波数における利得のグラフである。
特に、警報の開始に続き、固定スルーレート利得グラフ1320は、許された固定レートの3dB/sにおいてのみ減少する。その結果、期間6.5秒乃至約20秒の間、図13a及びグラフ1320の固定スルーレートシステムによって、警報は、所望のレベルより高いレベルでプロセッサを通過し得る。これに対して、適応スルーレート利得グラフ1310は、出力ダイナミックレンジと目標ダイナミックレンジとの間の不整合に対応する可変レートで減少する。約6.5秒から約11秒において、利得グラフ1310は、3dB/sより大きい可変レートで減少する。約11秒から約13秒において、利得グラフ1310は、3dB/sで減少する。利得グラフ1310は、可変スルーレート手法が、このようにして、固定スルーレート手法より実質的に急速にそのような急激な入力信号変動を抑制することを示す。更に、図13cのグラフ1330から、固定スルーレート手法及び適応スルーレート手法は、入力信号変化がほとんどない、もしくは、ない期間中又は周波数において、実質的に同じように振舞うことが明らかである。
従って、正常な聴覚のリスナーが、電話回線又は携帯電話によって送信された電話信号を聴いている音声環境において、本発明は、信号の可聴性が、リスナーの雑音環境における周辺雑音のマスキング効果に依存することを認識する。従って、本実施形態では、リスナーの雑音環境の周辺雑音が、監視され、少なくとも1つの帯域固有パラメータを適応可能に変えるための監視信号条件として用いられる。そのような周辺雑音のマスキング効果は、雑音の種類及び雑音のレベルに依存し得る。ADROパラメータ(各帯域に対する最大出力限界、快適度目標、可聴性目標、最大利得、及び利得スルーレート等)の1つ、幾つか又は全てを適合可能にして、リスナーの快適度を引き続き維持しつつ、リスナーの周辺雑音条件に対して可聴レベルに信号を維持し得る。このようなパラメータが、周辺雑音に応じて、時間と共に変化するにつれて、ADROの通常の適応関数は、適応可能な帯域固有のパラメータ(1つ又は複数)によって指定された規則に基づき、入力信号の変化を同時に補償して、出力ダイナミックレンジを目標ダイナミックレンジに適合させる。
図14は、本発明の第6実施形態に基づく、ADROパラメータを適合して衝撃又は驚愕信号を抑制する目的のために、入力音声信号1412に存在するそのような音響衝撃又は驚愕信号の検出を意図した音声処理装置1400の概略図である。図14において、入力信号1412は、フィルタバンク1414を通過し、驚愕/衝撃検出器1452によって監視され、通常の音声のそれと大きく異なる特性を備えた高レベル信号成分の存在及び位置に関する決定を行うが、ファックス音、過度な大きな音声、フィードバックの甲高い音、又は狭帯域雑音等の衝撃信号に特有のものである。
音声がある状態での音響衝撃又は驚愕周波数成分の検出は、多数の判断基準に基づき得るが、以下のものを含む。
1.信号レベル。通常、充分に高いレベルを備えた成分だけが、音響衝撃又は驚愕症状を起こす候補である。音響衝撃又は驚愕成分は、同じ周波数の音声より高い狭帯域レベルを有することが多い。
2.変調又はダイナミックレンジ。特性的に、衝撃信号は、音声のそれより低い変調特性を有し、また、この差異を用いて、更に、音声と非音声成分との間を識別し得る。図6a及び6bにおける平均推定範囲対信号対雑音比のグラフを参照されたい。
3.スペクトル形状及びピーク。通常、充分に高いレベルの狭帯域衝撃又は驚愕信号の存在によって、入力信号の周波数スペクトルの成分は、相対的エネルギが、スペクトルの他の成分に対して、普通の音声に通常存在するものより高い状態で、1つ又は複数の良好に画成されたピークを有し得る。
4.信号レベル変化率(攻撃又は襲来時間)。音響衝撃又は驚愕信号は、極めて急速に始まり、音声に特有のものではない周波数成分のレベルが急激に増加することが多い。この襲来時間の差異は、短期変調等の他の判断基準がまだ示されない場合、音響衝撃信号の存在に関する早期又は初期の判断を行う際、有用であり得る
一旦、音響衝撃又は驚愕成分が、回線入力信号に存在していると判断されると、驚愕検出器1452は、周波数位置及び他の情報を衝撃又は驚愕信号抑制器1454に渡す。この抑制システムは、ADROプロセッサによって衝撃又は驚愕成分を除去又は減衰する目的のためにADROパラメータの適合を制御する。この抑制は、適応ADROスルーレートアダプタ1456、適応ADRO目標アダプタ1458、及び適応ADRO状態情報アダプタ1460によって、以下に基づき、達成し得る。
1.適切なADRO90番目のパーセンタイル推定値又はパーセンタイル推定値スルーレートを適合させて、これら推定値が、衝撃又は驚愕信号の周波数領域におけるダイナミックレンジの上端の高いレベルを直ちに表すようにすること。
2.ADROプロセッサの快適目標規則が効果を現して、衝撃又は驚愕信号の周波数領域における利得を迅速に低減するように、下方利得スルーレートが増加するように適合させ、こうして、90番目のパーセンタイル推定値によって表されるダイナミックレンジの上端を快適度目標未満に低減すること。
3.ADRO音量制御/MOLの1420によって実現されるADRO最大出力限界目標が、衝撃又は驚愕周波数において低減されるように適合させ、こうして、出力レベルの低減を保証し、また、所定の時間間隔の間、レベルの増加がないようにすること。
この構成において、ADROプロセッサは、音響衝撃信号を快適度目標のレベルに急速に減衰し、また、充分な時間間隔の間、音響衝撃周波数におけるレベルが増大しないことを保証して、近い将来における同様な周波数での衝撃の可能性を回避する。
図3の音声処理装置300と同様に、音声処理装置1400には、更に、ADRO利得計算器1413、増幅器1416、ADROパーセンタイル推定器1418、フィルタバンク合成器1422、DAC1424、及びスピーカ1426が含まれる。
数多くの変更及び/又は修正を、広範囲に説明された本発明の精神又は範囲から逸脱することなく、特定の実施形態に示すように、本発明に対して行い得ることを当業者は認識されるであろう。従って、本実施形態は、全ての点において、例示的であって限定的ではないものと見なす。
線形増幅及び圧縮増幅方式用の入出力関数を示す図である。 本発明の第1実施形態に基づくADRO信号処理方式の少なくとも1つの信号処理パラメータで適応可能に変動する監視信号条件の用途を示すブロック図である。 本発明の第2実施形態に基づくADRO信号処理方式の少なくとも1つの信号処理パラメータで適応可能に変動する監視信号条件の用途を示すブロック図である。 本発明の第3実施形態に基づくADRO信号処理方式の少なくとも1つの信号処理パラメータで適応可能に変動する監視信号条件の用途を示すブロック図である。 本発明の第4実施形態に基づくADRO信号処理方式の少なくとも1つの信号処理パラメータで適応可能に変動する監視信号条件の用途を示すブロック図である。 本発明の第5実施形態に基づく、出力回線の監視信号条件が入力回線の信号処理パラメータに影響を及ぼす二重システムにおける音声処理方式の概略図である。 本発明の第5実施形態に基づく、出力回線の監視信号条件が入力回線の信号処理パラメータに影響を及ぼす二重システムにおける音声処理方式の概略図である。 図3の第5実施形態での用途に適する環境雑音推定器の概略図である。 図3の第5実施形態での用途に適する信号アクティビティ検出器の概略図である。 図2A乃至2Dの第1乃至第4実施形態又は図3の第5実施形態において、ルックアップ表として用いて信号アクティビティを決定するのに適する250Hzに中心がある帯域で信号対雑音比(SNR)を変えるための目標ダイナミックレンジの上端と下端との間における差異の大きさのグラフである。 図2A乃至2Dの第1乃至第4実施形態又は図3の第5実施形態において、ルックアップ表として用いて信号アクティビティを決定するのに適する1kHzに中心がある帯域で信号対雑音比(SNR)を変えるための目標ダイナミックレンジの上端と下端との間における差異の大きさのグラフである。 図2A乃至2Dの第1乃至第4実施形態又は図3の第5実施形態における雑音推定に関係のない低周波数成分を除去するための微分フィルタの周波数応答を示す図である。 aは、図3の第5実施形態に基づく周辺雑音の変動に伴う目標ダイナミックレンジパラメータの変動を示す図である。bは、図8のaのパラメータ変動に起因する音声レベルの変動を示す図である。cは、図8のaのパラメータ変動に起因する信号対雑音比の変動を示す図である。dは、図8のaのパラメータ変動に起因する改善された了解度を示す図である。eは、図8のaのパラメータ変動に起因する周辺雑音がある状態における出力信号の知覚音量の変動を示す図である。 図3の第5実施形態に基づく周辺雑音の増加に応答するパラメータの周波数依存変動を示す図である。 雑音レベルの増加に伴う狭帯域雑音用のマスキングの周波数拡散を示す図である。 ホス形状雑音の平均スペクトル大きさを示す図である。 出力ダイナミックレンジと目標ダイナミックレンジとの間における増加不整合の目安による利得スルーレートの変動を示す図である。 警報が起動して停止する固定利得スルーレートでADROによって処理された音声信号のスペクトル写真の図である。 警報が起動して停止する適応利得スルーレートでADROによって処理された音声信号のスペクトル写真の図である。 図12aの固定利得スルーレート及び図13bの適応利得スルーレート双方用の警報周波数成分を含む特定の周波数帯に対する利得対時間のグラフである。 本発明の第6実施形態に基づく入力回線の監視信号条件を用いて、リスナーを音響驚愕又は衝撃信号から保護する目的のために、ADROパラメータを適合させる場合の音声処理方式の概略図である。
符号の説明
212 ADROプロセッサ
218 適応パラメータプロセッサ
232 ADROプロセッサ
238 適応パラメータプロセッサ
252 第1ADROプロセッサ
258 適応パラメータプロセッサ
262 第2ADROプロセッサ
282 ADROプロセッサ
286 適応パラメータプロセッサ
288 イヤホーン
290 周辺雑音マイクロホン
300 音声処理装置
350 ADROプロセッサ
368 イヤホーン
310 適応パラメータプロセッサ
311 マイクロホン
314 信号アクティビティ検出器
316 環境雑音推定器
318 適応目標プロセッサ
320 出力誤差推定器
322 適応速度プロセッサ
324 フィルタ信号アクティビティ検出器
354 フィルタバンク分析器
356 増幅器
358 可変利得コントローラ
360 パーセンタイル推定器
362 音量コントローラ
364 フィルタバンク合成器
366 デジタル・アナログ変換器(DAC)
368 スピーカ
400 環境雑音推定器
410 マイクロホン
420 フィルタ
430 電力計算器
440 加重漏洩積分器
450 信号アクティビティ検出器
500 信号アクティビティ検出器
520 推定器
530 10番目のパーセンタイル推定器
540 90番目のパーセンタイル推定器
560 変調推定値
1400 音声処理装置
1414 フィルタバンク
1452 驚愕/衝撃検出器

Claims (128)

  1. 目標ダイナミックレンジを満たすために少なくとも1つの入力音声信号を処理する方法であって、
    少なくとも1つの入力音声信号固有利得を前記少なくとも1つの入力音声信号に適用して、処理済音声信号を生成する段階と、
    前記処理済音声信号のダイナミックレンジを測定する段階と、
    前記目標ダイナミックレンジとの前記測定ダイナミックレンジの整合を決定する段階と、
    少なくとも1つの入力音声信号固有パラメータに基づき、各入力音声信号固有利得を調整して、前記目標ダイナミックレンジとの前記処理済音声信号のダイナミックレンジの前記整合を改善する段階と、が含まれ、
    前記少なくとも1つの入力音声信号固有パラメータは、少なくとも1つの監視信号条件に応じて適応可能である方法。
  2. 請求項1に記載の方法であって、前記少なくとも1つの入力音声信号には、単一音声信号の変換が含まれる方法。
  3. 請求項1又は請求項2に記載の方法であって、前記少なくとも1つの入力音声信号は、マイクロホンから得られる方法。
  4. 請求項1又は請求項2に記載の方法であって、前記少なくとも1つの入力音声信号は、伝送媒体から得られる方法。
  5. 請求項1乃至4のいずれか1つに記載の方法であって、前記少なくとも1つの入力音声信号には、音声信号の一部が含まれる方法。
  6. 請求項1乃至4のいずれか1つに記載の方法であって、前記少なくとも1つの入力音声信号には、音声信号の一部の変換が含まれる方法。
  7. 請求項5又は請求項6に記載の方法であって、複数の入力音声信号は、そのように処理され、各入力音声信号は、単一音声信号の固有部分に対応する方法。
  8. 請求項5乃至7のいずれか1つに記載の方法であって、前記音声信号の前記部分は、周波数領域フィルタ処理によって得られ、こうして、前記少なくとも1つの入力音声信号には、制約された周波数帯内に入る前記音声信号の周波数成分だけが含まれる方法。
  9. 請求項5乃至8のいずれか1つに記載の方法であって、前記音声信号の前記部分は、周波数変換近似によって得られる方法。
  10. 請求項5乃至9のいずれか1つに記載の方法であって、前記音声信号の前記部分は、時間領域処理によって得られる方法。
  11. 請求項5乃至10のいずれか1つに記載のであって、前記音声信号の前記部分は、ウェーブレット関数を用いることによって得られる方法。
  12. 前述の請求項のいずれか1つに記載の方法であって、前記監視信号条件には、前記測定ダイナミックレンジと前記目標ダイナミックレンジとの間の不整合の測定値が含まれる方法。
  13. 請求項12に記載の方法であって、前記少なくとも1つの入力音声信号固有パラメータには、前記利得調整の利得スルーレートが含まれる方法。
  14. 請求項13に記載の方法であって、
    前記不整合が大きい場合、前記利得スルーレートが大きくなるように制御する段階と、前記不整合が小さい場合、前記利得スルーレートが小さくなるように制御する段階と、が含まれる方法。
  15. 請求項13又は請求項14に記載の方法であって、利得を増大させるための前記利得スルーレートは、利得を減少させるための前記利得スルーレートと異なるように制御される方法。
  16. 請求項15に記載の方法であって、利得を減少させるための前記利得スルーレートは、大きいことが許可され、また、利得を増大させるための前記利得スルーレートは、適度な利得スルーレートに制限される方法。
  17. 前述の請求項のいずれか1つに記載の方法であって、前記少なくとも1つの監視信号条件には、周辺雑音信号条件が含まれる方法。
  18. 請求項17に記載の方法であって、前記周辺雑音信号条件は、前記少なくとも1つの入力音声信号から監視される方法。
  19. 請求項17又は請求項18に記載の方法であって、前記周辺雑音信号条件は、前記処理済音声信号のリスナーの環境において、少なくとも1つのマイクロホンから得られた少なくとも1つの他の信号から監視される方法。
  20. 請求項17乃至19のいずれか1つに記載の方法であって、前記少なくとも1つの入力音声信号固有パラメータには、目標可聴レベル及び目標快適レベルの内の少なくとも1つが含まれる方法。
  21. 前述の請求項のいずれか1つに記載の方法であって、前記少なくとも1つの監視信号条件には、音声衝撃の存在が含まれる方法。
  22. 請求項21に記載の方法であって、前記少なくとも1つの入力音声信号固有パラメータには、利得スルーレートが含まれ、また、前記方法には、音声衝撃の存在の検出に応じて、大きな利得減少スルーレートを課して利得を低減する段階が含まれる方法。
  23. 請求項21又は請求項22に記載の方法であって、前記少なくとも1つの入力音声信号固有パラメータには、最大出力限界が含まれ、また、前記方法には、音声衝撃の存在の検出に応じて、前記最大出力限界を低減する段階が含まれる方法。
  24. 前述の請求項いずれか1つに記載の方法であって、前記少なくとも1つの監視信号条件には、対象信号の存在が含まれる方法。
  25. 請求項24に記載の方法であって、対象信号が存在する期間及び対象信号が存在しない期間を決定するために、入力信号を監視する段階が含まれる方法。
  26. 請求項24又は請求項25に記載の方法であって、前記少なくとも1つの入力音声信号固有パラメータは、利得増加スルーレートであり、また、前記方法には、対象信号が存在しない期間中、前記利得増加スルーレートをゼロに設定する段階が含まれる方法。
  27. 請求項17乃至20のいずれか1つに記載の方法であって、前記少なくとも1つの入力音声信号固有パラメータには、前記目標ダイナミックレンジが含まれる方法。
  28. 請求項27に記載の方法であって、前記目標ダイナミックレンジを前記周辺雑音レベルより上に維持するために、周辺雑音レベルの増加に応じて前記目標ダイナミックレンジの下端を増加させる段階が含まれる方法。
  29. 請求項27又は請求項28に記載の方法であって、周辺雑音の増加に応じて、周辺雑音がある状態でのリスナーの快適レベルの増加に対応する量だけ、前記目標ダイナミックレンジの上端を増加させる段階が含まれる方法。
  30. 請求項17乃至20及び27乃至29のいずれか1つに記載の方法であって、
    前記少なくとも1つの入力音声信号には、少なくとも1つの低周波数帯入力音声信号及び少なくとも1つの高周波数帯入力音声信号が含まれ、
    周辺雑音レベルの増加に応じて、前記少なくとも1つの高周波数帯入力音声信号の前記目標ダイナミックレンジは、前記少なくとも1つの低周波数帯入力音声信号の前記目標ダイナミックレンジより大きく引き上げられる方法。
  31. 前述の請求項のいずれか1つに記載の方法であって、前記少なくとも1つの適応可能な入力音声信号固有パラメータには、最大出力限界(1つ又は複数)、快適度目標(1つ又は複数)、可聴性目標(1つ又は複数)、背景雑音目標(1つ又は複数)、最大利得(1つ又は複数)、最小利得(1つ又は複数)、増加利得スルーレート(1つ又は複数)、減少利得スルーレート(1つ又は複数)、増加パーセンタイル推定スルーレート(1つ又は複数)、及び減少パーセンタイル推定スルーレート(1つ又は複数)の1つ、幾つか又は全てが含まれる方法。
  32. 前述の請求項のいずれか1つに記載の方法であって、前記少なくとも1つの入力音声信号には、フィルタ処理によって単一音声信号から得られた複数の入力音声信号が含まれる方法。
  33. 目標ダイナミックレンジを満たすために、少なくとも1つの入力音声信号を処理するための装置であって、
    少なくとも1つの入力音声信号固有利得を前記少なくとも1つの入力音声信号に適用して、処理済音声信号を生成するための利得段と、
    前記処理済音声信号のダイナミックレンジを測定するための、また、前記目標ダイナミックレンジとの前記測定ダイナミックレンジの整合を決定するための分析器と、
    少なくとも1つの入力音声信号固有パラメータに基づき、各入力音声信号固有利得を調整して、前記目標ダイナミックレンジとの前記処理済音声信号のダイナミックレンジの前記整合を改善するための利得コントローラと、が含まれ、
    前記少なくとも1つの入力音声信号固有パラメータは、少なくとも1つの監視信号条件に応じて適応可能である装置。
  34. 請求項33に記載の装置であって、前記少なくとも1つの入力音声信号には、単一音声信号の変換が含まれる装置。
  35. 請求項33又は請求項34に記載の装置であって、前記少なくとも1つの入力音声信号を得るためのマイクロホンが含まれる装置。
  36. 請求項33又は請求項34に記載の装置であって、伝送媒体から前記少なくとも1つの入力音声信号を得るためのポートが含まれる装置。
  37. 請求項33乃至36のいずれか1つに記載の装置であって、前記少なくとも1つの入力音声信号には、音声信号の一部が含まれる装置。
  38. 請求項33乃至36のいずれか1つに記載の装置であって、前記少なくとも1つの入力音声信号には、音声信号の一部の変換が含まれる装置。
  39. 請求項37又は請求項38に記載の装置であって、更に、複数の入力音声信号を処理するように動作可能であり、各入力音声信号は、単一音声信号の固有部分に対応する装置。
  40. 請求項37乃至39のいずれか1つに記載の装置であって、前記音声信号の前記部分を得るための周波数領域フィルタが含まれ、こうして、前記少なくとも1つの入力音声信号には、制約された周波数帯内に入る前記音声信号の周波数成分だけが含まれる装置。
  41. 請求項37乃至40のいずれか1つに記載の装置であって、前記音声信号の前記部分を得るための周波数変換近似器が含まれる装置。
  42. 請求項37乃至41のいずれか1つに記載の装置であって、前記音声信号の前記部分を得るための時間領域プロセッサが含まれる装置。
  43. 請求項37乃至42のいずれか1つに記載の装置であって、前記音声信号の前記部分を得るためのウェーブレット関数プロセッサが含まれる装置。
  44. 請求項33乃至43のいずれか1つに記載の装置であって、前記監視信号条件には、前記測定ダイナミックレンジと前記目標ダイナミックレンジとの間の不整合の測定値が含まれる装置。
  45. 請求項44に記載の装置であって、前記少なくとも1つの入力音声信号固有パラメータには、前記利得調整の利得スルーレートが含まれる装置。
  46. 請求項45に記載の装置であって、前記利得コントローラは、更に、前記不整合が大きい場合、前記利得スルーレートが大きくなるように制御し、また、前記不整合が小さい場合、前記利得スルーレートが小さくなるように制御する装置。
  47. 請求項45又は請求項46に記載の装置であって、前記利得コントローラは、更に、利得を増大させるための前記利得スルーレートが、利得を減少させるための前記利得スルーレートと異なるように制御する装置。
  48. 請求項47に記載の装置であって、前記利得コントローラは、利得を減少させるための利得スルーレートが大きいことを許可し、また、利得を増大させるための前記利得スルーレートを適度な利得スルーレートに制限する装置。
  49. 請求項33乃至48のいずれか1つに記載の装置であって、前記少なくとも1つの監視信号条件には、周辺雑音信号条件が含まれる装置。
  50. 請求項49に記載の装置であって、前記少なくとも1つの入力音声信号から前記周辺雑音信号条件を得るための周辺雑音検出器が含まれる装置
  51. 請求項49又は請求項50に記載の装置であって、前記処理済音声信号のリスナーの前記環境において、少なくとも1つのマイクロホンが含まれ、また、前記マイクロホンの信号から前記周辺雑音信号条件を得るための第2周辺雑音検出器が含まれる装置。
  52. 請求項49乃至51のいずれか1つに記載の装置であって、前記少なくとも1つの入力音声信号固有パラメータには、目標可聴レベル及び目標快適レベルの内の少なくとも1つが含まれる装置。
  53. 請求項33乃至52のいずれか1つに記載の装置であって、音声衝撃検出器が含まれ、また、前記少なくとも1つの監視信号条件には、音声衝撃の存在が含まれる装置。
  54. 請求項53に記載の装置であって、前記少なくとも1つの入力音声信号固有パラメータには、利得スルーレートが含まれ、また、前記利得コントローラは、音声衝撃の存在の検出に応じて、大きな利得低減スルーレートを課して利得を低減するように動作可能である装置。
  55. 請求項53又は請求項54に記載の装置であって、最大出力制限器が含まれ、前記少なくとも1つの入力音声信号固有パラメータには、最大出力限界が含まれ、また、前記最大出力制限器は、音声衝撃の存在の検出に応じて、前記最大出力限界を低減するように動作可能である装置。
  56. 請求項33乃至55のいずれか1つに記載の装置であって、対象信号検出器が含まれ、また、前記少なくとも1つの監視信号条件には、対象信号の存在が含まれる装置。
  57. 請求項56に記載の装置であって、前記対象信号検出器は、対象信号の存在を決定するために、入力信号を監視するように動作可能である装置。
  58. 請求項56又は請求項57に記載の装置であって、前記少なくとも1つの入力音声信号固有パラメータは、利得増加スルーレートであり、また、前記利得コントローラは、対象信号が存在しない期間中、前記利得増加スルーレートをゼロに設定するように動作可能である装置。
  59. 請求項49乃至52のいずれか1つに記載の装置であって、前記少なくとも1つの入力音声信号固有パラメータには、前記目標ダイナミックレンジが含まれる装置。
  60. 請求項59に記載の装置であって、前記目標ダイナミックレンジを前記周辺雑音レベルより上に維持するために、周辺雑音レベルの増加に応じて、前記目標ダイナミックレンジの下端を増加させるためのパラメータアダプタが含まれる装置。
  61. 請求項59又は請求項60に記載の装置であって、前記パラメータアダプタは、更に、周辺雑音の増加に応じて、周辺雑音がある状態でのリスナーの快適レベルの増加に対応する量だけ前記目標ダイナミックレンジの上端を増加させるように動作可能である装置。
  62. 請求項49乃至52及び59乃至61のいずれか1つに記載の装置であって、前記少なくとも1つの入力音声信号には、少なくとも1つの低周波数帯入力音声信号及び少なくとも1つの高周波数帯入力音声信号が含まれ、また、周辺雑音レベルの増加に応じて、前記少なくとも1つの高周波数帯入力音声信号の前記目標ダイナミックレンジを前記少なくとも1つの低周波数帯入力音声信号の前記目標ダイナミックレンジより大きく引き上げるように動作可能な第2パラメータアダプタが含まれる装置。
  63. 請求項33乃至62のいずれか1つに記載の装置であって、前記少なくとも1つの適応可能な入力音声信号固有パラメータには、最大出力限界(1つ又は複数)、快適度目標(1つ又は複数)、可聴性目標(1つ又は複数)、背景雑音目標(1つ又は複数)、最大利得(1つ又は複数)、最小利得(1つ又は複数)、増加利得スルーレート(1つ又は複数)、減少利得スルーレート(1つ又は複数)、増加パーセンタイル推定スルーレート(1つ又は複数)、及び減少パーセンタイル推定スルーレート(1つ又は複数)の1つ、幾つか又は全てが含まれる装置。
  64. 請求項33乃至63のいずれか1つに記載の装置であって、単一音声信号をフィルタ処理して、複数の入力音声信号を生成する複数のフィルタが含まれる装置。
  65. 目標ダイナミックレンジを満たすために、少なくとも1つの入力音声信号を処理するためのコンピュータプログラムであって、
    少なくとも1つの入力音声信号固有利得を前記少なくとも1つの入力音声信号に適用して処理済音声信号を生成するためのコードと、
    前記処理済音声信号のダイナミックレンジを測定するためのコードと、
    前記目標ダイナミックレンジとの前記測定ダイナミックレンジの整合を決定するためのコードと、
    少なくとも1つの入力音声信号固有パラメータに基づき、各入力音声信号固有利得を調整して、前記目標ダイナミックレンジとの前記処理済音声信号のダイナミックレンジの前記整合を改善するためのコードと、が含まれ、
    前記少なくとも1つの入力音声信号固有パラメータは、少なくとも1つの監視信号条件に応じて適応可能であるコンピュータプログラム。
  66. 請求項65に記載のコンピュータプログラムであって、前記少なくとも1つの入力音声信号には、単一音声信号の変換が含まれるコンピュータプログラム。
  67. 請求項65又は請求項66に記載のコンピュータプログラムであって、前記少なくとも1つの入力音声信号は、マイクロホンから得られるコンピュータプログラム。
  68. 請求項65又は請求項66に記載のコンピュータプログラムであって、前記少なくとも1つの入力音声信号は、伝送媒体から得られるコンピュータプログラム。
  69. 請求項65乃至68のいずれか1つに記載のコンピュータプログラムであって、前記少なくとも1つの入力音声信号には、音声信号の一部が含まれるコンピュータプログラム。
  70. 請求項65乃至68のいずれか1つに記載のコンピュータプログラムであって、前記少なくとも1つの入力音声信号には、音声信号の一部の変換が含まれるコンピュータプログラム。
  71. 請求項69又は請求項70に記載のコンピュータプログラムであって、複数の入力音声信号が、そのように処理され、また、各入力音声信号は、単一音声信号の固有部分に対応するコンピュータプログラム。
  72. 請求項69乃至71のいずれか1つに記載のコンピュータプログラムであって、前記少なくとも1つの入力音声信号が、制約された周波数帯内に入る前記音声信号の周波数成分だけを含むように、周波数領域フィルタ処理によって前記音声信号の前記部分を得るためのコードが含まれるコンピュータプログラム。
  73. 請求項69乃至72のいずれか1つに記載のコンピュータプログラムであって、周波数変換近似によって前記音声信号の前記部分を得るコードが含まれるコンピュータプログラム。
  74. 請求項69乃至73のいずれか1つに記載のコンピュータプログラムであって、時間領域処理によって前記音声信号の前記部分を得るコードが含まれるコンピュータプログラム。
  75. 請求項69乃至74のいずれか1つに記載のコンピュータプログラムであって、ウェーブレット関数を用いることによって前記音声信号の前記部分を得るコードが含まれるコンピュータプログラム。
  76. 請求項65乃至75のいずれか1つに記載のコンピュータプログラムであって、前記監視信号条件には、前記測定ダイナミックレンジと前記目標ダイナミックレンジとの間の不整合の測定値が含まれるコンピュータプログラム。
  77. 請求項76に記載のコンピュータプログラムであって、前記少なくとも1つの入力音声信号固有パラメータには、前記利得調整の利得スルーレートが含まれるコンピュータプログラム。
  78. 請求項77に記載のコンピュータプログラムであって、前記不整合が大きい場合、前記利得スルーレートが大きくなるように制御するための、また、前記不整合が小さい場合、前記利得スルーレートが小さくなるように制御するためのコードが含まれるコンピュータプログラム。
  79. 請求項77又は請求項78に記載のコンピュータプログラムであって、利得を増大させるための前記利得スルーレートが、利得を減少させるための前記利得スルーレートと異なるように制御するためのコードが含まれるコンピュータプログラム。
  80. 請求項79に記載のコンピュータプログラムであって、利得を減少させるための利得スルーレートが大きいことを許可し、また、利得を増大させるための前記利得スルーレートを適度な利得スルーレートに制限するコードが含まれるコンピュータプログラム。
  81. 請求項65乃至80のいずれか1つに記載のコンピュータプログラムであって、前記少なくとも1つの監視信号条件には、周辺雑音信号条件が含まれるコンピュータプログラム。
  82. 請求項81に記載のコンピュータプログラムであって、前記少なくとも1つの入力音声信号から前記周辺雑音信号条件を監視するためのコードが含まれるコンピュータプログラム。
  83. 請求項81又は請求項82に記載のコンピュータプログラムであって、前記処理済音声信号のリスナーの前記環境から得られたマイクロホン信号から前記周辺雑音信号条件を監視するためのコードが含まれるコンピュータプログラム。
  84. 請求項81乃至83のいずれか1つに記載のコンピュータプログラムであって、前記少なくとも1つの入力音声信号固有パラメータには、目標可聴レベル及び目標快適レベルの内の少なくとも1つが含まれるコンピュータプログラム。
  85. 請求項65乃至84のいずれか1つに記載のコンピュータプログラムであって、前記少なくとも1つの監視信号条件には、音声衝撃の存在が含まれるコンピュータプログラム。
  86. 請求項85に記載のコンピュータプログラムであって、前記少なくとも1つの入力音声信号固有パラメータには、利得スルーレートが含まれ、また、前記コンピュータプログラムには、音声衝撃の存在の検出に応じて、大きな利得低減スルーレートを課して利得を低減するためのコードが含まれるコンピュータプログラム。
  87. 請求項85又は請求項86に記載のコンピュータプログラムであって、前記少なくとも1つの入力音声信号固有パラメータには、最大出力限界が含まれ、また、前記コンピュータプログラムには、音声衝撃の存在の検出に応じて、前記最大出力限界を低減するためのコードが含まれるコンピュータプログラム。
  88. 請求項65乃至87のいずれか1つに記載のコンピュータプログラムであって、前記少なくとも1つの監視信号条件には、対象信号の存在が含まれるコンピュータプログラム。
  89. 請求項88に記載のコンピュータプログラムであって、対象信号が存在する期間及び対象信号が存在しない期間を決定するために、入力信号を監視するためのコードが含まれるコンピュータプログラム。
  90. 請求項88又は請求項89に記載のコンピュータプログラムであって、前記少なくとも1つの入力音声信号固有パラメータは、利得増加スルーレートであり、また、前記コンピュータプログラムには、対象信号が存在しない期間中、前記利得増加スルーレートをゼロに設定するためのコードが含まれるコンピュータプログラム。
  91. 請求項81乃至84のいずれか1つに記載のコンピュータプログラムであって、前記少なくとも1つの入力音声信号固有パラメータには、前記目標ダイナミックレンジが含まれるコンピュータプログラム。
  92. 請求項91に記載のコンピュータプログラムであって、周辺雑音レベルの増加に応じて、前記目標ダイナミックレンジを前記周辺雑音レベルより上に維持するために、前記目標ダイナミックレンジの下端を増加させるためのコードが含まれるコンピュータプログラム。
  93. 請求項91又は請求項92に記載のコンピュータプログラムであって、周辺雑音の増加に応じて、周辺雑音がある状態でのリスナーの快適レベルの増加に対応する量だけ前記目標ダイナミックレンジの上端を増加させるためのコードが含まれるコンピュータプログラム。
  94. 請求項81乃至84及び91乃至93のいずれか1つに記載のコンピュータプログラムであって、前記少なくとも1つの入力音声信号には、少なくとも1つの低周波数帯入力音声信号及び少なくとも1つの高周波数帯入力音声信号が含まれ、また、前記コンピュータプログラムには、周辺雑音レベルの増加に応じて、前記少なくとも1つの高周波数帯入力音声信号の前記目標ダイナミックレンジを前記少なくとも1つの低周波数帯入力音声信号の前記目標ダイナミックレンジより大きく引き上げるためのコードが含まれるコンピュータプログラム。
  95. 請求項65乃至94のいずれか1つに記載のコンピュータプログラムであって、前記少なくとも1つの適応可能な入力音声信号固有パラメータには、最大出力限界(1つ又は複数)、快適度目標(1つ又は複数)、可聴性目標(1つ又は複数)、背景雑音目標(1つ又は複数)、最大利得(1つ又は複数)、最小利得(1つ又は複数)、増加利得スルーレート(1つ又は複数)、減少利得スルーレート(1つ又は複数)、増加パーセンタイル推定スルーレート(1つ又は複数)、及び減少パーセンタイル推定スルーレート(1つ又は複数)の1つ、幾つか又は全てが含まれるコンピュータプログラム。
  96. 請求項65乃至95のいずれか1つに記載のコンピュータプログラムであって、単一音声信号をフィルタ処理して、複数の入力音声信号を得るためのコードが含まれるコンピュータプログラム。
  97. 目標ダイナミックレンジを満たすために、少なくとも1つの入力音声信号を処理するための手順をコンピュータに実行させるコンピュータプログラムコード手段が含まれるコンピュータプログラム要素であって、
    少なくとも1つの入力音声信号固有利得を前記少なくとも1つの入力音声信号に適用して、処理済音声信号を生成するためのコンピュータプログラムコード手段と、
    前記処理済音声信号のダイナミックレンジを測定するためのコンピュータプログラムコード手段と、
    前記目標ダイナミックレンジとの前記測定ダイナミックレンジの整合を決定するためのコンピュータプログラムコード手段と、
    少なくとも1つの入力音声信号固有パラメータに基づき、各入力音声信号固有利得を調整して、前記目標ダイナミックレンジとの前記処理済音声信号のダイナミックレンジの前記整合を改善するためのコンピュータプログラムコード手段と、が含まれ、
    前記少なくとも1つの入力音声信号固有パラメータは、少なくとも1つの監視信号条件に応じて適応可能であるコンピュータプログラム要素。
  98. 請求項97に記載のコンピュータプログラム要素であって、前記少なくとも1つの入力音声信号には、単一音声信号の変換が含まれるコンピュータプログラム要素。
  99. 請求項97又は請求項98に記載のコンピュータプログラム要素であって、前記少なくとも1つの入力音声信号は、マイクロホンから得られるコンピュータプログラム要素。
  100. 請求項97又は請求項98に記載のコンピュータプログラム要素であって、前記少なくとも1つの入力音声信号は、伝送媒体から得られるコンピュータプログラム要素。
  101. 請求項97乃至100のいずれか1つに記載のコンピュータプログラム要素であって、前記少なくとも1つの入力音声信号には、音声信号の一部が含まれるコンピュータプログラム要素。
  102. 請求項97乃至100のいずれか1つに記載のコンピュータプログラム要素であって、前記少なくとも1つの入力音声信号には、音声信号の一部の変換が含まれるコンピュータプログラム要素。
  103. 請求項101又は請求項102に記載のコンピュータプログラム要素であって、複数の入力音声信号は、そのように処理され、各入力音声信号は、単一音声信号の固有部分に対応するコンピュータプログラム要素。
  104. 請求項101乃至103のいずれか1つに記載のコンピュータプログラム要素であって、前記少なくとも1つの入力音声信号には、制約された周波数帯内に入る前記音声信号の周波数成分だけが含まれるように、周波数領域フィルタ処理によって前記音声信号の前記部分を得るコンピュータプログラムコード手段が含まれるコンピュータプログラム要素。
  105. 請求項101乃至104のいずれか1つに記載のコンピュータプログラム要素であって、周波数変換近似によって前記音声信号の前記部分を得るコンピュータプログラムコード手段が含まれるコンピュータプログラム要素。
  106. 請求項101乃至105のいずれか1つに記載のコンピュータプログラム要素であって、時間領域処理によって前記音声信号の前記部分を得るコンピュータプログラムコード手段が含まれるコンピュータプログラム要素。
  107. 請求項101乃至106のいずれか1つに記載のコンピュータプログラム要素であって、ウェーブレット関数を用いることによって前記音声信号の前記部分を得るコンピュータプログラムコード手段が含まれるコンピュータプログラム要素。
  108. 請求項97乃至107のいずれか1つに記載のコンピュータプログラム要素であって、前記監視信号条件には、前記測定ダイナミックレンジと前記目標ダイナミックレンジとの間の不整合の測定値が含まれるコンピュータプログラム要素。
  109. 請求項108に記載のコンピュータプログラム要素であって、前記少なくとも1つの入力音声信号固有パラメータには、前記利得調整の利得スルーレートが含まれるコンピュータプログラム要素。
  110. 請求項109に記載のコンピュータプログラム要素であって、前記不整合が大きい場合、前記利得スルーレートが大きくなるように制御するための、また、前記不整合が小さい場合、前記利得スルーレートが小さくなるように制御するためのコンピュータプログラムコード手段が含まれるコンピュータプログラム要素。
  111. 請求項109又は請求項110に記載のコンピュータプログラム要素であって、利得を増大させるための前記利得スルーレートが、利得を減少させるための前記利得スルーレートと異なるように制御するためのコンピュータプログラムコード手段が含まれるコンピュータプログラム要素。
  112. 請求項111に記載のコンピュータプログラム要素であって、利得を減少させるための前記利得スルーレートが大きいことを許可するための、また、利得を増大させるための前記利得スルーレートを適度な利得スルーレートに制限するためのコンピュータプログラムコード手段が含まれるコンピュータプログラム要素。
  113. 請求項97乃至112のいずれか1つに記載のコンピュータプログラム要素であって、前記少なくとも1つの監視信号条件には、周辺雑音信号条件が含まれるコンピュータプログラム要素。
  114. 請求項113に記載のコンピュータプログラム要素であって、前記少なくとも1つの入力音声信号から前記周辺雑音信号条件を監視するためのコンピュータプログラムコード手段が含まれるコンピュータプログラム要素。
  115. 請求項113又は請求項114に記載のコンピュータプログラム要素であって、前記処理済音声信号のリスナーの前記環境から得られたマイクロホン信号から前記周辺雑音信号条件を監視するためのコンピュータプログラムコード手段が含まれるコンピュータプログラム要素。
  116. 請求項113乃至115のいずれか1つに記載のコンピュータプログラム要素であって、前記少なくとも1つの入力音声信号固有パラメータには、目標可聴レベル及び目標快適レベルの内の少なくとも1つが含まれるコンピュータプログラム要素。
  117. 請求項97乃至116のいずれか1つに記載のコンピュータプログラム要素であって、前記少なくとも1つの監視信号条件には、音声衝撃の存在が含まれるコンピュータプログラム要素。
  118. 請求項117に記載のコンピュータプログラム要素であって、前記少なくとも1つの入力音声信号固有パラメータには、利得スルーレートが含まれ、また、前記コンピュータプログラム要素には、音声衝撃の存在の検出に応じて、大きな利得低減スルーレートを課して、利得を低減するためのコンピュータプログラムコード手段が含まれるコンピュータプログラム要素。
  119. 請求項117又は請求項118に記載のコンピュータプログラム要素であって、前記少なくとも1つの入力音声信号固有パラメータには、最大出力限界が含まれ、また、前記コンピュータプログラム要素には、音声衝撃の存在の検出に応じて、前記最大出力限界を低減するためのコンピュータプログラムコード手段が含まれるコンピュータプログラム要素。
  120. 請求項97乃至119のいずれか1つに記載のコンピュータプログラム要素であって、前記少なくとも1つの監視信号条件には、対象信号の存在が含まれるコンピュータプログラム要素。
  121. 請求項120に記載のコンピュータプログラム要素であって、対象信号が存在する期間及び対象信号が存在しない期間を決定するために、入力信号を監視するためのコンピュータプログラムコード手段が含まれるコンピュータプログラム要素。
  122. 請求項120又は請求項121に記載のコンピュータプログラム要素であって、前記少なくとも1つの入力音声信号固有パラメータは、利得増加スルーレートであり、また、前記コンピュータプログラム要素には、対象信号が存在しない期間中、前記利得増加スルーレートをゼロに設定するためのコンピュータプログラムコード手段が含まれるコンピュータプログラム要素。
  123. 請求項113乃至116のいずれか1つに記載のコンピュータプログラム要素であって、前記少なくとも1つの入力音声信号固有パラメータには、前記目標ダイナミックレンジが含まれるコンピュータプログラム要素。
  124. 請求項123に記載のコンピュータプログラム要素であって、前記目標ダイナミックレンジを前記周辺雑音レベルより上に維持するために、周辺雑音レベルの増加に応じて、前記目標ダイナミックレンジの下端を増加させるためのコンピュータプログラムコード手段が含まれるコンピュータプログラム要素。
  125. 請求項123又は請求項124に記載のコンピュータプログラム要素であって、周辺雑音の増加に応じて、周辺雑音がある状態でのリスナーの快適レベルの増加に対応する量だけ前記目標ダイナミックレンジの上端を増加させるためのコンピュータプログラムコード手段が含まれるコンピュータプログラム要素。
  126. 請求項113乃至116及び123乃至125のいずれか1つに記載のコンピュータプログラム要素であって、前記少なくとも1つの入力音声信号には、少なくとも1つの低周波数帯入力音声信号及び少なくとも1つの高周波数帯入力音声信号が含まれ、また、前記コンピュータプログラム要素には、周辺雑音レベルの増加に応じて、前記少なくとも1つの高周波数帯入力音声信号の前記目標ダイナミックレンジを前記少なくとも1つの低周波数帯入力音声信号の前記目標ダイナミックレンジより大きく引き上げるためのコンピュータプログラムコード手段が含まれるコンピュータプログラム要素。
  127. 請求項97乃至126のいずれか1つに記載のコンピュータプログラム要素であって、前記少なくとも1つの適応可能な入力音声信号固有パラメータには、最大出力限界(1つ又は複数)、快適度目標(1つ又は複数)、可聴性目標(1つ又は複数)、背景雑音目標(1つ又は複数)、最大利得(1つ又は複数)、最小利得(1つ又は複数)、増加利得スルーレート(1つ又は複数)、減少利得スルーレート(1つ又は複数)、増加パーセンタイル推定スルーレート(1つ又は複数)、及び減少パーセンタイル推定スルーレート(1つ又は複数)の1つ、幾つか又は全てが含まれるコンピュータプログラム要素。
  128. 請求項97乃至127のいずれか1つに記載のコンピュータプログラム要素であって、単一音声信号をフィルタ処理して、複数の入力音声信号を得るためのコンピュータプログラムコード手段が含まれるコンピュータプログラム要素。
JP2007543648A 2004-12-04 2004-12-04 適応可能な音声処理パラメータ用の方法及び装置 Pending JP2008522511A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/AU2004/001691 WO2006058361A1 (en) 2004-12-04 2004-12-04 Method and apparatus for adaptive sound processing parameters

Publications (1)

Publication Number Publication Date
JP2008522511A true JP2008522511A (ja) 2008-06-26

Family

ID=36564664

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007543648A Pending JP2008522511A (ja) 2004-12-04 2004-12-04 適応可能な音声処理パラメータ用の方法及び装置

Country Status (3)

Country Link
EP (1) EP1829028A1 (ja)
JP (1) JP2008522511A (ja)
WO (1) WO2006058361A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016015711A (ja) * 2014-06-10 2016-01-28 株式会社ディーアンドエムホールディングス オーディオシステム、オーディオ装置、携帯端末装置、及びオーディオ信号制御方法
JP2016506640A (ja) * 2012-11-19 2016-03-03 ハーマン インターナショナル インダストリーズ インコーポレイテッド オーディオラウドネス制御システム
JP2016212285A (ja) * 2015-05-11 2016-12-15 良明 森田 音声処理装置および音声処理方法

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101200615B1 (ko) 2006-04-27 2012-11-12 돌비 레버러토리즈 라이쎈싱 코오포레이션 청각 이벤트 검출에 기반한 비-라우드니스를 이용한 자동 이득 제어
WO2008111462A1 (ja) * 2007-03-06 2008-09-18 Nec Corporation 雑音抑圧の方法、装置、及びプログラム
WO2010000042A1 (en) * 2008-07-04 2010-01-07 Peter Blamey Linear gain amplification for mid-to-high intensity sounds in a compressive sound processor
DE102009004185B3 (de) 2009-01-09 2010-04-15 Siemens Medical Instruments Pte. Ltd. Verfahren zur Signalverarbeitung einer Hörvorrichtung und entsprechende Hörvorrichtung
DE212013000211U1 (de) * 2012-10-09 2015-06-11 Institut für Rundfunktechnik GmbH Messvorrichtung zur Messung des Lautstärkebereichs eines Audiosignals und Steuervorrichtung zur Steuerung des Lautstärkebereichs eines Audiosignals
ITTO20121011A1 (it) * 2012-11-20 2014-05-21 Inst Rundfunktechnik Gmbh Verfahren zum messen des lautstaekeumfangs eines audiosignals, messeinrichtung zum durchfuehren des verfahrens, verfahren zum regeln bzw. steuern des lautstaerkeumfangs eines audiosignals und regel- bzw. steuereinrichtung zum durchfuhren des regel- b
ITTO20120879A1 (it) * 2012-10-09 2014-04-10 Inst Rundfunktechnik Gmbh Verfahren zum messen des lautstaerkeumfangs eines audiosignals, messeinrichtung zum durchfuehren des verfahrens, verfahren zum regeln bzw. steuern des lautstaerkeumfangs eines audiosignals und regel- bzw. steuereinrichtung zum durchfuehren des regel-
CN108257612B (zh) * 2016-12-28 2020-10-16 宏碁股份有限公司 语音信号处理装置及语音信号处理方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02502151A (ja) * 1987-11-12 1990-07-12 ニコレット インストルメント コーポレーション 適合形プログラマブル信号処理補聴器
JP2000196388A (ja) * 1998-12-25 2000-07-14 Sony Corp 音声信号処理装置及びこれを具備した電子機器
WO2002097977A2 (en) * 2001-05-30 2002-12-05 Intel Corporation Enhancing the intelligibility of received speech in a noisy environment
US6731767B1 (en) * 1999-02-05 2004-05-04 The University Of Melbourne Adaptive dynamic range of optimization sound processor

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02502151A (ja) * 1987-11-12 1990-07-12 ニコレット インストルメント コーポレーション 適合形プログラマブル信号処理補聴器
JP2000196388A (ja) * 1998-12-25 2000-07-14 Sony Corp 音声信号処理装置及びこれを具備した電子機器
US6731767B1 (en) * 1999-02-05 2004-05-04 The University Of Melbourne Adaptive dynamic range of optimization sound processor
WO2002097977A2 (en) * 2001-05-30 2002-12-05 Intel Corporation Enhancing the intelligibility of received speech in a noisy environment

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016506640A (ja) * 2012-11-19 2016-03-03 ハーマン インターナショナル インダストリーズ インコーポレイテッド オーディオラウドネス制御システム
JP2016015711A (ja) * 2014-06-10 2016-01-28 株式会社ディーアンドエムホールディングス オーディオシステム、オーディオ装置、携帯端末装置、及びオーディオ信号制御方法
JP2016212285A (ja) * 2015-05-11 2016-12-15 良明 森田 音声処理装置および音声処理方法

Also Published As

Publication number Publication date
WO2006058361A1 (en) 2006-06-08
EP1829028A1 (en) 2007-09-05

Similar Documents

Publication Publication Date Title
US20060126865A1 (en) Method and apparatus for adaptive sound processing parameters
US9432766B2 (en) Audio processing device comprising artifact reduction
US9197181B2 (en) Loudness enhancement system and method
TWI463817B (zh) 可適性智慧雜訊抑制系統及方法
EP3122072B1 (en) Audio processing device, system, use and method
US7574010B2 (en) System and method for adjusting an audio signal
US8290190B2 (en) Method for sound processing in a hearing aid and a hearing aid
EP1667416A2 (en) Reverberation estimation and suppression system
US7835773B2 (en) Systems and methods for adjustable audio operation in a mobile communication device
US20110125494A1 (en) Speech Intelligibility
AU2009242464A1 (en) System and method for dynamic sound delivery
JP2007522706A (ja) オーディオ信号処理システム
WO2009136953A1 (en) Method and device for acoustic management control of multiple microphones
EP3340657B1 (en) A hearing device comprising a dynamic compressive amplification system and a method of operating a hearing device
JP2004061617A (ja) 受話音声処理装置
JP2008197200A (ja) 了解度自動調整装置及び了解度自動調整方法
JP2008522511A (ja) 適応可能な音声処理パラメータ用の方法及び装置
KR20240007168A (ko) 소음 환경에서 음성 최적화
EP2963817B1 (en) Method and apparatus for attenuating undesired content in an audio signal
US11445307B2 (en) Personal communication device as a hearing aid with real-time interactive user interface
EP3830823A1 (en) Forced gap insertion for pervasive listening
KR101896387B1 (ko) 휴대용 단말기의 굉음 방지장치 및 방법
JP2586847B2 (ja) 電子電話機
US11902747B1 (en) Hearing loss amplification that amplifies speech and noise subsignals differently
US11463809B1 (en) Binaural wind noise reduction

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100506

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20101102