JP2003513319A - 短期間の過渡的音声の特徴のエンファシス - Google Patents

短期間の過渡的音声の特徴のエンファシス

Info

Publication number
JP2003513319A
JP2003513319A JP2001534137A JP2001534137A JP2003513319A JP 2003513319 A JP2003513319 A JP 2003513319A JP 2001534137 A JP2001534137 A JP 2001534137A JP 2001534137 A JP2001534137 A JP 2001534137A JP 2003513319 A JP2003513319 A JP 2003513319A
Authority
JP
Japan
Prior art keywords
short
gain
signal
term
amplitude
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001534137A
Other languages
English (en)
Other versions
JP4737906B2 (ja
JP2003513319A5 (ja
Inventor
イー バンダリ,アンドリュー
エム. クラーク,グラエム
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Melbourne
Original Assignee
University of Melbourne
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Melbourne filed Critical University of Melbourne
Publication of JP2003513319A publication Critical patent/JP2003513319A/ja
Publication of JP2003513319A5 publication Critical patent/JP2003513319A5/ja
Application granted granted Critical
Publication of JP4737906B2 publication Critical patent/JP4737906B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2225/00Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
    • H04R2225/43Signal processing in hearing aids to enhance the speech intelligibility

Abstract

(57)【要約】 マイクロホン(1)、前置増幅器(2)、N個から成る並列フィルタ・バンク(3)、各フィルタ・チャネルのエンベロープ信号中の短期間の遷移を検出する手段、およびこれらのフィルタ・チャネルの出力にゲインを加える手段を含み、ゲインが各フィルタ・チャネルにおけるゆっくり変動するエンベロープ信号の2次導関数に関連していて、前記信号中での低い強度の短期間の音声の特徴を知覚することを支援する音処理装置。

Description

【発明の詳細な説明】
【0001】 〔発明の分野〕 本発明は、特に移植蝸牛刺激装置や補聴器のような聴覚補助装置や、音の処理
またはコード化を必要とする他のシステムにおいて刺激を発生させるための、音
の刺激からとり出される信号の処理に関する。 〔発明の背景〕 移植蝸牛刺激装置や補聴器のような聴覚補助装置を刺激するのに使用される音
信号を処理するための種々の音声処理ストラテジーが開発されている。このよう
なストラテジーは音声の特定の態様、例えばフォルマントに焦点を絞っている。
他のストラテジーは、本願の出願人によるオーストラリア特許第657959号
に詳細に記述されているスペクトラル・マキシマ・サウンド・プロセッサ(SM
SP)ストラテジーのように、より総合的な、チャネルごとの振幅に基づく選択
に依存する。上記特許の内容は関連文献として本願明細書中にとり込まれている
【0002】 このような音処理システムが繰り返し遭遇する困難は、利用者が音刺激中の音
声を正しく知覚できるのに充分な情報を提供することにある。 〔発明の概要および目的〕 この発明の目的は、音の刺激中の微弱な短期間の音声の特徴を知覚することを
支援するように、音の処理ストラテジーを提供することにある。
【0003】 本発明は音処理装置であって、互いに間隔を保つ複数の周波数チャネルにおけ
る音信号の振幅エンベロープを推定する手段と、推定された振幅エンベロープを
ある時間に亘って分析することによって前記エンベロープ中の短期間の振幅の遷
移を検出する手段と、前記短期間の振幅の遷移の所定期間に亘る変化のプロファ
イルのレートを決定する手段を含み、前記短期間の振幅の遷移の相対的な振幅を
増大させる手段と、前記変化のプロファイルのレートから、前記音信号における
前記遷移に適用される相対的な振幅の増大のサイズを求めることによって、前記
信号中の低い強度の短期間の音声の特徴を知覚することを支援する手段とから成
る前記音処理装置を提供する。
【0004】 好ましい実施態様では、前記所定期間は約60msである。ログの(logarith
mic)振幅目盛上で、前記短期間の振幅の遷移の変化のレートが速く/大きい程、
前記遷移に適用される相対的な振幅の増大も大きくなる。また、短期間のバース
ト遷移に対応する変化のプロファイルのレートでは、オンセット(onset)遷移
に対応するプロファイルの場合よりも相対的な振幅の増大がより顕著である。本
願明細書における“バースト遷移”とは、振幅エンベロープにおいて急激な増大
に続いて急激な低下が起こることを意味し、また“オンセット遷移”とは、振幅
エンベロープにおいて急激な増大に続いて比較的一定したレベルが現れることを
意味する。
【0005】 上記した過渡エンファシス・ストラテジーは、特に難聴者や移植蝸牛刺激装置
利用者のため、低い強度の短期間の音声の特徴を知覚することを支援するように
構成されている。これらの音声の特徴は典型的には、i)破裂音の子音を伴う低
い強度の短期間のノイズバースト/摩擦エネルギーと、ii)音声フォルマント(特
に第2フォルマント、F2)、例えば、破裂音、鼻音およびその他の子音のよう
な発音を伴う音声フォルマントの周波数における急激な遷移から成る。バックグ
ラウンド・ノイズと共に与えられた場合、これらの特徴の知覚を向上させること
で、幾つかの子音(即ち、破裂音と鼻音)の知覚だけでなく、音声全体の知覚をも
支援することが判明した。
【0006】 過渡エンファシス・ストラテジーは他の音声処理システム、特に、限定するも
のではないが、刺激用移植電極アレイに対するフロントエンドプロセスとして適
用することが好ましい。本発明の好ましい実施例は、上記スペクトラル・マキシ
マ・サウンド・プロセッサ(SMSP)ストラテジーに組み込まれている。過渡
エンファシス・スペクトラル・マキシマ(TESM)サウンド・プロセッサとし
て知られる複合ストラテジーは、過渡エンファシス・ストラテジーを利用するこ
とにより、最大振幅を有するチャネルを選択する前にSMSPのフィルタ・バン
クの出力を強調する。
【0007】 多重チャネル音声処理システムの多くがそうであるように、入力音信号は帯域
フィルタのバンクを利用することによって複数の周波数チャネルに分割される。
次いで、これらの帯域において、信号を整流および低域フィルタリングすること
によって信号エンベロープをとり出す。次いで、各チャネルごとにエンベロープ
信号中の短期間の遷移のエンファシスを行う。このエンファシスは、i)典型的
にはノイズ・バースト、フォルマント遷移、および音声オンセットのような音声
の特徴に対応する、チャネルエンベロープ中での短期間(約5乃至60ms)の振
幅変化を検出し、ii)これらの期間中に、信号ゲインを増大させることによって
行う。加えられるゲインは、ゆっくり変動するエンベロープ信号の時間に対する
2次導関数(または、好適な実施例の説明において後述するような同様のルール
)に関連している。
【0008】 エンベロープ信号中での定常状態または比較的緩やかに変動するレベルの期間
中(約60msの期間に亘る)は、ゲインは全く加えられない。エンベロープ信号
中の短期間の遷移が検出される期間中は、加えられるゲインの量は典型的には約
14dBまで変動可能である。ゲインは下記のいずれかに分類される短期間の遷
移の性質に応じて変動する。i)信号エンベロープにおける急激な増大に続く低下
(約60ms以内の期間に亘る)を生ずる場合で、典型的には、これは破裂音の子
音中に現れるノイズバースト、または、子音から母音または母音から子音への遷
移中に現れるフォルマントの急激な周波数シフトのような音声の特徴に対応する
。ii)信号エンベロープにおける急激な増大に続いて比較的一定したレベルが現
れる場合で、典型的には、母音における有声音のオンセットのような音声の特徴
に相当する。分類i)による短期間の音声の特徴は、分類ii)によるものよりも知
覚にとってより重要であると考えられ、従って、相対的に2倍のゲインを受ける
【0009】 なお、比較的一定したレベルに続いて急激な低下が現れる信号エンベロープは
有声音/音の中絶に相当するから、殆どまたは全くゲインを受けない。
【0010】 本発明をより容易に理解しうるようにするために、本発明の1つの好適な実施
形態について添付図面を参照しながら説明する。 〔好適な実施形態の説明〕 図1を参照しながら、この発明の好適な実施形態を、SMSPストラテジーを
もって使用する場合について説明する。SMSPストラテジーによって、マイク
ロホン1および前置増幅器2を介して受信される音信号に対応する電気信号が、
近接する周波数に同調させたN個の並列フィルタ・バンク3によって処理される
(典型的にはN=16)。各フィルタチャネルは各チャネルにおける信号の振幅
(エンベロープ)を推定するため、帯域フィルタ4、整流器5および低域フィル
タ6を含む。この実施形態では、フィルタ・バンクでの高速フーリエ変換(FF
T)の実行を採用する。N−チャネル・フィルタ・バンクの出力は、SMSPス
トラテジーに従ってさらに処理される前に、過渡エンファシス・アルゴリズム7
(後述する)によって修正される。
【0011】 2.5ms間隔で60msの期間に亘る、各チャネルにおけるエンベロープ信
号の動作履歴は、Sn(t)で示されるようにスライディング・バッファ8に保
持される。ここで、Sn(t)の添字nはチャネル番号、tは現在の分析間隔に
対する時間を表す。このバッファは3つの連続する20msのタイム・ウィンド
ウに分割され、ウィンドウ内の期間にわたって平均化することによって、各ウィ
ンドウにおいてゆっくり変動するエンベロープ信号の推定値が得られる。平均化
ウィンドウは遮断周波数が45Hzの2次低域フィルタとほぼ等価であり、主と
して、有声周波数変調や無声ノイズ変調のような、微細なエンベロープ構造の平
滑化に利用される。従って、3つのウィンドウから得られる平均値は、バッファ
n(t)の中点を基準として、過去(Ep)9、現在(Ec)10および未来(
f)11の、ゆっくり変動するエンベロープ信号の推定値である。印加される
付加的ゲインの量は方程式(1)で表される、ゆっくり変動するエンベロープの
推定値の関数から導出される。この関数の導出および分析は付記Aにおいて説明
する。
【0012】 G=(2×Ec−2×Ep−Ef)/(Ec+Ep+Ef) (1) 各チャンネルに対するゲイン係数(G)12は以下に説明するようにゆっくり
変動するエンベロープ信号の挙動によって変化する:(a)ゆっくり変動するエン
ベロープ信号中における(ほぼ60ms以内の期間に亘っての)急激な立上りと
これに続く急激な降下とから成る短期間の信号がGの最大値を発生させる。この
ようなタイプの信号では、Gは約0から2までの範囲にあると考えられる。(b
)急激な立上りとこれに続く比較的一定したレベルとから成る長期間信号の開始
に伴って、典型的には0から0.5までの範囲にある低いレベルのGを生成する
。(c)比較的定常な状態、またはゆっくり変動するエンベロープ信号は負の値
のGを生成する。(d)エンベロープ信号における比較的定常な状態のレベルと
これに続く急激な低下とは(即ち、エンベロープ・エネルギーの休止/オフセッ
トは)、小さい(約0.1より小)または負の値のGを生成する。負の値のGが
生じうるから、ステップ13において、方程式(2)に示すように、Gがゼロよ
り下に低下しないように方程式(1)の結果が制限される。
【0013】 (G<0)なら、G=0 (2) 方程式(1)のもう1つの重要な性質は、ゲイン係数を、ゆっくり変動するエ
ンベロープ信号の大きさにおける絶対レベルではなく、相対的な差の関数と関連
させることである。例えば、ピーク・レベルは異なるが、ピークと谷の比が同一
のゆっくり変動するエンベロープ信号中の短期間ピークは同じ量だけ増幅される
ことになる。
【0014】 各チャネルごとのゲイン係数(Gn)(ここで、nはチャネル番号を表す)は
、方程式(3)に従って元のエンベロープ信号Sn(t)をスケーリングするの
に利用される(ここで、tmはバッファSn(t)の中間点を表す)。
【0015】 S’n(tm)=Sn(tm)×(1+Kn×Gn) (3) ステップ14において、アルゴリズムの全体のゲインを調整するためのゲイン
修正子定数(Kn)が導入される。この実施例では、すべてのnに対してKn=2
である。いずれのチャネルのエンベロープ信号においても殆ど変化が無い期間で
は、ゲイン係数(Gn)はゼロに等しく、従って、S’n(tm)=Sn(tm)と
なるのに対して、急激な変化が起こる期間では、Gnは0から2までの範囲とな
り、従って、全体では0乃至14dBのゲインが印加される。ゲインはエンベロ
ープ信号の中間点で印加されるから、過渡エンファシス・アルゴリズムの入力か
ら出力までの時間に約30msの総合的遅延が導入される。ステップ15におい
て、修正されたエンベロープ信号S’n(t)が、フィルタ・バンクからとり出
された元のエンベロープ信号Sn(t)に取って代わり、以下、SMSPストラ
テジーにより処理が進められる。SMSPストラテジーによって、ステップ16
では、所与の時点において最大の振幅を有するS’n(t)のN個のチャネルの
うちのM個を選択する(典型的にはM=6)。これは規則正しいタイムインター
バルで、即ち、過渡エンファシス・ストラテジーでは通常2.5ms間隔で行わ
れる。次いで、M個の選択されたチャネルを利用して、これらM個の選択された
チャネルの振幅および周波数に対応する刺激強度および電極番号のM個の電気的
刺激17を発生させる(SMSPストラテジーにより)。これらM個の刺激を、
無線周波リンク18を介して移植蝸牛刺激装置19に伝送し、この刺激を利用し
て対応するM個の対応する電極場所を活性化する。
【0016】 過渡エンファシス・アルゴリズムはスペクトラル・マキシマの選択よりも前に
適用されるから、(a)常態では音声処理システムの、マップされている閾値レベ
ル以下に低下するか、(b)または、振幅が比較的大きい定常状態の信号を含む
チャネルが存在するためSMSPストラテジーでは選択されない、低い強度の短
期間の信号を含むチャネルであっても、増幅されることで選択される大きいチャ
ンスが与えられる。
【0017】 音声信号のコード化についてのストラテジーの効果を説明するため、チャネル
ごとの刺激強度を時間の関数としてプロットしたエレクトロドグラム(音信号に
対するスペクトログラムに相当)として知られる刺激出力パターンがSMSPお
よびTESMストラテジーに対して記録されたものを、それぞれ図2および3に
示す。これらの記録に提示されている音声語句は“god”であり、女性によって
発声されたものである。TESMストラテジーの効果はイニシアル・ストップ“
g”におけるノイズ・バースト・エネルギーを表す刺激強度および電極数に認め
られる(点A)。母音“o”におけるフォルマント・エネルギーの始まりもやや
強調されている(点B)。極めて重要な効果として、母音“o”からファイナル
・ストップ“d”への第2フォルマント遷移を表す刺激も、ファイナル・ストッ
プ“d”におけるノイズ・バースト・エネルギーをコード化する刺激(点D)と
同様に高い強度を示している(点C)。 〔付記A:TESMゲイン係数〕 ゆっくり変動するエンベロープ信号に関して各チャネルごとにゲイン係数(G
)12についての関数を求めるため、下記の判定基準を採用した。第1に、ゲイ
ン係数はゆっくり変動するエンベロープ信号の2次導関数と相関関係にあるべき
である。2次導関数はゆっくり変動するエンベロープ信号におけるピークでは最
大の負(谷では最大の正)となるから、これは無視する:方程式(A1)。
【0018】 G∝2×Ec−Ep−Ef (A1) 第2に、“逆方向(backward)”グラディエント(即ち、Ec−Ep)が正では
あるが小さい場合、Efが小さければ(即ち、長期間信号に対するエンベロープ
・エネルギーの休止(オフセット)の場合)、方程式(A1)で表されるような
かなりのゲインが得られる。この影響は望ましいものではなく、逆方向グラディ
エントが小さい場合それをゼロ近くまたはそれ以下に(即ち、負に)低下させる
ことによって最小にすることができる。但し、逆方向グラジエントが大きい場合
、方程式(A1)は維持すべきである。簡単な解決法はEpを2でスケーリング
することである。‘修正された’2次導関数は方程式(A2)で表される。Ep
がEcに近づくにつれて、Gは方程式(A1)の場合のようにEc−Efにではな
く、−Efに近づくから、ゲイン係数は小さい、または負の値に近づく。但し、
p<<Ecなら、Gは方程式(A1)の場合の限定的な状態と全く同様に2×E c −Efに近づく。
【0019】 G∝2×Ec−2×Ep−Ef (A2) 第3に、ゆっくり変動するエンベロープ信号での絶対値の差ではなく相対的な
差に基づいてゲインを提供することに注目するものであり、従って、方程式(A
3)によって、ゆっくり変動するエンベロープ信号の平均レベルに対してゲイン
係数を正規化しなければならない。方程式(A3)における分子は方程式(A2
)に規定されている線形ゲイン係数を0乃至2の範囲に圧縮する。これにより、
ゲイン係数は修正された2次導関数に比例し、ゆっくり変動するエンベロープ・
チャネル信号の平均レベルに反比例することになる。
【0020】 G=(2×Ec−2×Ep−Ef)/(Ec+Ep+Ef) (A3) 最後に、方程式(A3)で与えられるゲイン係数は、Ec<Ep+Ef/2ならゼ
ロ以下に低下する。そこで、ゲインが常にゼロ以上となるように、Gnに方程式
(A4)の条件を課する。
【0021】 (G<0)なら、G=0 (A4) ゲイン係数に対する限定的な場合を分析することによって、ゆっくり変動する
エンベロープ信号の関数としてゲイン係数の動向を記述するのに使用することが
できる。EpがEcよりもはるかに小さい場合(即ち、エンベロープ信号における
急激な立上りの期間)、方程式(A3)は下記のように簡略化される: G=(2×Ec-Ef)/(Ec+Ef) (A5) この場合、EfがEcよりも大きく、2×Ecに近ずけば(即ち、ゆっくり変動
するエンベロープ信号における定常的な立上りの期間)、Gはゼロに近くなる。
fがEcと同程度なら(即ち、長期間信号における立上り期間の終わり)、Gは
ほぼ0.5となる。EfがEcよりもやや小さければ(即ち、エンベロープ信号に
おける短期間ピークの場合と同様に、直後に急激な立下りが来る急激な立上りの
頂点において)Gがその最大値である2に近づく。
【0022】 EfがEcよりもはるかに小さい場合、方程式(A3)は下記のように簡略化さ
れる: G=(2×Ec-2×Ep)/(Ec+Ep) (A6) この場合、もしEcがEpと同程度なら(即ち、長期間信号に対するエンベロー
プの休止/オフセット)、Gはゼロに近づく。EcがEpよりもはるかに大きけれ
ば(即ち、エンベロープでのピークにおいて)、Gは最大ゲイン2に近づく。
【0023】 音声信号の処理に際しては、強度をログ(dB)目盛で表すのが普通である。
これにより、ゆっくり変動するエンベロープ信号のログ(log)の大きさのグラ
ディエントとの関連で、印加されたゲイン係数を見ることができて便利である。
方程式(A3)はゆっくり変動するエンベロープ信号の推定値の比で表すことが
できる。逆方向(backward)の大きさの比をRb=Ec/Ep、順方向(forward)
の大きさの比をRf=Ef/Ecと定義すれば、方程式(A7)が得られる。
【0024】 G=(2×Rb-2−Rb×Rf)/(Rb+1+Rb×Rf) (A7) 順方向および逆方向の大きさの比は、ログの大きさのグラディエントと等価で
あり、ログの大きさの項間の差、即ち、それぞれFg=log(Ef)-log(E c )およびBg=log(Ec)−log(Ep)で表すことができる。ゲイン係数
と順方向および逆方向のログの大きさのグラディエントとの関係を図A1に示す
。線形ゲインを縦軸に、逆方向のログの大きさのグラディエント(dBでの)を
横軸に示してある。ゲイン係数を、各曲線における順方向のログの大きさのグラ
ディエントの異なるレベルに対してプロットした。どの順方向のログの大きさの
グラディエントの値においても、逆方向のログの大きさのグラディエントが約4
0dBの時、ゲイン係数がある最大値に達する。この最大レベルは順方向のログ
の大きさのグラディエントのレベルに応じて異なる。点線で示すように、順方向
のログの大きさのグラディエントが0dBである場合(即ち、Ef=Ecである長
期間信号の立上り期間の終わりにおいて)、最大ゲインは0.5となる。順方向
のログの大きさのグラディエントが破線で示すように非常に急勾配という限定的
な場合(エンベロープ信号における急激な立下り、即ち、Ef<<Ec)、最大ゲイ
ンは2.0となる。順方向のログの大きさのグラディエントに対する限界は、そ
のグラディエントが約−40dBであるときに到達する。
【図面の簡単な説明】
【図1】 本発明により音信号に適用される信号処理を略示する図である。
【図2】 本発明の効果を示すための音信号の比較エレクトロドグラムである。
【図3】 本発明の効果を示すための音信号の比較エレクトロドグラムである。
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),OA(BF,BJ ,CF,CG,CI,CM,GA,GN,GW,ML, MR,NE,SN,TD,TG),AP(GH,GM,K E,LS,MW,MZ,SD,SL,SZ,TZ,UG ,ZW),EA(AM,AZ,BY,KG,KZ,MD, RU,TJ,TM),AE,AG,AL,AM,AT, AU,AZ,BA,BB,BG,BR,BY,BZ,C A,CH,CN,CR,CU,CZ,DE,DK,DM ,DZ,EE,ES,FI,GB,GD,GE,GH, GM,HR,HU,ID,IL,IN,IS,JP,K E,KG,KP,KR,KZ,LC,LK,LR,LS ,LT,LU,LV,MA,MD,MG,MK,MN, MW,MX,MZ,NO,NZ,PL,PT,RO,R U,SD,SE,SG,SI,SK,SL,TJ,TM ,TR,TT,TZ,UA,UG,US,UZ,VN, YU,ZA,ZW (72)発明者 クラーク,グラエム エム. オーストラリア国,ビクトリア 3095,エ ルサム,バヌーン ロード 13

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 音処理装置であって、互いに間隔を保つ複数の周波数チャネ
    ルにおける音信号の振幅エンベロープを推定する手段と、該推定された振幅エン
    ベロープをある時間に亘って分析することによって前記エンベロープ中の短期間
    の振幅の遷移を検出する手段と、前記短期間の振幅の遷移の所定期間に亘る変化
    のプロファイルのレートを決定する手段を含み、前記短期間の振幅の遷移の相対
    的な振幅を増大させる手段と、前記変化のプロファイルのレートから、前記音信
    号における前記遷移に適用される相対的な振幅の増大のサイズを求めることによ
    って、前記信号中の低い強度の短期間の音声の特徴を知覚することを支援する手
    段と、から成る音処理装置。
  2. 【請求項2】 前記所定期間が約60msであり、ログの振幅目盛上で、前
    記短期間の振幅の遷移の変化のレートが速く/大きい程、前記遷移に適用される
    相対的な振幅の増大も大きくなる、請求項1に記載の装置。
  3. 【請求項3】 前記変化のプロファイルのレートでの短期間の遷移の検出に
    よって約14dBのゲインまで前記音信号に加えられ、ゲインの量が、短期間の
    遷移の下記の性質に従って、即ち、 (i)急激な増大に続いてプロファイルが低下し(短期間のバースト遷移)、約
    14dBまでゲインを増大させるか、 (ii)急激な増大に続いてプロファイルが比較的一定のレベルを有し(オンセ
    ット遷移)、約6dBまでゲインを増大させるか、 (iii)比較的一定したレベルに続いてプロファイルが急激に低下し、ゲイン
    を殆どまたは全く増大させないか、 に従って選択される、請求項1または2に記載の装置。
  4. 【請求項4】 マイクロホン、前置増幅器、N個の並列フィルタ・バンク、
    およびフィルタの出力に、過渡エンファシス・アルゴリズムを適用する手段を含
    む、請求項1〜3のいずれか一項に記載の装置。
  5. 【請求項5】 nがフィルタチャネル番号を、tが時間をそれぞれ表すとし
    て、Sn(t)で示される、いずれかのフィルタ・チャネルにおける信号を、Gn が各チャネルに対するゲイン係数、Knが約2に等しいゲイン修正子定数を表す
    として、S’n(t)=Sn(t)×(1+Kn×Gn)に従ってスケーリングする
    、請求項1〜4のいずれか一項に記載の装置。
  6. 【請求項6】 バッファが各フィルタ・チャネルにおけるエンベロープ信号
    n(t)の履歴を保持し、各フィルタ・チャンネルに対して、ゆっくり変動す
    るエンベロープ信号の推定値が、約45Hzのカットオフ周波数を有して微細な
    プロファイル構造を平滑化する2次低域フィルタと等価の平均ウィンドウによっ
    てとり出される、請求項5に記載の装置。
  7. 【請求項7】 ゲイン係数Gnを、各フィルタ・チャネルにおけるゆっくり
    変動するエンベロープ信号の2次導関数と関連させる、請求項5または6に記載
    の装置。
  8. 【請求項8】 Ec、EpおよびEfが各フィルタ・チャネルにおける現在、
    過去および未来での、ゆっくり変動するエンベロープ信号の推定値を表すとして
    、各フィルタ・チャネルに対するゲイン係数が、関数: Gn=(2×Ec-2×Ep-Ef)/(Ec+Ep+Ef) から導出される、請求項5〜7のいずれか一項に記載の装置。
  9. 【請求項9】 音信号に加えられる付加的なゲイン係数Gnが、急激な立上
    りに続いて急激な立下りを有するゆっくり変動するエンベロープ・プロファイル
    では約0乃至2の範囲、急激な立上りに続いて比較的一定したレベルを有するプ
    ロファイルでは約0乃至0.5の範囲、定常状態レベルに続く急激な低下を有す
    るプロファイルでは0.1より小、定常状態レベルまたはゆっくり変動するプロ
    ファイルでは約0である、請求項8に記載の装置。
  10. 【請求項10】 異なったピークレベルではあるが、ピークと谷の比が類似
    している短期間のピークを示す、ゆっくり変動するエンベロープのプロファイル
    が、同様の量だけ増幅される、請求項8または9に記載の装置。
JP2001534137A 1999-10-26 2000-10-25 短期間の過渡的音声の特徴のエンファシス Expired - Fee Related JP4737906B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
AUPQ3667 1999-10-26
AUPQ3667A AUPQ366799A0 (en) 1999-10-26 1999-10-26 Emphasis of short-duration transient speech features
AU3667 1999-10-26
PCT/AU2000/001310 WO2001031632A1 (en) 1999-10-26 2000-10-25 Emphasis of short-duration transient speech features

Publications (3)

Publication Number Publication Date
JP2003513319A true JP2003513319A (ja) 2003-04-08
JP2003513319A5 JP2003513319A5 (ja) 2007-11-08
JP4737906B2 JP4737906B2 (ja) 2011-08-03

Family

ID=3817818

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001534137A Expired - Fee Related JP4737906B2 (ja) 1999-10-26 2000-10-25 短期間の過渡的音声の特徴のエンファシス

Country Status (8)

Country Link
US (3) US7219065B1 (ja)
EP (1) EP1224660B1 (ja)
JP (1) JP4737906B2 (ja)
AT (1) ATE474309T1 (ja)
AU (1) AUPQ366799A0 (ja)
CA (1) CA2385233A1 (ja)
DE (1) DE60044680D1 (ja)
WO (1) WO2001031632A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014524593A (ja) * 2011-07-29 2014-09-22 ディーティーエス・エルエルシー 適応音声了解度プロセッサ

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AUPQ366799A0 (en) 1999-10-26 1999-11-18 University Of Melbourne, The Emphasis of short-duration transient speech features
AU2001289593A1 (en) * 2000-09-20 2002-04-02 Leonhard Research A/S Quality control of electro-acoustic transducers
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
US7787956B2 (en) 2002-05-27 2010-08-31 The Bionic Ear Institute Generation of electrical stimuli for application to a cochlea
CA2492091C (en) 2002-07-12 2009-04-28 Widex A/S Hearing aid and a method for enhancing speech intelligibility
JP4178319B2 (ja) * 2002-09-13 2008-11-12 インターナショナル・ビジネス・マシーンズ・コーポレーション 音声処理におけるフェーズ・アライメント
US8023673B2 (en) * 2004-09-28 2011-09-20 Hearworks Pty. Limited Pitch perception in an auditory prosthesis
US8046218B2 (en) * 2006-09-19 2011-10-25 The Board Of Trustees Of The University Of Illinois Speech and method for identifying perceptual features
EP2031581A1 (de) * 2007-08-31 2009-03-04 Deutsche Thomson OHG Verfahren zum Erkennen eines akustischen Ereignisses in einem Audio-Signal
CN101627427B (zh) * 2007-10-01 2012-07-04 松下电器产业株式会社 声音强调装置及声音强调方法
US8005246B2 (en) * 2007-10-23 2011-08-23 Swat/Acr Portfolio Llc Hearing aid apparatus
WO2009086174A1 (en) 2007-12-21 2009-07-09 Srs Labs, Inc. System for adjusting perceived loudness of audio signals
US8831936B2 (en) * 2008-05-29 2014-09-09 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement
US8983832B2 (en) * 2008-07-03 2015-03-17 The Board Of Trustees Of The University Of Illinois Systems and methods for identifying speech sound features
US8538749B2 (en) * 2008-07-18 2013-09-17 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for enhanced intelligibility
US20110178799A1 (en) * 2008-07-25 2011-07-21 The Board Of Trustees Of The University Of Illinois Methods and systems for identifying speech sounds using multi-dimensional analysis
EP2394443B1 (en) * 2009-02-03 2021-11-10 Cochlear Ltd. Enhianced envelope encoded tone, sound procrssor and system
US20100246866A1 (en) * 2009-03-24 2010-09-30 Swat/Acr Portfolio Llc Method and Apparatus for Implementing Hearing Aid with Array of Processors
US9202456B2 (en) * 2009-04-23 2015-12-01 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for automatic control of active noise cancellation
US8538042B2 (en) 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
WO2011127832A1 (en) * 2010-04-14 2011-10-20 Huawei Technologies Co., Ltd. Time/frequency two dimension post-processing
US9053697B2 (en) 2010-06-01 2015-06-09 Qualcomm Incorporated Systems, methods, devices, apparatus, and computer program products for audio equalization
CN102958561B (zh) 2010-06-30 2015-11-25 Med-El电气医疗器械有限公司 包络特定刺激定时
WO2013009672A1 (en) 2011-07-08 2013-01-17 R2 Wellness, Llc Audio input device
US9384759B2 (en) * 2012-03-05 2016-07-05 Malaspina Labs (Barbados) Inc. Voice activity detection and pitch estimation
US9312829B2 (en) 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
CN105813688B (zh) 2013-12-11 2017-12-08 Med-El电气医疗器械有限公司 用于听力植入物中的瞬态声音修改的装置
IN2014MU00739A (ja) 2014-03-04 2015-09-25 Indian Inst Technology Bombay
US10475471B2 (en) * 2016-10-11 2019-11-12 Cirrus Logic, Inc. Detection of acoustic impulse events in voice applications using a neural network
US10242696B2 (en) * 2016-10-11 2019-03-26 Cirrus Logic, Inc. Detection of acoustic impulse events in voice applications
CN109147809A (zh) * 2018-09-20 2019-01-04 广州酷狗计算机科技有限公司 音频信号处理方法、装置、终端及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58184200A (ja) * 1981-10-05 1983-10-27 シグナトロン・インコ−ポレ−テッド 対話了解度を強調する装置およびその方法
JPH04116698A (ja) * 1990-09-07 1992-04-17 Matsushita Electric Ind Co Ltd 音声信号処理装置と音声信号処理方法
US5737719A (en) * 1995-12-19 1998-04-07 U S West, Inc. Method and apparatus for enhancement of telephonic speech signals
JPH1132395A (ja) * 1997-07-11 1999-02-02 Sony Corp 音声信号の処理回路
JP2000022469A (ja) * 1998-06-30 2000-01-21 Sony Corp 音声処理装置
JP2002518912A (ja) * 1998-06-08 2002-06-25 コックレア リミティド 聴覚装置

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4051331A (en) 1976-03-29 1977-09-27 Brigham Young University Speech coding hearing aid system utilizing formant frequency transformation
US4061875A (en) 1977-02-22 1977-12-06 Stephen Freifeld Audio processor for use in high noise environments
US4191864A (en) 1978-08-25 1980-03-04 American Hospital Supply Corporation Method and apparatus for measuring attack and release times of hearing aids
JPH0356736B2 (ja) 1979-05-28 1991-08-29
US4249042A (en) 1979-08-06 1981-02-03 Orban Associates, Inc. Multiband cross-coupled compressor with overshoot protection circuit
US4357497A (en) 1979-09-24 1982-11-02 Hochmair Ingeborg System for enhancing auditory stimulation and the like
DE3003315C2 (de) 1980-01-30 1982-09-16 Siemens AG, 1000 Berlin und 8000 München Verfahren zur Erzeugung von elektrokutanen Reizmustern als Träger akustischer Information und Gerät zur Durchführung dieses Verfahren
JPS5785800A (en) 1980-11-18 1982-05-28 Nissan Motor Method of assembling finger bar for forklift
CA1189147A (en) 1980-12-12 1985-06-18 James F. Patrick Speech processors
US4661981A (en) * 1983-01-03 1987-04-28 Henrickson Larry K Method and means for processing speech
US4536844A (en) 1983-04-26 1985-08-20 Fairchild Camera And Instrument Corporation Method and apparatus for simulating aural response information
US4696039A (en) * 1983-10-13 1987-09-22 Texas Instruments Incorporated Speech analysis/synthesis system with silence suppression
US4593696A (en) 1985-01-17 1986-06-10 Hochmair Ingeborg Auditory stimulation using CW and pulsed signals
GB2192511B (en) 1986-07-11 1990-02-21 Roger Frederick Laurence Hearing aid
US5165017A (en) 1986-12-11 1992-11-17 Smith & Nephew Richards, Inc. Automatic gain control circuit in a feed forward configuration
US4887299A (en) 1987-11-12 1989-12-12 Nicolet Instrument Corporation Adaptive, programmable signal processing hearing aid
JP2800005B2 (ja) 1987-11-18 1998-09-21 有機合成薬品工業株式会社 デオキシリボ核酸の製造法
DE3821970C1 (ja) 1988-06-29 1989-12-14 Ernst-Ludwig Von Dr. 8137 Berg De Wallenberg-Pachaly
US5371803A (en) 1990-08-31 1994-12-06 Bellsouth Corporation Tone reduction circuit for headsets
US5408581A (en) * 1991-03-14 1995-04-18 Technology Research Association Of Medical And Welfare Apparatus Apparatus and method for speech signal processing
US5278912A (en) 1991-06-28 1994-01-11 Resound Corporation Multiband programmable compression system
JPH06214597A (ja) 1991-07-02 1994-08-05 Univ Melbourne 音声処理装置
JPH075898A (ja) * 1992-04-28 1995-01-10 Technol Res Assoc Of Medical & Welfare Apparatus 音声信号処理装置と破裂性抽出装置
US5572593A (en) * 1992-06-25 1996-11-05 Hitachi, Ltd. Method and apparatus for detecting and extending temporal gaps in speech signal and appliances using the same
DK46493D0 (da) 1993-04-22 1993-04-22 Frank Uldall Leonhard Metode for signalbehandling til bestemmelse af transientforhold i auditive signaler
US5402498A (en) 1993-10-04 1995-03-28 Waller, Jr.; James K. Automatic intelligent audio-tracking response circuit
JP3321971B2 (ja) * 1994-03-10 2002-09-09 ソニー株式会社 音声信号処理方法
WO1997014266A2 (en) 1995-10-10 1997-04-17 Audiologic, Inc. Digital signal processing hearing aid with processing strategy selection
US5991663A (en) 1995-10-17 1999-11-23 The University Of Melbourne Multiple pulse stimulation
US5903655A (en) 1996-10-23 1999-05-11 Telex Communications, Inc. Compression systems for hearing aids
US6064913A (en) 1997-04-16 2000-05-16 The University Of Melbourne Multiple pulse stimulation
US6078838A (en) 1998-02-13 2000-06-20 University Of Iowa Research Foundation Pseudospontaneous neural stimulation system and method
US6993480B1 (en) * 1998-11-03 2006-01-31 Srs Labs, Inc. Voice intelligibility enhancement system
US6308155B1 (en) * 1999-01-20 2001-10-23 International Computer Science Institute Feature extraction for automatic speech recognition
US6453287B1 (en) * 1999-02-04 2002-09-17 Georgia-Tech Research Corporation Apparatus and quality enhancement algorithm for mixed excitation linear predictive (MELP) and other speech coders
US6732073B1 (en) * 1999-09-10 2004-05-04 Wisconsin Alumni Research Foundation Spectral enhancement of acoustic signals to provide improved recognition of speech
AUPQ366799A0 (en) * 1999-10-26 1999-11-18 University Of Melbourne, The Emphasis of short-duration transient speech features
US6693480B1 (en) * 2003-03-27 2004-02-17 Pericom Semiconductor Corp. Voltage booster with increased voltage boost using two pumping capacitors

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58184200A (ja) * 1981-10-05 1983-10-27 シグナトロン・インコ−ポレ−テッド 対話了解度を強調する装置およびその方法
JPH04116698A (ja) * 1990-09-07 1992-04-17 Matsushita Electric Ind Co Ltd 音声信号処理装置と音声信号処理方法
US5737719A (en) * 1995-12-19 1998-04-07 U S West, Inc. Method and apparatus for enhancement of telephonic speech signals
JPH1132395A (ja) * 1997-07-11 1999-02-02 Sony Corp 音声信号の処理回路
JP2002518912A (ja) * 1998-06-08 2002-06-25 コックレア リミティド 聴覚装置
JP2000022469A (ja) * 1998-06-30 2000-01-21 Sony Corp 音声処理装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014524593A (ja) * 2011-07-29 2014-09-22 ディーティーエス・エルエルシー 適応音声了解度プロセッサ

Also Published As

Publication number Publication date
US20070118359A1 (en) 2007-05-24
US20090076806A1 (en) 2009-03-19
US7444280B2 (en) 2008-10-28
WO2001031632A1 (en) 2001-05-03
DE60044680D1 (de) 2010-08-26
EP1224660A1 (en) 2002-07-24
JP4737906B2 (ja) 2011-08-03
US7219065B1 (en) 2007-05-15
ATE474309T1 (de) 2010-07-15
EP1224660A4 (en) 2005-08-17
US8296154B2 (en) 2012-10-23
AUPQ366799A0 (en) 1999-11-18
EP1224660B1 (en) 2010-07-14
CA2385233A1 (en) 2001-05-03

Similar Documents

Publication Publication Date Title
JP2003513319A (ja) 短期間の過渡的音声の特徴のエンファシス
US6732073B1 (en) Spectral enhancement of acoustic signals to provide improved recognition of speech
US5737719A (en) Method and apparatus for enhancement of telephonic speech signals
Moore Temporal integration and context effects in hearing
US8185383B2 (en) Methods and apparatus for adapting speech coders to improve cochlear implant performance
US8983832B2 (en) Systems and methods for identifying speech sound features
Krause et al. Evaluating the role of spectral and envelope characteristics in the intelligibility advantage of clear speech
EP2372707B1 (en) Adaptive spectral transformation for acoustic speech signals
EP1609134A1 (en) Sound system improving speech intelligibility
Weiss Effects of noise and noise reduction processing on the operation of the Nucleus-22 cochlear implant processor
Lane et al. Effects of short-and long-term changes in auditory feedback on vowel and sibilant contrasts
JP4876245B2 (ja) 子音加工装置、音声情報伝達装置及び子音加工方法
CN108986844B (zh) 一种基于说话人语音特征的语音端点检测方法
Verschuure et al. Speech intelligibility in noise with fast compression hearing aids
EP2899722A1 (en) Communication device
Dai et al. An improved model of masking effects for robust speech recognition system
JPH0449952B2 (ja)
CN102222507B (zh) 一种适用于汉语语言的听力损失补偿方法及设备
AU777832B2 (en) Emphasis of short-duration transient speech features
Alwan et al. Human and machine recognition of nasal consonants in noise
Beeston Perceptual compensation for reverberation in human listeners and machines
Knorr A hearing aid for subjects with extreme high-frequency losses
Haque et al. An auditory motivated asymmetric compression technique for speech recognition
Leijon et al. Fast amplitude compression in hearing aids improves audibility but degrades speech information transmission
Pascoe et al. Hearing‐Aid Design and Evaluation for a Presbycusic Patient

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070920

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070920

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100727

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20101026

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20101102

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101210

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110329

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110426

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140513

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140513

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140513

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140513

Year of fee payment: 3

R154 Certificate of patent or utility model (reissue)

Free format text: JAPANESE INTERMEDIATE CODE: R154

LAPS Cancellation because of no payment of annual fees