JP6441796B2 - マルチバンドの音声圧縮システムと方法 - Google Patents

マルチバンドの音声圧縮システムと方法 Download PDF

Info

Publication number
JP6441796B2
JP6441796B2 JP2015526557A JP2015526557A JP6441796B2 JP 6441796 B2 JP6441796 B2 JP 6441796B2 JP 2015526557 A JP2015526557 A JP 2015526557A JP 2015526557 A JP2015526557 A JP 2015526557A JP 6441796 B2 JP6441796 B2 JP 6441796B2
Authority
JP
Japan
Prior art keywords
suppression
level
frequency band
frequency
gain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015526557A
Other languages
English (en)
Other versions
JP2015531207A5 (ja
JP2015531207A (ja
Inventor
テイラー ニーリー スティーブン
テイラー ニーリー スティーブン
Original Assignee
ファーザー フラナガンズ ボーイズ ホーム ドゥーイング ビジネス アズ ボーイズ タウン ナショナル リサーチ ホスピタル
ファーザー フラナガンズ ボーイズ ホーム ドゥーイング ビジネス アズ ボーイズ タウン ナショナル リサーチ ホスピタル
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ファーザー フラナガンズ ボーイズ ホーム ドゥーイング ビジネス アズ ボーイズ タウン ナショナル リサーチ ホスピタル, ファーザー フラナガンズ ボーイズ ホーム ドゥーイング ビジネス アズ ボーイズ タウン ナショナル リサーチ ホスピタル filed Critical ファーザー フラナガンズ ボーイズ ホーム ドゥーイング ビジネス アズ ボーイズ タウン ナショナル リサーチ ホスピタル
Publication of JP2015531207A publication Critical patent/JP2015531207A/ja
Publication of JP2015531207A5 publication Critical patent/JP2015531207A5/ja
Application granted granted Critical
Publication of JP6441796B2 publication Critical patent/JP6441796B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/02Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
    • H03G9/025Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers frequency-dependent volume compression or expansion, e.g. multiple-band systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/10Earpieces; Attachments therefor ; Earphones; Monophonic headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/35Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception using translation techniques
    • H04R25/353Frequency, e.g. frequency shift or compression

Description

[連邦による後援研究または開発に関する陳述]
本願発明は、アメリカ国立衛生研究所(NIH:National Institutes of Health)により与えられた政府の助成第R01 DC008318号の下になされた。アメリカ合衆国政府は、本願発明における一定の権利を有する。
[関連出願への相互参照]
本出願は、2012年8月6日に出願され、「マルチ・バンド・オーディオ圧縮システムおよび方法」と題された米国特許仮出願番号第61/680085号の利益を主張するものである。これは、参照により、その全体がここに組み込まれる。
本願開示は、一般に、例えば、補聴器、移植可能聴覚人工器官(IAP)に使用するためなどのオーディオ圧縮システムおよび方法に関する。
種々の技術が、1989年11月21日に発行され、「マルチ・バンド・プログラム可能圧縮システム」と題された米国特許第4,882,762号、1994年1月11日に発行され、「マルチ・バンド・プログラム可能圧縮システム」と題された米国特許第5,278,912号、1989年12月12日に発行され、「適応型プログラム可能信号処理補聴器」と題された米国特許第4,887,299号、1991年6月25日に発行され、「適応型プログラム可能信号処理およびフィルタ処理補聴器」と題された米国特許第5,027,410号、および、2005年3月29日に発行され、「音声信号フィルタ処理および圧縮方法および装置」と題された米国特許第6,873,709号などオーディオ信号処理するために記述されてきた。しかしながら、常に、改良された圧縮機能が必要である。
米国特許第4882762号 米国特許第5278912号 米国特許第4887299号 米国特許第5027410号 米国特許第6873709号
B. C. J. Moore and D. A. Vickers, "The role of spread excitation and suppression in simultaneous masking," J. Acoust. Soc. Am., vol. 102, no. 4, pp. 2284-2290, Oct. 1997. I. Yasin and C. J. Plack, "The role of suppression in the upward spread of masking ," J. Assoc. Res. Otolaryngol., vol. 6, no. 4, pp. 368-377, 2005. J. Rodr?guez et al., "The role of suppression in psychophysical tone-on-tone masking," J. Acoust. Soc. Am., vol. 127, no. 1, pp. 361-369, 2009. M. A. Ruggero, L. Robles, and N. C. Rich, "Two-tone suppression in the basilar membrane of the cochlea: Mechanical basis of auditory-nerve rate suppression," B. C. J. Moore and D. A. Vickers, "The role of spread excitation and suppression in simultaneous masking," J. Acoust. Soc. Am., vol. 102, no. 4, pp. 2284-2290, Oct. 1997. W. S. Rhode and N. P. Cooper, "Two-tone suppression and distortion production on the basilar membrane in the hook region of cat and guinea pig cochleae," Hearing Research, vol. 66, no. 1, pp. 31-45, Mar. 1993. B. Delgutte, "Two-tone rate suppression in auditory-nerve fibers: Dependence on suppressor frequency and level," Hearing Research, vol. 49, no. 1-3, pp. 225-246, Nov. 1990. M. B. Sachs and N. Y. S. Kiang, "Two-tone inhibition in auditory-nerve fibers," J. Acoust. Soc. Am., vol. 43, no. 5, pp. 1120-1128, 1968. H. Duifhuis, "Level effects in psychophysical two-tone suppression," J. Acoust. Soc. Amer., vol. 67, no. 3, pp. 914-927, 1980. D. L. Weber, "Do off‐frequency simultaneous maskers suppress the signal?," J. Acoust. Soc. Am., vol. 73, no. 3, pp. 887-893, 1983. C. Abdala, "A developmental study of distortion product otoacoustic emission (2f1-f2) suppression in humans," Hearing Research, vol. 121, pp. 125-138, Jul. 1998. M. P. Gorga, S. T. Neely, D. Konrad-Martin, and P. A. Dorn, "The use of distortion product otoacoustic emission suppression as an estimate of response growth," J. Acoust. Soc. Am., vol. 111, no. 1, pp. 271-284, 2002. M. P. Gorga, S. T. Neely, J. Kopun, and H. Tan, "Growth of suppression in humans based on distortion-product otoacoustic emission measurements," J. Acoust. Soc. Am., vol. 129, no. 2, pp. 801-816, 2011a. M. B. Sachs and E. D. Young, "Effects of nonlinearities on speech encoding in the auditory nerve," J. Acoust. Soc. Am., vol. 68, no. 3, pp. 858-875, Mar. 1980. L. Turicchia and R. Sarpeshkar, "A bio-inspired companding strategy for spectral enhancement," IEEE Trans. Speech Audio Process., vol. 13, no. 2, pp. 243-253, Mar. 2005. A. J. Oxenham, A. M. Simonson, L. Turicchia, and R. Sarpeshkar, "Evaluation of companding-based spectral enhancement using simulated cochlear-implant processing," J. Acoust. Soc. Am., vol. 121, no. 3, pp. 1709-1716, 2007. A. Bhattacharya and F. G. Zeng, "Companding to improve cochlear-implant speech recognition in speech-shaped noise," J. Acoust. Soc. Am., vol. 122, no. 2, pp. 1079-1089, 2007. M. A. Stone and B. C. J. Moore, "Spectral feature enhancement for people with sensorineural hearing impairment: Effects on speech intelligibility and quality," J. Rehabil. Res. Dev., vol. 29, no. 2, pp. 39-56, 1992. R. A. Schmiedt, "Acoustic injury and the physiology of hearing," J. Acoust. Soc. Am., vol. 76, no. 5, pp. 1293-1317, 1984. C. Birkholz et al., "Growth of suppression using distortion-product otoacoustic emission measurements in hearing-impaired humans," J. Acoust. Soc. Am., vol. 132, no. 5, pp. 3305-3318, 2012. S. C. Al-Salim et al., "Reliability of categorical loudness scaling and its relation to threshold," Ear and Hearing, vol. 31, no. 4, pp. 567-578, Aug. 2010. B. Scharf, "Loudness," in Handbook of Perception: Vol IV. Hearing, E. C. Carterette and M. P. Friedman, Eds. New York: Academic Press, 1978, pp. 187-242. M. P. Gorga, S. T. Neely, J. Kopun, and H. Tan, "Distortion-product otoacoustic emission suppression tuning curves in humans," J. Acoust. Soc. Am., vol. 129, no. 2, pp. 817-827, 2011b. T. Brand and V. and Hohmann, "An adaptive procedure for categorical loudness scaling," J. Acoust. Soc. Am., vol. 112, no. 4, pp. 1597-1604, 2002. D. Byrne, H. Dillon, T. Ching, R. Katsch, and G. Keidser, "NAL-NL1 procedure for fitting nonlinear hearing aids: Characteristics and comparisons with other procedures," J. Amer. Acad. Audiol., vol. 12, pp. 37-51, 2001. L. E. Cornelisse, R. C. Seewald, and D. G. Jamieson, "The input/output formula: A theoretical approach to the fitting of personal amplification devices," J. Acoust. Soc. Am., vol. 97, no. 3, pp. 1854-1864, 1995. J. Rodr?guez and S. T. Neely, "Temporal aspects of suppression in distortion-product otoacoustic emissions," J. Acoust. Soc. of Am., vol. 129, no. 5, pp. 3082-3089, 2011. R. M. Arthur, R. R. Pfeiffer, and N. Suga, "Properties of 'two-tone inhibition' in primary auditory neurons," J. Physiol., vol. 212, no. 5, pp. 593-609, Feb 1971. T. Herzke and V. Hohmann, "Improved Numerical Methods for Gammatone Filterbank Analysis and Synthesis," Acta. Acust. Acust., vol. 93, pp. 498 - 500, 2007. R. D. Patterson and J. Holdsworth, "A functional model of neural activity patterns and auditory images," in Advances in Speech, Hearing and Language Processing, A. W. Ainsworth, Ed. Londom: JAI Press, 1996, pp. 547-563. V. Hohmann, "Frequency analysis and synthesis using a gammatone filterbank," Acta. Acust. Acust., vol. 88, pp. 433-442, 2002. C. A. Shera, J. J. Guinan, and A. J. Oxenham, "Otoacoustic estimation of cochlear tuning: Validation in the chinchilla," J. Assoc. Res. Otolaryngol., vol. 11, no. 3, pp. 343-365, Sep. 2010. A. Harma. Derivation of the complex-valued gammatone filters. [Online at //www.acoustics.hut.fi/software/HUTear/Gammatone/Complex_gt.html] R. Meddis, L. P. O'Mard, and E. A. Lopez-Poveda, "A computational algorithm for computing nonlinear auditory frequency selectivity," J. Acoust. Soc. Am., vol. 109, pp. 2852-2861, 2001. M. L. Jepsen, S. D. Ewert, and T. Dau, "A computational model of human auditory signal processing and perception," J. Acoust. Soc. Am., vol. 124, no. 1, pp. 422-438, 2008. W. S. Rhode and L. Robles, "Evidence from M?ssbauer experiments for nonlinear vibration in the cochlea," J. Acoust. Soc. Am., vol. 55, no. 3, pp. 588-596, 1974. M. A. Stone, B. C. J. Moore, K. Meisenbacher, and R. P. Derleth, "Tolerable hearing aid delays. V. Estimation of limits for open canal fittings," Ear and Hearing, vol. 29, no. 4, pp. 601-617, Aug. 2008. B. C. J. Moore and C. T. Tan, "Perceived naturalness of spectrally distorted speech and music," J. Acoust. Soc. Am., vol. 114, no. 1, pp. 408-419, 2003. E. M. Zettner and R. C. Folsom, "Transient emission suppression tuning curve attributes in relation to psychoacoustic threshold," J. Acoust. Soc. Am., vol. 113, no. 4, pp. 2031-2041, 2003. G. E. Peterson and H. L. Barney, "Control methods used in a study of the vowels," J. Acoust. Soc. Am., vol. 24, pp. 175-184, 1952. ISO, "Acoustics - Loudness scaling by means of categories," ISO, 16832, 2006. ISO, "Acoustics - Normal equal-loudness-level contours," ISO, 226, 2003. O. Strelcyk, N. Nooraei, S. Kalluri, and B. Edwards, "Restoration of loudness summation and differential loudness growth in hearing-impaired listeners," J. Acoust. Soc. Am., vol. 132, no. 4, pp. 2557-2568, 2012. J. B. Allen, J. L. Hall, and P. S. Jeng, "Loudness growth in 1/2-octave bands (LGOB) - A procedure for the assessment of loudness," J. Acoust. Soc. Amer., vol. 88, no. 2, pp. 745-753, 1990. J. B. Allen, "Derecruitment by multiband compression in hearing aids," in Modeling Sensorineural Hearing Loss, W Jesteadt, Ed. Hillsdale: Lawrence Erlbaum, 1997, pp. 99-112. R. M. Cox, "Using loudness data for hearing aid selection: The IHAFF approach," Hear. J., vol. 48, no. 2, pp. 39-42, 1995. S. Gordon-Salant, "Recognition of natural and time/intensity altered CVs by young and elderly subjects with normal hearing," J. Acoust. Soc. Am., vol. 80, no. 6, pp. 1599-1607, 1986. D. M. Rasetshwane, J. R. Boston, C. C. Li, J. D. Durrant, and G. Genna, "Enhancement of speech intelligibility using transients extracted by wavelet packets," in IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, New Paltz, 2009, pp. 173 - 176. D. H. Keefe, J. C. Ellison, D. F. Fitzpatrick, and M. P. Gorga, "Two-tone suppression of stimulus frequency otoacoustic emissions," J. Acoust. Soc. Am., vol. 123, no. 3, pp. 1479-1494, 2008. C. Elberling, "Loudness scaling revisited," J. Am. Acad. Audiol., vol. 10, pp. 248-260, 1999. T. Herzke and V. Hohmann, "Effects of Instantaneous Multiband Dynamic Compression on Speech Intelligibility," EURASIP J. Adv. Signal Process., vol. 18, pp. 3034-3043, 2005. J. Neurophysiol, vol. 68, pp. 1087-1099, 1992.
(例えば、補聴装置で使用するための、移植可能聴覚人工器官(IAP)など)オーディオ信号を処理する方法の1つの例示的な実施形態は、オーディオ信号入力を受信するステップと、前記オーディオ信号入力を複数の周波数帯に分離するステップと、該複数の周波数帯の各々を圧縮するステップと、を含むことができる。前記複数の周波数帯の各周波数帯を圧縮することは、圧縮されたそれぞれの周波数帯という結果となる、それぞれの周波数帯に対する抑制レベルに基づいて、時変利得を各周波数帯に適用することを含むことができる。(例えば、前記それぞれの周波数帯に対する前記抑制レベルは、利得が適用される前記それぞれの周波数帯に隣接している1つ以上の周波数帯の前記オーディオ信号入力レベルに依存することができる。)。この方法は、オーディオ信号出力を提供するのに使用するために、前記圧縮されたそれぞれの周波数帯を結合するステップを更に含むことができる。
圧縮システム(例えば、補聴器において、移植可能聴覚人工器官(IAP)を使用するために、など)の1つの例示的な実施形態は、オーディオ信号入力を複数の周波数帯に分離するように構成され、そして、さらに、その複数の周波数帯の各々を圧縮するように構成される、オーディオ信号入力および処理装置を含むことができる。前記複数の周波数帯の各周波数帯を圧縮することは、圧縮されたそれぞれの周波数帯という結果となる、それぞれの周波数帯に対する抑制レベルに基づいて、時変利得を各周波数帯に適用することを含むことができる。(例えば、前記それぞれの周波数帯に対する前記抑制レベルは、利得が適用される前記それぞれの周波数帯に隣接している1つ以上の周波数帯の前記オーディオ信号入力レベルに依存することができる。)。また、この処理装置は、オーディオ信号出力を提供するのに使用するために、圧縮されたそれぞれの周波数帯を結合するように構成することができる。
例示的な補聴器システムの1つの実施形態は、音圧信号をオーディオ信号入力を複数の周波数帯に分離するように構成され、そして、さらに、その複数の周波数帯の各々を圧縮するように構成される、オーディオ信号入力および処理装置に変換するように構成される入力トランスデューサ装置を含むことができる。前記複数の周波数帯の各周波数帯を圧縮することは、圧縮されたそれぞれの周波数帯という結果となる、それぞれの周波数帯に対する抑制レベルに基づいて、時変利得を各周波数帯に適用することを含むことができる(例えば、それぞれの周波数帯に対する前記抑制レベルは、利得が適用される前記それぞれの周波数帯に隣接している1つ以上の周波数帯の前記オーディオ信号入力レベルに依存している。)。また、この処理装置は、オーディオ信号出力を提供するのに使用するために、圧縮されたそれぞれの周波数帯を結合するように構成することができる。補聴器システムは、前記オーディオ信号出力に基づいて、音圧信号を提供するように構成される出力トランスデューサ装置を更に含むことができる。
1つ以上の例示的なシステムまたは方法において、それぞれの周波数帯に対する抑制レベルに基づいて、時変利得を各周波数帯に適用することは、それぞれの周波数帯に対して、通常の二音抑制に基づいた方程式を使用しているそれぞれの周波数帯に対する抑制レベルを決定することを含むことができる。
1つ以上の例示的なシステムまたは方法において、それぞれの周波数帯の1つ以上の信号は、それぞれの周波数帯に対して、抑制レベルに基づいて変化する量だけ遅延させられることがあり得る。
1つ以上の例示的なシステムまたは方法において、前記オーディオ信号入力を複数の周波数帯に分離することは、前記オーディオ信号入力を複数の隣接する周波数帯に分離することを含むことができる。また、例えば、それぞれの周波数帯に対する抑制レベルは、利得が適用されるそれぞれの周波数帯に隣接している1つ以上の周波数帯の瞬間的なオーディオ信号入力レベルに依存していることができる。
1つ以上の例示的なシステムまたは方法において、それぞれの周波数帯に対する抑制レベルは、利得が適用されるそれぞれの周波数帯に隣接している1つ以上の周波数帯の抑制強度の対数関数的変換であることができる。例えば、その抑制強度は、それぞれの周波数帯に隣接している複数の周波数帯に対応する複数のチャネル固有抑制強度の合計であることができる。また、例えば、チャネル固有抑制強度の各々は、その複数の周波数帯の対応する周波数帯のオーディオ信号入力レベルの線形関数である指数を有することができる。
1つ以上の例示的なシステムまたは方法において、それぞれの周波数帯に対する時変利得は、抑制レベルの区分線形関数であることができる。
1つ以上の例示的なシステムまたは方法において、それぞれの周波数帯に対する抑制レベルに基づいて、各周波数帯に適用される時変利得は、一定の利得であることができ、前記抑制レベルが指定された圧縮開始レベルより下にあるとき、指定された圧縮終了レベルの上の一定の利得であることができる、また、圧縮開始レベルと圧縮終了レベルとの間の中間レベルにあるとき、利得は、前記抑制レベルの区分線形関数として減少することができる。例えば、周波数帯ごとの圧縮開始レベルは、正常の聴力の耳では「非常に柔らかい」として感知される音圧レベルであることができる。そして、この圧縮開始レベルで適用される利得は、「非常に柔らかい」感知のために聴覚障害をもつ個人によって必要とされる過剰な音圧レベルに基づいたものであることができる。また、例えば、周波数帯ごとの圧縮開始レベルは、正常の聴力の耳に対するトーンを聞く閾値における音圧レベルであり得る。そして、この圧縮開始レベルで適用される利得は、同一のトーン閾値に対する聴覚障害をもつ個人によって必要とされる過剰な音圧レベルに基づいたものであることができる。またさらに、例えば、周波数帯ごとの前記圧縮終了レベルは、正常の聴力の耳では「非常に大きい」として感知される音圧レベルであることができる。そして、この圧縮終了レベルで適用される利得は、「非常に大きい」感知のために聴覚障害をもつ個人によって必要とされる過剰な音圧レベルに基づいたものであることができる。
1つ以上の例示的なシステムまたは方法において、それぞれの周波数帯の1つ以上の信号は、それぞれの周波数帯に対して、抑制レベルに基づいて変化する量だけ遅延させられることがあり得る。そのような追加された遅延は、圧縮開始レベルの下で一定でありえ、この遅延は、圧縮終了レベルより上で、ゼロであり得、そして、この遅延は、中間抑制レベルにおいて、減少関数であることができる。
1つ以上の例示的なシステムまたは方法において、各周波数帯に対する抑制レベルは、前記それぞれの周波数帯の瞬間的な音声信号レベルにほぼ等しいことがあり得る。またさらに、1つ以上の例示的なシステムまたは方法において、各周波数帯に時変利得を適用することは、それぞれの周波数帯に対する通常の二音抑制に基づいた方程式を使用しているそれぞれの周波数帯に対する抑制レベルに基づいて、複数の順次の時間に時変利得を適用することを含むことができる(例えば、隣接した順次の時間の間の中間の時間ステップにおける時変利得は、隣接した順次の時間の間で線形に補間されることができる。)。
1つ以上の例示的なシステムまたは方法において、オーディオ信号入力は、振幅と位相成分の両方を含む複素数値入力信号を含むことができる。複数の周波数帯の前記帯域幅は、高周波遅延は、5ミリ秒以下であるように隣接し、サイズ設定することができる。この方法/システムは、周波数固有時間および位相調整を音声信号出力に、可聴周波数の全範囲にわたってよりフラットな遅延のほうに向かうようにさせるために、その音声信号入力に適用することを含むことができる。および/または周波数固有時間および位相調整を、前記サプレッサの合計された出力に、可聴周波数の全範囲にわたって最もフラットな可能なディレイを持ったせることによって過渡的信号の保存を改善する前記入力信号に適用することができる。
上記の概要は、本願開示の各々の実施形態またはあらゆるインプリメンテーションを記述することを目的とするものではない。より完全な理解が、以下の詳細な説明と特許請求の範囲を、添付の図面とともに参照することによって、明らかとなり、認識できるようになる。
図面において、必ずしも一定の比率で描かれているわけではないが、同様の数字は、異なる図の同様のコンポーネントを記述することができる。異なる文字サフィックスを有する数字は、同様のコンポーネントの異なるインスタンスを表すことができる。これらの図面は、一般に、本願明細書において議論される種々の実施形態を、例として、図解するものであるが、しかし、制限としてではない。
図1は、Gorgaほか(2011)から、f=1,2,4および8kHzを含む種々の周波数に対するDPOAE抑制同調曲線を示す。この図のパラメータは、f(円=1kHz、下向き三角=2kHz、砂時計=4kHz、および、星=8kHz)である。Lは、10dBのSL(最も低いSTC)から60dBのSL(最も高いSTC)に変動した。STCの各々のセットの下の接続していないシンボルは、その周波数でのデータに寄与する主体のグループに対する平均挙動閾値を表す。 図2は、抑制レベルが、40dB SPLあり、そして、fが図の挿入部分にあるようなものであるときに、等価主レベル(dB SL)を示す。ただし、Lは、f≒fの下については、fに対してほとんど線形依存があるように見える。この傾向は、ここに記述される外挿手続きにおけるLのfおよびfに対する依存性を一般化するのに使用することができ、 図3は、Gorgaほか(2011)から、回帰係数(c=−a/a)の比率を示す。cは、fに関してのオクターブにおける、fの関数として圧縮(dB/dB)を表す。この傾向は、cのfに対する依存性を一般化するのに、そして、ここに記述される外挿手続きにおいて、使用することができる。 図4は、人間の蝸牛抑制のためのモデルのブロック図を示す。このモデルは、(1)ガンマトーン・フィルタバンクを用いた分析法、(2)周波数依存チャネル利得が計算される抑制ステージ、および、(3)抑制する影響による出力信号組み合わせ、生成する合成ステージ、の3つのステージを含む。 図5は、個々のガンマトーン・フィルタ(上部パネル)、および、入力および出力信号(中央パネル)の周波数応答を示す。また、このパネルにおいて、個々のフィルタのrmsレベルが示される。下部パネルは、出力信号の遅延、および、補聴器ユーザーが許容できる遅延を示す。 図6は、入力/出力関数(左パネル)および抑制および圧縮モードにおけるモデル動作に対するスロープ(右パネル)を示す。 図7は、モデルが、抑制モード(左パネル)および圧縮モード(右パネル)において動作しているときに、オン周波数およびオフ周波数サプレッサ・トーンに対するデクリメントを示す。 図8は、別々にプロットされる抑制モード(左パネル)における、および、互いに対する(右パネル)、モデル動作の4kHzプローブ・トーンに対する先端および末尾抑制閾値を示す。相対的な抑制閾値0.28のスロープは、固有の圧縮比の推定を提供する。 図9は、人間の蝸牛抑制のモデルを用いて得られる抑制同調曲線(STC)を示す。STCは、DPOAE・STCの測定と質的に同様である。 図10は、Al−Salimほか(2010)からの11の応答分類で分類別の音量スケールを示す。「非常のソフト」および「非常の大きい」分類に対する入力レベルは、補聴器フィッティング戦略において、使用することができる。 図11は、入力レベルLvs,NH、Lvl,NH、Lvs,HI、および、Lvl,HI、および、それらの外挿(左パネル)、入力レベルから決定される利得GcsおよびGce(右パネル)を示す。 図12は、入力音声信号(上部パネル)、抑制モードにおいて得られた出力音声信号(中央のパネル)、および、圧縮モードにおいて得られた出力音声信号(下部パネル)を示す。異なる縦軸スケールが視覚的明快さのために、入力および出力に対して使用されていることに留意する。 図13は、入力音声信号(上部パネル)、抑制モードにおいて得られた出力音声信号(中央のパネル)、および、圧縮モードにおいて得られた出力音声信号(下部パネル)を示す。 図14は、抑制ステージ(上部パネル)への入力、および、抑制モード(中央パネル)そして、圧縮モード(下部パネル)において、このステージで適用される利得を示す。 図15は、耳あな型補聴器(ITE)の1つの例示的な実施形態の断面図をサウンド入力トランスデューサ(マイクロフォン)、音響出力トランスデューサ(受信器)、および、シグナル・プロセッサ(回路)を含むその例示的なコンポーネントとともに示す。 図16は、例示的な補聴器処理ユニット(PROC)を示している補聴器の1つの例示的な実施形態のブロック図を、アナログ・ディジタル・コンバータ(A/D)、ディジタル・アナログ・コンバータ(D/A)、マイクロフォン(MIC)、増幅器(AMP)、および、受信器(RCVR)を含むそれの他の例示的なコンポーネントとともに、示す。ここに記載されるように、修正することができる種々の実施形態が、ジェームズM.ケーツによる教科書「ディジタル補聴器」(2008、プルーラル・パブリッシング)pp. 52−53、において提供される。 図17は、ここにおいて、式(8)によって記述される抑制利得Gs(Ls)の説明図を示す。GsおよびLsは、両方とも周波数の関数である。Ls≦LcsならばGs=Gcs、Ls≧LcsならばGs=Gceである。すなわち、利得Gsは、線形で、非圧縮である。Lcs<Ls<Lceに対して、利得Gsは、圧縮であり、抑制レベルLsに依存する。 図18は、圧縮モードを使用して処理した後(点線)の、および、抑制モード(破線)の男性によって話される合成母音の/α/のスペクトルの説明図を示す。実線は、未処理の母音である。この入力レベルは、70dB SPLある。抑制は、ピークと谷の間でのレベルの違いを増加することによってスペクトル・コントラストを改善することができる。 図19は、スペクトル・コントラスト強調の記述において使用するための表1を示す。「圧縮」および「抑制」は、モデル動作の圧縮モード、抑制モードを意味する。この入力レベルは、70dB SPLである。 図20は、圧縮モード(破線)と抑制モード(実線)とで得られる出力に対する入力レベルの関数として、表1の10の合成母音にわたる平均スペクトル・コントラスト強調(SCE)の説明図を示す。抑制は、レベルの広範囲に対してスペクトル・コントラスト強調という結果になる。
説明的実施形態の以下の詳しい説明において、本願明細書の部分を形成し、そして、実施することができる特定の実施形態が、説明として、示される図面の添付の図を参照する。他の実施形態を利用することができ、そして、構造的変更をここに提示される開示の範囲を離れることなく(その範囲に留まる)行うことができることが理解されるべきである。
例示的な方法、装置とシステムが、図1−20を参照して、記述される。1つの実施形態からの要素またはプロセスが、他の実施形態の要素またはプロセスと組み合わせて、使用することができ、ここに述べられる特徴の組み合わせを用いるような方法、装置およびシステムの可能な実施形態は、図および/またはここに記述される特定の実施形態に限られるものではないことは、当業者にとって明らかである。また、ここに記述される実施形態は、必ずしも一定の比率で示されるわけではない多くの要素を含むことができることが認識される。またさらに、特定のタイミング、1つ以上の要素の形状やサイズまたはタイプが、他のものより有利でありえるけれども、ここでの、プロセスのタイミングと、種々の要素のサイズと形状は、修正されることができ、依然本願開示の範囲内になるようにすることができることが認識される。
図15は、耳あな型補聴器(ITE)10の1つの例示的な実施形態の断面図を、サウンド入力トランスデューサ12(マイクロフォン)、音響出力トランスデューサ14(受信器)、および、シグナル・プロセッサ16(回路)を含むその例示的なコンポーネントとともに示す。図16は、例示的な補聴器処理ユニット16(PROC)をアナログ・ディジタル・コンバータ24(A/D)、ディジタル/アナログ・コンバータ26(D/A)、マイクロフォン12(MIC)、増幅器28(AMP)、および、受信器14(RCVR)を含むそれの他の例示的なコンポーネントとともに、示している補聴器の1つの例示的な実施形態のブロック図である。図15−16は、ここに記述される信号処理を使うことができる補聴器(例えば、ここに記述される圧縮プロセスを実行するように修正された従来型デバイス)の例示的な実施形態を示す。従来型補聴器機能に関する一般情報のためには、ジェームズM.ケーツによる教科書「ディジタル補聴器」(2008、プルーラル・パブリッシング)pp.52−53を参照。明らかにここに示される例示的な実施形態だけでなく、どんな補聴器でも、ここに記述される信号処理(例えば、少なくとも部分的には抑制に基づく圧縮技術)を実行するように構成された(例えば、プログラムされた)プロセッサ能力を利用や有することができることが認識される。ITEデバイスが図15に示されているけれども、任意の他のタイプの補聴器でも耳かけ型(BTE)補聴器、耳管内型(ITC)補聴器、携帯型補聴器、衣服着用型補聴器、移植可能聴覚人工器官、等を含むそのような処理から利益を得ることができる。しかし、明らかに、それらに限られるものではないことが認識される。また、補聴器に加えて、他デバイスが、たとえば、音声認識デバイス、分光写真ディスプレイ・デバイス、オーディオダイナミック・レンジ圧縮デバイス、等を含む、そのような処理から利益を得ることができる。
図15−16に図示されるように、プログラム可能な処理装置16(回路)を含む補聴器10は、入力トランスデューサ装置12(例えば、補聴器10のチューブ30を介してマイクまたはマイクロフォン12)でオーディオ信号X(f)を、例えば、音圧信号X(f)をオーディオ信号入力S(f)に変換するために受信する。マイクロフォンまたは入力トランスデューサ装置12の出力S(f)は、その操作のために、回路16(例えば、CIRCUIT)に結合している。その回路は、前置増幅器、自動利得制御回路、アナログ・ディジタル(A/D)コンバータ、ディジタル・アナログ(D/A)コンバータ、プロセッサや制御回路、フィルタ(例えば、帯域スプリット・フィルタ)、増幅器、フィードバック抑制回路、雑音除去回路、音分類回路など種々のコンポーネントを含むことができる。
図16に図示されるように、1つの例示的な実施形態において、マイクロフォンまたは入力トランスデューサ装置の出力S(f)は、ディジタル信号処理が、そこから発生するディジタル信号に対して実行されることができるようにアナログ・ディジタル(A/D)コンバータ24に結合している。次に、補聴器処理回路16は、その上で、(例えば、図4を参照して、処理回路16によって(例えば、HEAR AID PROC(H(f))、インプリメントすることができる、ここに記述されるディジタル信号処理などの)ディジタル信号処理を実行する。結果として生じる出力は、次に、ディジタル/アナログ変換(D/A)コンバータ26で、アナログ信号(例えば、U(f))に変換される。信号U(f)は、次に、増幅することができ(例えば、AMP((f))28)、外耳道に音圧信号(例えば、それに接続したTUBE 32を介してY(f))を提供するように構成された出力トランスデューサ装置14(例えば、RCVR(R(f)またはスピーカー))に提供することができる。例えば、処理回路16は、オーディオ信号入力を複数の周波数帯に分離するように構成されたフィルタ回路を含むことができ、その後、処理回路16は、その複数の周波数帯の各々を圧縮する(例えば、フィルタ処理を圧縮機能性を実行する同じ信号処理装置の一部として、または、それとは別々に実行されることができる。それらを別々にここにリストすることは、実行される別々の機能に言及するだけであり、必ずしもどの回路がそのような機能を実行するのかに言及するものではない)ように構成することができる。この複数の周波数帯の各周波数帯を圧縮することは、圧縮されたそれぞれの周波数帯という結果となる、それぞれの周波数帯に対する抑制レベルに基づいて、各周波数帯に時変利得を適用することを含むことができる。それぞれの周波数帯に対する抑制レベルは、利得が適用されるそれぞれの周波数帯に隣接している1つ以上の周波数帯の前記オーディオ信号入力レベルに依存することができる。また、処理装置16は、オーディオ信号出力を提供するのに使用するために、圧縮されたそれぞれの周波数帯(例えば、合成信号)を、(例えば、加算回路を用いて)組み合わせるように構成することができる。
図15−16に示される補聴器10は、任意の他の必要な電圧レギュレータ回路または、デバイスの作動のための他の電源回路とともに(例えば、バッテリ・コンパートメントの中に)電源40を更に含む。当該技術領域において、理解されるように、圧縮機能を含むプログラム可能処理回路16は、集積回路補聴器の領域に含まれるすべての回路の上でのインプリメンテーションに対して適応することができる(例えば、1つの集積回路基板の上に構成することができる)。補聴器は、単一セルの低電圧バッテリーで駆動することができる。また、音量調節機能42(例えば、ボリューム・コントロール)当該領域で知られているようにインプリメントすることができる。
また、プログラム可能な処理回路は、外部制御回路によって生成することができる複数の制御信号を受信するのに適応することができる外部制御回路は、補聴器の任意の1つ以上のコンポーネントに結合することができる。外部制御回路で発生する制御信号は、例えば、補聴器が、聴覚障害を補償する望ましい応答を引き起こすために、使用される周波数帯分離、適用される利得、圧縮開始点および終了点、等を制御するのに、適応することができる。
オーディオ信号圧縮システム(例えば、ここに記載されるように、補聴装置で使用可能なマルチバンド・オーディオ・ダイナミック・レンジ・コンプレッサ、または、そのような信号処理から利益を得ることができる任意の他のデバイス)の例示的な実施形態は、通常の人間の耳で観察されるように二音抑制の影響をシミュレーションするその周波数帯の各々において時変利得を含むことができる。1つ以上の実施形態において、コンプレッサを、広帯域オーディオ信号を複数の隣接する周波数帯に分割するフィルタバンクとを併せて、補聴器デバイスにおいて使用することができる。例えば、周波数帯の各々に適用される時変利得は、その帯域に対する抑制レベルに基づいたものである。抑制レベルの計算は、人間の二音抑制の測定においてもモデル化(例えば、ここに示されるように)することができ、そして、複数の隣接する周波数帯における瞬間的な音声レベルに依存することができる。1つ以上の実施形態において、コンプレッサは、音量の正常知覚を聴力損失による耳に対して元に戻すように、最大利得を低レベル音に、そして、最小利得を高レベル音に適用することができる。1つ以上のコンプレッサの実施形態は、クロス・チャネル抑制を含み、人間の耳ともっと同様でありえるという点において、他のマルチバンドのコンプレッサより有利でありえる。クロス・チャネル抑制は、情報量が多いスペクトル・コントラストを維持しながら、極端に急速に音が大きくなることを回避する。抑制なしでは、聴力損失による耳に対して正常の音量の修復は、可能とならない。
聴力のための主要な感覚器官は、蝸牛である。蝸牛の3つの主な信号処理機能は、(1)周波数分離または分析、(2)ダイナミック・レンジ圧縮(DRC)、および、(3)増幅、である。蝸牛は、これらの機能を、各々の機能の特徴を完全に分離することを許さない並列の態様でインプリメントしている。聴力損失の共通の形は、これらの信号処理機能の損傷に結びついている。聴力損失がDRCの損失を含むときはいつでも、外部補聴器の単純な線形利得の適用は、音響信号の正常知覚を復元することができない。
DRCの重要なバイ・プロダクトは、抑制である。それは、精神物理学的同時マスキングに貢献する(例えば、Mooreほか(1997)、Yasinほか(2005)、Rodriguezほか(2009)を参照)。ここに示されるように、二音抑制は、特定の周波数への応答(例えば、鼓膜基底板置換や神経発火頻度)が異なる周波数の第2のトーンが同時の存在することによって減少する健康な蝸牛の非線形の特性を指すことができる(例えば、Ruggeroほか(1992)、Rhodeほか(1993)、Delgutte(1990)、Sachsほか(1968)参照)。これらの侵襲性の測定は、人間で行うことができないので、抑制は、他の生理的あるいは精神物理学的手続き(例えば、Duifhuis(1980)、Weber(1983)、Abdala (1998)、Gorga(2002)、Gorga(2011)を参照)によって、推定しなければならない。歪成分耳音響放射(DPOAE)抑制は、これらの手続きのうちの1つであり、そして、別の周波数の上の1つの周波数の特定の抑制する影響の説明を提供するために、使うことができる(例えば、Abdala(1998)、および、Gorga(2011)を参照)。
抑制は、発話および他の複雑な刺激を符号化する役割をし(例えば、Sachsほか(1980)を参照)、そして、例えば、母音などの複合音のスペクトル・コントラストの強調という結果となることができる(例えば、Turicchiaほか(2005)、および、Oxenhamほか(2007)を参照)。スペクトル・コントラストのこの強調は、バックグラウンド・ノイズの存在のなかで音声知覚を改善することができる(例えば、Oxenhamほか(2007)、Bhattacharyaほか(2007)、Stoneほか(1992)を参照)。
感音難聴は、蝸牛の主要な信号処理機能の破壊のために上昇した閾値により規定されている。二音抑制は、通常、感音難聴の耳では減少される(例えば、Schmiedt(1984)、および、Birkholz(2012)を参照)。これらの耳は、典型的には、また、典型的には、ラウドネス・リクルートメントも呈するこれは、音のレベルの増加とともに、音の大きさの感覚が、正常以上に早く高まる現象である(例えば、Al−Salimほか(2010)、および、Scharf(1978)を参照)。
マルチバンドDRC補聴器は、DRCを復元する試みをするが、しかし、現在のものは、正常の抑制を復元しようとしない。DRCだけ(すなわち、抑制なしで)が、スペクトルの谷に対してより大きな利得を提供し、スペクトル・ピークに対する利得を減少することによって、スペクトル・コントラストを減らすことができる。ここに記述される補聴装置信号処理戦略は、少なくとも1つは発話などの信号に対して、これがスペクトル・コントラストを改善することを期待して、正常な蝸牛二音抑制を復元することを狙うものである。この戦略の抑制のインプリメンテーションは、少なくとも部分的は、DPOAE抑制同調曲線(STC)の測定に基づくものであった(Gorgaほか(2011)を参照)。DRC、増幅、および、抑制のプロセスは、この戦略の少なくとも1つの実施形態においては、別々にインプリメントされない。しかし、単一の操作に統一されることができる。本方法のための増幅の処方は、トーンの分類的ラウドネス・スケーリング(CLS)の測定に基づくものである(例えば、Al−Salimほか(2010)、および、Brandほか(2002)を参照)。また、任意のタイプの信号にたいして音量の正常な増加を復元することを意図している。この戦略の少なくとも1つの実施形態は、計算機的に効率的であり、そして、正常な抑制と正常な音量増加を復元する現在の補聴器技術(それに修正を加えて)を使用してインプリメントすることができた。正常な抑制の復元は、補聴器ユーザーの満足感を増すことができ、そして、バックグラウンド・ノイズが存在するなかで、音声知覚を改善することができる。これに対して、個別的な音量増加を復元することは、感音難聴の人の使えるダイナミック・レンジを増大することができる。
GorgaほかのDPOAE−STCは、別の周波数の上の1つの周波数の特定の抑制の影響の包括的な説明を提供する(Gorgaほか(2011)を参照)。これらの測定は、ここに記述される信号処理戦略の抑制コンポーネントに対するベースを提供する。利得の計算におけるDPOAE−STC測定の使用は、二音抑制の少なくとも1つのインプリメンテーションを可能にする。
Al−Salimほかは、正常な聴力(NH)リスナーと、トーンの同じ音量知覚を持つために、聴覚障害をもつ(HI)リスナーが必要であるレベル依存的な利得を決定するための方法を記述した(Al−Salimほか(2010)を参照)。これらのデータは、CLSに基づいて、ここに記述される増幅の処方戦略のうちの少なくとも1の基礎を提供する。具体的には、ここに記述される戦略の少なくとも1つの実施形態は、NHリスナーによって「非常に柔らかい」として知覚される音が、HIリスナーによって「非常に柔らかい」として知覚され、NHリスナーによって「非常に大きい」として知覚される音が、また、HIリスナーによって「非常に柔らかい」として知覚されるように周波数およびレベル依存利得をHIリスナーに提供することを狙っている。このアイディアは、低レベル音に対する聴度を最大にし、一方、同時に、高レベルにおける音の大きさの不快感を避けるものである。この戦略に適合する補聴器は、各々のHIリスナーに対して、いくつかの周波数におけるCLSデータを必要とする。正常からの逸脱を定量化するために、NHリスナーに対する平均CLSデータを、また、必要とする。周波数およびレベル依存利得を提供することは、発語のような複合音の個々の周波数成分の相対的な音量を増幅の後に保存されることを可能にする。正常な音量増加を復元するゴールは、音の大きさの不快感を避ける最大の補聴器出力を処方するためだけに、音量測定を使用する他の一般的に用いられる補聴器フィッティング戦略と対照的である(例えば、Byrneほか(2001)、および、Cornelisseほか(1995)を参照)。ここに記述されるフィッティング戦略の1つ以上と、他の現在のフィッティング方法との別の違いは、そのような戦略は、聴力検査の閾値、音量のモデル、または、発話明瞭度のモデルを使用することを必要をしないが、しかし、その代わりに、各々のHI個人からの実際のCLSデータを使用することができることである。
ここに記述される信号処理戦略の少なくとも1つの実施形態は、正常な蝸牛二音抑制を復元すること、および、正常な音量増加のゴールによって動機づけされる。この戦略は、入力信号を多重チャネルに分解するためのフィルタバンク、および、時変利得をこれらのチャネル出力をその後合計する前に各々のチャネルの出力に適用する二音抑制のモデルを使用することができる。時変利得は、DRC、増幅、そして、蝸牛がこれらの機能を実行する方法を模倣する抑制をインプリメントするために設計されることができる。そのような実施形態において、これらのプロセスは、別々にインプリメントされず、統一的なオペレーションにおいて同時にインプリメントされる。特定のチャネルに適用される利得は、すべてのフィルタバンク・チャネルのレベルの関数であることができ、ちょうどそのチャネルだけではない。その利得は、(1)GorgaほかのDPOAE STC測定、および、(2)Al−Salimほかの CLS測定に基づいた手法によって決定することができる。抑制の効果は、即座にこれらの利得に適用することができる。抑制の時間的な特徴の測定が、抑制が基本的に瞬間的なことを示唆するからである(例えば、Rodriguezほか(2011)、および、Arthurほか(1971)を参照)。
ここに説明の種々の部分は、DPOAE−STC測定の説明、そして、それらを、二音抑制という結果となるレベル依存利得を決定するために、どのように使用することができるか、および、信号処理戦略の1つ以上の実施形態の説明を提供する。信号処理評価が、(1)非線形入力/出力関数、(2)2つのトーン抑制、(3)STC、および、(4)スペクトル・コントラスト強調、を示すために、ここに提供される。また、増幅の処方のためのCLSデータの使用の説明も、また、提供される。
外部補聴器が正常な音量を復元しなければならないというアイディアは、新しいアイディアではない。LGOBとして知られている分類別の音量テストは、新しいマルチバンド圧縮補聴器にフィットするために開発された(Allen(1996)、Allen(1990)を参照)。また、同様の音量テストも、開発された(例えば、Cox(1995)を参照)。しかし、増幅を選択するために、音量データをどのように使用するかは、決してはっきりしていなかった。使用される種々の戦略のいずれも、まったく満足なものはなかった。
例えば、以下は、補聴器において、使用するための、種々の圧縮システムを記述している特許のリストである。米国特許第4882762号、米国特許第5278912号、米国特許第4887299号、米国特許第5027410号、および、米国特許第6873709号。これらの引用文献の各々は、参照により、ここに組み込まれる。
同様に、どのように、補聴器に、正常な蝸牛の信号処理の部分であると知られている利得上のクロス周波数の影響を組み込むべきか明らかでなかった。問題は、正常な蝸牛の抑制と比較したときに現実的であり、そして、補聴器の厳しい時間と電力制限内に実現可能であることの両方である抑制のモデルの全くの欠如であった。ここに記述される抑制モデルは、これらの要求を満たす。これを可能にすることができた1つの洞察が、歪成分耳音響放射(DPOAE)抑制データの数値的に効率的な数学的な表現の発見であった。
周波数成分が、蝸牛の内側で互いに非線形にインタラクトするので、トーンの音量増加は、複合音の音量増加との比較において、比較的単純である。「抑制」という用語は、第2のトーンが存在するなかで、1つのトーンの応答増加における縮小を指すのに用いられることができる。抑制は、蝸牛のメカニックの顕著な特徴であり、精神物理学的同時マスキングの主な一因である。抑制は、正常な聴力の主体、軽度から中程度の聴力損失の主体における歪成分耳音響放射(DPOAEs)の測定において明白である。抑制の時間領域モデルは、時変利得をこれらの出力をその後合計する前に、ガンマトーン・フィルタ・バンクの各々の出力に適用することによってインプリメントされた。抑制周波数の関数としてプロットされたシミュレーションされた抑制閾値は、測定されたDPOAE抑制同調曲線に似ている。蝸牛抑制をシミュレーションする我々のアプローチは、補聴器および他の聴力支援デバイス(例えば、IAP、など)の設計に役に立つ革新的な信号処理戦略を使用して、適用することができる。
ここに記述される補聴器の信号処理戦略の1つ以上の実施形態は、聴覚障害をもつリスナーにおける音量増加と二音抑制との両方を復元することを狙うものである。この戦略のための利得の処方は、分類的ラウドネス・スケーリングとして知られている方法による音量の測定に基づいたものである。少なくとも1つの実施形態において、提案された信号処理戦略は、測定されたDPOAE抑制同調曲線を再現し、任意数の周波数成分に一般化する。正常な抑制と正常な音量と両方の復元は、補聴器性能、および、ユーザーの満足感を向上させることができる。
蝸牛二音抑制の例示的な信号処理シミュレーションが、図1−14、17−20を参照して、ここに記述される。入力信号の抑制レベルに基づく周波数帯ごとに時変利得のアプリケーションを通して複数の周波数に特有のオーディオ信号を含む入力信号を圧縮するマルチバンド・サプレッサは、少なくとも部分的にはその中で記述される抑制モデリングに基づく。例えば、抑制レベルは、正常な人の二音抑制を記載する方程式にしたがって、入力信号に結びついた瞬間的な音のレベルのセットから計算される(例えば、ここの方程式5−6)。
例えば、ここにに記述されるサプレッサにおいて、この入力信号は、サプレッサによって必要とされる瞬間的な音のレベルのセットの計算を容易にするために、複素数値、すなわち、振幅と位相があるもの、でありえる。また、例えば、ここに記述されるサプレッサにおいて、周波数に特有の音声信号の帯域幅は、許容できない遅延を導入しないように隣接して、十分に広いと特定することができる。例えば、5ミリ秒以上の高周波遅延は、補聴器で許容できないと考えられる(例えば、2kHzを超えるような高周波)。
またさらに、ここに記述されるサプレッサにおいて、周波数固有時間および位相調整を、前記サプレッサの合計された出力に、可聴周波数の全範囲(例えば、およそ100Hzからおよそ12kHzまで)にわたって最もフラットな可能な遅延を持たせることによって過渡的信号の保存を改善する前記入力信号に適用することができる。
ここに提供されているモデリングにおいて記載したように、抑制レベルは、抑制強度の対数関数的変換であることができる。ここで、抑制強度は、複数のチャネル特有強度の合計であり(例えば、複数の周波数帯に対応している複数のチャネル)、このチャネル特有強度は、瞬間的なチャネル・レベルの線形関数である指数を有することができる。
またさらに、時変利得は、抑制レベルの区分線形関数であることができる。例えば、1つ以上の実施形態において、前記抑圧レベルが指定された圧縮開始レベルより下にあるとき、利得は一定でありえ、そして指定された圧縮終了レベルより上の場合、一定であり得る。圧縮開始レベルと圧縮終了レベルとの間の中間レベルにあるとき、利得は、抑制レベルの線形関数として減少することができる。
例えば、周波数帯ごとの圧縮開始レベルは、正常の聴力の耳では「非常に柔らかい」として感知される音圧レベルであることができる。少なくとも1つの実施形態において、このレベルにおける利得は、「非常に柔らかい」感知のために聴覚障害者によって必要とされる過剰な音圧レベルであり得る。また、例えば、周波数帯ごとの圧縮終了レベルは、正常の聴力の耳では「非常に大きい」として感知される音圧レベルであることができる。少なくとも1つの実施形態において、このレベルにおける利得は、「非常に大きい」感知のために聴覚障害者によって必要とされる過剰な音圧レベルであり得る。
また、例えば、周波数帯ごとの圧縮開始レベルは、正常の聴力の耳で(例えば、静けさのなかで)トーンを聞く閾値における音圧レベルであることができる。少なくとも1つの実施形態において、このレベルにおける利得は、同一のトーン閾値に対する聴覚障害者によって必要とされる過剰な音圧レベルであり得る。
1つ以上の更なる実施形態において、抑制レベルは、単に瞬間的なチャネル・レベルに等しいことがあり得る。このモードにおいて、このサプレッサは、クロス・チャネル抑制を有さない従来のコンプレッサに似ている。このモードは、減少した計算の負荷の利点を提供することができる。また更なる実施形態において、瞬間的なチャネル・レベルは、計算の効率を増やすために、2以上のファクタでダウン・サンプルすることができる。このモードにおいて、中間のステップにおける時変利得は、そこでの利得が完全に計算される隣接した時間ステップの間で線形に補間されることができる。
またさらに、1つ以上の実施形態において、ここに記述されるサプレッサにおいて、各々のチャネルにおける信号は、そのチャネルにおいて抑制レベルのある関数にしたがって変動する量だけ遅延させられることがあり得る。少なくとも1つの実施形態において、加えられる遅延は、圧縮開始レベルの下で一定、圧縮終了レベルより上ではゼロでありえ、そして、中間抑制レベルにおいて、減少関数であり得る。例えば、ポジティブな遅延総計は、正常な蝸牛機能をだいたい復元するために選択されることができる。
[DPOAE STC測定]
我々のモデル(例えば、図1−14および17−20を参照してここに記載されるような信号処理戦略)における別の周波数の上の1つの周波数の抑制の特定の影響は、Gorgaほかの(2011a、b)DPOAE抑制同調曲線(STC)の測定に基づいたものである。したがって、これらのDPOAE測定を最初に記載する。そのモデルは、後で記載する信号処理戦略を記載する前であるが、DPOAE測定に基づいているものである。
DPOAE抑制実験において、DPOAEsは正常な聴力主体(例えば、被験者)において、主要なトーンのペアf1およびf(f/f1≒1.2)によって引き出されたものである。第3の抑制トーンfは提示された間、そのレベルは、一定に保たれた(Gorgaほか(2011a、b)。fの抑制効果が、その存在が、主要なトーン・ペアに応答してDPOAEレベルを減らす量として規定された。fの周波数とレベルを変えることによって、(主に)抑制の量の上で、抑制トーンと主トーンとの間での周波数関係の影響に関する情報が、得られた。(例えば、ここに記述される)人間の蝸牛抑制のモデルのデザインで使用されるDPOAE測定は、8つの周波数f(0.5、1、1.4、2、2.8、 4、5.6、および、8kHz)、および、10dBのステップにおいて、10ないし60dBのSLの主トーン・レベルLを含む。各々の周波数f、に対して、fのまわり、あるいは、周囲の11の周波数fまでが、使用された。DPOAE STCの多くの研究があるが、これらのすべてが一般的に妥当なものであり、そして、ここに、使用することができたものである。しかしながら、Gorgaほか、は、正常な聴力の人間の大きなサンプルにおいて、最も広い範囲の周波数とレベルのデータを提供した。したがって、そのようなデータを、ここに記述される信号処理戦略の基礎として使用する。
DPOAE測定において、DPOAEレベルは、第3の(サプレッサ)トーンが存在するとき、減少し、そして、この縮小は、しばしばデクリメントとして言及される。dを、サプレッサによりDPOAEレベルにおけるデクリメントを表現するものとする(すなわち、1が、サプレッサなしのDPOAEレベル、マイナス、サプレッサありのDPOAEレベルに等しい)。Gorgaほか(2011a)は、変換されたデクリメントを、
と規定した。
単純な直線回帰(SLR)は、変換されたデクリメントDに、抑制増加関数のスロープを提供するのに適合する。変換されたデクリメントは、主レベルLおよび抑制レベルLの両方に対して概略線形依存があることが示された。
この方程式におけるすべての回帰係数(a、a、a)は、主周波数fと抑制周波数fに依存する。抑制閾値(すなわち、D=0)におけるサプレッサのレベルLを表現する図1に示されるもののような抑制同調曲線は、D=0のときに式(2)におけるLを解くことによって得られる(Gorgaほか、2011b)。
≒fであるとき、この方程式の右側の第1項(図1の中の分離されたシンボルとしてプロットされている)は、f≒fにおけるトーンの概略、静寂閾値に等しいことに留意する。視覚的明快さのために、図1は、f=1、2、4、および、8kHzを含むデータが利用可能である8つの周波数のサブセットに対してだけDPOAE STCを示している。STCの完全なセットについては、(Gorgaほか、2011b)を参照。
自身の蝸牛応答の増加の単一のトーンによる抑制は、その応答増加が圧縮に見える原因になるものである。fにおけるトーンの全体圧縮に対するfにおける抑制トーンの相対的な寄与は、D=0のときに、Lに対する式(3)を解くことによって、得ることができる。
ここで、c=−a/a、および、c=−a/aである。Lは、L=40dB SPLにおける(fに関してのオクターブにおける)fの関数として、(オクターブ親類でために)図2に示される。
係数cは、fの圧縮(fにおける圧縮に対して相対的な)を記述し、そして、図3にプロットされる。なお、Lおよびcは、両者とも、f≒fより下で(fに関してオクターブで表したときに)周波数fに対する概略線形依存を有するように見え、f≒fのときには、c≒1である。これらの傾向を、Lおよびcのfおよびfへの依存性を一般化するのに使用する。そして、モデルまたは信号処理戦略において、周波数依存利得を決定するために使用する外挿されたcおよびcを得る(式(4)を用いて外挿されLおよびcから得る)。cおよびcの外挿は、モデル・シミュレーションが実行されること、あるいは、DPOAE STC測定において使われた周波数におけるものだけではなく、関心の任意の周波数における信号処理戦略を適用するのを可能とする。
この外挿は、利用できる(データ)周波数から望ましい(モデル)周波数へのcおよびcの表現の拡張を可能にするツーステップ多項式回帰手続きであることができる。第1に、別々の多項式回帰を、8つのf周波数の各々においてcとLとの係数の両方に対する(図2および3に示されるデータの)f依存性を記述するために実行することができる。多項式回帰の第2セットを、16の最初の多項式(cに対する8およびLに対する8)のf依存性を記述するために実行することができる。この2ステップ回帰の結果は、周波数fおよびfの任意の望ましいペアに対してcおよびcに対する値の計算を可能にする2つの多項式のセットであることができる。更なる制約を、それらがデータを表現しないときに、計算値を調節するために課すことができる。1つのインプリメンテーションにおいて、2ステップ回帰手続きは、cの表現を、88(8f×11f周波数)データ・ポイントから10係数まで、そして、Lの表現を88のデータ・ポイントから15係数まで減らす。
[抑制モデルおよび/または補聴器設計]
図4に示されるブロック図(ここに記載されるように、補聴器の処理回路で実行されることができる)の人間の蝸牛抑制の信号処理モデルまたはシミュレーションは、(1)分析、(2)抑制、および、(3)合成、の3つの主なステージを含む。分析ステージにおいて、この入力信号は、ガンマトーン・フィルタバンクを使用して、周波数帯に分析される。抑制ステージは、圧縮効果と抑制効果の両方を達成するために、各々の周波数帯に適用される利得を決定する。最後のステージで、抑制ステージの個々の出力が、抑制の効果での出力信号を得るために結合される。これらの3つのステージは、任意の適切なハードウェア/ソフトウェア構成を使用して、補聴器に取り込むことができる。
例えば、ここに記述されるどんな機能でも、プログラム可能なプロセッサに、ここに記述される機能(例えば、利得を、抑制レベルに基づいて、周波数帯に対応する各々のチャネルに適用すること)を実装させるための命令を含むコンピュータ読取り可能媒体において、インプリメントすることができる。「コンピュータ読取り可能媒体」は、RAM、ROM、CD−ROM、NVRAM、EEPROMフラッシュ・メモリ、その他などの任意の揮発性あるいは不揮発性媒体を含む。しかし、それらに限定されるものではない。その命令は、それ自身で、あるいは、他のソフトウェアとの組合せで実行されることができる1つ以上のソフトウェア・モジュールとしてインプリメントすることができる。
記述された機能をインプリメントするのに用いられるハードウェアは、任意の適当なコンポーネント(例えば、補聴器において、現在機能をインプリメントするのに用いられるもの)を含むことができる。例えば、そのようなコンポーネントは、マイクロプロセッサ、ディジタル信号処理装置(DSP)、コントローラ、特定用途向け集積回路(ASIC)、フィールド・プログラマブル・ゲート・アレイ(FPGA)、または、等価なディスクリートまたは集積論理回路のうちの1つ以上を含むことができる。1つ以上の例示的な実施形態において、このプロセッサは、他のディスクリートまたは集積論理回路と並んで、1つ以上のマイクロプロセッサ、1つ以上のコントローラ、1つ以上のDSP、1つ以上のASIC、または、1つ以上のFPGAの任意の組合せなど複数のコンポーネントを含むことができる。ここに記述される機能およびプロセスは、ソフトウェア、ファームウェア、ハードウェア、または、その任意の組合せとして、具体化することができる、
ここに記述される技術を使用する補聴器は、(1)オーディオ信号を外耳道に、または、(2)振動を直接中耳の骨に、のいずれかを出力するものを含むことができる。ここに記述されるマルチバンドのオーディオ圧縮から利益を得ることができる補聴器の別のカテゴリーは、一般に移植可能聴覚人工器官(IAP)と呼ばれる。これらのデバイスは、聴覚ニューロンを直接刺激する電気信号を出力することにおいて補聴器と異なることができる。例えば、一般的な例は、蝸牛移植である。IAPへの音声入力は、実質的に補聴と同一である、そして、このように、マルチバンドの圧縮の必要は、この補聴器においても同様である。1つの信号処理の差異は、IAPが、典型的には、マルチ・チャネル出力を持ち、ところが、補聴器は、典型的には、単一の出力を持つことである。
[A.モデルまたは戦略分析]
周波数分析を、12kHzまでの周波数範囲にわたる31のチャネルを有する複雑なガンマトーン・フィルタバンクを使用して、実行することができる(例えば、Pattersonおよび Holdsworth (1996)、Hohmann(2002)を参照)。Hohmannのフィルタバンク・デザインは、複雑なフィルタバンクを要求するが、周波数全体で最適にフラットな群遅延を達成しており、周波数スペーシングと帯域幅の仕様における、その柔軟性のゆえに利用することができる。ここに記述される例において、フィルタバンクの個々のガンマトーン・フィルタは、n=4のオーダであり、Haermae(1999)の無限インパルス応答アルゴリズムを用いてインプリメントされた。このフィルタバンクは、1kHzを超えるフィルタが、QERB=8.65の同じチューニングと、1/6オクターブ・ステップで対数的に間隔をあけた中心周波数fを持つように設計された。ここで、QERBは、f/ERB(f)で規定されており、ERB(f)は、中心周波数fを有するフィルタの等価な長方形の帯域幅である(Sheraほか、2010を参照)。対数的に間隔をあけたフィルタを有するフィルタバンク・デザインにおいて、高い周波数に使われるより広いフィルタは、低い処理遅延を与え、低い周波数に使われるより狭いフィルタは、高い処理遅延を与える。低周波における遅延を許容範囲のなかに保つために、1kHz以下のフィルタが、0.1kHzの一定のERB、また、0.1kHzステップの線形間隔の中心周波数を持つように設計された。1kHzのフィルタは、伝達関数において、なめらかな遷移をつくるために0.11kHzのERBを有する。フィルタバンクの個々のガンマトーン・フィルタは、4次無限インパルス応答(IIR)フィルタであることができる。フィルタ係数は、Haermaeのガンマトーン・アルゴリズムを使用して計算すことができる(A. Haermae、「Derivation of the complex−valued gammatone filters」(オンライン、”www.acoustics.hut.fi/software/HUTear/Gammatone/Complex_gt.html”)。
ガンマトーン・フィルタバンクの出力は、実部が、帯域限定ガンマトーン・フィルタ出力を表し、そして、虚部が、そのヒルベルト変換を近似する入力信号の複素数値バンドパスでフィルタされた時間領域コンポーネントである(Hohmann(2002)を参照)。複素数値ガンマトーン・フィルタの使用は、2つの信号、虚部と実部とが、フィルタ出力が実際であるときの1つの信号だけの使用と対照的に、レベルの計算において含まれるので、瞬間的な時間領域レベルの正確な計算を容易にする。したがって、複雑なガンマトーン・フィルタは、信号の解析表現を生成し、これは、瞬間的な時間領域レベルの正確な計算を容易にする。
ガンマトーン・フィルタバンクの個々の出力は、これらの出力の待ち時間の推定に影響を及ぼすことができる異なる遅延を経験することができる。ガンマトーン・フィルタの遅延に対する補償は、フィルタバンク・ステージで、微細構造、および、各々のフィルタのインパルス応答のエンベロープを遅延させることによって、すべてのチャネルが、同じ瞬間において、それらのエンベロープを最大に、それらの微細構造を最大にし、望ましいフィルタバンク群遅延を有するように、実行されることができる(Hohmann (2002)を参照)。つまりフィルタバンクの個々の出力は、分散的なインパルス応答を有する合成された出力信号という結果になることができる異なる遅延を生じることができる。分散を避けるフィルタの遅延のための補償を、フィルタバンク・ステージにおいて、すべてのチャネルが、同じ目標とした瞬間において、それらのエンベロープを最大に、それらの微細構造を最大にするように、各々のフィルタのインパルス応答の微細構造位相と包絡線遅延との両方を調整することにより、実行することができる。1つのアプリケーションにおいて、この遅延(例えば、ターゲット遅延)が、4msであるように選択された。他のフィルタを使用することができるけれども、他のフィルタバンク(例えば、フーリエ変換、連続ウェーブレット変換、等)に対する、ガンマトーン・フィルタバンクを使うことの長所は、低周波数および高周波数の両方において、所望のように指定する周波数分解能を可能とすることである。加えて、ガンマトーン・フィルタは、精神物理学的聴覚モデルにおいて、しばしば使われる(例えば、Patterson and Holdsworth (1996)、Meddisほか(2001)、Jepsenほか(2008)を参照)、これは、鼓膜基底膜振動の生理的計測への彼らの類似性のためである(例えば、RhodeおよびRobles(1974)を参照)。
図5は、個々のガンマトーン・フィルタ(上部パネル)の周波数応答と、そして、出力信号の周波数応答、および、入力がインパルスであるとき、個々のフィルタ(中央パネル)の実効値(平方二乗平均、RMS)レベルを示す。出力信号の周波数応答は、インパルス応答を表し、1.5dBより小さな発振を有して、0.1kHzからフラットである。個々のフィルタのrmsレベルは、インパルス応答とマッチする。インパルス応答群遅延(下部パネル)は、所望のように、ほとんど一定の4msである。この一定の遅延の周辺の比較的マイナーな振動は、低周波において、最大である。この遅延は、補聴器ユーザーによって許容できる最大遅延よりも、低い(Stoneほか. (2008) 、Moorほか(2003)を参照)。
[B.抑制]
このモデルの抑制ステージは、抑制の効果を達成するために、各々の周波数帯に適用される利得を決定する。特定の周波数帯に適用される利得は、時変であり、そして、DPOAE STCの測定に基づいた態様で、あらゆるフィルタバンク出力の瞬間的なレベルに基づいている。しかしながら、2つの主トーン(fおよびf)に応じてDPOAEレベルの抑制周波数(f)が、表現されたDPOAE抑制測定におけるのと異なり、このモデルは、fに等しいプローブ周波数(f)上に等しい抑制周波数(f)の影響を示す。これからは、モデルの記載において、fおよびfを使用する。
における複数の抑制トーンのfにおけるトーンに対する全抑圧の影響が、各々のトーンの個々の抑制強度を合計することによって記述することができると仮定すると、
ここで、
は、fにおける単一の抑制トーンのfにおけるトーンの上で個々の抑圧するレベルを表現する。そして、Lは、fにおけるフィルタ出力レベルである。全抑制影響は、すべての周波数成分の抑制の効果をそれが単一のトーンのレベルであるならば(圧縮のための)利得における同じ縮小を引き起こす単一の等価レベルに結合する。係数cおよびcは、ここに記載されるように、DPOAEデータから導出することができる(式(4)を参照)。式(5)における合計は、抑制トーンを含むすべての周波数成分にわたるものである。式(5)の形式は、「制御条件」を引くことによって、再構築される典型的デクリメント機能を可能にする。制御条件は、「抑制条件」から、1つのコンポーネント刺激(LS1)に対する抑制レベルであり、抑制条件は、2つのコンポーネント刺激(LS2)に対する抑制レベルである。
式(7)は、LS1が固定され、また、LS2が変化するとき、典型的デクリメント機能の形を持つことに留意する。式(5)の形は、コントロール条件において、任意数のコンポーネント、そして、抑制条件において任意数の追加コンポーネントに一般化されるデクリメントの概念を可能にする。
方程式(5)は、すべての抑制トーンの組合せの抑制影響を記載する。この抑制レベルは、ここに記述されるモデルまたは戦略のデザインにおける少なくとも1つの利益である。このデザインは、フィルタバンク中心周波数のセットにおける周波数のすべての可能なペアに対する、cおよびcの仕様を使用することができる。圧縮の基準参照状態、しかし、クロス・チャネル抑制影響でないもの、がL(f)=Lとセッティングするによって達成できる。この作動の「圧縮モード」は記述された信号処理戦略において、抑制の効果を評価するために有用でありえる。L(f)=Lの場合には、式(8)にしたがって、周波数成分fにおいて適用される利得Gsは、そのコンポーネントのレベルLの関数だけである。方程式(5)および(6)は、クロス・チャネル抑制をもたらすが、この場合の利得の計算に含まれない。
(f)からの周波数依存利得の計算は、4つのパラメータの仕様を必要とする。Lcs(f)、Lce(f)、Gcs(f)、および、Gce(f)ここで、Lcs(f)およびLce(f)(Lcs<Lce)は、フィルタ出力レベルであり、そして、Gcs(f)、および、Gce(f)(Gcs>Gce)は、レベルLcsおよびLceに結びついたフィルタ利得である。サブスクリプトcsおよびceは、また、それぞれ、「圧縮開始(compression start)」、「圧縮終了(compression end)」を表し、Lcsが、圧縮利得が最初に適用されるレベルであり、そして、Lceが、圧縮利得が終了するレベルであり、対応する利得が、GcsおよびGceであることを示す。フィルタ出力レベルLcsより下であるときに、フィルタ利得は、Gcsにセットされ、そして、利得は線形である(すなわち、圧縮はない)。Lceより上で、フィルタ利得は、Gceに等しく、そして、また、この利得は、線形である。すなわち、線形利得は、Lcsより下、および、Lceより上で使用される。フィルタ出力レベルがLcsとLceとの間であるとき、フィルタ利得は、圧縮であり、そして、抑制レベルの線形関数として減少する。そうであるから、各々のフィルタの抑制利得Gsは、抑制レベルの関数であり、そして、3つの部分を持つ。
抑制レベルLへの抑制利得Gsの依存性が、図17に図示される。パラメータの2つのペア(Lcs、Gcs)および(Lce、Lce)が、補聴器の圧縮信号処理を特徴づける入出力関数の上下のニーポイントを決定する。特定のチャネルにおける圧縮比CRは、抑制レベルが、LcsとLceとの間にあるとき、
である。
追加的な制約を、出力レベルが、任意の特定のチャネルにおいて、最大出力レベルLmaxより決して大きくないように規定される極大利得Gmaxの形でGsに課すことができる。これは、音量の不快感を避けることができる。装着可能な補聴器では、音響フィードバックを除くために、低レベル(Gsにおいて最も大きい)でGsを減少することが望ましくなることがあり得る。つまり、極大利得Gmaxは、出力レベルが、最大出力レベルLmaxより大きいことが許容されないように規定することができる。圧縮の、しかし、クロス・チャネル抑制影響のない制御条件は、Ls(f)=Lとセッティングするによって達成できる。
「C.合成」
合成ステージにおいて、抑制ステージの個々の出力が、抑制の効果での出力信号を得るために結合される。個々の周波数帯の組合せは、完全な再構築を、達成することができる、すなわち、抑制ステージがオフにされるとき、出力信号は、前記入力信号におよそ同一であるが、しかし、フィルタバンク補償、または、ターゲット遅延(例えば、4ms)に等しい遅延を有するようになっている。
[モデルまたは戦略の評価]
以下に記す4件のテストは、抑制補聴器(SHA)信号処理のMATLAB(MathWorks, Inc., Natick MA)インプリメンテーションのパフォーマンスを評価する。特に、二音抑制の複製する、その能力に関して評価する。すべての4件のテストに対して、抑制利得パラメータは、以下の値にセットされた。Lcs=0、Lce=100、Lmax=115 dB SPL、Bcs=60、および、G=0dB。あとに続くシミュレーションにおいて、これらのセッティングは、60dBのシミュレーションされたフラット聴力損失に対するSHA処理のアプリケーションのために選ばれた。
[A.非線形入出力関数]
特性周波数において、入出力(I/O)関数をつくるために、4kHzの周波数において、単一の純音が、SHAシミュレーションまたはモデルに入力され、そのレベルは、−20から 120dB SPL変動し、そして、レベル出力の4kHzのコンポーネントが、追跡された。I/O関数が、正常な抑制モードで、また、チャネルに特有の圧縮モード(すなわち、クロス・チャネル抑制影響なしで)で、SHAシミュレーションまたはモデル作動に対してつくられた。
図6の左パネルは、モデルの、または、シミュレーション動作の2つのモードに対するI/O関数を示す。Lcs=0dB SPL、および、Lce=100dB SPLは、圧縮が開始し、終了する入力レベルをそれぞれ表すI/O関数における2つのニーポイントを規定する。2つのI/O関数は、両方とも、入力レベルが、Gs=0(式(8)を参照)および、出力レベルが入力レベルに等しいことを示すLcs=0dB SPLより小さいとき、ユニティのスロープを有する。両方のI/O関数は、また、抑制モードにおけるモデル動作またはシミュレーションに対するニーポイントが、式(5)によって導入された4kHzトーンのエネルギーにおけるクロス・チャネル・スプレッドによってLce=100dB SPLの下10dBで起こることを除いて、Lce=100dB SPLより上にユニティ・スロープを持つ、入力レベルが、LcsとLceとの間にあるとき、2つのI/O関数のスロープは、より急なスロープを持つ圧縮モードで、両方ともユニティより小さい。
図6の右パネルは、入力レベルの関数として2つのI/O関数のスロープの推定を示す。この図は、この目的のためにしばしば使われるという事実にもかかわらず、I/O関数のスロープが、圧縮比の良い推定値ではないことを示す(例えば、Dornほか(2001s)を参照)。I/O関数のスロープは、2つのニーポイントの間で、定数ではなく、その代わりに、抑制モードに対して0.18dB/dBの量だけ変動する。これは、3.0dB/dBの圧縮比推定量の変化に対応する。
[B.二音抑制]
2つのトーン抑制をシミュレーションするために、トーン・ペアが、SHAシミュレーションまたはモデルに入力された。第1のトーンは、プローブ・トーンと呼ばれ、周波数およびレベルにおいて、f=4kHz、および、Lp=40dB SPLに固定された。第2のトーンの周波数は、抑制トーンと呼ばれ、「オン周波数」抑制をシミュレーションするために、f=4.1kHzに、また、「オフ周波数」抑制をシミュレーションするために、f=2.1kHzにセットされた。オン周波数抑制をシミュレーションするとき、fが、fとわずかに異なる(例えば、それより高い)周波数にセットされる。もし、fがfと等しくセットされると、fを抑制する代わりに、fがfに加えることになるからである。オン周波数とオフ周波数抑制の両方において、抑制トーンのレベルLsは、プローブ周波数における出力レベルを追跡している間、0から100dBSPLdB変動した。サプレッサによって生成される抑制の量、デクリメント、の推定を得るために、出力レベルは、抑制トーンの非存在下で得られた出力レベルから引かれた。正常な抑制モードにおいて、また、圧縮モードにおいて、モデル動作(またはシミュレーション)に対する結果が生成された。
図7の左パネルは、モデル動作の抑制モードで得られたオン周波数とオフ周波数サプレッサに対するデクリメントを示す。抑制の始まりのために必要なサプレッサのレベルは、オン周波数のケース(Ls≒35dB SPL)では、オフ周波数のケース(Ls≒65dB SPL)に比較して、より低い。しかしながら、一旦、抑制の始まりに達すると、抑制は、オン周波数ケースと比較して、オフ周波数ケースにおいて、より速い率で、大きくなる。これらの調査結果は、OAE抑制の他の研究と整合するものである(例えば、Gorgaほか(2011a)、Zettnerおよび Folso(2003)を参照)。
図7の右パネルは、モデル動作の圧縮モードで得られるオン周波数とオフ周波数サプレッサに対するデクリメントを示す。再び、抑制の始まりは、オフ周波数ケースと比較して、オン周波数ケースに対しては、より低い抑制レベルを要求する。しかしながら、オフ周波数ケースで、抑制の始まりのために必要とされるサプレッサのレベルは、もっとずっと高く、そして、抑制は、両方のケースにおいて、同じ率で大きくなる。オフ周波数ケースで小さい抑制が存在する理由は、利得の計算においてクロス・チャネル影響の欠如であることがあり得る。
[先端および末尾抑制閾値]
抑制閾値を決定するために、デクリメントが、同一のプローブ周波数f=4kHz、および、抑制周波数f=2.1および4.1kHzに対する以前に記述した手続きの後につくられた。f=2.1および4.1kHzは、それぞれ、f=4kHzでの同調曲線の先端および末尾を表す。デクリメントdは、Lp=30から85dBのプローブ・レベルに対してつくられた。各々のデクリメントは、式(1)を使用して変換され、そして、変換されたデクリメントは、単純な直線回帰にフィットした。変換されたデクリメントは、D=0 dB(d=3dBに等しい)という結果となる抑制レベルを決定するために、解かれた。これは、抑制閾値として規定された(Gorgaほか(2011a)を参照)。抑制閾値は、抑制モードにおけるモデル動作のためだけに決定された。
図8の左パネルは、先端および末尾抑制閾値を示す。先端と比較して、末尾において抑制閾値を達成するためには、より高い抑制レベルLsが、要求される。そして、このLsは、末尾と比較して、先端において、より狭い範囲を持つ。これらの調査結果は、同調曲線の以前の研究と整合するものである(例えば、Gorgaほか、(2011b)、Zettnerおよび Folsom (2003)を参照)。先端における抑制閾値(ST)のプロットのスロープは、末尾におけるSTの関数として、固有の圧縮比の良い推定を提供するとして提案された( Lopez−PovedaおよびAlves−Pinto(2008))。図8の下部のパネルは、そのようなプロットを示す。関数のスロープは、SLRを関数にフィットすることによって決定され、0.28dB/dBである。これは、3.6dB/dBの同調比率に対応する。
[D.抑制同調曲線]
抑制同調曲線(STC)は、4つのプローブ周波数f=1、2、4、および、8kHz、そして、10dBのステップにおいて、6つのプローブ・レベルLp=10から60dBSLで、シミュレーションされた。各々のプローブ周波数に対して、プローブ周波数の2オクターブ下から1オクターブ上までの15の抑制周波数が、評価された。STCは、サプレッサ周波数fの関数として抑制閾値に対して要求されるサプレッサLsのレベルを表す。各々のプローブ周波数および、特定の抑制周波数において、抑制レベルは、Ls= 0から100dB SPLに変化し、そして、抑制閾値[D=0;式(2)]は、ここに記述される方法を使用して決定された。
図9は、モデルを用いて得られるSTCを示す。これらのSTCは、Gorgaのほか(2011b)のDPOAE STCの測定と質的に同様である。1つの違いは、QERBが、モデルSTCの周波数から比較的独立しているが、一方、QERBは、DPOAE STCの周波数で増加することである。この差異は、抑制パラメータをDPOAEデータにフィットするときになされた近似の結果であり得る。結果として、この違いは、これらの方法を更に改良することにより、減らすことができた。モデルSTCは、それらの絶対的レベルと、プローブ・トーン・レベルへの依存性において、DPOAE STCと同様である。
[E.スペクトル・コントラスト]
スペクトル・コントラストの強調は、バックグラウンド・ノイズの存在において、音声知覚を改善することができる(Turicchiaほか(2005)、Oxenhamほか(2007))。スペクトル・コントラストについて、ここに記述される処理の効果を図示するために、図18は、男性によって発話された合成母音/α/を処理するときの、圧縮および抑制モードにおいて得られる出力を示している。母音(F0)のピッチは124Hzであり、そして、最初の3つのフォルマントは、F1=730 Hz、F2=1090 Hz、および、F3=2410 Hzにある(Petersonほか(1952)を参照)。実線は、70dBSPLdBレベル、会話の発話レベルにおけるオリジナルの母音(未処理の入力)である。点線は、圧縮モードで得られる出力、そして、破線は、抑制モードにおいて得られる出力である。動作の両方のモードで得られる出力母音は、適用される利得の結果として、オリジナルの母音に比較すると、より高いSPLにある。2つの出力は、両方が、第1および第2のフォルマントに対して相対的に第3のフォルマントのレベルを押し上げたことにおいて同様である。F0のレベルは、また、オリジナルの母音(出力の124Hzの近くのピーク)と比較して、2つの出力において、より多く発音される。2つの出力を比較すると、抑制は、スペクトル・コントラストを改善する(すなわち、ピーク・谷の差異が、より大きい)ことが認められる。
スペクトル・コントラスト測定が、図18のスペクトル・コントラストを定量化するために、3つのフォルマント・ピークの平均、マイナス、2つの中間の最小値の平均として規定された。スペクトル・コントラスト大きさは、未処理のもの、圧縮出力、および、抑制出力に対して、それぞれ、13.56、13.84、および、15.30DBである。スペクトル・コントラスト測定を用いて、処理されたものに対するスペクトル・コントラスト、マイナス、未処理の母音に対するスペクトル・コントラストとしてスペクトル・コントラスト強調(SCE)を定めることができる。したがって、SCEは、入力信号のものに相対する、出力信号のスペクトル・コントラストを表す。SCE>0は、処理された信号が、未処理である信号に関連して強調されたスペクトル・コントラストを有することを示す。ここで示される例については、圧縮モードで得られる出力に対して、SCE = 0.28DBであり、抑制モードにおいて得られる出力に対して、SCE = 1.74DBである。つまり、抑制モードにおいて得られる出力は、未処理の母音または圧縮モードで得られる出力と比較して、より高いスペクトル・コントラスト強調という結果となる。男性および女性の話者による合成母音/α/および、4つの他の合成母音/i/、/I/、/ε/と/u/に対するSCE測定が、入力レベルが70dBSPLであったとき、SHAシミュレーションの抑制および圧縮モードの両方に対して図19の表1に示される。母音(F0、F1、F2およびF3)のフォルマント周波数は、また、表1に含まれる。70dBSPLの入力レベル、典型的会話のレベル、において、抑制モードにおける処理は、SCE = 0DBである、女性によって発話される母音/i/を除いて、すべての母音に対してポジティブSCEという結果となる。10の母音および2つの性別にわたる平均SCEは、1.78DBである。対照的に、圧縮モードにおける処理は、−1.15dBの平均SCEで、大部分の母音のスペクトル・コントラストの縮小というの結果となる。典型的非線形補聴器信号処理において、使用されるものとわずかに異なるけれども、圧縮だけでの結果は、現在の処理戦略で期待することができるものの第1次近似を提供する。
SCEの上の入力レベルの効果をまとめると、図20は、10の合成母音にわたる平均SCEを、SHAのシミュレーションの2つのモードに対する、入力レベル(20〜100dBSPLdBの関数として示す。抑制モード(実線)に対するSCEは、ゼロ(点線によって示される)より大きく、そして、入力レベルのすべてにわたる圧縮モード(破線)に対するSCEより高い。抑制モード(実線)に対するSCEは、85dB SPLの入力レベルにおいて4.38dBの最大値に到達する。圧縮モードのSCEは、低レベル(<33dB SPL)でゼロより大きいだけである。これは、このモードで得られた出力が、オリジナル信号中に存在したスペクトル・コントラストを悪化させることを示す。抑制および圧縮モードに対するSCEでの違いは、5.81dB(入力85dB SPLにおいて)程度の大きさであり得る。フォルマント・ピークに印加される品質因子(QERB)に基づいた、SCEの交互の測定も、また、評価された。この交互のSCE測定で得られた結果は、図19の中の表1、および、図20で提示されたものと同様である。したがって、ここには含まれない。
[補聴器フィッティング戦略]
1つの補聴器フィッティング戦略は、聴覚障害をもつ個人に正常な音量を復元するのに必要である周波数依存利得を提供するためのものである。具体的には、この戦略は、正常な聴力の(NH)個人によって「非常に柔らかい」として知覚される音(例えば、トーン)が、また、HI個人によって、「非常に柔らかい」として知覚され、そして、NH個人によって「非常の大きい」として知覚される音が、また、HI個人によって、「非常に大きい」として知覚されるように、聴覚障害をもつ(HI)個人に、利得を提供することを狙うものである。このアイディアは、高レベルにおける音量不快感を避ける一方、低いレベルの音の聴度を最大にするためのものである。利得のこの量は純音以外の音のためには多すぎることが予想される。しかしながら、抑制は、抑制が、正常に機能している蝸牛において利得を減らすのと同様な方法で、補聴器あるいは他の聴力デバイスにおける利得低減を提供する。加えて、ここに記載されるように、高レベルでの音量の不快感を避けるために最大利得を指定することができる。
ここに記述される信号処理戦略は、それが提供する利得を抑えるだけであることがあり得る。障害のある耳が、それがまだ有するいかなる残りの外有毛細胞(OHC)利得をも抑制し続けることが仮定される。組合せにおいて、抑制は、外部補助と、内耳との間で、全体利得へのそれらのそれぞれの寄与と同じ割合で、分割される。
補聴器フィッティング戦略は、いくつかの測定周波数で補聴器がフィットされているHI個人に対する分類的ラウドネス・スケーリング(CLS)データ、および、同じ周波数(例えば、1kHz)でのNHに対する平均CLSデータを必要とする。Al−Salim ほか(2010)により記載されたCLSテストは、例示的である。このテストは、図10に示される11のカテゴリーの各々に対応するいくつかのテスト周波数における純音の入力レベルを決定する。11の音量カテゴリーの7つだけが、テキスト・ラベルを有するが、しかし、すべてが、結びついた分類別の単位(CU)値を持つ。意味がある形容詞(例えば、「柔らか」、「中くらい」、「大きい」)が、CLS国際規格(ISO 2006)に適合したラベルとして使われる。利得とCLSカテゴリーとの間の関係を与えられると(Al−Salimほか(2010)参照)、例示的な「非常に柔らかい」(CU = 5)および、「非常に大きい」(CU = 45)が、ここに記述される補聴器フィッティング戦略に対して使われた。
CLSデータからの利得の決定は、また、Al−Salim ほか(2010)によって記述される方法に基づいたものであることができる。この方法において、NHに対する平均CLSデータが、利得のアプリケーションを通してHIに対して正常な音量を復元するために、達成されなければならない音量カテゴリーに対する参照入力レベルを決定するために使用される。HIリスナーにおいて、NHリスナーにおけるのと同じ音量知覚表象を引き出すために要求される利得は、したがって、正常な参照入力レベルと同じ音量知覚表象を達成するために、HIリスナーによって、要求される入力レベルとの間での違いである。
これらのカテゴリーのための入力レベルは、NHに対してLvs,NH、および、Lvl,NHとして、また、HIに対してLvs,HI、および、Lvl,HIとして、表される。シミュレーションの1kHzにおける入力レベルLvs,NH、および、Lvl,NHは、Al−Salimほか(2010)のCLSデータに基づいている。我々の補聴器シミュレータにおいて使われた他の周波数におけるLvs,NH、および、Lvl,NHの値は、Lvs,NH、および、Lvl,NHの平均SPL値に対応するフォンにおける音の大きさの等感曲線(equal loudness contour)(ISO−226、2003)の値としてとられる。外挿のこの方法は、音の大きさの等感曲線が、定義上、NHリスナーが、純音刺激に対して一定の音量を持つとして感知する周波数の関数として、dB SPLにおける音圧を表すので、有効である。Lvs,NH、および、Lvl,NHの決定の例が、Al−Salimほか(2010)の平均CLSデータを使用して、図11(破線)の左パネルに示される。この例では、1kHzにおいて、「非常に柔らかい」および「非常に大きい」カテゴリーに対する平均値は、それぞれ、Lvs,NH,NH=22.9、および、Lvl,NH=100.1dB SPLである。したがって、定義上、対応する大きさの等感曲線(2本の破線)は、22.9および100.1フォンの音の大きさのレベルを表す。比較のために、図11の左パネルは、また、Al−Salimほか(2010)によりテストされた他の周波数(2 および4kHz)で「非常に柔らかい」および「非常に大きい」としてトーンの知覚をされるために要求される平均レベル(塗りつぶしシンボル)は、音の大きさの等感曲線と合致することを示す。
さらにフィッティング戦略を記述すると、図11の左パネルは、また、0.25、0.5、 1、 2、4、および、8kHzの測定周波数でのCLSデータを有する仮定的HI個人に対する入力レベルLvs,HI、および、Lvl,HIを示す(白シンボル)。我々のSHAでシミュレーションにおいて使用された特定のフィルタバンク周波数に対するLvs,HI、および、Lvl,HIの値は、補間と外挿とによって得ることができる。この例において、音量カテゴリー「非常に柔らかい」に対して要求される入力レベルは、NH個人に比較して、HI個人に対しては、特に、高い周波数において、より高い。しかしながら、音量カテゴリー「非常に大きい」に対して要求される入力レベルは、NH曲線に近い。Lvs,HIおよびLvs,NHの間の違いは、「非常に柔らかい」音の正常な音量を復元するために、この仮定的HI個人のために要求される利得である。そして、Lvl,HIおよびLvl,NHの間の違いは、「非常に大きい」音の正常な音量を復元するために要求される利得である。式(8)の利得計算の面から、これらの利得およびそれらの結びついた入力レベルは、
である。
図11の右パネルは、周波数の関数として利得GcsおよびGceを示す。また、利得Gcsは、低周波に比較して、高周波においてより大きい。利得Gceは、小さく(6dBの範囲のみ)、そして、レベルLvl,HIおよびLvl,NHが同様であるので、周波数で、ほぼ一定である。利得GcsおよびGceの特定の周波数依存性は、各々、特定のHI個人の正常な参照入力レベルからの「損失(deficit)」によって決定される。
[発話処理(SPEECH PROCESSING)]
抑制モデルの典型的パフォーマンスが、発話サンプルを処理することにより示される。この例において使用されたパラメータLcs、Lce、GcsおよびGceの値は、以前に記述された[参照図11]仮定的HI主体対するものと同じである。Lmaxが、Lmax=115dBにセットされた。使われた発話サンプルは、男性の話者により話された文「私はあなたが猫を殴ったのを見た(I saw you hit the cat)」であった。発話処理結果は、正常な抑制モード、および、圧縮モードにおける、すなわち、クロス・チャネル抑制影響を有さないモデル動作に対して得られた。
図12は、入力発話(上部パネル)、および、抑制モード(中央パネル)と圧縮モード(下部パネル)とで得られた出力発話の時間領域プロットを示す。視覚的明快さのために、入力と出力に対して異なる縦軸目盛りが使われていることに留意する。入力発話の平均レベルは、54dB SPLであり、そして、出力発話の平均レベルは、抑制および圧縮モードに対して、それぞれ、68.1および69.3dB SPLである。図13は、入力および出力発話信号のガンマトーン・スペクトログラムを示す。抑制および圧縮モードで得られた出力発話は、非常に似ているように見えるが、しかし、2つの間の違いを、図14のスペクトログラムの中でプロットされているように、時間および周波数の関数として、利得を見ることによって、観察することができる。図14は、抑制ステージへの入力、および、この発話信号に適用される利得を示す(上部パネル)。抑制および圧縮モードの両方において、図11(右パネル)の利得関数から予想されるように、この利得は、低周波に比較すると、高周波において、より高い。また、両方のモードで、利得は、フォルマントの間、より低い。しかしながら、圧縮モード(下部パネル)に対する利得は、抑制モードに対する利得より、よくフォルマントを保つ。すなわち、フォルマント・セグメントと、非フォルマント・セグメントとの間で、より良いコントラストが存在する。この効果は、圧縮モードでのクロス・チャネル・インタラクションの欠如が、利得が、周波数においてよりローカライズされることを意味するので、予想される。
[抑制モデルに関して]
正常な補聴器による二音抑制を復元する試みは、以前から提案されていた。TuricchiaおよびSarpeshkarは、聴覚障害をもつマルチバンドの圧縮を使う個人における二音抑制の効果を復元するための戦略を記載し、拡張している(Turicchiaほか (2005)を参照)。圧縮および伸長(コンパンディング)は、以下の方法において、二音抑制に至ることができる。所与の帯域に対し、圧縮ステージに対して広帯域フィルター、そして、拡大ステージに対して狭帯域フィルタが使われた。周波数が、エキスパンダー狭帯域フィルタ通過帯域の外にあるが、コンプレッサの広帯域フィルターの通過帯域の内にある激しいトーンは、エキスパンダーの周波数におけるトーンのレベルの縮小という結果になる。しかし、したがって、狭帯域エキスパンダーにより除去され、二音抑制効果を生成する。これらは、彼らのシステムのためのパラメータは、聴覚系を真似するために選択することができることを示唆した。しかしながら、彼らの戦略の以降の評価は、発話明瞭度における小さな改善という結果に過ぎなかった(Oxenhamほか(2007)、Bhattacharyaほか(2007)を参照)。
Strelcykほかは、音量増加を復元するためのアプローチ、正常なラウドネス加算と差分ラウドネスの復元を記載した。(Strelcykほか(2012)を参照)。ラウドネス加算は、2つの音が、同一の音圧レベルを持つときに、広帯域音が、狭帯域音より大きいとして知覚される現象である。ラウドネス加算は、レベルの増加とともにチャネル・フィルタの帯域幅を広げることによって、Strelcykほかのシステムにおいて達成される。
ここに記述される補聴器信号処理戦略は、少なくとも、1つの実施形態においては、特定のチャネルに対して利得を計算するときに、すべての周波数チャネルの瞬間的な出力を考慮することによって、二音抑制の実行することができる。利得の計算において、このクロス・チャネル影響は、DPOAE STC測定に基づいており、また、即座に適用することができる。
2つのトーン抑制を復元するゴールに加えて、ここでの戦略は、また、CLSの個々の測定を用いることにより正常な音量増加を復元することを狙う。補聴器による音量の復元が、以前に提案された(例えば、 Alleほか(1990)、Allen (1997)、 Cox (1995)を参照)けれども、複合音に対する正常な音量を復元する増幅を定めるために、どのように狭帯域音量データ使用するかが全く明白でなかった。また、低レベルの入力に対する利得に関して懸念された。HIリスナーが、そのようなアプローチは、バックグラウンド・ノイズを大きくするとしばしば不満を述べるからである。二音抑制を使用する、ここに記載された少なくとも1つの実施形態は、音量増加復元を複合音に広げ、また、HIリスナーが、バックグラウンド・ノイズの非存在下で、低レベルの音を聞き取れるようにしたままで、増幅されたバックグラウンド・ノイズに結びついた問題をコントロールすることができる。抑制なしで非線形利得を提供することは、関心対象の低レベルの信号とともに、低レベルのノイズを増幅する。抑制を含めることにより、低レベル信号の利得を提供したままで、バックグラウンド・ノイズの利得を減らすことができる。これは、母音を処理するときに、我々のアルゴリズムを信号処理することによって達成されたスペクトル・コントラストの強調と同様でありえる(図18、20および図19の表1を参照)。
ここにおける1つ以上の実施形態は、抑制の損失が、HI耳の異常なラウドネス加算に対する顕著な寄与者であるという仮説に集中する。したがって、単一トーンの音量に基づいた抑制と非線形利得の統合は、ラウドネス加算に対して補償する可能性がある。利得を定めるために使用する音量データは、HI個人において、正常な音量を復元する単一トーンのレベルを規定することができる。この抑制は、1つのトーンのレベルが、どのように、異なる周波数の別のトーンのレベルに影響を及ぼすのかを記述することができる。この組み合わせた効果は、ブロードバンド刺激の音量復元に一般化することができ、したがって、ラウドネス加算を補償することができる。
ここに記述される信号処理戦略の少なくとも1つの実施形態のパフォーマンスが、SHAシミュレーションの結果を示すことによって示されたこのシミュレーションは、DPOAE STCデータと質的に同様であるSTCを生じる(図1、9を比較)。SHAシミュレーションは、また、スペクトル・コントラストの強調を提供する(図18、20を参照)。これは、バックグラウンド・ノイズが存在するなかで、音声知覚を改善することができる。スペクトル・コントラスト強調を評価するために、ここで使われる母音のセットに対して、最大のSCEが、85dB SPLの入力レベルにおいて、得られた。これは、会話の発話レベルより大きいレベルである。このレベルの上で、SCEは減少したが、まだゼロより大きかった。これは、ここでの戦略が、発話で遭遇するほとんどのレベルを含む発話レベルの範囲に対して、音声知覚の利点を提供することができることを示す。
以前の研究は、子音識別が、母音識別と比較して、特にバックグラウンド・ノイズが存在する場合に、発話知覚により重要であることを示した(例えば、Gordon−Salant(1986)を参照)。また、発話の子音と他の過渡部分を強調することを目的とする信号処理戦略が、バックグラウンド・ノイズの存在において、音声知覚を改善することができることを示した。(例えば、Rasetshwaneほか(2009)を参照)。ここでの戦略は、子音を強調するのを狙うのではなく、正常な蝸牛抑制を復元することを狙うものである。少なくとも1つのゴールは、抑制および圧縮を含む聴力損失で減らされる蝸牛の処理の復元に焦点を合わせることであり得る。順に、それらの復元は、音声知覚や音質を向上させることができる。少なくとも、ここにおける戦略の瞬間的な圧縮およびフラット群遅延は、バックグラウンド・ノイズが存在するなかで、過渡状態を保存することができる。
この中の補聴器信号処理戦略の1つの実施形態において、抑制のインプリメンテーションは、DPOAE STC測定に基づいている。DPOAE STCは、それらの測定の間使われる3トーン刺激ために、抑制および同調を過小評価するかもしれない。実際、データは、刺激−周波数OAE(SFOAE)抑制同調がよりシャープであることを示唆した(Keefeほか(2008)参照)。したがって、よりシャープな同調は、ここに記述される抑制の少なくとも1つのインプリメンテーションにおいて、有益である。
ここに記述される補聴器フィッティング戦略は、個々のHI個人に対して要求される利得を決定するために、規範的な参照音量関数を要求することができる。この規範的な参照は、音量スケーリング・データが、特に異なるスケーリング手続きにわたる変動性によって、特徴づけられるので、注意して作成されなければならない(Elberling(1999)を参照)。しかしながら、Al−Salimほか(2010)は、単一の手続きのための音量スケーリング・データは、信頼することができ、反復可能であり得、聴力検査の閾値と同様である変動性(セッションの間の平均差の標準偏差)を有することを示した。
ここに記述される補聴器フィッティング戦略の少なくとも1つの狙いは、NH個人によって「非常に柔らかい」として知覚されるトーンが、また、HI個人によって「非常に柔らかい」として知覚され、NH個人によって「非常に大きい」として知覚されるトーンが、また、HI個人によって「非常に大きい」として知覚されるように、利得をHI個人に提供することによってHI個人における正常な音量を復元することであり得る。利得における2つの端点を使用して、計算は、HI個人に対する線形CLS関数を仮定する。しかしながら、典型的CLS関数は、しばしば、「中くらいの」音量の周辺に接続する2つの異なった線形セグメントによって特徴づけられる(例えば、(Al−Salimほか(2010)、Brandほか(2002)、および、ISO(2006)を参照)。第3のカテゴリー、「中くらいの」音量を、我々のフィッティング戦略において使用することができる(すなわち、NH個人によって「中くらい」として知覚されるトーンが、また、HI個人によって「中くらい」として知覚されるように、HI個人に利得を提供する)。
「非常に柔らかい」音Gcsの正常な音量を復元するために要求される利得は、音響フィードバックという結果になり得る。このフィードバックは、1で以上のチャネルにおけるGcsが、さもなければ、「非常に柔らかい」音の正常な音量を復元するために、要求されるものより下に、減らされることを要求することによって、減らす、または、除くことができる。すなわち、Gcsは、Gmax(オーバーライン)より小さくでなければならず、ここで、Gmax(オーバーライン)は、フィードバックという結果にならない最大利得である。これは、新しいLcsより上のレベルにおける望ましい入力・利得関数を変えることなく、所望のGcs≦Gmax(オーバーライン)を達成する新しいニーポイントLcsを選択することによって、行うことができる。このように、ここに記述される処理戦略は、より高いレベルにおいて正常なクロス・チャネル抑制を復元してりるままで、フィードバックを除く必要によって課される制約に容易に適応することができる。1つ以上のフィードバックの信号処理戦略への影響は、また、中程度、または、それ以上の聴力損失に対する「開放耳道」補聴器設計を避けることによって減らすことができる。「開放耳道」補聴器は、開口部が、補聴器のマイクロフォンが受信器から音を受信するのを許すので、多くのフィードバックという結果となる。
ここに記述される信号処理戦略の1つの実施形態の少なくとも1つのゴールは、抑制とダイナミック・レンジを減少し、そして、ラウドネス・リクルートメントという結果となるOHCダメージによる効果を補償することであり得る。OHCダメージは、およそ60dBの損失より大きな結果とならず、結果として、アルゴリズムは、60dB以下の聴力損失から結果を改善するように設計されることができる。内部の有毛細胞ダメージ、または、一次求心性線維へのダメージに結びついた問題を改善するように設計されることはできない。これらは、典型的には、より大きな程度で、聴力損失と結びついている。代替の、および/または、追加の戦略は、これらの場合における、救済を提供するために、必要となり得る。しかしながら、SHA処理を含む戦略のいくつかの組合せが、OHCダメージのための軽度ないし中度の聴力損失の結果を克服することに加えて、同様にこれらの場合利益を提供することが示されることが可能である。
ここでの戦略の1つ以上の実施形態は、正常な抑制と音量増加の両方を復元することができる方法を取り入れる。最初の近似に対して、先行音によるマスキングの量は、マスカーに対する応答に依存し、また、有毛細胞/求心性線維シナプスのレベルで調停された、短期適合プロセスを反映すると考えられる。我々のインプリメンテーションが利得を制御する程度に、それは、また、任意の信号によって引き出される応答を制御することができる。順に、圧縮の利得は、また、シナプスにおける適合効果に影響することができ、そして、おそらく、このメカニズムを通して、先行音によるマスキングに影響することが予想される。信号処理は、時間の関数として、正常な音量を速く復元することによって、より正常に近づくために、先行音によるマスキング、および、後方マスキングを引き起こすことが可能である。
ここに記述される戦略の1つ以上のバリエーションは、有益である。例えば、計算の効率や電力消費などの補聴器ハードウェアの問題に、取り組むことができる。例えば、補聴器において、あらゆる計算は、バッテリーから電源を得る、したがって、バッテリー寿命を最大にするために計算の効率が重要である。ここに記述されるフィルタバンクのガンマトーン・フィルタは、4次IIRフィルタを使用してインプリメントすることができる。一般に、4次IIRフィルタは、分子において5つの係数を持ち、そして、分母において5つの係数を持つ。このフィルタのアプリケーションは、各々の係数に対して、乗算動作を要求する。係数は、第1の分母係数が1に等しく、9つの可能性のある乗算を要求するように、典型的に正規化される。我々のガンマトーン・フィルタにおける分子係数の2つは、常に、ゼロであることができる。したがって、我々のガンマトーン・フィルタは、サンプルにつき7つの複素数乗算、または、サンプルにつき14の実数乗算を要求することができる。31のチャネルおよびサンプリング・レート24kHzで、我々のガンマトーン・フィルタバンクは、サンプルにつき434の乗算、または、12kHzの帯域幅に対して、1秒につきおよそ1040万の乗算を要求することができる。秒毎の乗算の数を減らす種々の方法が存在する。これは、計算の効率を増やし、そして、それによって、電力消費が、減少する。例えば、6kHzの帯域幅は、25のチャネルと12kHzのサンプリング・レートだけを要求するものであるが、フィルタバンク・ステージにおいて、乗算の数を、1秒につきおよそ420万の乗算に減らす。HerzkeおよびHohmannが、ガンマトーン・フィルタバンクの計算の効率を改善するための追加的な戦略を概説した(Herzkeほか(2007)を参照)。
さらなる計算の効率を、抑制ステージに変化をもたらすことによって達成することができる。サンプルごとに利得を計算し、適用する代わりに、出力信号に透過的な効率的なダウン・サンプリングのいくつかの形を、適用することができる。例えば、1つのインプリメンテーションにおいて、抑制ステージにより要求される計算時間は、フィルタバンクにより要求される計算時間に、およそ等しくなることがあり得る。完全なフィルタバンク(31のチャネルと24kHzのサンプリング・レート)を使用したシミュレーションを通して、1秒あたりの浮動小数点演算の数を(フロップス、MATLABによって報告されているように)、6のファクタだけ利得計算をダウン・サンプリングすることによって255Mflopsから108のMflopsに減らすことができる。計算の効率は、式(5)における抑制レベルの計算に使用されるチャネルの数を制限することによって、さらに改善されることができる。
ここに記述される抑制の少なくとも1つのモデルまたはインプリメンテーションは、蝸牛圧縮を、各々の特性周波数におけるレベル依存的な利得の上のクロス周波数影響と統合する。この複合モデルにおいて、各々の周波数における利得は、蝸牛ライクな二音抑制を実現するような態様で、周波数の全ての可聴範囲にわたる周波数成分の瞬間的なレベルの上の変動する程度に依存している。このモデルの蝸牛抑制への類似性は、シミュレーションされたSTCの、NHをもつ人間において測定されたDPOAE STCへの類似性において示される。抑制の存在は、明らかに、ローカル・スペクトル・コントラストの維持という結果になることができる。これは、バックグラウンド・ノイズのなかにおける音声知覚のために有用でありえる。ここに記述される戦略は、現在の補聴器技術でのリアルタイム・インプリメンテーションに対して計算機的に十分に効率的である。また、リスナー選好、および、発話明瞭度の面から利益であることができる。
以下の引用文献は、参照によって、本願明細書に組み込まれる。
B. C. J. Moore and D. A. Vickers, "The role of spread excitation and suppression in simultaneous masking," J. Acoust. Soc. Am., vol. 102, no. 4, pp. 2284-2290, Oct. 1997.
I. Yasin and C. J. Plack, "The role of suppression in the upward spread of masking ," J. Assoc. Res. Otolaryngol., vol. 6, no. 4, pp. 368-377, 2005.
J. Rodr?guez et al., "The role of suppression in psychophysical tone-on-tone masking," J. Acoust. Soc. Am., vol. 127, no. 1, pp. 361-369, 2009.
M. A. Ruggero, L. Robles, and N. C. Rich, "Two-tone suppression in the basilar membrane of the cochlea: Mechanical basis of auditory-nerve rate suppression," B. C. J. Moore and D. A. Vickers, "The role of spread excitation and suppression in simultaneous masking," J. Acoust. Soc. Am., vol. 102, no. 4, pp. 2284-2290, Oct. 1997.
W. S. Rhode and N. P. Cooper, "Two-tone suppression and distortion production on the basilar membrane in the hook region of cat and guinea pig cochleae," Hearing Research, vol. 66, no. 1, pp. 31-45, Mar. 1993.
B. Delgutte, "Two-tone rate suppression in auditory-nerve fibers: Dependence on suppressor frequency and level," Hearing Research, vol. 49, no. 1-3, pp. 225-246, Nov. 1990.
M. B. Sachs and N. Y. S. Kiang, "Two-tone inhibition in auditory-nerve fibers," J. Acoust. Soc. Am., vol. 43, no. 5, pp. 1120-1128, 1968.
H. Duifhuis, "Level effects in psychophysical two-tone suppression," J. Acoust. Soc. Amer., vol. 67, no. 3, pp. 914-927, 1980.
D. L. Weber, "Do off‐frequency simultaneous maskers suppress the signal?," J. Acoust. Soc. Am., vol. 73, no. 3, pp. 887-893, 1983.
C. Abdala, "A developmental study of distortion product otoacoustic emission (2f1-f2) suppression in humans," Hearing Research, vol. 121, pp. 125-138, Jul. 1998.
M. P. Gorga, S. T. Neely, D. Konrad-Martin, and P. A. Dorn, "The use of distortion product otoacoustic emission suppression as an estimate of response growth," J. Acoust. Soc. Am., vol. 111, no. 1, pp. 271-284, 2002.
M. P. Gorga, S. T. Neely, J. Kopun, and H. Tan, "Growth of suppression in humans based on distortion-product otoacoustic emission measurements," J. Acoust. Soc. Am., vol. 129, no. 2, pp. 801-816, 2011a.
M. B. Sachs and E. D. Young, "Effects of nonlinearities on speech encoding in the auditory nerve," J. Acoust. Soc. Am., vol. 68, no. 3, pp. 858-875, Mar. 1980.
L. Turicchia and R. Sarpeshkar, "A bio-inspired companding strategy for spectral enhancement," IEEE Trans. Speech Audio Process., vol. 13, no. 2, pp. 243-253, Mar. 2005.
A. J. Oxenham, A. M. Simonson, L. Turicchia, and R. Sarpeshkar, "Evaluation of companding-based spectral enhancement using simulated cochlear-implant processing," J. Acoust. Soc. Am., vol. 121, no. 3, pp. 1709-1716, 2007.
A. Bhattacharya and F. G. Zeng, "Companding to improve cochlear-implant speech recognition in speech-shaped noise," J. Acoust. Soc. Am., vol. 122, no. 2, pp. 1079-1089, 2007.
M. A. Stone and B. C. J. Moore, "Spectral feature enhancement for people with sensorineural hearing impairment: Effects on speech intelligibility and quality," J. Rehabil. Res. Dev., vol. 29, no. 2, pp. 39-56, 1992.
R. A. Schmiedt, "Acoustic injury and the physiology of hearing," J. Acoust. Soc. Am., vol. 76, no. 5, pp. 1293-1317, 1984.
C. Birkholz et al., "Growth of suppression using distortion-product otoacoustic emission measurements in hearing-impaired humans," J. Acoust. Soc. Am., vol. 132, no. 5, pp. 3305-3318, 2012.
S. C. Al-Salim et al., "Reliability of categorical loudness scaling and its relation to threshold," Ear and Hearing, vol. 31, no. 4, pp. 567-578, Aug. 2010.
B. Scharf, "Loudness," in Handbook of Perception: Vol IV. Hearing, E. C. Carterette and M. P. Friedman, Eds. New York: Academic Press, 1978, pp. 187-242.
M. P. Gorga, S. T. Neely, J. Kopun, and H. Tan, "Distortion-product otoacoustic emission suppression tuning curves in humans," J. Acoust. Soc. Am., vol. 129, no. 2, pp. 817-827, 2011b.
T. Brand and V. and Hohmann, "An adaptive procedure for categorical loudness scaling," J. Acoust. Soc. Am., vol. 112, no. 4, pp. 1597-1604, 2002.
D. Byrne, H. Dillon, T. Ching, R. Katsch, and G. Keidser, "NAL-NL1 procedure for fitting nonlinear hearing aids: Characteristics and comparisons with other procedures," J. Amer. Acad. Audiol., vol. 12, pp. 37-51, 2001.
L. E. Cornelisse, R. C. Seewald, and D. G. Jamieson, "The input/output formula: A theoretical approach to the fitting of personal amplification devices," J. Acoust. Soc. Am., vol. 97, no. 3, pp. 1854-1864, 1995.
J. Rodr?guez and S. T. Neely, "Temporal aspects of suppression in distortion-product otoacoustic emissions," J. Acoust. Soc. of Am., vol. 129, no. 5, pp. 3082-3089, 2011.
R. M. Arthur, R. R. Pfeiffer, and N. Suga, "Properties of 'two-tone inhibition' in primary auditory neurons," J. Physiol., vol. 212, no. 5, pp. 593-609, Feb 1971.
T. Herzke and V. Hohmann, "Improved Numerical Methods for Gammatone Filterbank Analysis and Synthesis," Acta. Acust. Acust., vol. 93, pp. 498 - 500, 2007.
R. D. Patterson and J. Holdsworth, "A functional model of neural activity patterns and auditory images," in Advances in Speech, Hearing and Language Processing, A. W. Ainsworth, Ed. Londom: JAI Press, 1996, pp. 547-563.
V. Hohmann, "Frequency analysis and synthesis using a gammatone filterbank," Acta. Acust. Acust., vol. 88, pp. 433-442, 2002.
C. A. Shera, J. J. Guinan, and A. J. Oxenham, "Otoacoustic estimation of cochlear tuning: Validation in the chinchilla," J. Assoc. Res. Otolaryngol., vol. 11, no. 3, pp. 343-365, Sep. 2010.
A. Harma. Derivation of the complex-valued gammatone filters. [Online at //www.acoustics.hut.fi/software/HUTear/Gammatone/Complex_gt.html]
R. Meddis, L. P. O'Mard, and E. A. Lopez-Poveda, "A computational algorithm for computing nonlinear auditory frequency selectivity," J. Acoust. Soc. Am., vol. 109, pp. 2852-2861, 2001.
M. L. Jepsen, S. D. Ewert, and T. Dau, "A computational model of human auditory signal processing and perception," J. Acoust. Soc. Am., vol. 124, no. 1, pp. 422-438, 2008.
W. S. Rhode and L. Robles, "Evidence from M?ssbauer experiments for nonlinear vibration in the cochlea," J. Acoust. Soc. Am., vol. 55, no. 3, pp. 588-596, 1974.
M. A. Stone, B. C. J. Moore, K. Meisenbacher, and R. P. Derleth, "Tolerable hearing aid delays. V. Estimation of limits for open canal fittings," Ear and Hearing, vol. 29, no. 4, pp. 601-617, Aug. 2008.
B. C. J. Moore and C. T. Tan, "Perceived naturalness of spectrally distorted speech and music," J. Acoust. Soc. Am., vol. 114, no. 1, pp. 408-419, 2003.
E. M. Zettner and R. C. Folsom, "Transient emission suppression tuning curve attributes in relation to psychoacoustic threshold," J. Acoust. Soc. Am., vol. 113, no. 4, pp. 2031-2041, 2003.
G. E. Peterson and H. L. Barney, "Control methods used in a study of the vowels," J. Acoust. Soc. Am., vol. 24, pp. 175-184, 1952.
ISO, "Acoustics - Loudness scaling by means of categories," ISO, 16832, 2006.
ISO, "Acoustics - Normal equal-loudness-level contours," ISO, 226, 2003.
O. Strelcyk, N. Nooraei, S. Kalluri, and B. Edwards, "Restoration of loudness summation and differential loudness growth in hearing-impaired listeners," J. Acoust. Soc. Am., vol. 132, no. 4, pp. 2557-2568, 2012.
J. B. Allen, J. L. Hall, and P. S. Jeng, "Loudness growth in 1/2-octave bands (LGOB) - A procedure for the assessment of loudness," J. Acoust. Soc. Amer., vol. 88, no. 2, pp. 745-753, 1990.
J. B. Allen, "Derecruitment by multiband compression in hearing aids," in Modeling Sensorineural Hearing Loss, W Jesteadt, Ed. Hillsdale: Lawrence Erlbaum, 1997, pp. 99-112.
R. M. Cox, "Using loudness data for hearing aid selection: The IHAFF approach," Hear. J., vol. 48, no. 2, pp. 39-42, 1995.
S. Gordon-Salant, "Recognition of natural and time/intensity altered CVs by young and elderly subjects with normal hearing," J. Acoust. Soc. Am., vol. 80, no. 6, pp. 1599-1607, 1986.
D. M. Rasetshwane, J. R. Boston, C. C. Li, J. D. Durrant, and G. Genna, "Enhancement of speech intelligibility using transients extracted by wavelet packets," in IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, New Paltz, 2009, pp. 173 - 176.
D. H. Keefe, J. C. Ellison, D. F. Fitzpatrick, and M. P. Gorga, "Two-tone suppression of stimulus frequency otoacoustic emissions," J. Acoust. Soc. Am., vol. 123, no. 3, pp. 1479-1494, 2008.
C. Elberling, "Loudness scaling revisited," J. Am. Acad. Audiol., vol. 10, pp. 248-260, 1999.
T. Herzke and V. Hohmann, "Effects of Instantaneous Multiband Dynamic Compression on Speech Intelligibility," EURASIP J. Adv. Signal Process., vol. 18, pp. 3034-3043, 2005. J. Neurophysiol, vol. 68, pp. 1087-1099, 1992.
すべての特許、特許文献、および、ここに引用した文献は、各々が別々に組み込まれたように、その全体が組み込まれる。本願の開示は、例示的な実施形態を参照して提供され、また、限定的に解釈されることを意味するものではない。先に記載したように、当業者は、他の種々の例示的アプリケーションが、ここに記述された装置および方法の有益な特性の有利さをとるために、ここに記載されるような技術を使用することができることを認識する。例示的実施形態の種々の修正は、本願開示の追加的実施形態と同様に、本願の記載を参照すれば、すぐに明らかとなるものである。

Claims (21)

  1. オーディオ信号を処理する方法であって、
    オーディオ信号入力を受信するステップと、
    前記オーディオ信号入力を複数の周波数帯に分離するステップと、
    該複数の周波数帯の各々を圧縮するステップであって、該複数の周波数帯の各周波数帯を圧縮することは、圧縮されたそれぞれの周波数帯という結果となる、それぞれの周波数帯に対するモデル化された抑制レベルに基づいて、時変利得を各周波数帯に適用することを含み、前記それぞれの周波数帯に対する前記抑制レベルは、利得が適用される前記それぞれの周波数帯に隣接している1つ以上の周波数帯の瞬間的な前記オーディオ信号入力のレベルに依存しており、それぞれの周波数帯に対するモデル化された抑制レベルに基づいて、時変利得を各周波数帯に適用することは、それぞれの周波数帯に対する通常の二音抑制に基づいた方程式を使用して、それぞれの周波数帯に対する前記抑制レベルを決定することを含む、ステップと、
    オーディオ信号出力を提供するのに使用するために、前記圧縮されたそれぞれの周波数帯を結合するステップと、
    を含む方法。
  2. 圧縮システムであって、
    オーディオ信号入力と、
    該オーディオ信号入力を複数の周波数帯に分離するように構成され、該複数の周波数帯の各々を圧縮するようにさらに構成される処理装置と、
    を備え、
    前記複数の周波数帯の各周波数帯を圧縮することは、圧縮されたそれぞれの周波数帯という結果となる、それぞれの周波数帯に対するモデル化された抑制レベルに基づいて、時変利得を各周波数帯に適用することを含み、
    それぞれの周波数帯に対する前記抑制レベルは、利得が適用される前記それぞれの周波数帯に隣接している1つ以上の周波数帯の瞬間的な前記オーディオ信号入力のレベルに依存しており、それぞれの周波数帯に対するモデル化された抑制レベルに基づいて、時変利得を各周波数帯に適用することは、それぞれの周波数帯に対する通常の二音抑制に基づいた方程式を使用して、それぞれの周波数帯に対する前記抑制レベルを決定することを含み、
    前記処理装置は、オーディオ信号出力を提供するのに使用するために、前記圧縮されたそれぞれの周波数帯を結合するようにさらに構成される、
    圧縮システム。
  3. 補聴器システムであって、
    音圧信号をオーディオ信号入力に変換するように構成された入力トランスデューサ装置と、
    該オーディオ信号入力を複数の周波数帯に分離するように構成され、該複数の周波数帯の各々を圧縮するように構成される処理装置であって、
    該複数の周波数帯の各周波数帯を圧縮することは、圧縮されたそれぞれの周波数帯という結果となる、それぞれの周波数帯に対するモデル化された抑制レベルに基づいて、時変利得を各周波数帯に適用することを含み、
    前記それぞれの周波数帯に対する前記抑制レベルは、利得が適用される前記それぞれの周波数帯に隣接している1つ以上の周波数帯の瞬間的な前記オーディオ信号入力のレベルに依存しており、それぞれの周波数帯に対するモデル化された抑制レベルに基づいて、時変利得を各周波数帯に適用することは、それぞれの周波数帯に対する通常の二音抑制に基づいた方程式を使用して、それぞれの周波数帯に対する前記抑制レベルを決定することを含み、
    前記処理装置は、オーディオ信号出力を提供するのに使用するために、前記圧縮されたそれぞれの周波数帯を結合するようにさらに構成される、
    処理装置と、
    前記オーディオ信号出力に基づいて、音圧信号を提供するように構成された出力トランスデューサ装置と、
    を備える補聴器システム。
  4. 前記それぞれの周波数帯の1つ以上の前記オーディオ信号は、それぞれの周波数帯に対して、抑制レベルに基づいて変化する量だけ遅延させられる、請求項1に記載の方法。
  5. 前記オーディオ信号入力を複数の周波数帯に分離するステップは、前記オーディオ信号入力を複数の隣接する周波数帯に分離するステップを含み、さらに、それぞれの周波数帯に対する前記抑制レベルは、利得が適用される前記それぞれの周波数帯に隣接している1つ以上の周波数帯の瞬間的な前記オーディオ信号入力のレベルに依存している、請求項1または4に記載の方法。
  6. 前記それぞれの周波数帯に対する前記抑制レベルは、利得が適用される前記それぞれの周波数帯に隣接している前記1つ以上の周波数帯の抑制強度の対数関数的変換である、請求項1、4または5に記載の方法。
  7. 前記抑制強度は、前記それぞれの周波数帯に隣接している複数の周波数帯に対応する複数のチャネル固有抑制強度の合計であり、さらに、チャネル固有抑制強度の各々は、前記複数の周波数帯の対応する周波数帯の前記オーディオ信号入力のレベルの線形関数である指数を有する、請求項6に記載の方法。
  8. 前記それぞれの周波数帯に対する時変利得は、前記抑制レベルの区分線形関数である、請求項1、4、5、6または7に記載の方法。
  9. それぞれの周波数帯に対する抑制レベルに基づいて、各周波数帯に適用される時変利得は、前記抑制レベルが指定された圧縮開始レベルより下にあるとき、一定の利得であり、前記抑制レベルが指定された圧縮終了レベルの上にあるとき、一定の利得であり、前記抑制レベルが圧縮開始レベルと圧縮終了レベルとの間の中間レベルにあるとき、前記利得は、抑制レベルの線形関数として減少する、請求項8に記載の方法。
  10. 周波数帯ごとの圧縮開始レベルは、正常の聴力の耳では「非常に柔らかい」として感知される音圧レベルであって、この圧縮開始レベルで適用される利得は、「非常に柔らかい」感知のために聴覚障害をもつ個人によって必要とされる過剰な音圧レベルに基づいたものである、請求項9に記載の方法。
  11. 周波数帯ごとの前記圧縮開始レベルは、正常の聴力の耳に対するトーンを聞く閾値における音圧レベルであって、この圧縮開始レベルで適用される利得は、同一のトーン閾値に対する聴覚障害をもつ個人によって必要とされる過剰な音圧レベルに基づいたものである、請求項9に記載の方法。
  12. 周波数帯ごとの前記圧縮終了レベルは、正常の聴力の耳では「非常に大きい」として感知される音圧レベルであって、この圧縮終了レベルで適用される利得は、「非常に大きい」感知のために聴覚障害をもつ個人によって必要とされる過剰な音圧レベルに基づいたものである、請求項9に記載の方法。
  13. 前記それぞれの周波数帯の1つ以上の前記オーディオ信号は、それぞれの周波数帯に対して、抑制レベルに基づいて変化する量だけ遅延させられる、請求項9に記載の方法。
  14. 追加された前記遅延は、前記圧縮開始レベルの下で一定であり、前記遅延は、前記圧縮終了レベルより上でゼロであり、前記遅延は、中間抑制レベルにおいて、減少関数である、請求項13に記載の方法。
  15. それぞれの周波数帯に対する前記抑制レベルは、前記それぞれの周波数帯の瞬間的な音声信号レベルにほぼ等しい、請求項1、4、5、6、7、8、9、10、11、12、13または14に記載の方法。
  16. 各周波数帯に前記時変利得を適用することは、それぞれの周波数帯に対する通常の二音抑制に基づいた方程式を使用して決定されたそれぞれの周波数帯に対する抑制レベルに基づいて、複数の順次の時間に時変利得を適用することを含み、隣接した順次の時間の間の中間の時間ステップにおける前記時変利得は、前記隣接した順次の時間の間で、線形に補間される、請求項1、4、5、6、7、8、9、10、11、12、13、14または15に記載の方法。
  17. 前記オーディオ信号入力は、振幅と位相成分の両方を含む複素数値入力信号を含む、請求項1、4、5、6、7、8、9、10、11、12、13、14、15または16に記載の方法。
  18. 複数の周波数帯の帯域幅は、高周波遅延が5ミリ秒以下であるように隣接し、サイズ設定をされる、請求項1、4、5、6、7、8、9、10、11、12、13、14、15、16または17に記載の方法。
  19. 前記方法は、周波数に特有の時間と位相調整を、オーディオ信号出力に、可聴周波数の全体の範囲にわたりよりフラットな遅延の方へ動かせるために、オーディオ信号入力に適用するステップを更に含む、請求項1、4、5、6、7、8、9、10、11、12、13、14、15、16、17または18に記載の方法。
  20. 周波数固有時間および位相調整が、サプレッサの合計された出力に、可聴周波数の全範囲にわたって最もフラットな可能な遅延を持たせることによって過渡的信号の保存を改善するために入力信号に適用される、請求項1、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18または19に記載の方法。
  21. 請求項1、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19または20に記載の方法を使用して、抑制レベルに基づいて、オーディオ信号を圧縮するためのシステム。
JP2015526557A 2012-08-06 2013-07-25 マルチバンドの音声圧縮システムと方法 Active JP6441796B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261680085P 2012-08-06 2012-08-06
US61/680,085 2012-08-06
PCT/US2013/051996 WO2014025542A1 (en) 2012-08-06 2013-07-25 Multiband audio compression system and method

Publications (3)

Publication Number Publication Date
JP2015531207A JP2015531207A (ja) 2015-10-29
JP2015531207A5 JP2015531207A5 (ja) 2016-09-01
JP6441796B2 true JP6441796B2 (ja) 2018-12-19

Family

ID=48985818

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015526557A Active JP6441796B2 (ja) 2012-08-06 2013-07-25 マルチバンドの音声圧縮システムと方法

Country Status (6)

Country Link
US (1) US9654876B2 (ja)
EP (1) EP2880761B1 (ja)
JP (1) JP6441796B2 (ja)
AU (1) AU2013299982B2 (ja)
DK (1) DK2880761T3 (ja)
WO (1) WO2014025542A1 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9144833B2 (en) 2013-03-14 2015-09-29 The Electric Materials Company Dual-phase hot extrusion of metals
EP3395082B1 (en) * 2015-12-22 2020-07-29 Widex A/S Hearing aid system and a method of operating a hearing aid system
US10149070B2 (en) * 2016-01-19 2018-12-04 Massachusetts Institute Of Technology Normalizing signal energy for speech in fluctuating noise
EP3420740B1 (en) * 2016-02-24 2021-06-23 Widex A/S A method of operating a hearing aid system and a hearing aid system
JP6094844B1 (ja) * 2016-03-14 2017-03-15 合同会社ディメンションワークス 音響再生装置、音響再生方法、及びプログラム
US10511277B2 (en) 2016-04-29 2019-12-17 Cirrus Logic, Inc. Audio signal processing
WO2017025108A2 (en) * 2016-10-04 2017-02-16 Al-Shalash Taha Kais Taha Sequencing the speech signal
EP3704870B1 (en) * 2017-11-02 2021-10-20 Two Pi GmbH Method for processing an acoustic speech input signal and audio processing device
JP7447085B2 (ja) 2018-08-21 2024-03-11 ドルビー・インターナショナル・アーベー コンパンディングによる密過渡イベントの符号化
WO2020044377A1 (en) * 2018-08-31 2020-03-05 Indian Institute Of Technology, Bombay Personal communication device as a hearing aid with real-time interactive user interface
EP3662468B1 (en) 2018-09-28 2020-11-04 Dolby Laboratories Licensing Corporation Distortion reducing multi-band compressor with dynamic thresholds based on scene switch analyzer guided distortion audibility model
EP3972292A1 (en) * 2020-09-18 2022-03-23 Oticon Medical A/S A generalized method for providing one or more stimulation coding parameters in a hearing aid system for obtaining a perceivable hearing loudness

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4887299A (en) 1987-11-12 1989-12-12 Nicolet Instrument Corporation Adaptive, programmable signal processing hearing aid
US4882762A (en) 1988-02-23 1989-11-21 Resound Corporation Multi-band programmable compression system
US5027410A (en) 1988-11-10 1991-06-25 Wisconsin Alumni Research Foundation Adaptive, programmable signal processing and filtering for hearing aids
US5278912A (en) 1991-06-28 1994-01-11 Resound Corporation Multiband programmable compression system
US8085959B2 (en) 1994-07-08 2011-12-27 Brigham Young University Hearing compensation system incorporating signal processing techniques
AU7118696A (en) * 1995-10-10 1997-04-30 Audiologic, Inc. Digital signal processing hearing aid with processing strategy selection
US6732073B1 (en) * 1999-09-10 2004-05-04 Wisconsin Alumni Research Foundation Spectral enhancement of acoustic signals to provide improved recognition of speech
WO2002013572A2 (en) * 2000-08-07 2002-02-14 Audia Technology, Inc. Method and apparatus for filtering and compressing sound signals
DE50214759D1 (de) * 2002-09-10 2010-12-23 Phonak Ag Verfahren zur Anpassung einer Signalverstärkung in einem Hörgerät sowie ein Hörgerät
WO2006133580A1 (en) * 2005-06-16 2006-12-21 Universität Zürich Sound analyzer based on a biomorphic design
JP4703324B2 (ja) * 2005-08-30 2011-06-15 株式会社東芝 半導体装置
AU2005336068B2 (en) * 2005-09-01 2009-12-10 Widex A/S Method and apparatus for controlling band split compressors in a hearing aid
US8213653B2 (en) * 2006-05-10 2012-07-03 Phonak Ag Hearing device
DE102008024490B4 (de) * 2008-05-21 2011-09-22 Siemens Medical Instruments Pte. Ltd. Filterbanksystem für Hörgeräte
WO2011048741A1 (ja) * 2009-10-20 2011-04-28 日本電気株式会社 マルチバンドコンプレッサ
US9706314B2 (en) * 2010-11-29 2017-07-11 Wisconsin Alumni Research Foundation System and method for selective enhancement of speech signals
US8913768B2 (en) * 2012-04-25 2014-12-16 Gn Resound A/S Hearing aid with improved compression

Also Published As

Publication number Publication date
AU2013299982A1 (en) 2015-01-22
EP2880761B1 (en) 2020-10-21
JP2015531207A (ja) 2015-10-29
US20150264482A1 (en) 2015-09-17
WO2014025542A1 (en) 2014-02-13
DK2880761T3 (da) 2020-11-09
EP2880761A1 (en) 2015-06-10
US9654876B2 (en) 2017-05-16
AU2013299982B2 (en) 2016-12-22

Similar Documents

Publication Publication Date Title
JP6441796B2 (ja) マルチバンドの音声圧縮システムと方法
Kates et al. Coherence and the speech intelligibility index
Kates et al. The hearing-aid speech perception index (HASPI)
US5274711A (en) Apparatus and method for modifying a speech waveform to compensate for recruitment of loudness
Fu et al. Effects of amplitude nonlinearity on phoneme recognition by cochlear implant users and normal-hearing listeners
US8098859B2 (en) Methods, devices and systems using signal processing algorithms to improve speech intelligibility and listening comfort
Stone et al. Effects of spectro-temporal modulation changes produced by multi-channel compression on intelligibility in a competing-speech task
Chen et al. A new method of calculating auditory excitation patterns and loudness for steady sounds
Kates An auditory model for intelligibility and quality predictions
US20050114127A1 (en) Methods and apparatus for maximizing speech intelligibility in quiet or noisy backgrounds
EP3584927A1 (en) Systems and methods for processing an audio signal for replay on an audio device
Rasetshwane et al. Signal-processing strategy for restoration of cross-channel suppression in hearing-impaired listeners
Kates Modeling the effects of single-microphone noise-suppression
CN113993053B (zh) 一种通道自适应的数字助听器宽动态范围压缩方法
Kortlang et al. Auditory model-based dynamic compression controlled by subband instantaneous frequency and speech presence probability estimates
Li et al. Wavelet-based nonlinear AGC method for hearing aid loudness compensation
JPS62224200A (ja) デイジタル聴覚増進装置、聴覚を増進する方法およびトランスマルチプレクサ
Falk et al. Non-intrusive objective speech quality and intelligibility prediction for hearing instruments in complex listening environments
Ewert et al. A model-based hearing aid: Psychoacoustics, models and algorithms
Jemaa et al. Intelligibility enhancement of vocal announcements for public address systems: a design for all through a presbycusis pre-compensation filter.
Huang et al. Combination and comparison of sound coding strategies using cochlear implant simulation with mandarin speech
Ewert et al. Model-based hearing aid gain prescription rule
Wirtzfeld et al. Predictions of speech chimaera intelligibility using auditory nerve mean-rate and spike-timing neural cues
Anderson et al. The acoustic and peceptual effects of series and parallel processing
Chen et al. Modeling speech intelligibility with recovered envelope from temporal fine structure stimulus

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160714

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160714

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171003

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171201

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180508

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20180808

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180817

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181023

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181122

R150 Certificate of patent or registration of utility model

Ref document number: 6441796

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250