JP7237993B2 - オーディオデバイスで再生するためのオーディオ信号を処理するシステム及び方法 - Google Patents

オーディオデバイスで再生するためのオーディオ信号を処理するシステム及び方法 Download PDF

Info

Publication number
JP7237993B2
JP7237993B2 JP2020569897A JP2020569897A JP7237993B2 JP 7237993 B2 JP7237993 B2 JP 7237993B2 JP 2020569897 A JP2020569897 A JP 2020569897A JP 2020569897 A JP2020569897 A JP 2020569897A JP 7237993 B2 JP7237993 B2 JP 7237993B2
Authority
JP
Japan
Prior art keywords
drc
signal
feedforward
path
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020569897A
Other languages
English (en)
Other versions
JP2021529980A (ja
Inventor
ニコラス アール クラーク,
Original Assignee
ミミ ヒアリング テクノロジーズ ゲーエムベーハー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from EP18178873.8A external-priority patent/EP3584927B1/en
Application filed by ミミ ヒアリング テクノロジーズ ゲーエムベーハー filed Critical ミミ ヒアリング テクノロジーズ ゲーエムベーハー
Publication of JP2021529980A publication Critical patent/JP2021529980A/ja
Application granted granted Critical
Publication of JP7237993B2 publication Critical patent/JP7237993B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/02Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
    • H03G9/025Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers frequency-dependent volume compression or expansion, e.g. multiple-band systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/005Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/20Combinations of two or more types of control, e.g. gain control and tone control in frequency-selective amplifiers
    • H03G9/24Combinations of two or more types of control, e.g. gain control and tone control in frequency-selective amplifiers having semiconductor devices
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/26Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifying stages as well as in frequency-selective amplifying stages
    • H03G9/30Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifying stages as well as in frequency-selective amplifying stages all amplifying stages having semiconductor devices
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/35Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception using translation techniques
    • H04R25/356Amplitude, e.g. amplitude shift or compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2205/00Details of stereophonic arrangements covered by H04R5/00 but not provided for in any of its subgroups
    • H04R2205/041Adaptation of stereophonic signal reproduction for the hearing impaired
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2225/00Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
    • H04R2225/43Signal processing in hearing aids to enhance the speech intelligibility
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/03Synergistic effects of band splitting and sub-band processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • General Health & Medical Sciences (AREA)
  • Neurosurgery (AREA)
  • Otolaryngology (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Description

本発明は、全体として、デジタル信号処理(DSP)、音響工学、及び聴覚学の分野に関し、より詳細には、オーディオデバイスで再生するためのオーディオ信号を処理するシステム及び方法、例えば、強化されたリスニング体験をオーディオデバイスで提供するシステム及び方法に関する。
従来のDSPサウンドパーソナライゼーションの手法は、多くの場合、ユーザの聴覚プロファイルに応じて補償的な周波数ゲインを適用するイコライゼーション技術に依拠している(例えば、米国特許第9,138,178号、第9,468,401号、第9,680,438号、第9898248号を参照)。一般に、ユーザが聴覚閾値の上昇を示す周波数を特定するためには、純音閾値(PTT)聴覚検査が用いられる。そして、オーディオグラムデータに基づいて、周波数出力が適宜に変調される。その際、ユーザのために音響体験を拡張するアプローチは一次元的なものである。ゲインにより、ユーザは、以前に聞き取れなかった周波数を再び捕らえることができるようになるが、後に音の大きさからくる不快を感じる可能性がある。感音性難聴の聴取者は、聴覚閾値が上がっているにもかかわらず、正常聴覚の聴取者と比較した場合、一般的には、不快閾値がほぼ同じであるか、または低くすらある。この点で、ダイナミックレンジが狭くなり、EQゲインを単純に追加するだけでは、長期的には聴覚の健康状態に悪影響を及ぼすことになる(図1)。
ダイナミックレンジ圧縮(DRC)を使用すると、大きな音の音量を下げながら静かな音を増幅し、すなわちオーディオのダイナミックレンジを狭めることで、この問題に対処することができる。しかし、これは、低周波数の騒音が、関心のある高周波数の音の増幅を妨げる可能性があるために問題をもたらし得る。この理由から、補聴器用プロセッサには、微弱な音は大幅に増幅されるが高強度の音は増幅されない、広ダイナミックレンジ圧縮を採用している。この点で、従来の補聴器は、広ダイナミックレンジの音が聴取者に関連する実社会の状況での使用のために設計されており、つまり、聴取者は、目の前で人が大きな声で話していることなどの音響情報の意味を理解するのを望む一方で、同時に、通りを歩きながら、遠くから近づいてくる車のかすかな音に気付くことができるようになることを望む。このことは、実際的な実社会の問題には有効であるが、モバイルデバイスまたはその他の類似のデバイスで消費されるオーディオコンテンツは、日常生活で遭遇する音とは全く異なる信号統計を有するため、聴取者に有益なサウンドパーソナライゼーション体験を提供するには異なる処理戦略が求められる。
健康人の聴覚の機能処理をデジタル方式で再現する機能により、聴覚障害(HI)を持つユーザにとって、より自然で明瞭なリスニング体験が可能になる。ごく最近まで人間の耳の物理学は十分に解明されていなかった。人間の耳は、音環境を理解するために、音を脳への伝達に最適な形式に前処理する。この前処理は、いくつかの階層的な信号プロセス及びフィードバックループとしてモデル化することができ、その多くは非線形であるために、複雑な非線形機構となる。難聴は、典型的には高音域から始まるが、難聴があることを自覚している聴取者は、一般に、高音域の音が聞こえないことについて不平を言うことはない。その代わりに、その聴取者らは、雑音の多い環境でのリスニングや、オーディオストリームなどの複雑に混ざり合った音の細部を聞き取ることが困難であると報告している。要するに、離調音により、HIの個人に対しては情報が他の周波数のエネルギーで覆い隠されやすくなり、以前は細部まで明瞭かつ豊かであった音楽が曖昧になってしまう。これは、音楽自体が非常にセルフマスキング的なものであるためである。
聴覚が悪化すると、耳の信号調整機能が低下し始め、結果として、HI聴取者は、複雑な音響場面において関心のある音を理解するために、より多大な知的努力を費やす必要がある(さもなければ情報を完全に聞き逃すことになる)。オーディオグラムにおける閾値の上昇は、単に聴覚感度が低下したということだけでなく、微弱音の感知を不能にする影響を持つ聴覚系中の何らかの深層プロセスの機能不全の結果である。
最近の研究では、中耳の内側の基底膜、内側オリーブ蝸牛複合体、ならびに内有毛細胞及び外有毛細胞の相互接続をモデル化して、人間の耳の物理的性質をより適切にモデル化することが試みられた。Clark et al.(2012)は、補聴方式技術を基に、基底膜に対する内側オリーブ蝸牛の減衰効果を模倣して、人間の聴覚をより適切にモデル化するアルゴリズムを開発した。それによって、前述の事柄からのデータが示唆するように、ノイズ中の音声のロバスト性を改善する可能性がある(Clark et al., A frequency-selective feedback model of auditory efferent suppression and its implications for the recognition of speech in noise. Journal of the acoustical society of America, Volume 132, issue 3, pages 1535 to 1541, 2012を参照のこと)。この結果は、スペクトル分解された系内で、遅延フィードバック減衰制御(DFAC)を双対共鳴非線形(DRNL)アルゴリズムに組み込むことによって達成される(DRNLについては、E.Lopez-Poveda and R.Meddis. A human nonlinear cochlearfilterbank. Journal of the acoustical society of America,Volume 110,issue 6,Pages 3107 to 3118,2001を参照のこと)。DRNLアルゴリズムは、瞬時ダイナミックレンジ圧縮を含む。
ただし、このアルゴリズムは、聴覚系をモデル化するための枠組みとしてのみ機能し、音の増大のために特化されていなかった。この点で、このアルゴリズムは、歪み成分に対する制御の欠如に起因した主観的な聴覚体験に際してのいくつかの欠点を有する。これらの欠点には、歪みを制御する能力の低下と、(狭帯域フィルタと組み合わせて使用した場合)音の時間的スミアリングを生じさせ、その結果として明瞭度を低下させる可能性のある、周波数分解能の制限、及び位相歪みとが含まれる。つまり、このアルゴリズムは、難聴のユーザが使用した場合、実社会での使用事例のいくつかの態様を改善できる可能性はあるが、オーディオとのからみでは、より幅広いカテゴリの聴取者のリスニング体験を向上させることができない。したがって、本発明の目的は、聴取者に有益なサウンドパーソナライゼーションを提供する、改良された、生物学的知見に基づいたDSPを作り出すことである。
既知の先行技術で提起された問題は、以下に説明する本発明において少なくとも部分的に解決される。本発明による特徴は独立請求項中に明示され、その有利な実施態様は従属請求項に示される。特許請求の範囲の特徴は、技術的に意味のある任意の様式で組み合わせることができ、以下の明細書からの説明と同様に、本発明の更なる実施形態を示す図からの特徴も考慮に入れることができる。
健康人の耳の機能処理をより忠実に模倣する、改良された、生物学的知見に基づいたDSPアルゴリズムを作り出すことにより、本提示技術は、先行技術のDSP手法が内包する制限、すなわち、帯域間の群遅延差によって引き起こされる周波数分解能の低さと時間的スミアリングとを解決する。この点で、本発明は、難聴の聴取者と、低から中程度の難聴を示す個人との両者に、強化されたリスニング体験をオーディオデバイスで提供するものであり、両者はより明瞭なリスニング体験を享受する。
全体として、本技術は、オーディオデバイスで再生するためのオーディオ信号を処理する方法を特徴としている。特に、本方法は、オーディオ信号を処理して、オーディオデバイスで(例えば、再生されたときに)強化された聴覚体験を提供する方法であり得る。
一態様によれば、オーディオデバイスで再生するためのオーディオ信号を処理する方法は、a)バンドパスフィルタ(例えば、入力バンドパスフィルタ)を使用して、オーディオ信号を複数の周波数帯域にスペクトル分解する(例えば、複数のサブバンド信号にスペクトル分解し、各サブバンド信号はそれぞれの周波数帯域にある)ことを含み得る。本方法は、b)周波数帯域ごとに、周波数帯域内のオーディオ信号(例えば、サブバンド信号)をそれぞれの変調器に供給し、変調器の出力から、周波数帯域内のオーディオ信号を、それぞれの第1のダイナミックレンジコンプレッサに(例えば、第1のDRCの例としてのフィードフォワードDRCに)供給することを更に含み得る。フィードフォワードDRCは、それぞれの周波数帯域(またはサブバンド信号)の第1の処理経路の一部であり得、周波数帯域内の(変調された)オーディオ信号(例えば、サブバンド信号)は、第1の処理経路に供給され得る。第1の処理経路は、フィードフォワード経路と呼ばれる場合がある。本方法は、c)周波数帯域ごとに、周波数帯域内の変調されたオーディオ信号(例えば、変調されたサブバンド信号)をフィードフォワード圧縮して、それぞれの周波数帯域内のフィードフォワード圧縮オーディオ信号(例えば、フィードフォワード圧縮されたサブバンド信号)を取得することを更に含み得る。それに関して、フィードフォワードDRCは、瞬時DRCに対して遅くされている。この減速は、直接的または間接的に行うことができる。このダイナミックレンジ圧縮の減速により、高調波歪み成分と相互変調歪み成分とのスペクトル拡散を制御することができる。フィードフォワード圧縮周波数帯域(例えば、周波数帯域内のフィードフォワード圧縮オーディオ信号、またはフィードフォワード圧縮サブバンド信号)は、それぞれの圧縮出力に供給され得る。本方法は、d)周波数帯域ごとに、それぞれの圧縮出力からの各フィードフォワード圧縮周波数帯域をフィードバック圧縮することを更に含み得る。この目的のために、各フィードフォワード圧縮周波数帯域は、それぞれの第2のDRCを含むそれぞれの第2の処理経路に供給され得る。第2の処理経路は、フィードバック経路と呼ばれる場合がある。第2のDRCは、(第2のDRCの例として)フィードバックDRCと呼ばれる場合がある。更に、フィードバックDRCは、フィードフォワードDRCに対して遅延させられ得る。つまり、第2の処理経路の出力は、例えば、遅延要素(例えば、バッファなど)によって意図的に遅延させられ得る。遅延は、フィードバックDRCの前または後に挿入することができる。次に、(遅延)フィードバック圧縮周波数帯域が、それぞれの周波数帯域の変調器に供給される。一般に、第2の処理経路の出力は、それぞれの変調器に供給される。変調器は、第2の処理経路の出力に応じて(例えば、第2の処理経路の出力の制御下で)動作することができる。変調器は、第2の処理経路の出力に応じて、ステップcの圧縮入力で減衰を提供することができる。本方法は、e)フィードフォワード圧縮周波数帯域(例えば、周波数帯域内のフィードフォワード圧縮オーディオ信号、またはフィードフォワード圧縮サブバンド信号)を再結合することを更に含み得る。
上記のように構成される提案された方法は、ユーザに強化されたリスニング体験を提供するという利点と技術的効果とを有する。これは、健康人の聴覚系の機能処理を模倣する技術を使用してオーディオ信号を処理することによって達成される。
一実施形態では、入力バンドパスフィルタは位相線形である。更なる実施形態では、位相線形入力バンドパスフィルタは、周波数領域で動作する有限インパルス応答フィルタである。
いくつかの実施形態では、第1のDRCを瞬時DRCに対して遅くすることは、それぞれのサブバンド信号をオーバサンプリングすることに関連し得る。例えば、オーバサンプリングすることは、サブバンド信号にn点FFTを適用することと、FFT変換をn/Nサンプルだけオーバラップすることとを含み、Nはオーバサンプリングレートであり、nはNよりも大きい。所与のnに対して、オーバサンプリングレートNは、例えば2~n/2の範囲(これは、n/2サンプルと2サンプルとの間の範囲のオーバラップに変換される)になり得る。代表的な実施態様(例えば、n=256、512、1024)の場合、オーバサンプリングレートNは、例えば128~512の範囲になり得る。
いくつかの実施形態では、第1のDRCを瞬時DRCに対して遅くすることは、第1のDRCのアタック時定数及び/またはリリース時定数を増加させること(すなわち、アタック時定数及び/またはリリース時定数を0とは異なる値に設定すること)に関連し得る。例えば、第1のDRCを、瞬時DRCに対して遅くすることは、0.01ms~3msの範囲から選択される時定数τに基づいて、第1のDRCのアタック時定数及び/またはリリース時定数を設定することに関連し得る。同様に、第1のDRCを、瞬時DRCに対して遅くすることは、それぞれの(周波数)サブバンド内の周波数fに対応する時定数τに基づいて、第1のDRCのアタック時定数及び/またはリリース時定数を設定することに関連し得る。この周波数は、サブバンドの低域カットオフ周波数、高域カットオフ周波数、または中心周波数の場合がある。
いくつかの実施形態では、瞬時DRCに対して第1のDRCを遅くすることは、それぞれのサブバンド信号をオーバサンプリングすることと、第1のDRCのアタック時定数及び/またはリリース時定数を増加させること(すなわち、アタック時定数及び/またはリリース時定数を0とは異なる値に設定すること)との両方に関わり得る。当業者であれば、第1のDRCを遅くすることは、間接的な減速(すなわち、オーバサンプリング)と、直接的な減速(すなわち、第1のDRCの時定数を変更すること)との両方の組み合わせによって達成され得ることを理解することができる。直接減速の場合、τは、RC回路の代替パラメータであるカットオフ周波数fに、τ=RC=1/(2πf)によって関連付けられている。オーバサンプリングによる減速の代わりに、直接的に減速される第1のDRCの時定数τに(間接的に)相当する値は、オーバサンプリングレートNをサンプリングレート(例えば、44100Hz)で割ることによって計算することができる。この点で、DRCの間接的な減速と直接的な減速との組み合わせの効果は、これら2つの値の関数として容易に計算可能である。
別の態様によれば、オーディオ信号を処理して(例えば、再生されたときに)、強化された聴覚体験をオーディオデバイスで提供する方法は、未処理のオーディオ信号を第1の信号経路と第2の信号経路とに分割することと、第1の信号経路でオーディオ信号を処理することと、第1の信号経路と第2の信号経路との出力をある比率で再結合することとを含み得る。第1の信号経路における処理は、a)バンドパスフィルタを使用して、第1の信号経路で、オーディオ信号の複数のサブバンド信号へのスペクトル分解を実行することを含み得る。第1の信号経路における処理は、b)サブバンド信号ごとに、サブバンド信号をそれぞれの変調器に供給し、変調器の出力から、サブバンド信号を、第1のダイナミックレンジコンプレッサであるDRCを含むそれぞれの第1の処理経路に供給することを更に含み得る。第1の処理経路は、フィードフォワード経路と呼ばれる場合がある。第1の信号経路における処理は、c)サブバンド信号ごとに、それぞれの第1のDRCによってサブバンド信号をフィードフォワード圧縮して、それぞれの周波数帯域でフィードフォワード圧縮されたオーディオ信号(例えば、フィードフォワード圧縮サブバンド信号)を取得することを更に含み得る。それに関して、フィードフォワードDRCは、瞬時DRCに対して遅くされている。この減速は、直接的または間接的に行うことができる。このダイナミックレンジ圧縮の減速により、高調波歪み成分と相互変調歪み成分とのスペクトル拡散を制御することができる。フィードフォワード圧縮周波数帯域(例えば、周波数帯域内のフィードフォワード圧縮オーディオ信号、またはフィードフォワード圧縮サブバンド信号)は、それぞれの圧縮出力に供給され得る。第1の信号経路における処理は、d)それぞれの圧縮出力からの各フィードフォワード圧縮周波数帯域をフィードバック圧縮することを更に含み得る。この目的のために、各フィードフォワード圧縮周波数帯域は、それぞれの第2のDRCを含むそれぞれの第2の処理経路に供給され得る。第2の処理経路は、フィードバック経路と呼ばれる場合がある。第2のDRCは、(第2のDRCの例として)フィードバックDRCと呼ばれる場合がある。更に、フィードバックDRCは、フィードフォワードDRCに対して遅延させられ得る。つまり、第2の処理経路の出力は、例えば、遅延要素(例えば、バッファなど)によって意図的に遅延させられ得る。遅延は、フィードバックDRCの前または後に挿入することができる。次に、(遅延)フィードバック圧縮周波数帯域が、それぞれの周波数帯域の変調器に供給される。一般に、第2の処理経路の出力は、それぞれの変調器に供給される。変調器は、第2の処理経路の出力に応じて(例えば、第2の処理経路の出力の制御下で)動作することができる。変調器は、第2の処理経路の出力に応じて、ステップcの圧縮入力で減衰を提供することができる。第1の信号経路における処理は、e)フィードフォワード圧縮周波数帯域(例えば、周波数帯域内のフィードフォワード圧縮オーディオ信号、またはフィードフォワード圧縮サブバンド信号)を再結合することを更に含み得る。
一実施形態では、入力バンドパスフィルタは位相線形である。更なる実施形態では、位相線形入力バンドパスフィルタは、周波数領域で動作する有限インパルス応答フィルタである。
いくつかの実施形態では、第1のDRCを瞬時DRCに対して遅くすることは、それぞれのサブバンド信号をオーバサンプリングすることに関連し得る。例えば、オーバサンプリングすることは、サブバンド信号にn点FFTを適用することと、FFT変換をn/Nサンプルだけオーバラップすることとを含み、Nはオーバサンプリングレートであり、nはNよりも大きい。所与のnに対して、オーバサンプリングレートNは、例えば2~n/2の範囲(これは、n/2サンプルと2サンプルとの間の範囲のオーバラップに変換される)になり得る。代表的な実施態様(例えば、n=256、512、1024)の場合、オーバサンプリングレートNは、例えば、128~512の範囲であり得る。
いくつかの実施形態では、第1のDRCを瞬時DRCに対して遅くすることは、第1のDRCのアタック時定数及び/またはリリース時定数を増加させること(すなわち、アタック時定数及び/またはリリース時定数を0とは異なる値に設定すること)に関連し得る。例えば、第1のDRCを、瞬時DRCに対して遅くすることは、0.01ms~3msの範囲から選択される時定数τに基づいて、第1のDRCのアタック時定数及び/またはリリース時定数を設定することに関連し得る。同様に、第1のDRCを、瞬時DRCに対して遅くすることは、それぞれの(周波数)サブバンド内の周波数fに対応する時定数τに基づいて、第1のDRCのアタック時定数及び/またはリリース時定数を設定することに関連し得る。この周波数は、サブバンドの低域カットオフ周波数、高域カットオフ周波数、または中心周波数の場合がある。
いくつかの実施形態では、瞬時DRCに対して第1のDRCを遅くすることは、それぞれのサブバンド信号をオーバサンプリングすることと、第1のDRCのアタック時定数及び/またはリリース時定数を増加させること(すなわち、アタック時定数及び/またはリリース時定数を0とは異なる値に設定すること)との両方に関わり得る。当業者であれば、第1のDRCを遅くすることは、間接的な減速(すなわち、オーバサンプリング)と、直接的な減速(すなわち、第1のDRCの時定数を変更すること)との両方の組み合わせによって達成され得ることを理解することができる。直接減速の場合、τは、RC回路の代替パラメータであるカットオフ周波数fに、τ=RC=1/(2πf)によって関連付けられている。オーバサンプリングによる減速の代わりに、直接的に減速される第1のDRCの時定数τに(間接的に)相当する値は、オーバサンプリングレートNをサンプリングレート(例えば、44100Hz)で割ることによって計算することができる。この点で、DRCの間接的な減速と直接的な減速との組み合わせの効果は、これら2つの値の関数として容易に計算可能である。
別の態様によれば、オーディオ信号を処理して(例えば、再生されたときに)、強化された聴覚体験をオーディオデバイスで提供する方法において、サブバンド信号自体が、更に、第1の信号経路と第2の信号経路とに分割され、ある比率で再結合され得る。したがって、本方法は、a)バンドパスフィルタを使用して、オーディオ信号を複数のサブバンド信号にスペクトル分解することを含み得る。本方法は、b)サブバンド信号ごとに、サブバンド信号を第1の信号経路と第2の信号経路とに分割することと、第1の信号経路内のサブバンド信号を処理することと、第1の信号経路及び第2の信号経路をある比率で再結合して、処理済みサブバンド信号を取得することとを更に含み得る。第1の信号経路内のサブバンド信号の処理は、b1)周波数帯域内のオーディオ信号(例えば、サブバンド信号)をそれぞれの変調器に供給し、変調器の出力から、周波数帯域内のオーディオ信号を、それぞれの第1のダイナミックレンジコンプレッサに(例えば、第1のDRCの例としてのフィードフォワードDRCに)供給することを含み得る。フィードフォワードDRCは、それぞれの周波数帯域(またはサブバンド信号)の第1の処理経路の一部であり得、周波数帯域内の(変調された)オーディオ信号(例えば、サブバンド信号)は、第1の処理経路に供給され得る。第1の処理経路は、フィードフォワード経路と呼ばれる場合がある。第1の信号経路内のサブバンド信号の処理は、b2)周波数帯域内のオーディオ信号(例えば、変調されたサブバンド信号)を、それぞれの第1のDRCによってフィードフォワード圧縮して、フィードフォワード圧縮オーディオ信号(例えば、フィードフォワード圧縮サブバンド信号)を取得することを更に含み得る。それに関して、フィードフォワードDRCは、瞬時DRCに対して遅くされている。この減速は、直接的または間接的に行うことができる。このダイナミックレンジ圧縮の減速により、高調波歪み成分と相互変調歪み成分とのスペクトル拡散を制御することができる。フィードフォワード圧縮周波数帯域(例えば、周波数帯域内のフィードフォワード圧縮オーディオ信号、またはフィードフォワード圧縮サブバンド信号)は、それぞれの圧縮出力に供給され得る。第1の信号経路内のサブバンド信号の処理は、b3)それぞれの圧縮出力からのフィードフォワード圧縮周波数帯域をフィードバック圧縮することを更に含み得る。この目的のために、フィードフォワード圧縮周波数帯域は、それぞれの第2のDRCを含むそれぞれの第2の処理経路に供給され得る。第2の処理経路は、フィードバック経路と呼ばれる場合がある。第2のDRCは、(第2のDRCの例として)フィードバックDRCと呼ばれる場合がある。更に、フィードバックDRCは、フィードフォワードDRCに対して遅延させられ得る。つまり、第2の処理経路の出力は、例えば、遅延要素(例えば、バッファなど)によって意図的に遅延させられ得る。遅延は、フィードバックDRCの前または後に挿入することができる。次に、(遅延)フィードバック圧縮周波数帯域が、それぞれの周波数帯域の変調器に供給される。一般に、第2の処理経路の出力は、それぞれの変調器に供給される。変調器は、第2の処理経路の出力に応じて(例えば、第2の処理経路の出力の制御下で)動作することができる。変調器は、第2の処理経路の出力に応じて、ステップb3の圧縮入力で減衰を提供することができる。本方法は、c)フィードフォワード圧縮周波数帯域(例えば、周波数帯域内のフィードフォワード圧縮オーディオ信号、またはフィードフォワード圧縮サブバンド信号)を再結合することを更に含み得る。
一実施形態では、入力バンドパスフィルタは位相線形である。更なる実施形態では、位相線形入力バンドパスフィルタは、周波数領域で動作する有限インパルス応答フィルタである。
いくつかの実施形態では、第1のDRCを瞬時DRCに対して遅くすることは、それぞれのサブバンド信号をオーバサンプリングすることに関連し得る。例えば、オーバサンプリングすることは、サブバンド信号にn点FFTを適用することと、FFT変換をn/Nサンプルだけオーバラップすることとを含み得、Nはオーバサンプリングレートであり、nはNよりも大きい。所与のnに対して、オーバサンプリングレートNは、例えば2~n/2の範囲(これは、n/2サンプルと2サンプルとの間の範囲のオーバラップに変換される)になり得る。代表的な実施態様(例えば、n=256、512、1024)の場合、オーバサンプリングレートNは、例えば、128~512の範囲であり得る。
いくつかの実施形態では、第1のDRCを瞬時DRCに対して遅くすることは、第1のDRCのアタック時定数及び/またはリリース時定数を増加させること(すなわち、アタック時定数及び/またはリリース時定数を0とは異なる値に設定すること)に関連し得る。例えば、第1のDRCを、瞬時DRCに対して遅くすることは、0.01ms~3msの範囲から選択される時定数τに基づいて、第1のDRCのアタック時定数及び/またはリリース時定数を設定することに関連し得る。同様に、第1のDRCを、瞬時DRCに対して遅くすることは、それぞれの(周波数)サブバンド内の周波数fに対応する時定数τに基づいて、第1のDRCのアタック時定数及び/またはリリース時定数を設定することに関連し得る。この周波数は、サブバンドの低域カットオフ周波数、高域カットオフ周波数、または中心周波数の場合がある。
いくつかの実施形態では、瞬時DRCに対して第1のDRCを遅くすることは、それぞれのサブバンド信号をオーバサンプリングすることと、第1のDRCのアタック時定数及び/またはリリース時定数を増加させること(すなわち、アタック時定数及び/またはリリース時定数を0とは異なる値に設定すること)との両方に関わり得る。当業者であれば、第1のDRCを遅くすることは、間接的な減速(すなわち、オーバサンプリング)と、直接的な減速(すなわち、第1のDRCの時定数を変更すること)との両方の組み合わせによって達成され得ることを理解することができる。直接減速の場合、τは、RC回路の代替パラメータであるカットオフ周波数fに、τ=RC=1/(2πf)によって関連付けられている。オーバサンプリングによる減速の代わりに、直接的に減速される第1のDRCの時定数τに(間接的に)相当する値は、オーバサンプリングレートNをサンプリングレート(例えば、44100Hz)で割ることによって計算することができる。この点で、DRCの間接的な減速と直接的な減速との組み合わせの効果は、これら2つの値の関数として容易に計算可能である。
別の態様によれば、オーディオ信号を処理して(例えば、再生されたときに)、強化された聴覚体験をオーディオデバイスで提供する方法は、a)バンドパスフィルタ(例えば、入力バンドパスフィルタ)を使用して、オーディオ信号を複数の周波数帯域にスペクトル分解する(例えば、複数のサブバンド信号にスペクトル分解し、各サブバンド信号はそれぞれの周波数帯域にある)ことを含み得る。本方法は、b)周波数帯域ごとに、周波数帯域内のオーディオ信号(例えば、サブバンド信号)をそれぞれの変調器に供給し、変調器の出力から、周波数帯域内のオーディオ信号を、それぞれの第1のダイナミックレンジコンプレッサに(例えば、第1のDRCの例としてのフィードフォワードDRCに)供給することを更に含み得る。フィードフォワードDRCは、それぞれの周波数帯域(またはサブバンド信号)の第1の処理経路の一部であり得、周波数帯域内の(変調された)オーディオ信号(例えば、サブバンド信号)は、第1の処理経路に供給され得る。第1の処理経路は、フィードフォワード経路と呼ばれる場合がある。本方法は、c)周波数帯域ごとに、周波数帯域内の変調されたオーディオ信号(例えば、変調されたサブバンド信号)をフィードフォワード圧縮して、それぞれの周波数帯域内のフィードフォワード圧縮オーディオ信号(例えば、フィードフォワード圧縮されたサブバンド信号)を取得することを更に含み得る。それに関して、フィードフォワードDRCは、瞬時DRCに対して遅くされている。この減速は、直接的または間接的に行うことができる。このダイナミックレンジ圧縮の減速により、高調波歪み成分と相互変調歪み成分とのスペクトル拡散を制御することができる。フィードフォワード圧縮周波数帯域(例えば、周波数帯域内のフィードフォワード圧縮オーディオ信号、またはフィードフォワード圧縮サブバンド信号)は、それぞれの圧縮出力に供給され得る。本方法は、d)周波数帯域ごとに、第2のDRCを含む第2の処理経路にフィードフォワード圧縮サブバンド信号を供給し、更に、隣接周波数帯域からの1つ以上のフィードフォワード圧縮サブバンド信号を、各フィードフォワード圧縮サブバンド信号がそれぞれの重み付け係数で重み付けされて、第2の処理経路に供給することを更に含み得る。それに関して、第2の処理経路内で、フィードフォワード圧縮サブバンド信号と、隣接周波数サブバンドからの重み付きフィードフォワード圧縮サブバンド信号とは、それぞれの第2のDRCによって圧縮される。第2のDRCは、(第2のDRCの例として)フィードバックDRCと呼ばれる場合がある。更に、フィードバックDRCは、フィードフォワードDRCに対して遅延させられ得る。つまり、第2の処理経路の出力は、例えば、遅延要素(例えば、バッファなど)によって意図的に遅延させられ得る。遅延は、フィードバックDRCの前または後に挿入することができる。次に、(遅延)フィードバック圧縮周波数帯域が、それぞれの周波数帯域の変調器に供給される。一般に、第2の処理経路の出力は、それぞれの変調器に供給される。変調器は、第2の処理経路の出力に応じて(例えば、第2の処理経路の出力の制御下で)動作することができる。変調器は、第2の処理経路の出力に応じて、ステップcの圧縮入力で減衰を提供することができる。本方法は、e)フィードフォワード圧縮周波数帯域(例えば、周波数帯域内のフィードフォワード圧縮オーディオ信号、またはフィードフォワード圧縮サブバンド信号)を再結合することを更に含み得る。
一実施形態では、入力バンドパスフィルタは位相線形である。更なる実施形態では、位相線形入力バンドパスフィルタは、周波数領域で動作する有限インパルス応答フィルタである。
いくつかの実施形態では、第1のDRCを瞬時DRCに対して遅くすることは、それぞれのサブバンド信号をオーバサンプリングすることに関連し得る。例えば、オーバサンプリングすることは、サブバンド信号にn点FFTを適用することと、FFT変換をn/Nサンプルだけオーバラップすることとを含み得、Nはオーバサンプリングレートであり、nはNよりも大きい。所与のnに対して、オーバサンプリングレートNは、例えば2~n/2の範囲(これは、n/2サンプルと2サンプルとの間の範囲のオーバラップに変換される)になり得る。代表的な実施態様(例えば、n=256、512、1024)の場合、オーバサンプリングレートNは、例えば、128~512の範囲であり得る。
いくつかの実施形態では、第1のDRCを瞬時DRCに対して遅くすることは、第1のDRCのアタック時定数及び/またはリリース時定数を増加させること(すなわち、アタック時定数及び/またはリリース時定数を0とは異なる値に設定すること)に関連し得る。例えば、第1のDRCを、瞬時DRCに対して遅くすることは、0.01ms~3msの範囲から選択される時定数τに基づいて、第1のDRCのアタック時定数及び/またはリリース時定数を設定することに関連し得る。同様に、第1のDRCを、瞬時DRCに対して遅くすることは、それぞれの(周波数)サブバンド内の周波数fに対応する時定数τに基づいて、第1のDRCのアタック時定数及び/またはリリース時定数を設定することに関連し得る。この周波数は、サブバンドの低域カットオフ周波数、高域カットオフ周波数、または中心周波数の場合がある。
いくつかの実施形態では、第1のDRCを瞬時DRCに対して遅くすることは、それぞれのサブバンド信号をオーバサンプリングすることと、第1のDRCのアタック時定数及び/またはリリース時定数を増加させること(すなわち、アタック時定数及び/またはリリース時定数を0とは異なる値に設定すること)との両方に関連し得る。当業者であれば、第1のDRCを遅くすることは、間接的な減速(すなわち、オーバサンプリング)と、直接的な減速(すなわち、第1のDRCの時定数を変更すること)との両方の組み合わせによって達成され得ることを理解することができる。直接減速の場合、τは、RC回路の代替パラメータであるカットオフ周波数fに、τ=RC=1/(2πf)によって関連付けられている。オーバサンプリングによる減速の代わりに、直接的に減速される第1のDRCの時定数τに(間接的に)相当する値は、オーバサンプリングレートNをサンプリングレート(例えば、44100Hz)で割ることによって計算することができる。この点で、DRCの間接的な減速と直接的な減速との組み合わせの効果は、これら2つの値の関数として容易に計算可能である。
健康人の機能処理を模倣するDSP方法は、客観的にも主観的にも豊かなリスニング体験を生み出すために不可欠である。音響処理によって基底膜及びMOCの働きをより正確に再現することにより、HIの聴取者及び健康な聴取者の両者は、より明瞭で自然な音をオーディオデバイスで楽しむことができる。
別段の定義がない限り、本明細書で使用する全ての技術用語は、本技術が属する技術分野の当業者によって一般的に理解されるものと同じ意味を有する。
本明細書において使用される用語「オーディオデバイス」は、携帯電話、コンピュータ、テレビ、補聴器、ヘッドフォン、及び/またはスピーカシステムを含むがこれらに限定されない、オーディオを出力する任意のデバイスと定義されている。
本明細書において使用される句「ダイナミックレンジ圧縮」または「DRC」は、オーディオ信号のダイナミックレンジを縮小させるオーディオプロセスと定義されている。コンプレッサは、フィードフォワード設計またはフィードバック設計のいずれかを有し得る。ダイナミックレンジ圧縮は、瞬時に行われる場合もあれば、コンプレッサのアタック時定数及びリリース時定数の調整を通じてレートが制御される場合もある。
本明細書において使用される句「間接的に減速される」は、マルチレート信号処理など、コンプレッサのアタック時間及びリリース時間を調整すること以外の手段によってDRCを減速させることと定義されている。
本明細書において使用される句「直接的に減速される」は、コンプレッサのアタック時定数及びリリース時定数を調整することによってDRCを減速させることと定義されている。
本明細書において使用される句「バンドパスフィルタ」は、特定の範囲内の周波数を(実質的に)通過させ、その範囲外の周波数を減衰させるデバイスと定義されている。
本明細書において使用される句「位相線形」は、フィルタの位相応答が周波数の線形関数であり、入力信号の全ての周波数成分が時間的に同じ一定量だけ移動されるようにして、結果として位相歪みが生じない特性と定義されている。
本明細書において使用される句「高調波歪み」は、非線形系に起因する元の周波数の倍数の生成と定義されている。
本明細書において使用される句「相互変調歪み」は、2つ以上の信号が非線形系において混在する場合に生成される外積周波数の発生と定義されている。
本明細書において使用される句「コンピュータ可読記憶媒体」は、フラッシュメモリを備えたUSB記憶装置、CD-ROM、DVDまたはBluRay(登録商標)、ディスクまたはテープを含むがこれに限定されない、固形の非一時的な記憶媒体と定義されている。この記憶媒体はまた、ユーザがアクセス可能なサーバ内の物理的な記憶場所であって、例えば、ユーザのデバイスにコンピュータプログラムをインストールするためにダウンロードするための記憶場所、またはクラウドコンピューティングのためにダウンロードするための記憶場所であってもよい。
本開示の上記及び他の利点ならびに特徴を獲得することが可能な方法を説明するために、上で簡潔に説明した原理のより具体的な説明が、添付の図面に示されているその特定の実施形態を参照することによって提供される。これらの図面は、本開示の例示的な実施形態のみを示し、したがってその範囲を限定するものと見なされるべきではないことを理解されたい。本明細書の原理は、添付の図面の使用により、追加の特定性及び詳細と合わせて説明され、明らかにされる。
聴覚障害を持つ聴取者におけるダイナミックレンジの減少を示すグラフを示す。 聴覚系の処理モデルと、聴覚変調に影響を与える求心路及び遠心路とを示す。 先行技術の補聴器回路を示す。 基底膜及び内側オリーブ蝸牛複合体に触発されたコアデジタル信号処理回路を示す。 信号がスペクトル分解され、並列的に圧縮され、再結合される例示的な実施形態を示す。 図5の構成を使用して周波数歪みが低減されたスペクトログラムを示す。 HI対象者の心理測定的同調曲線をシャープにする、本明細書に開示される生物学的に設計されたDSP技術の実施例を示す。 2つの圧縮された試験信号からの歪みパターンを示す。テスト信号がバンドパスフィルタの仮想的なエッジの近くに移動されると、出力バンドパスフィルタが使用されていない場合は、歪みパターンがより対称的になる。 信号が第1の信号経路と第2の信号経路(被処理経路と未処理経路)とに分割され、その後、ユーザ定義の比率で再結合される更なる実施形態を示す。 信号が第1の信号経路と第2の信号経路とに分割され、その後、ユーザ定義の比率で再結合される更なる実施形態を示す。 信号が、各周波数帯域で第1の信号経路と第2の信号経路とに分割され、その後、周波数帯域に従ってユーザ定義の様々な比率で再結合され得る追加の実施形態を示す。 スペクトル分解されたオーディオ信号において、図11の構造を使用する技術を利用した、より広範な実施例を示す。 フィードバックDRCでの制御信号が、隣接周波数帯域内の同じ信号の重み付けされたバージョンを含み得る実施例を示す。 本技術の特定の態様を実施するためのシステムの実施例を示す。
以下に、本開示の様々な例示的な実施形態を詳細に説明する。具体的な実施態様について説明しているが、これは説明することのみを目的として行われていることを理解しておく必要がある。当業者であれば、本開示の趣旨及び範囲から離れることなく、他の構成要素及び構成を使用できることを認識するであろう。
人間の耳の機能処理を模倣するオーディオ処理アルゴリズムを作成するには、まず健康な聴覚の枠組みを開発しなければならない。一般に、正常聴覚のモデルは、聴覚系の信号処理経路の生理学的部分をシミュレートするカスケード段で構成されている。Meddis,R.によって開発されたモデル(Meddis, R., N. R. Clark, W. Lecluyse, and T. Jurgens, “BioAid - A Biologically Inspired Hearing Aid”. Audiological Acoustics 52: 2013, 148-152, 2013を参照のこと)は、図2の聴覚末梢系のモデルに見られるように、聴覚神経の発火パターンを忠実に表現することを目的としている。最初に、音響入力信号はフィルタ処理される。この処理は、外耳及び中耳201の、周波数に依存した、アブミ骨の変位に対する音圧の伝達を模倣している。続いて、信号は、フィルタバンク202を用いて周波数帯域に分解される。フィルタバンクは、外有毛細胞の寄与をモデル化した非線形経路と、基底膜の受動的応答をモデル化した線形経路とで構成されている。後段は、ステレオ変位と、内有毛細胞203の電位変動と、最終的に内有毛細胞と聴覚神経205との間に位置するシナプス間隙204への伝達物質放出とをシミュレートする。
同側の音響反射作用(AR)206と、同側の内側オリーブ蝸牛反射作用(MOC)207とをモデル化するために、2つの遠心性フィードバックループが付加されている。MOC207フィードバックループは、フィルタバンクの非線形経路における活動の減衰として周波数局在的に組み込まれている。減衰の量は、脳幹208レベルの対応する周波数帯域での総スパイク活動によって制御される。BM応答のMOC減衰は、音響刺激の定常部分の間に増大し、刺激の消失後に50msの時定数で減衰する。刺激の開始からMOC減衰の開始までの10msの遅延は、シナプス潜時を模倣するために使用される。音響反射作用206は、全てのニューロンの総活動に対するアブミ骨応答の減衰として組み込まれる。
この健康な聴覚のモデルは、図3に示すように、Meddis et al.の「BioAid-algorithm」の基礎を形成した。最初に、オーディオ信号は、制御入力301に供給され、次に、入力バンドパスフィルタ303(これは、再帰的な無限インパルス応答(IIR)フィルタであり、結果として位相歪みを導入する)によって複数の周波数帯域にスペクトル分解302される。各周波数帯域は、パラメータが各周波数帯域に対して異なるものの全て同じ演算器を有する、概略的に示された複数の並列チャネルで処理される。各周波数帯域はそれぞれ、圧縮入力304に供給され、(時定数ゼロをもつ)瞬時ダイナミックレンジコンプレッサ305によってフィードフォワード圧縮される。圧縮出力306からは、オーディオ信号は、フィードバックDRC307によって処理され、このフィードバックDRC307は、瞬時DRC305に対して遅延している。続いて、圧縮されたオーディオ信号は、瞬時のフィードフォワードDRCに供給されるオーディオ信号を減衰させるように、変調器308を通って変調される。
遅延フィードバックDRC処理は、2つの調整可能パラメータ、すなわち、閾値パラメータ及び強度パラメータによって特徴付けられる。閾値パラメータは、フィードバック処理が機能し始める、瞬時フィードフォワードDRCからの出力のレベルを指定する。強度パラメータは、フィードバック処理がアクティブなときに適用される減衰の量を決定するものであり、フィードバック処理の閾値に対するフィードバック処理プロセスへの入力のdB単位の比率で倍加される(したがって、減衰値をdBで与える)スカラ量である。
圧縮出力306からのこの圧縮されたオーディオ信号は、出力IIRバンドパスフィルタ309を通過させて、歪みのスペクトル拡散を制御する。この二次的なIIRフィルタ309は、入力IIRバンドパスフィルタ303と同じ通過帯域を有する。その後、圧縮された周波数帯域は、ゲイン310によって変調され、最後に、演算器311において再結合されて、制御出力に供給すべき完全な広帯域オーディオ信号を再度形成する。
上記のように、このアルゴリズムは、IIRフィルタ303、309、及び瞬時DRC305の使用及び構成に起因する主観的な聴覚体験に際しての欠点を有する。この構成では、可聴歪みの拡散が制限されなくなり、特に軽度の難聴のユーザに対しては、知覚品質に悪影響を及ぼすことになる(例えば、図6、8を参照)。このアルゴリズムは、実社会での使用事例(例えば、騒音の中での会話)において難聴の聴取者を支援する補聴アルゴリズムとして設計されているため、オーディオコンテンツをパーソナライズするには不十分なモデルであった。この点で、本発明の目的は、幅広いNH聴取者及びHI聴取者のための客観的及び主観的なリスニング体験を改善することである。
図4及び図5には、本発明の例示的な実施形態が示されている。処理入力401に広帯域オーディオ信号が供給され、次いで、広帯域オーディオ信号は、複数の周波数帯域にスペクトル分解(501)される(例えば、複数のサブバンド信号にスペクトル分解され、各サブバンド信号がそれぞれの周波数帯域にある)。スペクトル分解は、例えば、入力バンドパスフィルタ402、502によって行われ得る。各周波数帯域は、それぞれの中心周波数fと、低域カットオフ周波数及び/または高域カットオフ周波数とを有し得る。
各周波数帯域はそれぞれ、圧縮入力403に供給され、フィードフォワードDRC404によってフィードフォワード圧縮される。フィードフォワードDRC404(またはDRC404によって適用されるダイナミックレンジ圧縮)は、瞬時DRCに対して遅くされている。この減速は、直接的であるかまたは間接的である場合がある。フィードフォワード圧縮を間接的に遅くすることは、DRCのアタック時定数及び/またはリリース時定数を調整すること以外の手段で達成され得る。この間接的な減速は、有限インパルス応答フィルタと、その後に続く信号のオーバサンプリングとを利用して発生させることができ、これにはフィードフォワード圧縮を瞬時DRCに対して遅くするという正味の効果がある。この場合は、圧縮された周波数帯域は、例えば、元のサンプルレート及び/または更なる処理及び音質のための十分なレートにダウンサンプリングされる。この手法は、アルゴリズムの計算効率を向上させるだけでなく、分析帯域幅とは無関係に歪みの拡散をパラメータ化する機会を更に提供する。別の実施形態では、フィードフォワードDRC404は、DRC404のアタック時定数及び/またはリリース時定数を調整することによって直接的に減速される。この遅くした圧縮は、いずれの場合も、先行技術と比較して、高調波歪み成分及び相互変調歪み成分のスペクトル拡散の減少をもたらす。
フィードフォワードDRC404の直接減速のための時定数τは、信号処理を受ける周波数の範囲、例えば、スペクトル分解によって出力される周波数帯域の範囲に基づいて決定され得る。いくつかの実施形態では、この範囲は、60Hz~20kHzに及んでもよい。対応する周波数fの時定数τは、τ=1/(2πf)により与えられる。これにより、周波数帯域の範囲は、フィードフォワードDRC404を直接減速するための時定数τの範囲に変換され得る。60Hzから20kHzに及ぶ周波数範囲の実施例の場合、時定数τの対応する範囲は、約0.008ms~約2.65msに及ぶ。よって、いくつかの実施形態では、時定数τの範囲が0.01ms~3msとなるように選択される場合がある。その場合、フィードフォワードDRC404を直接減速するのに用いられる実際の時定数τを、時定数の範囲(複数可)から選択することができる。フィードフォワードDRC404を直接減速するためのアタック時定数及び/またはリリース時定数は、例えば、Fred Floru, Attack and Release Time Constants in RMS-Based Compressors and Limiters, 99th AES Convention, 6-9 October 1999に記載されているようにして、選択された時定数τから計算することができる。
特に、時定数τの上記範囲は、フィードフォワードDRC404のパラメータの典型的な更新レートに適合する。例えば、44,100Hz及び48,000Hzのサンプリングレートに対して64サンプルごとにフィードフォワードDRC404を更新すると、それぞれ1.45ms及び1.33msの更新間隔が得られ、これらは時定数τの上記範囲に収まる。
いくつかの実施形態では、所与の周波数帯域でフィードフォワードDRC404を減速するための時定数τは、それぞれの周波数帯域の範囲内の周波数fによって決まり得る。例えば、周波数fは、それぞれの周波数帯域に対するRCフィルタ(例えば、ハイパスフィルタ、ローパスフィルタ、またはバンドパスフィルタ)の特性周波数fとなるように選択されてもよい。この特性周波数fは、例えば、RCフィルタの低域カットオフ周波数、高域カットオフ周波数、または中心周波数(または同様に、それぞれの周波数帯域の低域カットオフ周波数、高域カットオフ周波数、または中心周波数)である場合がある。この場合もやはり、所与の周波数帯域の時定数τは、τ=1/(2πf)またはτ=1/(2πf)によって決定することができ、フィードフォワードDRC404を直接減速するためのアタック時定数及び/またはリリース時定数は、例えば、Fred Floru, Attack and Release Time Constants in RMS-Based Compressors and Limiters, 99th AES Convention, 6-9 October 1999に記載されているようにして、時定数τから計算することができる。いくつかの実施形態では、時定数は、RCフィルタのRC時定数、τ=RCであってもよい。
上記のように、フィードフォワードDRC404の間接的な減速では、係数N(例えば、128、256、512など)による信号のオーバサンプリングを伴う場合がある。例えば、信号処理は、n点FFT(例えば、256点FFTまたは512点FFT)を適用した後に、FFT領域で行ってもよい。例えば、n点FFTを各周波数帯域に適用してもよく、またはスペクトル分解をFFT領域で処理してもよい。その場合、各周波数帯域の変換は、n/Nサンプル(例えば、256点FFT及びN=128のオーバサンプリングレートの場合は2サンプル)だけオーバラップされ得る。これは、理論上の(サブバンド)サンプルレートのN倍大きいレートが使用されることを意味する。しかし、このレートは、依然として、それぞれの周波数帯域におけるフルデータレートよりもn/Nだけ遅いレートである。この相対的な遅さは、フィードフォワードDRC404が、アタック時定数及びリリース時定数を適用したフルレートの瞬時DRCのように動作することを意味する。ちなみに、n点FFTを適用すると、サンプルレートが(例えば、各周波数帯域で)大幅に低下し、それにより、時間領域での実施と比較して、処理が大幅に節約されるという効果がある。所与のnについて、オーバサンプリングレートNは、例えば2からn/2に及び得る(これは、n/2サンプルと2サンプルとの間の範囲のオーバラップに変換される)。代表的な実施態様(例えば、n=256、512、1024)の場合、オーバサンプリングレートNは、例えば、128~512の範囲であり得る。
上記のように、瞬時DRCに対して第1のDRCを遅くすることは、それぞれのサブバンド信号をオーバサンプリングすることと、第1のDRCのアタック時定数及び/またはリリース時定数を増加させること(すなわち、アタック時定数及び/またはリリース時定数を0とは異なる値に設定すること)との両方に関わり得る。当業者であれば、第1のDRCを遅くすることは、間接的な減速(すなわち、オーバサンプリング)と、直接的な減速(すなわち、第1のDRCの時定数を変更すること)との両方の組み合わせによって達成され得ることを理解することができる。直接減速の場合、τは、RC回路の代替パラメータであるカットオフ周波数fに、τ=RC=1/(2πf)によって関連付けられている。オーバサンプリングによる減速の代わりに、直接的に減速される第1のDRCの時定数τに(間接的に)相当する値は、オーバサンプリングレートNをサンプリングレート(例えば、44100Hz)で割ることによって計算することができる。この点で、DRCの間接的な減速と直接的な減速との組み合わせの効果は、これら2つの値の関数として容易に計算可能である。
重要なことには、フィードフォワードDRC404を遅くすることはまた、出力バンドパスフィルタ309を備える必要性に取って代わり、それによって、残っている高調波歪みの分布がより対称的になる。健康な聴覚系では、蝸牛プロセス自体が一連の変化する特性を持つ共鳴システムと考えることができるため、自然な歪みが基底膜の全ての周波数領域で対称的に発出する。図8に見られるように、所与の周波数の歪みパターンが、出力バンドパスフィルタのバンドエッジの1つに向かって移動すると(パネル802、803を参照)、歪みパターンは非対称的に短縮される(パネル802を参照)。出力バンドパスフィルタが存在しない場合、高調波の対称性はより良好に保持され、この結果として、基底膜が作り出す自然な歪みをより良好にエミュレートする。
圧縮出力405からは、オーディオ信号は、フィードバックDRC406によって処理される。フィードバックDRC406は、フィードフォワードDRCに対して遅延している。フィードバック経路は、フィードフォワードDRCプロセスの出力から引き出される。フィードバック経路は、特定の閾値を超える信号部分を取得するように閾値選定することによって、減衰させることができる。その場合、この信号は、時間的平滑化のためにローパスフィルタに通されてもよく、スカラ係数が乗算されてもよい。上記の遅延は、例えば、リングバッファなどのバッファを使用することによって獲得され得る。これは、その遅延によってMOCフィードバック系のシナプス遅延をシミュレートする減衰値のストリームをもたらす。この値のストリームは、その後、各帯域内のフィードフォワードDRC404に供給されるオーディオ信号を変調するのに使用される。変調、フィードフォワード圧縮、及びフィードバック圧縮は、連続的に進行する。したがって、フィードバックループは、圧縮をオーディオ信号レベルに動的に適応させ、聴覚系で生理学的に発生するプロセスである離調音マスキングのより効果的な緩和を可能にする。
周波数帯域は、ゲイン408によって変調され得、最後に、演算器503において再結合され得て、制御出力504に供給すべき完全な広オーディオ帯域信号を再度形成する。各周波数帯域は、それぞれ独自の明確なパラメータ、例えばゲイン、減衰係数などを有してもよい。
本発明の別の例示的な実施形態が図9に示され、図4、図5の構成に従って処理された音が、第1の信号伝送経路(または信号経路)と第2の信号伝送経路(または信号経路)とに分割される。具体的には、広帯域オーディオ信号が、処理入力901に供給され、次いで、第1の経路(第1の信号経路)902と第2の経路(第2の信号経路)903とに分割される。本実施例では、第2の経路903は、遅延904及び保護リミッタ905のみを受ける。対照的に、第1の経路902では、制御入力901からのオーディオ信号は、図4の構成に従ってスペクトル分解されて処理される。各経路902、903は、それぞれ重み付け演算器906及び907を含み得る。例えば、これらの重み付け演算器906及び907は、単一制御変数910によってユーザによる調整が可能な共通関数によって互いに関係付けられてもよい。その後、これらの経路902及び903は、それらの重み付け係数に従って演算器908において再結合され、処理出力909に供給される。
並列圧縮は、ユーザが、未処理またはわずかに処理された「乾いた」音を処理された「湿った」音と混合できるようになるという利益を提供し、主観的な好みに基づいて処理をカスタマイズできるようにする。例えば、これにより、聴覚障害を持つユーザが、中程度から低度の難聴のユーザと比較して、大いに処理された音を高い比率で使用することが可能になる。更に、最も高いピークを下げるのではなく、最も弱い音を引き上げることにより、オーディオ信号のダイナミックレンジを縮小することで、音に聞きやすいディティールを与える。人間の耳は、大きな音が急激に音量を下げられることに対しては敏感であるが、弱い音が音量を上げられることに対してはあまり敏感ではない。このミキシング方法は、この観察結果を巧みに利用しており、ダイナミックレンジコンプレッサを単独で使用する場合と比較して、より自然に聞こえるダイナミックレンジの縮小をもたらす。更に、並列圧縮は、会話に関する理解、及び/または完全な本来の音色で音楽を聴くことに特に有用である。
2つの異なる信号経路を混合するには、経路内の信号が位相線形性に従うか、もしくは位相歪みを使用して経路の同一位相に入る必要があり、または経路混合変調器は、相関信号を合計して制御出力にオーディオ信号を供給する際の位相相殺を防ぐために、位相補正ネットワークを必要とする。特に、再帰的入力及び出力IIRバンドパスフィルタがオーディオ信号に位相歪みを導入するので、先行技術のアプローチを使用する並列圧縮は問題がある。位相歪み信号を同様のオーディオ信号と重ね合わせると、いわゆるコムフィルタ処理効果が発生し、結果の音質に悪影響を与える可能性がある。ユーザはこれらの影響に敏感であり、それによって主観的な聴覚体験を損なうことになる。
本発明の更なる例示的な実施形態が図10に示されており、処理入力1001に広帯域オーディオ信号が供給され、次いで広帯域オーディオ信号は、図3と同じ処理構成を利用した第1の被処理経路1002(第1の信号伝送経路、または第1の信号経路)と、第2の被処理経路1003(第1の信号伝送経路、または第1の信号経路)とに分割される。図9の構成と同様に、位相相殺及びコムフィルタ処理効果を防ぐために、各被処理経路の位相は同期していなければならない。第2の被処理経路1003は、例えば、ユーザが経路比を調整して、会話に関するより良好な理解を可能にすることができるようにする、及び/またはそれぞれの背景雑音環境において、ユーザが、ユーザにとって主観的により快適な音楽聴覚体験を得られるようにする、会話理解アルゴリズムなどの音声強調アルゴリズムを含むことができる。更なる実施例はまた、図4に示された構成を使用する異なってパラメータ化されたプロセスを含んでもよく、一般に、好ましくは線形位相特性を有する、補聴アルゴリズムなどの任意の音響処理アルゴリズムが、第1の被処理経路1002と混合されてもよい。2つの被処理経路は、次のいずれかのルールに従っていなければならない。各経路の信号は、(i)位相線形性に準拠するか、(ii)同一の位相歪みを導入するか、または(iii)相関信号を合計して出力を形成する際の位相相殺を防ぐために、位相補正ネットワークを含む必要がある。好ましくは、選択肢(i)または選択肢(ii)が実装されるが、これが無駄のない簡単な実装を可能にするためである。
本発明の更なる例示的な実施形態が図11及び12に示されており、処理入力1101、1201に広帯域オーディオ信号が供給され、次いで広帯域オーディオ信号は、複数の周波数帯域にスペクトル分解される(例えば、複数のサブバンド信号にスペクトル分解され、各サブバンド信号がそれぞれの周波数帯域にある)。スペクトル分解は、例えば、入力バンドパスフィルタ1202によって行われ得る。各周波数帯域(例えば、サブバンド信号)はそれぞれ、第1の経路(第1の信号経路)1103と第2の経路(第2の信号経路)1104とに分割される。本実施例では、第2の経路1104は、遅延1105及び保護リミッタ1106のみを含むので、処理が軽い。その一方、第1の経路1103は、図5に示された構成と同様に処理される。すなわち、第1の経路の周波数帯域は、圧縮入力に供給され、フィードフォワードDRC404によってフィードフォワード圧縮される。圧縮出力からは、オーディオ信号は、フィードバックDRC406によって処理され、このフィードバックDRC406は、フィードフォワードDRC404に対して遅延し得る。つまり、フィードバック処理経路の出力は、例えば、遅延要素(例えば、バッファなど)によって意図的に遅延させられ得る。遅延は、フィードバックDRCの前または後に挿入することができる。続いて、圧縮されたオーディオ信号は、フィードフォワードDRC404に供給されるオーディオ信号を減衰させるように、変調器407を通って変調され得る。次に、圧縮された周波数帯域は、ゲイン408、1107によって変調され得る。第1の周波数帯域経路及び第2の周波数帯域経路は、それぞれ、重み付け演算器1108及び1109を含み得る。ここで、これらの重み付け演算器1108及び1109は、単一制御変数1112によってユーザによる調整が可能な共通関数によって互いに関係付けられてもよい。その後、これらの経路1103及び1104は、それらの重み付け係数に従って演算器1110において再結合され、処理出力1111に供給される。最後に、周波数帯域(例えば、サブバンド信号)は、演算器1203で再結合されて、制御出力1204に供給すべき完全な広オーディオ帯域信号を再度形成する。図11及び図12の構成は、重要なことに、ユーザが、信号の音声スペクトルにおいて、どの周波数を処理するかについて、はるかに多くの制御を可能にする。例えば、高音域が強い楽曲では、高周波数範囲にわたって音を処理することが好ましい場合がある。逆に、約150Hz~4kHzの人間の音声に耳を傾けている間は、より狭いスペクトルに的を絞って処理を行ってもよい。一般に、スペクトル処理は、計算を節約する目的のために調整することができる。
本発明の更なる例示的な実施形態が図13に示されている。処理入力1301に広帯域オーディオ信号が供給され、次いで、広帯域オーディオ信号は、複数の周波数帯域にスペクトル分解される(例えば、複数のサブバンド信号にスペクトル分解され、各サブバンド信号がそれぞれの周波数帯域にある)。スペクトル分解は、例えば、入力バンドパスフィルタ1302によって行われ得る。各周波数帯域はそれぞれ、圧縮入力1303に供給され、フィードフォワードDRC1304によってフィードフォワード圧縮される。フィードフォワードDRC1304は、瞬時DRCに対して遅くされている。これは、直接的または間接的に、例えば上記のようにして行われ得る。複数の周波数帯域1306の圧縮出力1305であって、それぞれの周波数帯域からの各圧縮出力に、個別の重み付け1307、1308、1309が割り当てられている圧縮出力1305からは、それぞれのオーディオ信号は、フィードバック圧縮1314によって処理される。図13は、単一の周波数帯域についてのみ、隣接周波数帯域からの重み付きフィードフォワード圧縮オーディオ信号の供給を示しているが、各周波数帯域におけるフィードバック圧縮が、それぞれの隣接周波数帯域からの入力として、重み付きフィードフォワード圧縮オーディオ信号を受け取り得ることが理解されよう。フィードバックDRC1314は、フィードフォワードDRC1304に対して遅延させられ得る。つまり、フィードバックDRCの出力は、例えば、遅延要素(例えば、バッファなど)によって意図的に遅延させられ得る。遅延は、フィードバックDRCの前または後に挿入することができる。複数の遅延フィードバック圧縮オーディオ信号は、フィードフォワードDRC1304に供給されるオーディオ信号を減衰させるように、変調器1310を通って変調され得る。次に、圧縮された周波数帯域は、ゲイン1311によって変調され得、最後に、演算器1312において再結合されて、制御出力1313に供給すべき完全な広オーディオ帯域信号を再度形成する。所与の周波数帯域のオーディオ信号を、1つ以上の隣接周波数帯域の信号レベルを含む関数として減衰させる機能により、拡張聴覚体験のためのより細かなパラメータ化の度合いが提供される。更に、このプロセスは、耳の中のオリーブ蝸牛系で自然に行われている(Effects of electrical stimulation of efferent olivochoclear neurons on cat auditory-nerve fibers. Ill, Tuning curves and thresholds at CF, Guinan & Gifford, 1988)。したがって、このオーディオ処理の構成は、聴覚幹の健康な聴覚をより厳密にモデル化する。
図14は、システムの構成要素が接続1405を使用して互いに通信しているコンピューティングシステム1400(例えば、オーディオデバイス、スマートフォンなど)の実施例を示す。接続1405は、バスを介した物理的接続、またはチップセットアーキテクチャなどのプロセッサ1410への直接接続であり得る。接続1405はまた、仮想接続、ネットワーク接続、または論理接続であってもよい。
いくつかの実施形態では、コンピューティングシステム1400は、本開示で説明した機能が、データセンタ、複数のデータセンタ、ピアネットワークなどの中で分散され得る分散システムである。いくつかの実施形態では、説明したシステム構成要素の1つ以上は、それぞれが、そのために構成要素を説明した機能の一部または全てを実行する多くのそのような構成要素を表す。いくつかの実施形態では、構成要素は、物理デバイスまたは仮想デバイスであってよい。
例示的なシステム1400は、少なくとも1つの処理ユニット(CPUまたはプロセッサ)1410と、読み出し専用メモリ(ROM)及びランダムアクセスメモリ(RAM)などのシステムメモリ1415を含む様々なシステム構成要素をプロセッサ1410に結合する接続1405とを含む。コンピューティングシステム1400は、プロセッサ1410に直接接続されているか、近接しているか、またはプロセッサ1410の一部として統合されている高速メモリのキャッシュを含み得る。
プロセッサ1410は、任意の汎用プロセッサと、ストレージデバイス1430に格納されたサービス1432、1434、及び1436など、プロセッサ1410を制御するように構成されたハードウェアサービスまたはソフトウェアサービスと、ソフトウェア命令が実際のプロセッサ設計に組み込まれた専用プロセッサとを含み得る。プロセッサ1410は、本質的に、複数のコアまたはプロセッサ、バス、メモリコントローラ、キャッシュなどを含む完全に自己完結型のコンピューティングシステムであり得る。マルチコアプロセッサは、対称型または非対称型であり得る。
ユーザインタラクションを可能にするために、コンピューティングシステム1400は、スピーチ用のマイクロフォン、ジェスチャ入力用またはグラフィック入力用のタッチセンシティブスクリーン、キーボード、マウス、モーション入力、スピーチなどの任意の数の入力機構を表すことができる入力デバイス1445を含む。いくつかの例では、入力デバイスはまた、オーディオジャックなどを介するようなオーディオ信号を含んでもよい。コンピューティングシステム1400はまた、出力デバイス1435を含むこともでき、これは、当業者に知られているいくつかの出力機構のうちの1つ以上であってよい。場合によっては、マルチモーダルシステムにより、ユーザがコンピューティングシステム1400と対話するための複数のタイプの入力/出力を提供することが可能となり得る。コンピューティングシステム1400は、通信インタフェース1440を含んでもよく、これは、一般に、ユーザ入力及びシステム出力の制御及び管理を行い得る。いくつかの例では、通信インタフェース1440は、1つ以上のネットワーク(例えば、ブルートゥース(登録商標)、インターネットなど)を介して1つ以上のオーディオ信号を受信するように構成され得る。特定のハードウェア構成で動作することに制限はなく、したがって、ここでの基本的な機能は、ハードウェアまたはファームウェアの構成が開発されるとき、改善されたそれらの構成に簡単に置き換えることができる。
ストレージデバイス1430は、不揮発性メモリデバイスであってもよく、磁気カセット、フラッシュメモリカード、ソリッドステートメモリデバイス、デジタル多用途ディスク、カートリッジ、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、及び/またはこれらのデバイスのいくつかの組み合わせなど、コンピュータによってアクセス可能なデータを記憶することができるハードディスクまたは他のタイプのコンピュータ可読媒体であり得る。
ストレージデバイス1430は、ソフトウェアサービス、サーバ、サービスなどを含むことができ、そのようなソフトウェアを定義するコードがプロセッサ1410によって実行されると、システムに機能を実行させる。いくつかの実施形態では、特定の機能を実行するハードウェアサービスは、その機能を実行するために必要な、例えば、プロセッサ1410、接続1405、出力デバイス1435などのハードウェア構成要素に関連してコンピュータ可読媒体に格納されたソフトウェア構成要素を含んでもよい。
説明を明確にするために、場合によっては、本技術は、ソフトウェアで具体化される方法におけるデバイス、デバイス構成要素、ステップもしくはルーチン、またはハードウェアとソフトウェアの組み合わせを含む機能ブロックを含む個々の機能ブロックを含むものとして提示され得る。
本提示技術は、健康人の耳の機能処理をより忠実に模倣する、改良された、生物学的知見に基づいたDSPアルゴリズムを作成する。本発明は、先行技術のDSP方法論に固有の制限、すなわち、制約のない周波数歪み及び位相歪みを回避する。この点で、本発明は、難聴のある個人と健康な聴覚を持つ個人との両者に、強化されたリスニング体験を提供するものであり、両者は、より豊かで鮮明になるオーディオコンテンツのリスニング体験を経験する。
追加の実施形態
本開示の更なる例示的な実施形態は、以下に列挙された例示的な実施形態(EEE)に要約されている。
第1のEEEは、オーディオデバイスで再生するためのオーディオ信号を処理する方法に関し、本方法は、a)バンドパスフィルタ(402、502)を使用して、オーディオ信号(501)の複数のサブバンド信号へのスペクトル分解を実行することと、b)サブバンド信号ごとに、サブバンド信号を、それぞれの変調器(407)に供給し、変調器の出力から、サブバンド信号を、第1のダイナミックレンジコンプレッサであるDRC(404)を含むそれぞれの第1の処理経路に供給することと、c)サブバンド信号ごとに、サブバンド信号を、それぞれの第1のDRC(404)によってフィードフォワード圧縮して、フィードフォワード圧縮サブバンド信号を取得することと、d)サブバンド信号ごとに、第2のDRC(406)を含む第2の処理経路にフィードフォワード圧縮サブバンド信号を供給すること、フィードフォワード圧縮サブバンド信号を、それぞれの第2のDRC(406)によって圧縮すること、及び第2の処理経路の出力を、それぞれの変調器(407)に供給することであって、サブバンド信号を、それぞれの変調器(407)によって変調することが、第2の処理経路の出力に応じて実行される、フィードフォワード圧縮サブバンド信号を供給すること、第2のDRC(406)によって圧縮すること、及び変調器(407)に供給することと、e)フィードフォワード圧縮サブバンド信号を再結合することとを含み、フィードフォワード圧縮することが、サブバンド信号ごとに、それぞれの第1のDRC(404)を瞬時DRCに対して遅くすることを含む。
第2のEEEは、オーディオデバイスで再生するためのオーディオ信号を処理する方法に関し、本方法は、未処理のオーディオ信号を、第1の信号経路(903、1003)と第2の信号経路(902、1002)とに分割することと、第1の信号経路(902、903)内のオーディオ信号を処理することと、第1の信号経路及び第2の信号経路(902/903、1002/1003)の出力を比率(910、1004)で再結合することとを含み、第1の信号経路(902、1002)での処理が、a)バンドパスフィルタ(402、502)を使用して、オーディオ信号(501)の複数のサブバンド信号へのスペクトル分解を実行することと、b)サブバンド信号ごとに、サブバンド信号を、それぞれの変調器(407)に供給し、変調器の出力から、サブバンド信号を、第1のダイナミックレンジコンプレッサであるDRC(404)を含むそれぞれの第1の処理経路に供給することと、c)サブバンド信号ごとに、サブバンド信号を、それぞれの第1のDRC(404)によってフィードフォワード圧縮して、フィードフォワード圧縮サブバンド信号を取得することと、d)サブバンド信号ごとに、第2のDRC(406)を含む第2の処理経路にフィードフォワード圧縮サブバンド信号を供給すること、フィードフォワード圧縮サブバンド信号を、それぞれの第2のDRC(406)によって圧縮すること、及び第2の処理経路の出力を、それぞれの変調器(407)に供給することであって、サブバンド信号を、それぞれの変調器(407)によって変調することが、第2の処理経路の出力に応じて実行される、フィードフォワード圧縮サブバンド信号を供給すること、第2のDRC(406)によって圧縮すること、及び変調器(407)に供給することと、e)フィードフォワード圧縮サブバンド信号を再結合することとを含み、フィードフォワード圧縮することが、サブバンド信号ごとに、それぞれの第1のDRC(404)を瞬時DRCに対して遅くすることを含む。
第3のEEEは、第2のEEEの方法に関し、比率(910、1004)が、ユーザ定義の比率である。
第4のEEEは、第2のEEEまたは第3のEEEによる方法に関し、第2の信号経路(903)は遅延を特徴としており、遅延信号は保護リミッタにかけられる。
第5のEEEは、EEE2~4による方法に関し、125Hz~12,000Hzの周波数のみが、第1の信号経路(902、1002)で処理される。
第6のEEEは、オーディオデバイス上で再生するためのオーディオ信号を処理する方法に関し、本方法は、a)バンドパスフィルタ(1102、1202)を使用して、オーディオ信号の複数のサブバンド信号へのスペクトル分解(1202)を実行することと、b)サブバンド信号ごとに、サブバンド信号を第1の信号経路(1103)と第2の信号経路(1103)とに分割すること、第1の信号経路(1103)内のサブバンド信号を処理すること、ならびに第1の信号経路及び第2の信号経路(1103、1104)をある比率で再結合して、処理済みサブバンド信号を取得することと、c)処理済みサブバンド信号を再結合することとを含み、サブバンド信号ごとに、第1の信号経路(1103)内のサブバンド信号の処理が、b1)サブバンド信号を、それぞれの変調器(407)に供給し、変調器の出力から、サブバンド信号を、第1のダイナミックレンジコンプレッサであるDRC(404)を含むそれぞれの第1の処理経路に供給することと、b2)サブバンド信号を、それぞれの第1のDRC(404)によってフィードフォワード圧縮して、フィードフォワード圧縮サブバンド信号を取得することと、b3)第2のDRC(406)を含む第2の処理経路にフィードフォワード圧縮サブバンド信号を供給すること、フィードフォワード圧縮サブバンド信号を、それぞれの第2のDRC(406)によって圧縮すること、及び第2の処理経路の出力を、それぞれの変調器(407)に供給することであって、サブバンド信号を変調することが、第2の処理経路の出力に応じて実行される、フィードフォワード圧縮サブバンド信号を供給すること、第2のDRC(406)によって圧縮すること、及び変調器(407)に供給することとを含み、フィードフォワード圧縮することが、サブバンド信号ごとに、それぞれの第1のDRC(404)を瞬時DRCに対して遅くすることを含む。
第7のEEEは、第6のEEEによる方法に関し、第2の信号経路(1104)は遅延を特徴としており、遅延信号は保護リミッタにかけられる。
第8のEEEは、オーディオデバイスで再生するためのオーディオ信号を処理する方法に関し、本方法は、a)バンドパスフィルタを使用して、オーディオ信号の複数のサブバンド信号へのスペクトル分解(1302)を実行することと、b)サブバンド信号ごとに、サブバンド信号を、それぞれの変調器(407)に供給し、変調器の出力から、サブバンド信号を、第1のダイナミックレンジコンプレッサであるDRC(1304)を含むそれぞれの第1の処理経路に供給することと、c)サブバンド信号ごとに、サブバンド信号を、それぞれの第1のDRC(1304)によってフィードフォワード圧縮して、フィードフォワード圧縮サブバンド信号を取得することと、d)サブバンド信号ごとに、第2のDRC(1314)を含む第2の処理経路にフィードフォワード圧縮サブバンド信号を供給し、更に、隣接周波数帯域からの1つ以上のフィードフォワード圧縮サブバンド信号を、各フィードフォワード圧縮サブバンド信号がそれぞれの重み付け係数で重み付けされて、第2の処理経路に供給すること、第2の処理経路内で、フィードフォワード圧縮サブバンド信号と、隣接周波数サブバンドからの重み付きフィードフォワード圧縮サブバンド信号とを、それぞれの第2のDRC(1314)によって圧縮すること、及び第2の処理経路の出力を、それぞれの変調器に供給することであって、サブバンド信号を変調することが、第2の処理経路の出力に応じて実行される、第2の処理経路に供給すること、第2のDRC(1314)によって圧縮すること、及び変調器に供給することと、e)フィードフォワード圧縮オーディオ信号を再結合することとを含み、フィードフォワード圧縮することが、サブバンド信号ごとに、それぞれの第1のDRC(1304)を瞬時DRCに対して遅くすることを含む。
第9のEEEは、先行EEEのいずれかによる方法に関し、サブバンド信号ごとに、それぞれの第2の処理経路(406)の出力を遅延させることを更に含む。
第10のEEEは、先行EEEのいずれかによる方法に関し、サブバンド信号ごとに、それぞれの第2の処理経路の出力が、5ms~20msの間隔の遅延量だけ遅延させられている。
第11のEEEは、先行EEEのいずれかによる方法に関し、バンドパスフィルタ(402、502)は位相線形である。
第12のEEEは、先行EEEのいずれかによる方法に関し、バンドパスフィルタ(402、502)が、周波数領域で動作する有限インパルス応答フィルタである。
第13のEEEは、先行EEEのいずれかによる方法に関し、第1のDRC(404)は、スペクトル分解プロセスの一部としてのマルチレート信号処理によって遅くされる。
第14のEEEは、EEE1~12のいずれかによる方法に関し、第1のDRC(404)は、第1のDRC(404)のアタック時定数及び/またはリリース時定数を変更することによって遅くされる。
第15のEEEは、先行EEEのいずれかによる方法に関し、オーディオデバイスは、携帯電話、タブレット、コンピュータ、テレビ、ヘッドフォン、補聴器、またはスピーカシステムのいずれかである。
第16のEEEは、先行EEEのいずれかによる方法に関し、1つの周波数帯域につき1つのバンドパスフィルタのみが使用される。
第17のEEEは、先行EEEのいずれかの方法に従ってオーディオ信号を処理するためのプロセッサを含むオーディオ出力デバイスに関する。
第18のEEEは、EEE1~16のいずれかの方法に従って、オーディオ出力デバイスにオーディオ処理を実行させるプログラムを格納するコンピュータ可読記憶媒体に関する。
201 外耳及び中耳
202 フィルタバンク
203 内有毛細胞(IHC)
204 IHCシナプス
205 聴覚神経
206 音響反射作用
207 MOC反射作用
208 脳幹
301 制御入力
302 スペクトル分解
303 IIR入力バンドパスフィルタ
304 圧縮入力
305 瞬時DRC
306 圧縮出力
307 フィードバックDRC
308 変調器
309 IIR出力バンドパスフィルタ
310 ゲイン
311 演算器
401 制御入力
402 入力バンドパスフィルタ
403 圧縮入力
404 フィードフォワードDRC
405 圧縮出力
406 フィードバックDRC
407 変調器
408 ゲイン
501 スペクトル分解
502 入力バンドパスフィルタ
503 演算器
504 制御出力
601 スペクトログラム-瞬時圧縮(IC)出力(1kHz入力)からの歪み
602 スペクトログラム-入力IIRバンドパスフィルタ及び出力IIRバンドパスフィルタを用いたIC出力からの歪み
603 スペクトログラム-入力FIRバンドパスフィルタを用いたDRCからの歪み
701 請求項1によるアルゴリズムを受ける前後の対象者からの心理物理的同調曲線-左耳
702 請求項1によるアルゴリズムを受ける前後の対象者からの心理物理的同調曲線-右耳
801 バンドパスフィルタを通過する歪み-中心に配置
802 バンドパスフィルタを通過する歪み-中心からずれた
803 歪み-バンドパスフィルタなし-中心に配置
804 歪み-バンドパスフィルタなし-中心からずれた
901 制御入力
902 被処理経路
903 未処理経路
904 遅延
905 保護リミッタ
906 被処理経路の重み付け演算器
907 未処理経路の重み付け演算器
908 2つの経路の再結合
909 制御出力
910 単一制御変数
1001 制御入力
1002 被処理経路1
1003 被処理経路2
1004 制御変数
1101 制御入力
1102 入力バンドパスフィルタ
1103 被処理周波数帯域経路
1104 未処理周波数帯域経路
1105 遅延
1106 保護リミッタ
1107 ゲイン
1108 被処理周波数帯域経路の重み付け演算器
1109 未処理周波数帯域経路の重み付け演算器
1110 単一制御変数
1111 制御出力
1201 制御入力
1202 入力バンドパスフィルタ
1203 周波数帯域の再結合
1204 制御出力
1301 制御入力
1302 入力バンドパスフィルタ
1303 一次周波数帯域の圧縮入力
1304 フィードフォワードDRC
1305 フィードバックDRC
1306 代替周波数帯域
1307 重み付け1
1308 重み付け2
1309 重み付け3
1310 変調器
1311 ゲイン
1312 周波数帯域の再結合
1313 制御出力
1314 フィードバックDRC

Claims (16)

  1. オーディオデバイスで再生するためのオーディオ信号を処理する方法であって、
    バンドパスフィルタ(402、502)を使用して、前記オーディオ信号(501)の複数のサブバンド信号へのスペクトル分解を実行することであって、前記複数のサブバンド信号それぞれは、各サブバンド内の少なくとも1つの基準周波数fに関連付けられることと、
    前記複数のサブバンド信号のサブバンド信号ごとに、
    前記サブバンド信号を、それぞれの変調器(407)に供給し、前記変調器の出力から、前記サブバンド信号を、第1のダイナミックレンジコンプレッサであるDRC(404)を含むそれぞれの第1の処理経路に供給することと、
    前記変調されたサブバンド信号を、フィードフォワード圧縮して、フィードフォワード圧縮サブバンド信号を取得することと、
    第2のDRC(406)を含む第2の処理経路に前記フィードフォワード圧縮サブバンド信号を供給、前記フィードフォワード圧縮サブバンド信号を、それぞれの前記第2のDRC(406)によって圧縮することと、
    記第2の処理経路の出力を、それぞれの前記変調器(407)に供給することであって、前記フィードフォワード圧縮サブバンド信号を、それぞれの前記変調器(407)によって変調すること、前記第2の処理経路の前記出力に応じて実行されることと
    前記フィードフォワード圧縮サブバンド信号を再結合することと
    を含み、
    フィードフォワード圧縮することは、前記第1のDRC(404)の1以上のアタック時定数及びリリース時定数を調整することによって、それぞれの前記第1のDRC(404)を瞬時DRCに対して直接的に遅くすることを含み、前記第1のDRC(404)のアタック時定数及び/またはリリース時定数の調整は、前記サブバンド信号内の基準周波数fに対応する基準時定数τに基づく、前記方法。
  2. 未処理のオーディオ信号を、第1の信号経路(90、100)と第2の信号経路(90、100)とに分割することと、
    前記第1の信号経路(902、1002)内の前記未処理のオーディオ信号を、請求項1に記載の方法の全てのステップを適用することによって処理することと、
    前記第1の信号経路及び前記第2の信号経路(902、903;1002、1003)の出力を比率(910、1004)で再結合することと
    を含む、請求項1に記載の方法。
  3. 前記複数のサブバンド信号のサブバンド信号ごとに、
    前記サブバンド信号を、第1の信号経路(1103)と第2の信号経路(1104)とに分割することと、
    前記第1の信号経路(1103)内の前記サブバンド信号を処理することと、
    前記第1の信号経路及び前記第2の信号経路(1103、1104)をある比率で再結合して、処理済みサブバンド信号を取得することと
    を含み、
    前記第1の信号経路(1103)内の前記サブバンド信号を処理することが、
    前記サブバンド信号を、それぞれの前記変調器(407)に供給し、前記変調器の出力から、前記サブバンド信号を、前記第1のダイナミックレンジコンプレッサであるDRC(404)を含むそれぞれの前記第1の処理経路に供給することと、
    前記サブバンド信号を、それぞれの前記第1のDRC(404)によってフィードフォワード圧縮して、前記フィードフォワード圧縮サブバンド信号を取得することと、
    前記第2のDRC(406)を含む前記第2の処理経路に前記フィードフォワード圧縮サブバンド信号を供給すること、前記フィードフォワード圧縮サブバンド信号を、それぞれの前記第2のDRC(406)によって圧縮すること、及び前記第2の処理経路の前記出力を、それぞれの前記変調器(407)に供給することと
    を含み、
    前記サブバンド信号を変調することが、前記第2の処理経路の前記出力に応じて実行される、請求項1に記載の方法。
  4. 前記比率(910)が、ユーザ定義の比率である、請求項2または請求項3に記載の方法。
  5. 前記第2の信号経路(903;1104)は遅延を特徴としており、前記遅延信号は保護リミッタにかけられる、請求項2~4のいずれか1項に記載の方法。
  6. 60Hz~20000Hzの周波数のみが、前記第1の信号経路(902;1103)で処理される、請求項2~5のいずれか1項に記載の方法。
  7. 前記複数のサブバンド信号のサブバンド信号ごとに、
    前記第2のDRC(1314)を含む前記第2の処理経路に前記フィードフォワード圧縮サブバンド信号を供給し、更に、隣接周波数帯域からの1つ以上のフィードフォワード圧縮サブバンド信号を、各フィードフォワード圧縮サブバンド信号がそれぞれの重み付け係数で重み付けされて、前記第2の処理経路に供給することと、
    前記第2の処理経路内で、前記フィードフォワード圧縮サブバンド信号と、前記隣接周波数サブバンドからの前記重み付きフィードフォワード圧縮サブバンド信号とを、それぞれの前記第2のDRC(1314)によって圧縮することと
    を含む、請求項1~6のいずれか1項に記載の方法。
  8. サブバンド信号ごとに、それぞれの前記第2の処理経路の前記出力を遅延させることを更に含み、
    任意選択で、サブバンド信号ごとに、それぞれの前記第2の処理経路の前記出力が、5ms~20msの間隔の遅延量だけ遅延させられている、請求項1~7のいずれか1項に記載の方法。
  9. 前記バンドパスフィルタ(402、502)が、周波数領域有限インパルス応答フィルタである、請求項1~8のいずれか1項に記載の方法。
  10. 前記第1のDRCを、前記瞬時DRCに対して遅くすることが、前記サブバンド信号をオーバサンプリングすることに関連している、請求項1~9のいずれか1項に記載の方法。
  11. 前記サブバンド信号が、128~512の範囲のオーバサンプリングレートNによってオーバサンプリングされる、請求項10に記載の方法。
  12. 前記オーバサンプリングすることは、前記サブバンド信号にn点FFTを適用することと、前記FFT変換をn/Nサンプルだけオーバラップすることとを含み、Nはオーバサンプリングレートであり、nはNよりも大きい、請求項10または請求項11に記載の方法。
  13. 前記第1のDRC(404)を、前記瞬時DRCに対して遅くすることは、前記第1のDRC(404)の前記アタック時定数及び/または前記リリース時定数を増加させることに関連する、請求項1~12のいずれか1項に記載の方法。
  14. 前記第1のDRCを、前記瞬時DRCに対して遅くすることは、0.01ms~3msに及ぶ範囲から選択される前記基準時定数τに基づいて、前記第1のDRC(404)の前記アタック時定数及び/または前記リリース時定数を設定することに関連する、請求項1~13のいずれか1項に記載の方法。
  15. 請求項1~14のいずれか1項の方法に従ってオーディオ信号を処理するように適合されたプロセッサを含む、オーディオ出力デバイス。
  16. オーディオ出力デバイスのプロセッサに、前記プロセッサ上で実行されたときに、請求項1~14のいずれか1項に記載の方法に従ってオーディオ処理を実行させるプログラムを格納する、コンピュータ可読記憶媒体。
JP2020569897A 2018-06-20 2019-01-16 オーディオデバイスで再生するためのオーディオ信号を処理するシステム及び方法 Active JP7237993B2 (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
EP18178873.8A EP3584927B1 (en) 2018-06-20 2018-06-20 Systems and methods for processing an audio signal for replay on an audio device
EP18178873.8 2018-06-20
US16/019,230 US10199047B1 (en) 2018-06-20 2018-06-26 Systems and methods for processing an audio signal for replay on an audio device
US16/019,230 2018-06-26
US16/244,727 US10991375B2 (en) 2018-06-20 2019-01-10 Systems and methods for processing an audio signal for replay on an audio device
US16/244,727 2019-01-10
PCT/EP2019/051041 WO2019242895A1 (en) 2018-06-20 2019-01-16 Systems and methods for processing an audio signal for replay on an audio device

Publications (2)

Publication Number Publication Date
JP2021529980A JP2021529980A (ja) 2021-11-04
JP7237993B2 true JP7237993B2 (ja) 2023-03-13

Family

ID=68578583

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020569897A Active JP7237993B2 (ja) 2018-06-20 2019-01-16 オーディオデバイスで再生するためのオーディオ信号を処理するシステム及び方法

Country Status (6)

Country Link
US (1) US10991375B2 (ja)
EP (1) EP3584928B1 (ja)
JP (1) JP7237993B2 (ja)
AU (1) AU2019289648B2 (ja)
CA (1) CA3099725A1 (ja)
WO (1) WO2019242895A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10687155B1 (en) 2019-08-14 2020-06-16 Mimi Hearing Technologies GmbH Systems and methods for providing personalized audio replay on a plurality of consumer devices
US11330377B2 (en) 2019-08-14 2022-05-10 Mimi Hearing Technologies GmbH Systems and methods for fitting a sound processing algorithm in a 2D space using interlinked parameters
US11094328B2 (en) * 2019-09-27 2021-08-17 Ncr Corporation Conferencing audio manipulation for inclusion and accessibility

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008295052A (ja) 2008-05-27 2008-12-04 Hearworks Pty Ltd 適応ダイナミックレンジ最適化サウンドプロセッサ
US20120134522A1 (en) 2010-11-29 2012-05-31 Rick Lynn Jenison System and Method for Selective Enhancement Of Speech Signals

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4180707A (en) 1977-06-21 1979-12-25 Norlin Industries, Inc. Distortion sound effects circuit
US5259033A (en) 1989-08-30 1993-11-02 Gn Danavox As Hearing aid having compensation for acoustic feedback
US5408580A (en) 1992-09-21 1995-04-18 Aware, Inc. Audio compression system employing multi-rate signal analysis
US5832444A (en) 1996-09-10 1998-11-03 Schmidt; Jon C. Apparatus for dynamic range compression of an audio signal
US6240192B1 (en) 1997-04-16 2001-05-29 Dspfactory Ltd. Apparatus for and method of filtering in an digital hearing aid, including an application specific integrated circuit and a programmable digital signal processor
US6219427B1 (en) 1997-11-18 2001-04-17 Gn Resound As Feedback cancellation improvements
US6868163B1 (en) 1998-09-22 2005-03-15 Becs Technology, Inc. Hearing aids based on models of cochlear compression
US6993480B1 (en) 1998-11-03 2006-01-31 Srs Labs, Inc. Voice intelligibility enhancement system
US6947509B1 (en) 1999-11-30 2005-09-20 Verance Corporation Oversampled filter bank for subband processing
US6618486B2 (en) 2000-05-03 2003-09-09 Robert A. Orban Controller for FM 412 multiplex power regulation
CA2354755A1 (en) 2001-08-07 2003-02-07 Dspfactory Ltd. Sound intelligibilty enhancement using a psychoacoustic model and an oversampled filterbank
US8139787B2 (en) 2005-09-09 2012-03-20 Simon Haykin Method and device for binaural signal enhancement
US7881398B2 (en) * 2006-08-21 2011-02-01 Agere Systems Inc. FFT numerology for an OFDM transmission system
US8000487B2 (en) 2008-03-06 2011-08-16 Starkey Laboratories, Inc. Frequency translation by high-frequency spectral envelope warping in hearing assistance devices
ES2319955B2 (es) 2008-12-02 2009-09-22 Universidad Politecnica De Madrid Procedimiento de amplificacion de señales de audio generadas por instrumentos musicales para preamplificadores de estado solido.
US8229125B2 (en) 2009-02-06 2012-07-24 Bose Corporation Adjusting dynamic range of an audio system
US8626516B2 (en) 2009-02-09 2014-01-07 Broadcom Corporation Method and system for dynamic range control in an audio processing system
WO2011115944A1 (en) 2010-03-18 2011-09-22 Dolby Laboratories Licensing Corporation Techniques for distortion reducing multi-band compressor with timbre preservation
US9138178B2 (en) 2010-08-05 2015-09-22 Ace Communications Limited Method and system for self-managed sound enhancement
US20150281853A1 (en) 2011-07-11 2015-10-01 SoundFest, Inc. Systems and methods for enhancing targeted audibility
US8861760B2 (en) 2011-10-07 2014-10-14 Starkey Laboratories, Inc. Audio processing compression system using level-dependent channels
EP2944097A4 (en) 2013-01-09 2016-11-23 Ace Comm Ltd METHOD AND SYSTEM FOR AUTOGERATED SOUND ENHANCEMENT
US9762198B2 (en) 2013-04-29 2017-09-12 Dolby Laboratories Licensing Corporation Frequency band compression with dynamic thresholds
US9680438B2 (en) 2015-07-01 2017-06-13 Meq Inc. Method and device for playing modified audio signals
JP6728340B2 (ja) * 2015-09-02 2020-07-22 ユニヴァーシティ オブ ワシントン 超広帯域ダイレクトサンプリングトランシーバのためのシステム及び方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008295052A (ja) 2008-05-27 2008-12-04 Hearworks Pty Ltd 適応ダイナミックレンジ最適化サウンドプロセッサ
US20120134522A1 (en) 2010-11-29 2012-05-31 Rick Lynn Jenison System and Method for Selective Enhancement Of Speech Signals

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
BioAid Part 2: From Auditory Model to Hearing Aid Algorithm,AudioPlastic,2013年01月29日,http://audioplastic.org/
Yu-Ting Kuo et. al.,Complexity-Effective Auditory Compensation for Digital Hearing Aids,2008 IEEE International Symposium on Circuits and Systems (ISCAS),2008年05月

Also Published As

Publication number Publication date
CA3099725A1 (en) 2019-12-26
US10991375B2 (en) 2021-04-27
AU2019289648B2 (en) 2022-11-17
EP3584928B1 (en) 2021-03-24
AU2019289648A1 (en) 2020-12-03
JP2021529980A (ja) 2021-11-04
WO2019242895A1 (en) 2019-12-26
EP3584928A1 (en) 2019-12-25
US20190392849A1 (en) 2019-12-26

Similar Documents

Publication Publication Date Title
CN109545233B (zh) 用于处理音频信号以在音频装置上重放的系统和方法
CN107547983B (zh) 用于提高目标声音的可分离性的方法和听力装置
JP7237993B2 (ja) オーディオデバイスで再生するためのオーディオ信号を処理するシステム及び方法
US20030185411A1 (en) Single channel sound separation
JP5248512B2 (ja) 補聴処理装置、調整装置、補聴処理システム、補聴処理方法、プログラム、及び集積回路
CN103747403A (zh) 用于依赖于声音环境分类缓解耳鸣的声音富集
CN101641968A (zh) 用于缓解耳鸣的声音富集
CN104885360A (zh) 具有声压级和频率依赖性增益的助听器
CN103517193A (zh) 用于耳鸣缓解的声音富集系统
Kates Modeling the effects of single-microphone noise-suppression
US11062717B2 (en) Systems and methods for processing an audio signal for replay on an audio device
WO2023000602A1 (zh) 一种耳机及其音频处理方法、装置、存储介质
Lezzoum et al. Noise reduction of speech signals using time-varying and multi-band adaptive gain control for smart digital hearing protectors
Patel et al. Compression Fitting of Hearing Aids and Implementation
Patel et al. Frequency-based multi-band adaptive compression for hearing aid application
JP5046233B2 (ja) 音声強調処理装置
WO2010000042A1 (en) Linear gain amplification for mid-to-high intensity sounds in a compressive sound processor
Lai et al. Adaptive dynamic range compression for improving envelope-based speech perception: Implications for cochlear implants
Negi et al. Comparative Analysis of Octave and Band Pass Filter for Improving Hearing Capability of Deaf People
JP2021157134A (ja) 信号処理方法、信号処理装置及び聴取装置
Zou Multi-Channel Dynamic-Range Compression Techniques for Hearing Devices
Zhao et al. An Improved Frequency-Shift Compression Method Based on Auto Energy Gain Compensation for Digital Hearing Aids
Moore Research data supporting" Effects of Sound-Induced Hearing Loss and Hearing Aids on the Perception of Music"
WO2017025107A2 (en) Talker language, gender and age specific hearing device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221018

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230117

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230131

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230301

R150 Certificate of patent or registration of utility model

Ref document number: 7237993

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150