JP2018174521A - 聴覚装置、方法、及び、聴覚システム - Google Patents

聴覚装置、方法、及び、聴覚システム Download PDF

Info

Publication number
JP2018174521A
JP2018174521A JP2018025398A JP2018025398A JP2018174521A JP 2018174521 A JP2018174521 A JP 2018174521A JP 2018025398 A JP2018025398 A JP 2018025398A JP 2018025398 A JP2018025398 A JP 2018025398A JP 2018174521 A JP2018174521 A JP 2018174521A
Authority
JP
Japan
Prior art keywords
speech intelligibility
indicator
speech
input signal
hearing device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018025398A
Other languages
English (en)
Other versions
JP6965178B2 (ja
JP2018174521A5 (ja
Inventor
セーレンセン シャーロット
Soerensen Charlotte
セーレンセン シャーロット
ビー. ボルト イェスパー
B Boldt Jesper
ビー. ボルト イェスパー
クセナキ アンジェリキ
Xenaki Angeliki
クセナキ アンジェリキ
ジー. クリステンセン マッズ
G Christensen Mads
ジー. クリステンセン マッズ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GN Hearing AS
Original Assignee
GN Hearing AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GN Hearing AS filed Critical GN Hearing AS
Publication of JP2018174521A publication Critical patent/JP2018174521A/ja
Publication of JP2018174521A5 publication Critical patent/JP2018174521A5/ja
Application granted granted Critical
Publication of JP6965178B2 publication Critical patent/JP6965178B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/50Customised settings for obtaining desired overall acoustical characteristics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/50Customised settings for obtaining desired overall acoustical characteristics
    • H04R25/505Customised settings for obtaining desired overall acoustical characteristics using digital signal processing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/40Arrangements for obtaining a desired directivity characteristic
    • H04R25/405Arrangements for obtaining a desired directivity characteristic by combining a plurality of transducers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/40Arrangements for obtaining a desired directivity characteristic
    • H04R25/407Circuits for combining signals of a plurality of transducers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/43Electronic input selection or mixing based on input signal analysis, e.g. mixing or selection between microphone and telecoil or between microphones with different directivity characteristics
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2225/00Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
    • H04R2225/41Detection or adaptation of hearing aid parameters or programs to listening situation, e.g. pub, forest
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2225/00Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
    • H04R2225/43Signal processing in hearing aids to enhance the speech intelligibility

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Otolaryngology (AREA)
  • Neurosurgery (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】第1マイクロフォン入力信号を提供するための第1マイクロフォンを備えるセットのマイクロフォンと、入力信号を処理し、入力信号に基づいて電気出力信号を提供するためのプロセッサと、を備える聴覚装置を提供する。【解決手段】聴覚装置2は、電気出力信号をオーディオ出力信号に変換するためのレシーバ16と、セットのマイクロフォン8、10に動作可能に接続されているコントローラ12と、を備える。コントローラは、1個以上のマイクロフォン入力信号に基づいて、音声明瞭度の指標となる音声明瞭度インジケータを推定するための音声明瞭度推定器12aを備え、音声明瞭度インジケータに基づいて、プロセッサ14を制御する。音声明瞭度推定器は、第1音源のピッチパラメータを推定するためのピッチ推定器12aaを備えている。音声明瞭度インジケータは、ピッチパラメータと、第1音源の方向と、に基づく。【選択図】図1

Description

本開示は、聴覚装置、聴覚装置の動作方法、及び、聴覚システムに関する。
補聴器ユーザが直面する主な課題の1つは、「カクテルパーティ問題」のような多数の話者がいる騒がしい環境で、音声明瞭度がひどく悪化することである。一般的に、聞き取り補助器具のユーザの音声明瞭度は、特定の聞き取り環境に大きく依存する。このように、ある種の聞き取り環境で、音声強調処理スキームが有益な場合であっても、他の聞き取り環境では有害な場合がある。音声強調処理スキームは、必ずしも、あらゆる環境での音声明瞭度を高めるわけではない。
従って、背景技術の欠点を克服する聴覚装置、方法、及び、聴覚システムが必要とされている。
聴覚装置が開示されている。聴覚装置は、第1マイクロフォン入力信号を提供するための第1マイクロフォンを備えるセットのマイクロフォンと、入力信号を処理し、入力信号に基づいて、電気出力信号を提供するためのプロセッサと、を備える。聴覚装置は、電気出力信号をオーディオ出力信号に変換するためのレシーバと、セットのマイクロフォンに動作可能に接続されているコントローラと、を備える。コントローラは、1個以上のマイクロフォン入力信号に基づいて、音声明瞭度の指標となる音声明瞭度インジケータを推定するための音声明瞭度推定器を備えている。コントローラは、音声明瞭度インジケータに基づいて、プロセッサを制御するように構成されている。音声明瞭度推定器は、第1音源のピッチパラメータを推定するためのピッチ推定器を備えている。音声明瞭度インジケータは、ピッチパラメータと、第1音源の方向と、に基づく。
さらに、本開示は、聴覚装置の動作方法に関する。本方法は、聴覚装置又は聴覚システムで動作する。本方法は、音声を、第1マイクロフォン入力信号を含む1個以上のマイクロフォン入力信号に変換するステップを備える。本方法は、第1マイクロフォン入力信号に関連する音声明瞭度の指標となる音声明瞭度インジケータを取得する第1の取得ステップを備える。音声明瞭度インジケータを取得するステップは、第1音源のピッチパラメータを取得するステップを備えてもよい。音声明瞭度インジケータは、ピッチパラメータと、第1音源の方向とに基づく。本方法は、音声明瞭度インジケータに基づいて、聴覚装置を制御する制御ステップを備える。
本開示は、聴覚システムに関する。聴覚システムは、プロセッサ、インターフェース及びメモリを備える付属装置と、聴覚装置と、を備える。聴覚システムは、聴覚装置内に設けられ、第1マイクロフォン入力信号を提供するための第1マイクロフォンを備えるセットのマイクロフォンと、入力信号を処理し、入力信号に基づく電気出力信号を提供するためのプロセッサと、を備える。聴覚システムは、聴覚装置内に設けられ、電気出力信号をオーディオ出力信号に変換するためのレシーバと、セットのマイクロフォンに動作可能に接続されているコントローラと、を備える。聴覚システムは、1個以上のマイクロフォン入力信号に基づいて、音声明瞭度の指標となる音声明瞭度インジケータを推定するように構成されている。聴覚システムは、第1音源のピッチパラメータを推定するように構成されている。音声明瞭度インジケータは、ピッチパラメータと、第1音源の方向と、に基づく。
本開示の利点は、利用可能なリファレンス音声信号がなくても、音声明瞭度を評価することができることである。音声明瞭度は、有利な点として、聞き取り環境の状況を検知し、音声強調スキームをそれに適合させるために、本開示で使用される。特に、本開示は、人間の発声の基本的な態様(例えば、ピッチ)を活用し、音声明瞭度の推定の正確さを高める。
本発明の上述の特徴及び利点と、他の特徴及び利点は、添付の図面を参照しつつ、以下の例示的な実施形態の詳細な記載によって当業者には容易に明らかになるであろう。
本開示の例示的な聴覚装置を模式的に示す。 本開示の例示的な方法のフロー図である。 本開示の例示的な聴覚システムを模式的に示す。
関連するときは図面を参照しつつ、本明細書で以下に種々の例示的な実施形態及び詳細を記載する。図面は、縮尺通りに描かれていてもよく、描かれていなくてもよく、同様の構造又は機能をもつ要素は、図面全体で同様の参照番号によって表されることを注記しておくべきである。図面は、実施形態の説明を容易にすることだけを意図していることも注記しておくべきである。図面は、発明の包括的な記載であることは意図しておらず、又は、発明の範囲を限定するものであることは意図していない。これに加え、図示されている実施形態は、示されている全ての態様又は利点を有する必要はない。特定の実施形態と関連して記載される態様又は利点は、必ずしもその実施形態に限定されず、図示されていない場合であっても、又は、そのように明確に記載されていない場合であっても、任意の他の実施形態で実施することができる。
音声強調スキームを、評価済みの聞き取り環境の音声明瞭度に基づいて評価することができ、それによって、音声強調スキームが必要な場合にのみ適用されるために、聞き取り環境の自動的な明瞭度評価が、聴覚装置のユーザによって有益になり得ることが本願発明者らによって見出された。従って、本願発明者らは、聴覚装置の処理に音声明瞭度インジケータを使用することに利点を見出した。音声明瞭度を評価するために、短期客観的明瞭度(STOI)測定及び正規化共分散基準値(NCM)のような許容され得る信頼性を有しつつ音声明瞭度を予測する種々の煩わしい方法が存在する。
しかしながら、STOI法及びNCM法は、煩わしい。即ち、これらの方法は全て、「きれいな」音声信号をリファレンス音声信号として入手する必要がある。「きれいな」音声信号は、リファレンス音声信号であり、音源から発せられる信号と同様の特性(例えば、音声明瞭度についての十分な情報)を示す信号である。「きれいな」音声信号は、例えば、音源が、スパウスマイクロフォン器具に取り付けられたとき、その音源によって提供され得る。しかし、大部分の実生活の状況(例えば、カクテルパーティ)では、リファレンス音声信号として「きれいな」音声信号を入手することは、ほとんどできない。
EP3057335A1号には、ユーザの左耳及び右耳に、又は、ユーザの左耳の中及び右耳の中に配置されるように適合された左耳用及び右耳用の聴覚装置と、出力刺激にさらされた時に、左耳用及び右耳用のそれぞれの聴覚装置の信号処理ユニットから処理された信号yl(t)、yr(t)に基づいて、ユーザの予測される音声明瞭度の両耳用SI測定値を提供するための両耳用音声明瞭度予測ユニットと、を備える両耳用システムが記載されている。
しかしながら、EP3057335A1号のシステムも、左耳用聴覚装置から、処理された音声信号をリファレンス音声信号として入手する必要があるという点で煩わしい。音声明瞭度の予測において、EP3057335A1号の両耳用システムは、1個の聴覚装置からの処理された信号であって、リファレンス音声信号として使用される処理された信号に依存する。このような技術は、片耳用聴覚システムには適用することができない。片耳用聴覚システムでは、別の聴覚装置から、処理された信号を得ることができず、片耳用聴覚システムではリファレンス音声信号を容易に入手することができないためである。さらに、EP3057335A1号のシステムは、例えば、左耳用聴覚装置からの処理された信号が、右耳用聴覚装置からの信号と同じ音声明瞭度の欠陥を有し易く、それによって、信頼性の高いリファレンス音声信号とすることができないので、最善には及ばない音声明瞭度の推定を提供する。
本開示は、聞き取り環境において、マイクロフォン入力信号及び音源のピッチパラメータに基づいて、音声明瞭度インジケータを推定することによって、聞き取り環境の音声明瞭度を煩わしくなく推定する聴覚装置を提供する。本開示は、推定された音声明瞭度インジケータを使用し、マイクロフォン入力信号の処理を制御することを目的とする。
本開示の利点は、音声明瞭度インジケータを推定するために、リファレンス音声信号にアクセスする必要がないことである。本開示は、ピッチパラメータ及びマイクロフォン入力信号に基づいて、リファレンス音声信号(即ち、音声信号の明瞭度を表すリファレンス音声信号)を再構築することができる聴覚装置、方法、及び、聴覚システムを提案する。本開示は、マイクロフォン入力信号、ピッチパラメータ、及び、到来方向を活用することによって、リファレンス音声信号を入手することができないか、又は、リファレンス音声信号にアクセスにすることができないという問題を克服する。
聴覚装置が、本明細書に開示される。聴覚装置は、補聴器であってもよく、プロセッサは、ユーザの聴力損失を補償するように構成されていてもよい。聴覚装置は、補聴器、例えば、耳掛(BTE)型、耳穴(ITE)型、耳道(ITC)型、耳道レシーバ(RIC)型、又は、耳穴レシーバ(RITE)型の補聴器であってもよい。
聴覚装置は、セットのマイクロフォンを備えている。セットのマイクロフォンは、1個以上のマイクロフォンを備えていてもよい。セットのマイクロフォンは、第1マイクロフォン入力信号を提供するための第1マイクロフォン及び/又は第2マイクロフォン入力信号を提供するための第2マイクロフォンを備える。セットのマイクロフォンは、N個のマイクロフォン信号を与えるためのN個のマイクロフォンを備えていてもよい。ここで、Nは、1〜10の範囲の整数である。1個以上の例示的な聴覚装置において、マイクロフォンの数であるNは、2、3、4、5、又は、それよりも大きい。セットのマイクロフォンは、第3マイクロフォン入力信号を提供するための第3マイクロフォンを備えていてもよい。
聴覚装置は、入力信号、例えばマイクロフォン入力信号を処理するためのプロセッサを備えている。プロセッサは、プロセッサへの入力信号に基づいて、電気出力信号を提供する。プロセッサの入力端子は、任意的に、マイクロフォンのそれぞれの出力端子に接続される。プロセッサの1個以上のマイクロフォン入力端子は、マイクロフォンの1個以上のマイクロフォン出力端子のそれぞれに接続されていてもよい。プロセッサは、ユーザの聴力損失を補償し、入力信号に基づいて、電気出力信号を提供するように構成されていてもよい。
聴覚装置は、電気出力信号をオーディオ出力信号に変換するためのレシーバを備えている。レシーバは、電気出力信号を、聴覚装置のユーザの鼓膜に向かって進むオーディオ出力信号に変換するように構成されていてもよい。
聴覚装置は、1個以上の無線入力信号、例えば、第1無線入力信号及び/又は第2無線入力信号をアンテナ出力信号に変換するためのアンテナを、任意的に備えている。無線入力信号は、例えば、スパウスマイクロフォン器具、無線のTVオーディオ送信機及び/又は無線送信機と関連する分散したマイクロフォンアレイといった外部の音源に由来する。
聴覚装置は、アンテナ出力信号をトランシーバ入力信号に変換するためにアンテナに連結されている無線トランシーバを、任意的に備えている。異なる外部音源からの無線信号は、トランシーバでトランシーバ入力信号に多重化されてもよいし、又は、分離された複数のトランシーバ入力信号として、無線トランシーバの複数のトランシーバ入力端子に提供されてもよい。聴覚装置は、複数のアンテナを備えていてもよいし、及び/又は、アンテナは、1つ又は複数のアンテナモードで動作するように構成されていてもよい。トランシーバ入力信号は、第1外部音源からの第1無線信号の代表例である第1トランシーバ入力信号を備える。
聴覚装置は、コントローラを備えている。コントローラは、第1マイクロフォン及びプロセッサに動作可能に接続されていてもよい。コントローラは、第2マイクロフォンが存在する場合には、第2マイクロフォンに動作可能に接続されていてもよい。コントローラは、1個以上のマイクロフォン入力信号に基づいて、音声明瞭度の指標となる音声明瞭度インジケータを推定するための音声明瞭度推定器を備えていてもよい。コントローラは、1個以上のマイクロフォン入力信号に基づいて、音声明瞭度の指標となる音声明瞭度インジケータを推定するように構成されていてもよい。コントローラは、音声明瞭度インジケータに基づいて、プロセッサを制御するように構成されている。
音声明瞭度推定器は、第1音源のピッチパラメータを推定するためのピッチ推定器を備えていてもよい。音声明瞭度インジケータは、ピッチパラメータと、第1音源の方向と、に基づく。第1音源の方向は、例えば、第1音源からマイクロフォンで受信したマイクロフォン入力信号が到来した方向である。例えば、コントローラ又は音声明瞭度推定器は、ピッチパラメータと第1音源の方向とに基づいて、音声明瞭度インジケータを推定するように構成されていてもよい。異なる言い方をすると、音声明瞭度インジケータは、ピッチパラメータと第1音源の方向とに基づいて、コントローラ又は音声明瞭度推定器によって予測される。この方向は、既知であってもよいし(例えば、ユーザの鼻が向いている正面の方向と仮定する)、又は、本開示のピッチパラメータと合わせて推定されてもよい。
1つ以上の例示的な聴覚装置において、プロセッサは、コントローラを備えている。1つ以上の例示的な聴覚装置において、コントローラは、プロセッサと併設されている。
1つ以上の例示的な聴覚装置において、音声明瞭度推定器は、ピッチパラメータに基づいて、再構築された音声信号を生成するためのスピーチシンセサイザを備えている。音声明瞭度インジケータは、再構築された音声信号に基づいていてもよい。再構築された音声信号は、マイクロフォン入力信号の明瞭度を表すリファレンス音声信号と認識してもよい。異なる言い方をすると、スピーチシンセサイザは、ピッチパラメータに基づいて、音声信号を再構築し、再構築された音声信号を合成するように構成されている。例えば、コントローラ又は音声明瞭度推定器は、ピッチパラメータに基づいて、再構築された音声信号を生成し、再構築された音声信号、ピッチパラメータ、及び、第1音源の方向に基づいて、音声明瞭度インジケータを推定するように構成されていてもよい。合成され、再構築された音声信号に基づいて、コントローラ又は音声明瞭度推定器によって音声明瞭度インジケータが予測されることが理解されるであろう。再構築された音声信号は、再構築されたリファレンス音声信号とされてもよい。第1音源の方向(すなわち、空間的な手掛かり)とピッチパラメータ(すなわち、時間的な手掛かり)を組み合わせることは、開示される技術が、例えば反響又は競合する話者に起因する曖昧さを解決するように、リファレンス音声信号の再構築の正確性を向上させる。
1つ以上の例示的な聴覚装置において、音声明瞭度推定器は、短期客観的明瞭度(STOI)推定器を備えている。短期客観的明瞭度推定器は、再構築された音声信号と、1個以上のマイクロフォン入力信号に基づくベース音声信号と、を比較するように構成されていてもよい。短期客観的明瞭度推定器は、この比較に基づく音声明瞭度インジケータを提供するように構成されていてもよい。ベース音声信号は、1個以上のマイクロフォンから取得され、レシーバに提供される騒がしい音声信号を参照する。ベース音声信号は、1個のマイクロフォンによって捕捉されてもよいし(全方向性)、又は、(例えば、ビームフォーミングを用いて)複数のマイクロフォンによって捕捉されてもよい。例えば、音声明瞭度インジケータは、コントローラ又は音声明瞭度推定器が再構築された音声信号とベース音声とを比較すること、例えばSTOI推定器を用いて、再構築された音声信号とベース音声とを比較することによって予測されてもよい。
1つ以上の例示的な聴覚装置において、音声明瞭度推定器は、マイクロフォン入力信号の高調波モデルパラメータを提供するためにピッチ推定器に動作可能に接続されている高調波モデル推定器を備えている。ピッチパラメータは、高調波モデルパラメータに基づいていてもよい。高調波モデルパラメータは、例えば、基本周波数、サンプリング周波数、到来方向を提供する信号であって、第1音源から1個以上のマイクロフォンへの信号の遅れ、第1音源からの信号の減衰、振幅(例えば、複素振幅)、高調波の数、高調波の実際の振幅、及び/又は、高調波の位相を備える。
1つ以上の例示的な聴覚装置において、高調波モデル推定器は、マルチチャンネル信号の高調波モデルの構造に基づいて、マイクロフォン入力信号の高調波モデルパラメータを提供するように構成されており、チャンネルはマイクロフォンに対応する。高調波モデルの構造は、空間−時間的な高調波モデルの構造とされてもよい。第1音源は、所望の音源であると考えられてもよく、周期的であると仮定されてもよい。例えば、再構築された音声は、第1音源から多くの狭帯域信号として受信したマイクロフォン入力信号と、空間−時間的な高調波モデルを用い、高調波として関連するキャリア周波数とを考慮することに基づいて、信号特性を推定することによって生成される。
1つ以上の例示的な聴覚装置において、ピッチ推定器は、高調波モデルパラメータを受信し、高調波モデルパラメータ及び対数尤度関数に基づいて、ピッチパラメータを推定するように構成されている。
1つ以上の例示的な聴覚装置において、ピッチ推定器は、対数尤度関数及び高調波モデルパラメータに基づいて、ピッチパラメータを推定するための最大尤度推定器を備えている。
開示される技術が適用される実例において、STOI推定器に対する入力として再構築された音声信号を生成するために、マルチチャンネルの空間−時間的な高調波モデルが適用される。この実例では、フレーム長Nにおける妨害音源とバックグラウンドノイズとが合わさったものに加えられる所望のマイクロフォン入力信号を取得するために、K個のマイクロフォンが使用することが仮定される。k番目のマイクロフォンについて、このマイクロフォンから得られるマイクロフォン入力信号は、データベクトルxk=[xk(0) xk(1) … xk(N-1)]T(k=0, … ,K-1)によって表すことができる。所望の音源は、周期的であると仮定され、この仮定は、有音音声の短いセグメントに対して適切な仮定である。このように、データベクトルxkは、以下のようにモデル化することができる。
Figure 2018174521
Figure 2018174521
Figure 2018174521
Figure 2018174521
kは、記録されたノイズと干渉の合計を示し;
ω0は、基本周波数であり、fsは、サンプリング周波数であり;
τkは、到来方向(DOA)を与える0番目のマイクロフォンとk番目のマイクロフォンとの間の入力信号の遅れであり;
βkは、k番目のマイクロフォンでのマイクロフォン入力信号の減衰であり、
α=[α1… αL]Tは、l番目の複素振幅であるα=Alejφlによって与えられる複素振幅であり;
Lは、高調波の数であり;
>0及びφlは、それぞれ、l番目の高調波の実際の振幅及び位相である。
開示される技術が適用される実例において、それぞれのマイクロフォン又はそれぞれのマイクロフォンのチャンネルにおいて、ノイズは、分散σk 2を有する補正されていない白色ガウスであると仮定され、複素データベクトルxkの対数尤度関数は、(2)のように記述することができる。
Figure 2018174521
Ψは、xkの信号パラメータを含むベクトルを示す。この例では、白色ガウスノイズ分布は、ノイズのエントロピーを最大にし、そのため、ノイズの確率密度関数の良好な選択肢である。ピッチは、振幅α^、減衰因子βk、及び、ノイズの分散σk 2のそれぞれに関する微分によって、対数尤度関数を最大にすることによって、推定することができる。これらのパラメータは、互いに依存している。従って、最初に、β及びσk 2を1に設定し、式(3)、(4)及び(5)の式の計算を繰り返すことによって推定される。推定された複素振幅は、式(3)によって表わされる。
Figure 2018174521
k番目のマイクロフォンでの所望の音源の減衰の推定は、式(4)として取得することができる。
Figure 2018174521
さらに、ノイズの分散は、式(5)として見出すことができる。
Figure 2018174521
Figure 2018174521
次いで、ピッチパラメータは、最大尤度推定器を用い、式(6)として推定することができる。
Figure 2018174521
Ωは、可能なピッチパラメータ候補のセットである。この例では、第1音源の方向は、既知であると仮定されるために、ピッチパラメータの推定が、一次元探索で行われる。このことは、さらに、計算の複雑性を抑え、他の方向からの強い干渉する高調波源に対してロバスト性のある技術を提供する。k番目のマイクロフォンの再構築された音声信号は、与えられたピッチω0及び遅れτkの推定値から取得することができる。
Figure 2018174521
射影行列ΠA=A (AHA)-1AHが用いられている。
次いで、短期客観的明瞭度推定器への入力として使用される再構築された音声信号は、全てのマイクロフォンチャンネルについて再構築された音声信号を合計することによって得られる。
Figure 2018174521
これに代えて、又はこれに加えて、式(5)の分散の推定値を使用し、再構築された音声信号の重み推定を生成することができる。
1つ以上の例示的な聴覚装置において、セットのマイクロフォンは、第2マイクロフォン入力信号を提供するための第2マイクロフォンを備える。音声明瞭度推定器は、第1マイクロフォン入力信号及び第2マイクロフォン入力信号に基づいて、第1音源の方向を推定するための方向推定器を備えていてもよい。音声明瞭度インジケータは、第1音源の方向に基づいていてもよい。例えば、ピッチパラメータ及び第1音源の方向(例えば、マイクロフォン入力信号の到来方向)は、音声明瞭度推定器又はコントローラが、1つ以上のマイクロフォンによって受信される所望の周期的なマイクロフォン入力信号について、空間−時間的な高調波モデルを利用することによって、一緒に推定される。
1つ以上の例示的な聴覚装置において、聴覚装置は、音声明瞭度インジケータが第1判定基準を満たす場合に、第1処理スキームを選択し、第1処理スキームをマイクロフォン入力信号に適用するように構成されている。例えば、音声明瞭度インジケータが第1判定基準を満たす(例えば、音声明瞭度インジケータが、音声明瞭度が十分ではないことを示す)場合に、第1処理スキームが、音声明瞭度を向上させるようにマイクロフォン入力信号に適用される必要がある。第1処理スキームは、1つ以上の音声強調処理スキームを備えてもよい。第1処理スキームは、ユーザの聴力損失を補償するように構成された1個以上の音声強調処理を備えてもいてもよい。例えば、コントローラは、プロセッサに音声明瞭度インジケータを提供してもよく、音声明瞭度インジケータが第1判定基準を満たす場合に、第1処理スキームを選択し、第1処理スキームをマイクロフォン入力信号に適用するように構成されていてもよい。1つ以上の例示的な聴覚装置において、コントローラは、音声明瞭度インジケータが第1判定基準を満たす場合に、第1処理スキームを選択し、第1処理スキームをマイクロフォン入力信号に適用するように構成されていてもよい。
1つ以上の例示的な聴覚装置において、聴覚装置は、音声明瞭度インジケータが第1判定基準を満たさない場合に、既に適用されている処理スキームと同じ処理スキームを引き続きマイクロフォン入力信号に適用するように構成されている。例えば、音声明瞭度インジケータが第1判定基準を満たさない(即ち、音声明瞭度インジケータが、音声明瞭度が十分であることを示す)場合に、既に適用されている処理スキームと同じ処理スキームを変える必要はなく、聴覚装置又はプロセッサは、同じ処理スキームを引き続きマイクロフォン入力信号に適用してもよい。
第1判定基準は、第1明瞭度閾値に基づいていてもよい。1つ以上の例示的な聴覚装置において、音声明瞭度インジケータが第1明瞭度閾値より小さいときに、音声明瞭度インジケータが第1判定基準を満たす。例えば、第1明瞭度閾値は、75〜95%の範囲、例えば、80%、85%であってもよい。例えば、音声明瞭度インジケータが85%より小さいときに、聴覚装置は、第1処理スキーム(例えば、ビームフォーミングスキーム)を選択し、適用する。音声明瞭度インジケータが85%以上である場合、聴覚装置は、既に適用されている処理スキームと同じスキームの適用に進む。
1つ以上の例示的な聴覚装置において、聴覚装置は、音声明瞭度インジケータが第2判定基準を満たす場合に、第2処理スキームを選択し、第2処理スキームを第1マイクロフォン入力信号に適用するように構成されている。第2判定基準は、第2明瞭度閾値及び第3明瞭度閾値に基づいていてもよい。例えば、第2明瞭度閾値は、60〜75%の範囲、例えば、65%、70%であってもよい。例えば、第3明瞭度閾値は、77〜84%の範囲、例えば、80%、84%であってもよい。例えば、音声明瞭度インジケータが第2明瞭度閾値と第3明瞭度閾値の間にある場合、音声明瞭度インジケータは、第2判定基準を満たす。例えば、音声明瞭度インジケータが、70%以上であるが、80%を超えない場合、音声明瞭度インジケータは、第2判定基準を満たす。別の例は、音声明瞭度インジケータが第3判定基準を満たす場合であり、このとき、第3判定基準は、ゼロ閾値に基づく。例えば、音声明瞭度インジケータが0%に達したら、さらに狭いビームフォーミング(もっと大きな指向指数を有する)が選択され、適用される。
いずれの処理スキームが選択され、マイクロフォン入力信号に適用されるべきかを特定するために、聴覚装置によって種々の判定基準(例えば、第1判定基準、第2判定基準、第3判定基準、第4判定基準・・・)が使用されてもよいことが想定されるであろう。
第1処理スキーム及び/又は第2処理スキームは、ビームフォーミングスキーム、ノイズ低減スキーム、ゲイン制御スキーム、及び、圧縮スキームのうちの1個以上のスキームを備えていてもよい。例えば、音声明瞭度インジケータに基づいて聴覚装置によって選択される第1処理スキームは、ビームフォーミングスキームとノイズ低減スキームの組み合わせを備えていてもよい。
1つ以上の例示的な聴覚装置において、第1処理スキーム及び/又は第2処理スキームは、第1のセットのビームフォーミング係数を備える第1ビームフォーミングスキーム及び/又は第2のセットのビームフォーミング係数を備える第2ビームフォーミングスキームを備えていてもよい。
1つ以上の例示的な聴覚装置において、第1処理スキーム及び/又は第2処理スキームは、改善された信号ノイズ比を生じる1個以上のノイズ低減機能を提供するノイズ低減スキームを備えていてもよい。
1つ以上の例示的な聴覚装置において、第1処理スキーム及び/又は第2処理スキームは、圧縮スキーム及び/又はゲイン制御スキームを備えていてもよい。マイクロフォン入力信号に適用されるゲインは、聴力損失補償に基づいて制御される。本開示は、聴覚装置の動作方法に関する。この方法は、聴覚装置又は聴覚システムで行われてもよい。この方法は、音声を、第1マイクロフォン入力信号を含む1個以上のマイクロフォン入力信号に変換するステップを備える。この方法は、第1マイクロフォン入力信号に関連する音声明瞭度の指標となる音声明瞭度インジケータを取得するステップを備える。音声明瞭度インジケータを取得することは、第1音源のピッチパラメータを取得するステップを備える。音声明瞭度インジケータは、ピッチパラメータと、第1音源の方向とに基づく。この方法は、音声明瞭度インジケータに基づいて、聴覚装置を制御するステップを備える。
1つ以上の例示的な方法において、第1音源のピッチパラメータを取得するステップは、ピッチパラメータを推定することを備える。音声明瞭度インジケータを取得するステップは、1個以上のマイクロフォン入力信号に基づいて、音声明瞭度インジケータを推定するステップを備えていてもよい。
1つ以上の例示的な方法において、音声明瞭度インジケータを取得するステップは、ピッチパラメータに基づいて、再構築された音声信号を生成するステップと、再構築された音声信号に基づいて、音声明瞭度インジケータを決定するステップと、を備える。音声明瞭度インジケータを取得するステップは、例えば、短期客観的明瞭度推定器を用い、再構築された音声信号とベース音声信号を比較するステップを備えていてもよい。音声明瞭度インジケータを取得するステップは、マイクロフォン入力信号の高調波モデルパラメータを取得するステップと、高調波モデルパラメータに基づいて、ピッチパラメータを導出するステップと、を備えていてもよい。音声明瞭度インジケータを取得するステップは、マイクロフォン入力信号に基づいて、第1音源の方向を推定するステップを備えていてもよい。
1つ以上の例示的な方法において、音声明瞭度インジケータに基づいて、聴覚装置を制御するステップは、音声明瞭度インジケータが第1判定基準を満たす場合に、第1処理スキームを選択し、第1処理スキームをマイクロフォン入力信号に適用するステップを備える。第1判定基準は、第1明瞭度閾値に基づいていてもよい。第1処理スキームは、ビームフォーミングスキーム、ノイズ低減スキーム、ゲイン制御スキーム、及び、圧縮スキームのうち1個以上のスキームを備えていてもよい。
1つ以上の例示的な方法において、第1音源のピッチパラメータを取得するステップは、外部装置(例えば、付属装置)からピッチパラメータを受信するステップを備えていてもよい。音声明瞭度インジケータの推定が、外部装置(例えば、オンライン)で行われることが想定されてもよく、聴覚装置は、外部装置から音声明瞭度を取得するために、外部装置にマイクロフォン入力信号を提供するように構成される。
音声明瞭度インジケータの推定と、音声明瞭度インジケータに従ったマイクロフォン入力信号の処理は、外部装置(例えば、オンライン)で行われることが想定されてもよく、聴覚装置は、処理された(例えば、ノイズが低減された)マイクロフォン入力信号又はビームフォーミングパラメータを取得するために、外部装置にマイクロフォン入力信号を提供するように構成される。
本開示は、プロセッサ、インターフェース及びメモリを含む付属装置と、聴覚装置とを備える聴覚システムに関する。聴覚システムは、聴覚装置内に設けられ、第1マイクロフォン入力信号を提供するための第1マイクロフォンを含むセットのマイクロフォンと、入力信号を処理し、入力信号に基づいて、電気出力信号を提供するためのプロセッサと、を備えている。聴覚システムは、聴覚装置内に設けられ、電気出力信号をオーディオ出力信号に変換するためのレシーバと、セットのマイクロフォンに動作可能に接続されているコントローラと、を備えている。コントローラは、音声明瞭度インジケータに基づいてプロセッサを制御するように構成されている。聴覚システムは、1個以上のマイクロフォン入力信号に基づいて、音声明瞭度の指標となる音声明瞭度インジケータを推定するように構成されている。聴覚システムは、第1音源のピッチパラメータを推定するように構成されている。音声明瞭度インジケータは、ピッチパラメータと、第1音源の方向と、に基づく。
付属装置は、聴覚装置の付属品であってもよい。付属装置は、聴覚装置とペアリングされていてもよく、その他の様式で聴覚装置に無線接続されていてもよい。聴覚システムは、聴覚装置のユーザが保持し、聴覚装置のユーザによって制御されてもよい。付属装置は、スマートフォン、スマートウォッチ又はタブレット型コンピュータであってもよい。
1つ以上の例示的な聴覚システムにおいて、付属装置は、コントローラを備えており、このコントローラは、聴覚装置のプロセッサによって遠隔からアクセスされ、音声明瞭度の推定は、聴覚装置から遠隔で、例えば、付属装置で行われる。
本明細書に開示される聴覚装置、システム、及び、方法によって、音声明瞭度インジケータを予測し、予測された音声明瞭度インジケータに従って、入力信号に適用される処理の調節が可能になる。
図面は、明確さのための略図であり、単純化されており、図面は、本発明の理解にとって不可欠な詳細を単に示すものであり、他の詳細は省略される。全体的に、同一又は対応する部分には、同じ参照番号が使用される。
図1は、本開示の例示的な聴覚装置2のブロック図である。聴覚装置2は、セットのマイクロフォンを備えている。セットのマイクロフォンは、1個以上のマイクロフォンを備えていてもよい。セットのマイクロフォンは、第1マイクロフォン入力信号9を提供するための第1マイクロフォン8、及び/又は、第2マイクロフォン入力信号11を提供するための第2マイクロフォン10を備える。
聴覚装置2は、第1外部音源(図1に示さない)の第1無線入力信号5をアンテナ出力信号に変換するためのアンテナ4を、任意的に備えている。聴覚装置2は、アンテナ出力信号を1個以上のトランシーバ入力信号に変換するために、アンテナ4に接続されており、かつ、第1マイクロフォン入力信号9及び第2マイクロフォン入力信号11のそれぞれを提供するために、第1マイクロフォン8及び任意的に第2マイクロフォン10を備えるセットのマイクロフォンに接続されている無線トランシーバ7を、任意的に備えている。
聴覚装置2は、入力信号(例えば、マイクロフォン入力信号)を処理するためのプロセッサ14を備えている。プロセッサ14は、プロセッサ14に対する入力信号に基づいて、電気出力信号を提供する。
聴覚装置は、電気出力信号をオーディオ出力信号に変換するためのレシーバ16を備えている。
聴覚装置は、コントローラ12を備えている。コントローラ12は、第1マイクロフォン8及びプロセッサ14に動作可能に接続されている。コントローラ12は、第2マイクロフォン10に動作可能に接続されていてもよい。コントローラ12は、1個以上のマイクロフォン入力信号に基づいて、音声明瞭度の指標となる音声明瞭度インジケータを推定するように構成される。コントローラ12は、1個以上のマイクロフォン入力信号に基づいて、音声明瞭度の指標となる音声明瞭度インジケータを推定するための音声明瞭度推定器12aを備えている。コントローラ12は、音声明瞭度インジケータに基づいて、プロセッサ14を制御するように構成されている。
音声明瞭度推定器12aは、第1音源のピッチパラメータを推定するためのピッチ推定器12aaを備えている。音声明瞭度インジケータは、ピッチパラメータと、第1音源の方向とに基づく。音声明瞭度推定器12aは、ピッチパラメータ及び第1音源の方向に基づいて、音声明瞭度インジケータを推定するように構成されている。
プロセッサ14は、ユーザの聴力損失を補償し、入力信号に基づいて、電気出力信号15を提供するように構成されている。レシーバ16は、電気出力信号15を、聴覚装置のユーザの鼓膜に向かって進むオーディオ出力信号に変換する。
音声明瞭度推定器12aは、ピッチパラメータに基づいて、再構築された音声信号を生成するためのスピーチシンセサイザ12abを備えていてもよい。音声明瞭度推定器12aは、スピーチシンセサイザによって取得される再構築された音声信号に基づいて、音声明瞭度インジケータを推定するように構成されていてもよい。
音声明瞭度推定器12aは、短期客観的明瞭度(STOI)推定器12acを備えていてもよい。短期客観的明瞭度推定器12acは、1個以上のマイクロフォン入力信号に基づいて、再構築された音声信号とベース音声信号とを比較し、この比較に基づいて、音声明瞭度インジケータを提供するように構成されている。例えば、短期客観的明瞭度推定器12acは、再構築された音声信号(例えば、再構築されたリファレンス音声信号)と、マイクロフォン入力信号に基づいて取得されるベース音声信号(例えば、騒がしい音声信号)と、を比較する。異なる言い方をすると、短期客観的明瞭度推定器12acは、再構築された音声信号とベース音声との相関関係を評価し、評価された相関関係を使用して、音声明瞭度インジケータをコントローラ12又はプロセッサ14に提供する。
音声明瞭度推定器12aは、マイクロフォン入力信号の高調波モデルパラメータを提供するために、ピッチ推定器12aaに動作可能に接続される高調波モデル推定器12adを備えていてもよい。ピッチ推定器12aaは、高調波モデルパラメータと、任意的に、対数尤度関数を用いて、ピッチパラメータを導出するように構成されていてもよい。
1つ以上の例示的な聴覚装置において、セットのマイクロフォン8、10は、第2マイクロフォン入力信号11を提供するための第2マイクロフォン10を備える。音声明瞭度推定器12aは、第1マイクロフォン入力信号9及び第2マイクロフォン入力信号11に基づいて、第1音源の方向を推定するための方向推定器12aeを備えていてもよい。音声明瞭度推定器12aは、第1音源の方向に基づいて、音声明瞭度インジケータを導出するように構成されていてもよい。例えば、ピッチパラメータ及び第1音源の方向(例えば、マイクロフォン入力信号の到来方向)は、1個のマイクロフォンによって受信される所望のマイクロフォン入力信号のための空間−時間的な高調波モデルを利用することによって、音声明瞭度推定器12aで一緒に推定される。
1つ以上の例示的な聴覚装置において、聴覚装置2は、音声明瞭度インジケータが第1判定基準を満たす場合に、聴覚装置が、第1処理スキームを選択し、第1処理スキームをマイクロフォン入力信号9、11に適用するように構成されている。その反対に、音声明瞭度インジケータが第1判定基準を満たさない場合に、聴覚装置2は、既に適用されているのと同じ処理スキームを引き続きマイクロフォン入力信号に適用するように構成されている。第1判定基準は、第1明瞭度閾値に基づいていてもよい。例えば、音声明瞭度インジケータが第1明瞭度閾値より小さいときに、音声明瞭度インジケータは、第1判定基準を満たす。音声明瞭度インジケータが第1明瞭度閾値と等しいか、又は、第1明瞭度閾値より大きいときに、音声明瞭度インジケータが第1判定基準を満たすことが想定されてもよい。
1つ以上の例示的な聴覚装置において、音声明瞭度インジケータが第2判定基準を満たす場合に、聴覚装置2が、第2処理スキームを選択し、第2処理スキームを第1マイクロフォン入力信号に適用するように構成されていてもよい。1つ以上の例示的な聴覚装置において、第1処理スキーム及び/又は第2処理スキームは、ビームフォーミングスキーム、ノイズ低減スキーム、ゲイン制御スキーム、及び、圧縮スキームのうちの1個以上のスキームを備える。
聴覚装置2は、プロセッサ14及び/又はコントローラ12を用いて、第1処理スキーム及び/又は第2処理スキームを選択し、第1マイクロフォン入力信号9に適用するように構成されていてもよい。
図2は、本開示の聴覚装置を動作させる例示的な方法のフロー図である。聴覚装置の動作方法100は、本開示の聴覚装置又は聴覚システムで行われてもよい。方法100は、音を、第1マイクロフォン入力信号を備える1個以上のマイクロフォン入力信号に変換するステップ102を備える。この方法は、第1マイクロフォン入力信号に関連する音声明瞭度の指標となる音声明瞭度インジケータを取得するステップ104を備える。音声明瞭度インジケータを取得するステップ104は、第1音源のピッチパラメータと、任意的に、第1音源の方向を取得するステップ104aを備える。音声明瞭度インジケータは、ピッチパラメータと、第1音源の方向とに基づく。この方法は、音声明瞭度インジケータに基づいて、聴覚装置を制御するステップ106を備える。
1つ以上の例示的な方法において、第1音源のピッチパラメータを取得するステップ104aは、ピッチパラメータを推定するステップ104aaを備える。音声明瞭度インジケータを取得するステップ104は、1個以上のマイクロフォン入力信号、ピッチパラメータ及び第1音源の方向に基づいて、音声明瞭度インジケータを推定するステップ104bを備えていてもよい。
1つ以上の例示的な方法において、音声明瞭度インジケータを取得するステップ104は、ピッチパラメータに基づいて、再構築された音声信号を生成するステップ104cと、再構築された音声信号に基づいて、音声明瞭度インジケータを決定するステップ104dと、を備える。音声明瞭度インジケータを取得するステップ104は、例えば、短期客観的明瞭度推定器を用いて、再構築された音声信号とベース音声信号を比較するステップ104eを備えていてもよい。
音声明瞭度インジケータを取得するするステップ104は、マイクロフォン入力信号の高調波モデルパラメータを取得するステップと、高調波モデルパラメータに基づいて、ピッチパラメータを導出するステップと、を備えていてもよい。音声明瞭度インジケータを取得するステップ104は、マイクロフォン入力信号に基づいて、第1音源の方向を推定するステップを備えていてもよい。
1つ以上の例示的な方法において、音声明瞭度インジケータに基づいて、聴覚装置を制御するステップ106は、音声明瞭度インジケータが第1判定基準を満たす場合に、第1処理スキームを選択し、第1処理スキームをマイクロフォン入力信号に適用するステップを含む。第1判定基準は、第1明瞭度閾値に基づいていてもよい。第1処理スキームは、ビームフォーミングスキーム、ノイズ低減スキーム、ゲイン制御スキーム及び圧縮スキームのうち1個以上のスキームを備えていてもよい。
1つ以上の例示的な方法において、第1音源のピッチパラメータを取得するステップ104aは、外部装置(例えば、付属装置)からピッチパラメータを受信するステップを含んでいてもよい。音声明瞭度インジケータの推定が、外部装置(例えば、オンライン)で行われることが想定されていてもよく、聴覚装置は、外部装置から音声明瞭度を取得するために、外部装置にマイクロフォン入力信号を提供するように構成される。
音声明瞭度インジケータの推定と、音声明瞭度インジケータに従ったマイクロフォン入力信号の処理は、外部装置(例えば、オンライン)で行われることが想定されていてもよく、聴覚装置は、処理された(例えば、ノイズが低減された)マイクロフォン入力信号又はビームフォーミングパラメータを取得するために、外部装置にマイクロフォン入力信号を提供するように構成される。
図3は、本開示の例示的な聴覚システム200のブロック図である。聴覚システム200は、プロセッサ204、インターフェース206及びメモリ208を含む付属装置202と、聴覚装置210とを備える。
聴覚システム200は、聴覚装置内に配置され、第1マイクロフォン入力信号を提供するための第1マイクロフォン212(及び任意的に第2マイクロフォン214)を備えるセットのマイクロフォンと、入力信号を処理し、入力信号に基づいて、電気出力信号を提供するためのプロセッサ216と、を備える。聴覚システムは、聴覚装置内に配置され、電気出力信号をオーディオ出力信号に変換するためのレシーバ218と、セットのマイクロフォン212、214に動作可能に接続されているコントローラ12と、を備えている。コントローラ12は、図1に関連して開示される音声明瞭度インジケータに基づいてプロセッサを制御するように構成されている。図3のコントローラ12は、聴覚装置210内に配置されている。1つ以上の例示的な聴覚システムにおいて、コントローラ12は、付属装置202に配置されていてもよい。
聴覚システム200は、1個以上のマイクロフォン入力信号に基づいて、音声明瞭度の指標となる音声明瞭度インジケータを推定するように構成されている。例えば、聴覚装置210は、コントローラ12を用い、1個以上のマイクロフォン入力信号に基づいて、音声明瞭度の指標となる音声明瞭度インジケータを推定するように構成されていてもよい。1つ以上の例示的な聴覚システムにおいて、付属装置202は、聴覚装置210によって送信されたマイクロフォン入力信号を(例えば、アンテナ222及び無線トランシーバ224を介し、通信リンク230を利用して)受信するように構成されており、付属装置に配置されたコントローラ12によって、1個以上のマイクロフォン入力に基づいて、音声明瞭度の指標となる音声明瞭度インジケータを推定するように構成されていてもよい。
聴覚システム200は、第1音源のピッチパラメータを推定するように構成されている。音声明瞭度インジケータは、ピッチパラメータと、第1音源の方向と、に基づく。例えば、聴覚装置210は、コントローラ12を用い、第1音源のピッチパラメータを推定し、ピッチパラメータと方向とに基づいて、音声明瞭度を導出するように構成されていてもよい。
1つ以上の例示的な聴覚システムにおいて、付属装置202は、聴覚装置210によって送信されたマイクロフォン入力信号を(例えば、アンテナ222及び無線トランシーバ224を介し、通信リンク230を利用して)受信し、コントローラ12を用いて、第1音源のピッチパラメータを推定し、ピッチパラメータと方向とに基づいて、音声明瞭度を導出するように構成されていてもよい。
「第1」、「第2」、「第3」及び「第4」などの用語の使用は、任意の特定の順序を暗示するものではなく、個々の要素を特定するために含まれている。さらに、第1、第2などの用語の使用は、任意の順序又は重要性を示すものではなく、むしろ、ある要素を別の要素と区別するために使用される。第1及び第2との用語は、単なる標識のためにこの部分及び他の箇所で使用され、任意の特定の空間的な順序又は時間的な順序を示すことを意図したものではない。さらに、第1要素との標識は、第2の要素の存在を暗示するものではなく、その逆に、第2要素との標識は、第1の要素の存在を暗示するものではない。
特定の特徴を示し、記載してきたが、これらの特徴は、特許請求の範囲に記載された発明を限定することを意図していないことが理解され、特許請求の範囲に記載された発明の精神及び範囲から逸脱することなく種々の変更及び改変が行われてもよいことが当業者に明らかになるだろう。従って、明細書及び図面は、限定するという観点ではなく、実例であると考えるべきである。特許請求の範囲に記載された発明は、全ての代替例、改変及び均等物を包含することを意図している。
2 :聴覚装置
4 :アンテナ
5 :第1無線入力信号
7 :トランシーバ
8 :第1マイクロフォン
9 :第1マイクロフォン入力信号
10 :第2マイクロフォン
11 :第2マイクロフォン入力信号
12 :コントローラ
12a :音声明瞭度推定器
12aa :ピッチ推定器
12ab :スピーチシンセサイザ
12ac :短期客観的明瞭度(STOI)推定器
12ad :高調波モデル推定器
12ae :方向推定器
14 :プロセッサ
16 :レシーバ
100 :聴覚装置の動作方法
102 :音を1個以上のマイクロフォン入力信号に変換するステップ
104 :音声明瞭度インジケータを取得するステップ
104a :第1音源のピッチパラメータを取得するステップ
104aa:ピッチパラメータを推定するステップ
104b :1個以上のマイクロフォン入力信号に基づいて、音声明瞭度インジケータを推定するステップ
104c :ピッチパラメータに基づいて、再構築された音声信号を生成するステップ
104d :再構築された音声信号に基づいて、音声明瞭度インジケータを決定するステップ
104e :再構築された音声信号とベース音声信号を比較するステップ
106 :音声明瞭度インジケータに基づいて、聴覚装置を制御するステップ
200 :聴覚システム
202 :付属装置
204 :プロセッサ
206 :インターフェース
208 :メモリ
210 :聴覚装置
212 :第1マイクロフォン
214 :第2マイクロフォン
216 :プロセッサ
218 :レシーバ
222 :アンテナ
224 :トランシーバ
230 :通信リンク

Claims (15)

  1. 聴覚装置であって、
    −第1マイクロフォン入力信号を提供するための第1マイクロフォンを備えるセットのマイクロフォンと;
    −入力信号を処理し、入力信号に基づいて、電気出力信号を提供するためのプロセッサと;
    −前記電気出力信号をオーディオ出力信号に変換するためのレシーバと;
    −前記セットのマイクロフォンに動作可能に接続されているコントローラと、
    を備え、
    前記コントローラは、
    1個以上のマイクロフォン入力信号に基づいて、音声明瞭度の指標となる音声明瞭度インジケータを推定するための音声明瞭度推定器を備えており、
    前記音声明瞭度インジケータに基づいて、前記プロセッサを制御するように構成されており、
    前記音声明瞭度推定器は、第1音源のピッチパラメータを推定するためのピッチ推定器を備えており、
    前記音声明瞭度インジケータは、前記ピッチパラメータと、前記第1音源の方向と、に基づく、
    聴覚装置。
  2. 前記音声明瞭度推定器は、前記ピッチパラメータに基づいて、再構築された音声信号を生成するためのスピーチシンセサイザを備えており、
    前記音声明瞭度インジケータは、前記再構築された音声信号に基づく、請求項1に記載の聴覚装置。
  3. 前記音声明瞭度推定器は、短期客観的明瞭度推定器を備えており、
    前記短期客観的明瞭度推定器は、前記再構築された音声信号と、前記1個以上のマイクロフォン入力信号に基づくベース音声信号と、を比較し、前記音声明瞭度インジケータを提供するように構成されている、請求項2に記載の聴覚装置。
  4. 前記音声明瞭度推定器は、前記マイクロフォン入力信号の高調波モデルパラメータを提供するために前記ピッチ推定器に動作可能に接続されている高調波モデル推定器を備えており、
    前記ピッチパラメータは、前記高調波モデルパラメータに基づく、請求項1から3のいずれか一項に記載の聴覚装置。
  5. 前記セットのマイクロフォンは、第2マイクロフォン入力信号を提供するための第2マイクロフォンを備え、
    前記音声明瞭度推定器は、前記第1マイクロフォン入力信号及び前記第2マイクロフォン入力信号に基づいて、前記第1音源の方向を推定するための方向推定器を備えており、
    前記音声明瞭度インジケータは、前記第1音源の方向に基づく、請求項1から4のいずれか一項に記載の聴覚装置。
  6. 前記音声明瞭度インジケータが第1判定基準を満たす場合に、第1処理スキームを選択し、前記第1処理スキームを前記マイクロフォン入力信号に適用するように構成されている、請求項1から5のいずれか一項に記載の聴覚装置。
  7. 前記音声明瞭度インジケータが第1判定基準を満たさない場合に、既に適用されているのと同じ処理スキームを引き続き前記マイクロフォン入力信号に適用するように構成されている、請求項1から6のいずれか一項に記載の聴覚装置。
  8. 前記第1判定基準が、第1明瞭度閾値に基づく、請求項6または7に記載の聴覚装置。
  9. 前記音声明瞭度インジケータが前記第1明瞭度閾値より小さいときに、前記音声明瞭度インジケータが前記第1判定基準を満たす、請求項8に記載の聴覚装置。
  10. 前記音声明瞭度インジケータが第2判定基準を満たす場合に、第2処理スキームを選択し、前記第2処理スキームを前記第1マイクロフォン入力信号に適用するように構成されている、請求項1から9のいずれか一項に記載の聴覚装置。
  11. 前記第1処理スキーム及び/又は前記第2処理スキームは、ビームフォーミングスキーム、ノイズ低減スキーム、ゲイン制御スキーム、及び、圧縮スキームのうちの1個以上のスキームを備える、請求項6から10のいずれか一項に記載の聴覚装置。
  12. 聴覚装置の動作方法であって、
    −音を、第1マイクロフォン入力信号を含む1個以上のマイクロフォン入力信号に変換するステップと、
    −前記第1マイクロフォン入力信号に関連する音声明瞭度の指標となる音声明瞭度インジケータを取得するステップであって、前記音声明瞭度インジケータを取得するステップは、第1音源のピッチパラメータを取得するステップを備え、前記音声明瞭度インジケータは、前記ピッチパラメータと、前記第1音源の方向とに基づく、前記音声明瞭度インジケータを取得するステップと、
    −前記音声明瞭度インジケータに基づいて、前記聴覚装置を制御するステップと、
    を備える、方法。
  13. 前記第1音源の前記ピッチパラメータを取得するステップは、前記ピッチパラメータを推定するステップを備え、
    前記音声明瞭度インジケータを取得するステップは、前記1個以上のマイクロフォン入力信号に基づいて、前記音声明瞭度インジケータを推定するステップを備える、請求項12に記載の方法。
  14. 前記音声明瞭度インジケータを取得するステップは、
    前記ピッチパラメータに基づいて、再構築された音声信号を生成するステップと、
    前記再構築された音声信号に基づいて、前記音声明瞭度インジケータを決定するステップと、
    を備える、請求項12または13に記載の方法。
  15. プロセッサ、インターフェース及びメモリを備える付属装置と、聴覚装置と、を備える聴覚システムであって、
    −前記聴覚装置内に配置され、第1マイクロフォン入力信号を提供するための第1マイクロフォンを備えるセットのマイクロフォンと;
    −入力信号を処理し、入力信号に基づいて、電気出力信号を提供するためのプロセッサと;
    −前記聴覚装置内に配置され、前記電気出力信号をオーディオ出力信号に変換するためのレシーバと;
    −前記セットのマイクロフォンに動作可能に接続されているコントローラと、を備え、
    前記コントローラは、音声明瞭度インジケータに基づいて前記プロセッサを制御するように構成されており、
    前記聴覚システムは、
    1個以上のマイクロフォン入力信号に基づいて、音声明瞭度の指標となる前記音声明瞭度インジケータを推定するように構成されており、
    第1音源のピッチパラメータを推定するように構成されており、
    前記音声明瞭度インジケータは、前記ピッチパラメータと、前記第1音源の方向と、に基づく、聴覚システム。
JP2018025398A 2017-03-02 2018-02-15 聴覚装置、方法、及び、聴覚システム Active JP6965178B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP17158989.8A EP3370440B1 (en) 2017-03-02 2017-03-02 Hearing device, method and hearing system
EP17158989.8 2017-03-02

Publications (3)

Publication Number Publication Date
JP2018174521A true JP2018174521A (ja) 2018-11-08
JP2018174521A5 JP2018174521A5 (ja) 2021-04-01
JP6965178B2 JP6965178B2 (ja) 2021-11-10

Family

ID=58227955

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018025398A Active JP6965178B2 (ja) 2017-03-02 2018-02-15 聴覚装置、方法、及び、聴覚システム

Country Status (5)

Country Link
US (1) US20180255406A1 (ja)
EP (1) EP3370440B1 (ja)
JP (1) JP6965178B2 (ja)
CN (1) CN108540912B (ja)
DK (1) DK3370440T3 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11412333B2 (en) * 2017-11-15 2022-08-09 Starkey Laboratories, Inc. Interactive system for hearing devices
EP3961624A1 (de) * 2020-08-28 2022-03-02 Sivantos Pte. Ltd. Verfahren zum betrieb einer hörvorrichtung in abhängigkeit eines sprachsignals
DE102020210919A1 (de) 2020-08-28 2022-03-03 Sivantos Pte. Ltd. Verfahren zur Bewertung der Sprachqualität eines Sprachsignals mittels einer Hörvorrichtung

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110224976A1 (en) * 2010-03-11 2011-09-15 Taal Cees H Speech intelligibility predictor and applications thereof
EP2528356A1 (en) * 2011-05-25 2012-11-28 Oticon A/s Voice dependent compensation strategy

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2736273A1 (en) * 2012-11-23 2014-05-28 Oticon A/s Listening device comprising an interface to signal communication quality and/or wearer load to surroundings
US9769576B2 (en) * 2013-04-09 2017-09-19 Sonova Ag Method and system for providing hearing assistance to a user
US20170374476A9 (en) * 2013-11-08 2017-12-28 Avraham Suhami Hearing Eyeglass System and Method
DK3057335T3 (en) 2015-02-11 2018-01-08 Oticon As HEARING SYSTEM, INCLUDING A BINAURAL SPEECH UNDERSTANDING

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110224976A1 (en) * 2010-03-11 2011-09-15 Taal Cees H Speech intelligibility predictor and applications thereof
EP2528356A1 (en) * 2011-05-25 2012-11-28 Oticon A/s Voice dependent compensation strategy

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JENSEN, JESPER RINDOM ET AL.: "STATISTICALLY EFFICIENT METHODS FOR PITCH AND DOA ESTIMATION", 2013 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING, JPN6021016445, 31 May 2013 (2013-05-31), pages 3900 - 3904, XP032508459, ISSN: 0004607339, DOI: 10.1109/ICASSP.2013.6638389 *
SORENSEN, CHARLOTTE ET AL.: "SEMI-NON-INTRUSIVE OBJECTIVE INTELLIGIBILITY MEASURE USING SPATIAL FILTERING IN HEARING AIDS", 2016 24TH EUROPEAN SIGNAL PROCESSING CONFERENCE(EUSIPCO), JPN6021016444, 2 September 2016 (2016-09-02), pages 1358 - 1362, ISSN: 0004607338 *

Also Published As

Publication number Publication date
JP6965178B2 (ja) 2021-11-10
EP3370440B1 (en) 2019-11-27
DK3370440T3 (da) 2020-03-02
CN108540912A (zh) 2018-09-14
EP3370440A1 (en) 2018-09-05
US20180255406A1 (en) 2018-09-06
CN108540912B (zh) 2021-01-26

Similar Documents

Publication Publication Date Title
CN108600907B (zh) 定位声源的方法、听力装置及听力系统
CN109040932B (zh) 传声器系统及包括传声器系统的听力装置
CN109951785B (zh) 听力装置及包括双耳降噪系统的双耳听力系统
DK3057335T3 (en) HEARING SYSTEM, INCLUDING A BINAURAL SPEECH UNDERSTANDING
US9723422B2 (en) Multi-microphone method for estimation of target and noise spectral variances for speech degraded by reverberation and optionally additive noise
JP4955676B2 (ja) 音響ビーム形成装置及び方法
US11109164B2 (en) Method of operating a hearing aid system and a hearing aid system
US10425745B1 (en) Adaptive binaural beamforming with preservation of spatial cues in hearing assistance devices
US20210335380A1 (en) Hearing device and method with non-intrusive speech intelligibility
JP6965178B2 (ja) 聴覚装置、方法、及び、聴覚システム
CN108882110B (zh) 基于语音清晰度的听力设备及相关方法
WO2020035158A1 (en) Method of operating a hearing aid system and a hearing aid system
US20160119728A1 (en) Hearing system for estimating a feedback path of a hearing device
US11438712B2 (en) Method of operating a hearing aid system and a hearing aid system
EP4075829B1 (en) A hearing device or system comprising a communication interface
US9906876B2 (en) Method for transmitting an audio signal, hearing device and hearing device system
JP2019135826A (ja) 聴覚機器と、ビームフォーミングを柔軟に制御する方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210209

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210209

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20210209

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20210309

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210511

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210702

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211005

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211020

R150 Certificate of patent or registration of utility model

Ref document number: 6965178

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150