JP6665379B2 - 聴覚支援システムおよび聴覚支援装置 - Google Patents
聴覚支援システムおよび聴覚支援装置 Download PDFInfo
- Publication number
- JP6665379B2 JP6665379B2 JP2015221387A JP2015221387A JP6665379B2 JP 6665379 B2 JP6665379 B2 JP 6665379B2 JP 2015221387 A JP2015221387 A JP 2015221387A JP 2015221387 A JP2015221387 A JP 2015221387A JP 6665379 B2 JP6665379 B2 JP 6665379B2
- Authority
- JP
- Japan
- Prior art keywords
- sound
- sound source
- user
- hearing
- ear
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000004807 localization Effects 0.000 claims description 42
- 230000006870 function Effects 0.000 claims description 27
- 238000000926 separation method Methods 0.000 claims description 23
- 238000012546 transfer Methods 0.000 claims description 19
- 230000035807 sensation Effects 0.000 claims description 18
- 230000015572 biosynthetic process Effects 0.000 claims description 17
- 238000001514 detection method Methods 0.000 claims description 17
- 238000003786 synthesis reaction Methods 0.000 claims description 17
- 230000005236 sound signal Effects 0.000 claims description 12
- 208000016354 hearing loss disease Diseases 0.000 claims description 11
- 206010011878 Deafness Diseases 0.000 claims description 10
- 210000005069 ears Anatomy 0.000 claims description 10
- 231100000888 hearing loss Toxicity 0.000 claims description 10
- 230000010370 hearing loss Effects 0.000 claims description 10
- 238000012937 correction Methods 0.000 claims description 8
- 230000002238 attenuated effect Effects 0.000 claims description 5
- 230000002194 synthesizing effect Effects 0.000 claims description 4
- 210000003128 head Anatomy 0.000 description 32
- 238000012545 processing Methods 0.000 description 20
- 238000000034 method Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 12
- 230000001629 suppression Effects 0.000 description 8
- 238000003491 array Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 230000010354 integration Effects 0.000 description 4
- 208000032041 Hearing impaired Diseases 0.000 description 3
- 239000008186 active pharmaceutical agent Substances 0.000 description 3
- 230000033001 locomotion Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 230000002354 daily effect Effects 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000000474 nursing effect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 206010036626 Presbyacusis Diseases 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 210000000613 ear canal Anatomy 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 244000144985 peep Species 0.000 description 1
- 238000011897 real-time detection Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 125000000391 vinyl group Chemical group [H]C([*])=C([H])[H] 0.000 description 1
- 229920002554 vinyl polymer Polymers 0.000 description 1
Landscapes
- Stereophonic System (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Description
(3次元音源定位)
音源定位に関しては、まず、3次元空間DOA評価部3202.1〜3202.Mが、各マイクロホンアレイ10.1〜10.Mのそれぞれに対してDOA推定を行う。空間情報統合部3206は、1つ以上のアレイによるDOA情報と人位置検出追跡部310からの人位置情報を統合することで、音源の3次元空間内の位置を推定する。
実環境での音のDOA推定は広く研究されてきており、MUSIC法は、複数のソースを高い分解能で定位できる最も有効な手法の一つであり、たとえば、上述した特許文献2,3にも開示されている。音源数を固定した数値に仮定し、しきい値を超えたMUSICスペクトルのピークを音源として認識する。ここでは、たとえば、MUSIC法の実装にあたり、100msごとに1度の分解能を有するように構成したとしても、動作クロック周波数2GHzのシングルコアCPUで、リアルタイムに音源の方向を探索することができる。
さらに、聴覚支援システム1000にとって、最も重要な音源は人の音声である。そこで、音源定位装置300では、人の声を漏れ無く抽出するために、複数の2次元LRFで構成したヒューマントラッキングシステムを使用する。空間情報統合部3206は、マイクロホンアレイからのDOA推定出力とLRFのトラッキング結果が同じ位置(または所定の距離以内の位置)で交差すれば、そこに音源がある可能性が高いと判断する。
(音源分離)
音源分離部330では、選択された複数の人物(および注目する音源)(個数:j)をパラレルに分離している。
なお、話者または注目する音源の個数jについては、予め所定の値が設定されているものとする。
ビームフォーミングの基本原理を、2マイクロホンの場合を例に簡単に説明する。
音空間再構成部540において、空間再構成部550は、環境センサ側から受信した方向・位置情報と推定されたユーザ2の顔の向きに応じて、座標系(x,y,z)における音源の位置を再構成し、推定された顔の向きから、左右のチャンネルに対応した正確な頭部伝達関数(HRTF:Head Relative Transfer Function)をデータベース530から選択する。
音空間再構成部540において、HRTF処理部5502.1〜5502.jは、分離され音量が制御された音声に、選択された頭部伝達関数との畳み込み演算を行い、左耳音合成部5504.1および右耳音合成部5504.2は、それぞれ左耳周波数特性補正部5506.1および右耳周波数特性補正部5506.2を通して、ステレオヘッドホン610の左右のスピーカでユーザ2に再生する左耳用音および右耳用音をそれぞれ合成する。
(音源ボリュームの調整)
聴覚支援システム1000では、選択されたすべての音源に対して、位置情報を反映したステレオ音声を合成し、足し合わせて、音場を表現する出力が再生される。しかし、これでは選択された各音源のボリュームが予測できない。もし、ユーザ側で各音源のボリュームを各々独立して操作することができれば、自分にとって注目したい音源に焦点をあてた音環境を作ることができる。
以下では、音場をコントロールするための2つの異なる操作パターンのユーザインタフェースについて説明する。
図7(b)中では、ユーザの顔の向きは、斜線の入った丸に付随する矢印で示されている。
Claims (11)
- 対象空間内の利用者の聴覚を補助するための聴覚支援システムであって、
前記対象空間に設置される音源定位装置を備え、前記音源定位装置は、
前記対象空間における対象物の位置を検出する位置検出手段と、
前記対象空間内に設置されるマイクロホンアレイからの出力に応じて、前記マイクロホンアレイについて音の到来方向を推定し、前記位置検出手段の検出結果と統合して、前記対象空間内での音源の位置を特定して出力する音源定位手段と、
特定された音源の位置からの音を分離して出力するための音源分離手段とを含み、
前記利用者の顔姿勢に応じて、対象空間内の音声を再構成するための空間感覚合成装置をさらに備え、前記空間感覚合成装置は、
前記対象空間内の利用者の顔姿勢を検出するための顔姿勢検出手段と、
前記利用者に装着され、前記利用者の両耳に対して前記対象空間の音環境を再現するための音再現手段と、
前記音源定位手段から、前記音源の位置を受信し、検出された顔姿勢に応じて、前記対象空間の前記音源の位置から前記利用者の各耳への頭部伝達関数を用いて、前記音源分離手段からの分離音の信号から前記音再現手段により各耳へ再現するための音信号を合成する音空間再構成手段とを含み、
前記音空間再構成手段は、前記利用者の顔の前方の所定範囲内にある音源からの音は強調され、所定範囲外にある音源からの音は減衰されるように、それぞれの音量を調節する、聴覚支援システム。 - 前記空間感覚合成装置は、前記利用者の各耳の難聴特性に合わせて周波数帯域ごとの音量を補正する周波数特性補正手段をさらに備える、請求項1に記載の聴覚支援システム。
- 前記音再現手段は、ヘッドホンまたはイヤホンであり、
前記顔姿勢検出手段は、前記ヘッドホンに装着されたジャイロおよびコンパスを含む、請求項2記載の聴覚支援システム。 - 前記音再現手段は、ヘッドホンまたはイヤホンであり、
前記顔姿勢検出手段は、撮像された前記利用者の画像から前記利用者の顔姿勢を推定する、請求項2記載の聴覚支援システム。 - 前記音源定位手段は、マイクロホンアレイに基づく音の到来方向と前記位置検出手段で検出された音源の位置が、交差することに応じて、前記音源の位置を特定する、請求項1〜4のいずれか1項に記載の聴覚支援システム。
- 音源から利用者の各耳までの方向に応じた複数の頭部伝達関数の係数を保存するデータベースをさらに備え、
前記音空間再構成手段は、
前記対象空間において、前記対象空間の前記音源の位置から前記利用者の各耳への頭部伝達関数を前記データベースから選択して、各前記耳へ空間的感覚を再現するための音信号を合成する、請求項1〜5のいずれか1項に記載の聴覚支援システム。 - 対象空間の音環境に関する情報を送信する環境センサ装置からの情報に基づき、前記対象空間の音環境を利用者の顔姿勢に応じて再現するための聴覚支援装置であって、前記環境センサ装置からは、前記対象空間における音源の位置を示す位置情報と、前記位置情報で特定された音源の位置からの音を分離した分離音の信号とが送信され、
前記対象空間内の利用者の顔姿勢を検出するための顔姿勢検出手段と、
前記利用者に装着され、前記利用者の両耳に対して前記音環境に対応する音を再現するための音再現手段と、
前記音源位置の前記位置情報を受信し、検出された顔姿勢に応じて、前記対象空間の前記音源の位置から前記利用者の各耳への頭部伝達関数を用いて、前記分離音の信号から前記音再現手段により各耳へ再現するための音信号を合成する音空間再構成手段とを備え、
前記音空間再構成手段は、前記利用者の顔の前方の所定範囲内にある音源からの音は強調され、所定範囲外にある音源からの音は減衰されるように、それぞれの音量を調節する、聴覚支援装置。 - 前記利用者の各耳の難聴特性に合わせて周波数帯域ごとの音量を補正する周波数特性補正手段をさらに備える、請求項7記載の聴覚支援装置。
- 前記音再現手段は、ヘッドホンまたはイヤホンであり、
前記顔姿勢検出手段は、前記ヘッドホンに装着されたジャイロおよびコンパスを含む、請求項7または8記載の聴覚支援装置。 - 前記音再現手段は、ヘッドホンまたはイヤホンであり、
前記顔姿勢検出手段は、撮像された前記利用者の画像から前記利用者の顔姿勢を推定する、請求項8記載の聴覚支援装置。 - 音源から利用者の各耳までの方向に応じた複数の頭部伝達関数の係数を保存するデータベースをさらに備え、
前記音空間再構成手段は、
前記対象空間において、前記対象空間の前記音源の位置から前記利用者の各耳への頭部伝達関数を前記データベースから選択して、各前記耳へ空間的感覚を再現するための音信号を合成する、請求項7〜10のいずれか1項に記載の聴覚支援装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015221387A JP6665379B2 (ja) | 2015-11-11 | 2015-11-11 | 聴覚支援システムおよび聴覚支援装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015221387A JP6665379B2 (ja) | 2015-11-11 | 2015-11-11 | 聴覚支援システムおよび聴覚支援装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017092732A JP2017092732A (ja) | 2017-05-25 |
JP6665379B2 true JP6665379B2 (ja) | 2020-03-13 |
Family
ID=58768533
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015221387A Active JP6665379B2 (ja) | 2015-11-11 | 2015-11-11 | 聴覚支援システムおよび聴覚支援装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6665379B2 (ja) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11209306B2 (en) | 2017-11-02 | 2021-12-28 | Fluke Corporation | Portable acoustic imaging tool with scanning and analysis capability |
US10003905B1 (en) | 2017-11-27 | 2018-06-19 | Sony Corporation | Personalized end user head-related transfer function (HRTV) finite impulse response (FIR) filter |
EP3503592B1 (en) | 2017-12-19 | 2020-09-16 | Nokia Technologies Oy | Methods, apparatuses and computer programs relating to spatial audio |
JP2019126033A (ja) * | 2018-01-18 | 2019-07-25 | 株式会社電通ライブ | 音声情報提供システム、音声情報提供装置、及びプログラム |
US10142760B1 (en) | 2018-03-14 | 2018-11-27 | Sony Corporation | Audio processing mechanism with personalized frequency response filter and personalized head-related transfer function (HRTF) |
WO2019233588A1 (en) * | 2018-06-07 | 2019-12-12 | Sonova Ag | Microphone device to provide audio with spatial context |
EP3827227A1 (en) | 2018-07-24 | 2021-06-02 | Fluke Corporation | Systems and methods for projecting and displaying acoustic data |
US10856097B2 (en) | 2018-09-27 | 2020-12-01 | Sony Corporation | Generating personalized end user head-related transfer function (HRTV) using panoramic images of ear |
US11113092B2 (en) | 2019-02-08 | 2021-09-07 | Sony Corporation | Global HRTF repository |
US11451907B2 (en) | 2019-05-29 | 2022-09-20 | Sony Corporation | Techniques combining plural head-related transfer function (HRTF) spheres to place audio objects |
US11347832B2 (en) | 2019-06-13 | 2022-05-31 | Sony Corporation | Head related transfer function (HRTF) as biometric authentication |
EP4011099A1 (de) * | 2019-08-06 | 2022-06-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | System und verfahren zur unterstützung von selektivem hören |
US11146908B2 (en) | 2019-10-24 | 2021-10-12 | Sony Corporation | Generating personalized end user head-related transfer function (HRTF) from generic HRTF |
US11070930B2 (en) | 2019-11-12 | 2021-07-20 | Sony Corporation | Generating personalized end user room-related transfer function (RRTF) |
CN113284504A (zh) * | 2020-02-20 | 2021-08-20 | 北京三星通信技术研究有限公司 | 姿态检测方法、装置、电子设备及计算机可读存储介质 |
WO2021187335A1 (ja) | 2020-03-16 | 2021-09-23 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 音響再生方法、音響再生装置およびプログラム |
JPWO2022224586A1 (ja) * | 2021-04-20 | 2022-10-27 | ||
WO2023199746A1 (ja) * | 2022-04-14 | 2023-10-19 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 音響再生方法、コンピュータプログラム及び音響再生装置 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008175733A (ja) * | 2007-01-19 | 2008-07-31 | Fujitsu Ltd | 音声到来方向推定・ビームフォーミングシステム、移動装置及び音声到来方向推定・ビームフォーミング方法 |
WO2010084769A1 (ja) * | 2009-01-22 | 2010-07-29 | パナソニック株式会社 | 補聴装置 |
EP2328362B1 (en) * | 2009-06-24 | 2013-08-14 | Panasonic Corporation | Hearing aid |
JP5660362B2 (ja) * | 2010-04-05 | 2015-01-28 | 株式会社国際電気通信基礎技術研究所 | 音源定位装置及びコンピュータプログラム |
JP5724125B2 (ja) * | 2011-03-30 | 2015-05-27 | 株式会社国際電気通信基礎技術研究所 | 音源定位装置 |
JP5954987B2 (ja) * | 2011-12-28 | 2016-07-20 | キヤノン株式会社 | 撮影装置及びその処理方法 |
JP5983313B2 (ja) * | 2012-10-30 | 2016-08-31 | 富士通株式会社 | 情報処理装置、音像定位強調方法、及び音像定位強調プログラム |
JP2015076797A (ja) * | 2013-10-10 | 2015-04-20 | 富士通株式会社 | 空間情報提示装置、空間情報提示方法及び空間情報提示用コンピュータプログラム |
DK201370793A1 (en) * | 2013-12-19 | 2015-06-29 | Gn Resound As | A hearing aid system with selectable perceived spatial positioning of sound sources |
-
2015
- 2015-11-11 JP JP2015221387A patent/JP6665379B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017092732A (ja) | 2017-05-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6665379B2 (ja) | 聴覚支援システムおよび聴覚支援装置 | |
US10431239B2 (en) | Hearing system | |
CN108369811B (zh) | 分布式音频捕获和混合 | |
US10397722B2 (en) | Distributed audio capture and mixing | |
US10097921B2 (en) | Methods circuits devices systems and associated computer executable code for acquiring acoustic signals | |
US10349197B2 (en) | Method and device for generating and playing back audio signal | |
US9838825B2 (en) | Audio signal processing device and method for reproducing a binaural signal | |
KR101547035B1 (ko) | 다중 마이크에 의한 3차원 사운드 포착 및 재생 | |
US10880669B2 (en) | Binaural sound source localization | |
CN106664485A (zh) | 基于自适应函数的一致声学场景再现的系统、装置和方法 | |
KR101678305B1 (ko) | 텔레프레즌스를 위한 하이브리드형 3d 마이크로폰 어레이 시스템 및 동작 방법 | |
KR20160136716A (ko) | 오디오 신호 처리 방법 및 장치 | |
JP6587047B2 (ja) | 臨場感伝達システムおよび臨場感再現装置 | |
US20190306618A1 (en) | Methods circuits devices systems and associated computer executable code for acquiring acoustic signals |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181016 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190826 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190917 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20191105 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191227 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200124 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200127 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6665379 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |