JP2021022843A - 頭部伝達関数の推定モデル生成装置、頭部伝達関数の推定装置および頭部伝達関数の推定用プログラム - Google Patents
頭部伝達関数の推定モデル生成装置、頭部伝達関数の推定装置および頭部伝達関数の推定用プログラム Download PDFInfo
- Publication number
- JP2021022843A JP2021022843A JP2019138608A JP2019138608A JP2021022843A JP 2021022843 A JP2021022843 A JP 2021022843A JP 2019138608 A JP2019138608 A JP 2019138608A JP 2019138608 A JP2019138608 A JP 2019138608A JP 2021022843 A JP2021022843 A JP 2021022843A
- Authority
- JP
- Japan
- Prior art keywords
- hrtf
- transfer function
- data
- related transfer
- head
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012546 transfer Methods 0.000 title claims abstract description 70
- 230000006870 function Effects 0.000 claims abstract description 74
- 238000001228 spectrum Methods 0.000 claims abstract description 38
- 238000010801 machine learning Methods 0.000 claims abstract description 11
- 210000003128 head Anatomy 0.000 claims description 72
- 238000012545 processing Methods 0.000 claims description 17
- 230000004044 response Effects 0.000 claims description 9
- 238000000034 method Methods 0.000 claims description 8
- 238000013527 convolutional neural network Methods 0.000 claims description 6
- 210000000613 ear canal Anatomy 0.000 claims description 3
- 238000011156 evaluation Methods 0.000 description 24
- 238000004364 calculation method Methods 0.000 description 20
- 238000010586 diagram Methods 0.000 description 7
- 230000004807 localization Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 210000003454 tympanic membrane Anatomy 0.000 description 1
Landscapes
- Stereophonic System (AREA)
Abstract
Description
12 推定モデル生成部
21 推定用データ入力部
22 HRTF推定部
100 推定モデル生成装置
101 耳介形状関連データ生成部
102 HRTFデータ生成部
200 推定装置
Claims (7)
- 耳介形状を表す耳介形状関連データと、上記耳介形状に関して実測された頭部伝達関数を表すHRTFデータとをデータセットとして、複数のデータセットを学習用データとして入力する学習用データ入力部と、
上記学習用データ入力部により入力された上記学習用データを用いて機械学習処理を行うことにより、受聴者に関する耳介形状関連データが入力された際に上記受聴者の頭部伝達関数を出力するためのHRTF推定モデルを生成する推定モデル生成部とを備え、
上記学習用データ入力部により入力される上記HRTFデータは、耳介の位置を基準とした垂直方向の角度に対する周波数特性のパターンを示す周波数スペクトラムの画像データであり、
上記HRTF推定モデルは、上記耳介形状関連データを入力とし、上記頭部伝達関数を表す上記周波数スペクトラムの画像データを出力とするものであることを特徴とする頭部伝達関数の推定モデル生成装置。 - 上記HRTF推定モデルは、上記耳介形状関連データから上記耳介形状の特徴量を抽出するための畳み込みニューラルネットワークと、当該畳み込みニューラルネットワークにより抽出された特徴量をもとに上記頭部伝達関数を表す上記周波数スペクトラムの画像データを推定するための逆畳み込みニューラルネットワークとにより構成されることを特徴とする請求項1に記載の頭部伝達関数の推定モデル生成装置。
- 上記学習用データ入力部により入力される上記HRTFデータは、上記耳介の位置を基準として水平方向および垂直方向にそれぞれ角度を変えて計測した複数のインパルス応答のデータを用いて、上記垂直方向の角度に対する周波数特性のパターンを示す周波数スペクトラムの画像データを上記水平方向の角度ごとに生成したものであり、
上記HRTF推定モデルは、上記水平方向の角度ごとに存在し、
上記推定モデル生成部は、上記水平方向の角度ごとに存在する複数の上記HRTF推定モデルごとに上記機械学習処理を行うことを特徴とする請求項1または2に記載の頭部伝達関数の推定モデル生成装置。 - 上記学習用データ入力部により入力される上記耳介形状関連データは、センサから耳介の各点までの距離をそれぞれ表示態様の違いで表した画像データであることを特徴とする請求項1〜3の何れか1項に記載の頭部伝達関数の推定モデル生成装置。
- 受聴者の耳介形状を表す耳介形状関連データを推定用データとして入力する推定用データ入力部と、
上記推定用データ入力部により入力された耳介形状関連データを、請求項1〜4の何れか1項に記載の推定モデル生成装置により生成された上記HRTF推定モデルに入力することにより、上記受聴者の頭部伝達関数を表す周波数スペクトラムの画像データを推定するHRTF推定部とを備えたことを特徴とする頭部伝達関数の推定装置。 - 耳介形状を表す耳介形状関連データと、上記耳介形状に関して実測された頭部伝達関数を表すHRTFデータとをデータセットとして、複数のデータセットを学習用データとして入力する学習用データ入力手段、および
上記学習用データ入力手段により入力された上記学習用データを用いて機械学習処理を行うことにより、受聴者に関する耳介形状関連データが入力された際に上記受聴者の頭部伝達関数を出力するためのHRTF推定モデルを生成する推定モデル生成部手段
として推定モデル生成装置のコンピュータを機能させ、
上記学習用データ入力手段により入力される上記HRTFデータは、耳介の位置を基準とした垂直方向の角度に対する周波数特性のパターンを示す周波数スペクトラムの画像データであり、
上記HRTF推定モデルは、上記耳介形状関連データを入力とし、上記頭部伝達関数を表す上記周波数スペクトラムの画像データを出力とするものであることを特徴とする頭部伝達関数の推定用プログラム。 - 受聴者の耳介形状を表す耳介形状関連データを推定用データとして入力する推定用データ入力手段、および
上記推定用データ入力手段により入力された耳介形状関連データを、請求項1〜4の何れか1項に記載の推定モデル生成装置により生成された上記HRTF推定モデルに入力することにより、上記受聴者の頭部伝達関数を表す周波数スペクトラムの画像データを推定するHRTF推定手段
として推定装置のコンピュータを機能させるための頭部伝達関数の推定用プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019138608A JP7358010B2 (ja) | 2019-07-29 | 2019-07-29 | 頭部伝達関数の推定モデル生成装置、頭部伝達関数の推定装置および頭部伝達関数の推定用プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019138608A JP7358010B2 (ja) | 2019-07-29 | 2019-07-29 | 頭部伝達関数の推定モデル生成装置、頭部伝達関数の推定装置および頭部伝達関数の推定用プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021022843A true JP2021022843A (ja) | 2021-02-18 |
JP7358010B2 JP7358010B2 (ja) | 2023-10-10 |
Family
ID=74574860
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019138608A Active JP7358010B2 (ja) | 2019-07-29 | 2019-07-29 | 頭部伝達関数の推定モデル生成装置、頭部伝達関数の推定装置および頭部伝達関数の推定用プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7358010B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115460526A (zh) * | 2022-11-11 | 2022-12-09 | 荣耀终端有限公司 | 一种听力模型的确定方法、电子设备及系统 |
GB2620796A (en) * | 2022-07-22 | 2024-01-24 | Sony Interactive Entertainment Europe Ltd | Methods and systems for simulating perception of a sound source |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017047309A1 (ja) * | 2015-09-14 | 2017-03-23 | ヤマハ株式会社 | 耳形状解析方法、耳形状解析装置および耳形状モデル生成方法 |
-
2019
- 2019-07-29 JP JP2019138608A patent/JP7358010B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017047309A1 (ja) * | 2015-09-14 | 2017-03-23 | ヤマハ株式会社 | 耳形状解析方法、耳形状解析装置および耳形状モデル生成方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2620796A (en) * | 2022-07-22 | 2024-01-24 | Sony Interactive Entertainment Europe Ltd | Methods and systems for simulating perception of a sound source |
CN115460526A (zh) * | 2022-11-11 | 2022-12-09 | 荣耀终端有限公司 | 一种听力模型的确定方法、电子设备及系统 |
Also Published As
Publication number | Publication date |
---|---|
JP7358010B2 (ja) | 2023-10-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10939225B2 (en) | Calibrating listening devices | |
US11706582B2 (en) | Calibrating listening devices | |
CN108885690B (zh) | 用于产生头相关传递函数滤波器的方法、设备和计算机可读介质 | |
US6996244B1 (en) | Estimation of head-related transfer functions for spatial sound representative | |
WO2005025270A1 (ja) | 音像制御装置の設計ツールおよび音像制御装置 | |
US11528577B2 (en) | Method and system for generating an HRTF for a user | |
Schönstein et al. | HRTF selection for binaural synthesis from a database using morphological parameters | |
US10917735B2 (en) | Head-related transfer function personalization using simulation | |
JP7206027B2 (ja) | 頭部伝達関数学習装置および頭部伝達関数推論装置 | |
JP7358010B2 (ja) | 頭部伝達関数の推定モデル生成装置、頭部伝達関数の推定装置および頭部伝達関数の推定用プログラム | |
CN107820158A (zh) | 一种基于头相关脉冲响应的三维音频生成装置 | |
He et al. | Fast continuous HRTF acquisition with unconstrained movements of human subjects | |
JP6730568B2 (ja) | 立体音再生装置およびプログラム | |
Sunder | Binaural audio engineering | |
Durin et al. | Acoustic analysis of the directional information captured by five different hearing aid styles | |
Iida et al. | Estimation of the category of notch frequency bins of the individual head-related transfer functions using the anthropometry of the listener’s pinnae | |
US11315277B1 (en) | Device to determine user-specific HRTF based on combined geometric data | |
Tommasini et al. | Usage of spectral distortion for objective evaluation of personalized HRTF in the median plane | |
JP6296072B2 (ja) | 音響再生装置及びプログラム | |
JP2018152834A (ja) | 仮想聴覚環境において音声信号出力を制御する方法及び装置 | |
Braun et al. | A Measurement System for Fast Estimation of 2D Individual HRTFs with Arbitrary Head Movements | |
Jayaram et al. | HRTF Estimation in the Wild | |
Duraiswami et al. | Capturing and recreating auditory virtual reality | |
US20240089689A1 (en) | Method for determining a personalized head-related transfer function | |
Sunder | 7.1 BINAURAL AUDIO TECHNOLOGIES-AN |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220617 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230308 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230426 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230522 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230926 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230926 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7358010 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |