JP6834985B2 - 音声処理装置および方法、並びにプログラム - Google Patents
音声処理装置および方法、並びにプログラム Download PDFInfo
- Publication number
- JP6834985B2 JP6834985B2 JP2017560106A JP2017560106A JP6834985B2 JP 6834985 B2 JP6834985 B2 JP 6834985B2 JP 2017560106 A JP2017560106 A JP 2017560106A JP 2017560106 A JP2017560106 A JP 2017560106A JP 6834985 B2 JP6834985 B2 JP 6834985B2
- Authority
- JP
- Japan
- Prior art keywords
- head
- transfer function
- related transfer
- harmonic
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
- H04S7/303—Tracking of listener position or orientation
- H04S7/304—For headphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/033—Headphones for stereophonic communication
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/01—Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/11—Application of ambisonics in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Stereophonic System (AREA)
Description
〈本技術について〉
本技術は、ある平面における頭部伝達関数自体を2次元極座標の関数ととらえ、同様に環状調和関数変換を行って、球面調和領域または環状調和領域の音声信号である入力信号のスピーカアレイ信号へのデコードを介さずに環状調和領域において入力信号と頭部伝達関数との合成を行うことで、演算量やメモリ使用量においてより効率のよい再生系を実現するものである。
ここで、図7を参照して、以上において説明した本技術による手法(以下、提案手法とも称する)と、一般手法にヘッドトラッキング機能を追加した手法(以下、拡張手法とも称する)との積和演算量および必要メモリ量の比較を行う。
次に、以上において説明した本技術を適用した音声処理装置について説明する。図8は、本技術を適用した音声処理装置の一実施の形態の構成例を示す図である。
続いて、図9のフローチャートを参照して、音声処理装置81により行われる駆動信号生成処理について説明する。この駆動信号生成処理は、外部から入力信号D’m(ω)が供給されると開始される。
〈時間周波数ごとの次数の切捨てについて〉
ところで、行列H(ω)を構成する頭部伝達関数H(u(φj)-1xi,ω)は、環状調和領域において必要な次数が異なることが分かっており、このことは、例えば「Efficient Real Spherical Harmonic Representation of Head-Related Transfer Functions (Griffin D. Romigh et. al. , 2015)」などに記載されている。
〈頭部伝達関数に関する必要メモリ量削減について〉
ところで、頭部伝達関数は、聴取者の頭部や耳介などの回折、反射により形成されるフィルタであるため、聴取者個人によって頭部伝達関数は異なる。そのため、頭部伝達関数を個人に最適化することはバイノーラル再生にとって重要なことである。
行列H’(ω)を生成する場合、音声処理装置81は、例えば図15に示すように構成される。なお、図15において図8における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。
続いて、図16のフローチャートを参照して、図15に示した構成の音声処理装置81により行われる駆動信号生成処理について説明する。
ところで、以上で行ってきた議論では、保持する頭部伝達関数および初期頭部方向に対する仮想的なスピーカ配置がどのような平面に対して環状に置かれているかは問われない。
ところで、上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウェアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のコンピュータなどが含まれる。
環状調和領域の入力信号、または球面調和領域の入力信号のうちの環状調和領域に対応する部分と、対角化された頭部伝達関数とを合成する頭部伝達関数合成部と、
前記合成により得られた信号を環状調和関数に基づいて環状調和逆変換することで、時間周波数領域のヘッドホン駆動信号を生成する環状調和逆変換部と
を備える音声処理装置。
(2)
前記頭部伝達関数合成部は、複数の頭部伝達関数からなる行列を環状調和関数変換により対角化して得られた対角行列と、環状調和関数の各次数に対応する前記入力信号からなるベクトルとの積を求めることで、前記入力信号と前記対角化された頭部伝達関数とを合成する
(1)に記載の音声処理装置。
(3)
前記頭部伝達関数合成部は、前記対角行列の対角成分のうちの時間周波数ごとに設定可能な所定の前記次数の要素のみを用いて、前記入力信号と前記対角化された頭部伝達関数との合成を行う
(2)に記載の音声処理装置。
(4)
前記対角行列には、各ユーザで共通して用いられる前記対角化された頭部伝達関数が要素として含まれている
(2)または(3)に記載の音声処理装置。
(5)
前記対角行列には、ユーザ個人に依存する前記対角化された頭部伝達関数が要素として含まれている
(2)乃至(4)の何れか一項に記載の音声処理装置。
(6)
前記対角行列を構成する、各ユーザで共通する前記対角化された頭部伝達関数を予め保持するとともに、ユーザ個人に依存する前記対角化された頭部伝達関数を取得して、取得した前記対角化された頭部伝達関数と、予め保持している前記対角化された頭部伝達関数とから前記対角行列を生成する行列生成部をさらに備える
(2)または(3)に記載の音声処理装置。
(7)
前記環状調和逆変換部は、各方向の環状調和関数からなる環状調和関数行列を保持しており、前記球面調和関数行列の所定方向に対応する行に基づいて、前記環状調和逆変換を行う
(1)乃至(6)の何れか一項に記載の音声処理装置。
(8)
前記ヘッドホン駆動信号に基づく音声を聴取するユーザの頭部の方向を取得する頭部方向取得部をさらに備え、
前記環状調和逆変換部は、前記環状調和関数行列における前記ユーザの頭部の方向に対応する行に基づいて、前記環状調和逆変換を行う
(7)に記載の音声処理装置。
(9)
前記ユーザの頭部の回転を検出する頭部方向センサ部をさらに備え、
前記頭部方向取得部は、前記頭部方向センサ部による検出結果を取得することで、前記ユーザの頭部の方向を取得する
(8)に記載の音声処理装置。
(10)
前記ヘッドホン駆動信号を時間周波数逆変換する時間周波数逆変換部をさらに備える
(1)乃至(9)の何れか一項に記載の音声処理装置。
(11)
環状調和領域の入力信号、または球面調和領域の入力信号のうちの環状調和領域に対応する部分と、対角化された頭部伝達関数とを合成し、
前記合成により得られた信号を環状調和関数に基づいて環状調和逆変換することで、時間周波数領域のヘッドホン駆動信号を生成する
ステップを含む音声処理方法。
(12)
環状調和領域の入力信号、または球面調和領域の入力信号のうちの環状調和領域に対応する部分と、対角化された頭部伝達関数とを合成し、
前記合成により得られた信号を環状調和関数に基づいて環状調和逆変換することで、時間周波数領域のヘッドホン駆動信号を生成する
ステップを含む処理をコンピュータに実行させるプログラム。
Claims (12)
- 環状調和領域の入力信号、または球面調和領域の入力信号のうちの環状調和領域に対応する部分と、対角化された頭部伝達関数とを合成する頭部伝達関数合成部と、
前記合成により得られた信号を環状調和関数に基づいて環状調和逆変換することで、時間周波数領域のヘッドホン駆動信号を生成する環状調和逆変換部と
を備える音声処理装置。 - 前記頭部伝達関数合成部は、複数の頭部伝達関数からなる行列を環状調和関数変換により対角化して得られた対角行列と、環状調和関数の各次数に対応する前記入力信号からなるベクトルとの積を求めることで、前記入力信号と前記対角化された頭部伝達関数とを合成する
請求項1に記載の音声処理装置。 - 前記頭部伝達関数合成部は、前記対角行列の対角成分のうちの時間周波数ごとに設定可能な所定の前記次数の要素のみを用いて、前記入力信号と前記対角化された頭部伝達関数との合成を行う
請求項2に記載の音声処理装置。 - 前記対角行列には、各ユーザで共通して用いられる前記対角化された頭部伝達関数が要素として含まれている
請求項2または請求項3に記載の音声処理装置。 - 前記対角行列には、ユーザ個人に依存する前記対角化された頭部伝達関数が要素として含まれている
請求項2乃至請求項4の何れか一項に記載の音声処理装置。 - 前記対角行列を構成する、各ユーザで共通する前記対角化された頭部伝達関数を予め保持するとともに、ユーザ個人に依存する前記対角化された頭部伝達関数を取得して、取得した前記対角化された頭部伝達関数と、予め保持している前記対角化された頭部伝達関数とから前記対角行列を生成する行列生成部をさらに備える
請求項2または請求項3に記載の音声処理装置。 - 前記環状調和逆変換部は、各方向の環状調和関数からなる環状調和関数行列を保持しており、前記環状調和関数行列の所定方向に対応する行に基づいて、前記環状調和逆変換を行う
請求項1乃至請求項6の何れか一項に記載の音声処理装置。 - 前記ヘッドホン駆動信号に基づく音声を聴取するユーザの頭部の方向を取得する頭部方向取得部をさらに備え、
前記環状調和逆変換部は、前記環状調和関数行列における前記ユーザの頭部の方向に対応する行に基づいて、前記環状調和逆変換を行う
請求項7に記載の音声処理装置。 - 前記ユーザの頭部の回転を検出する頭部方向センサ部をさらに備え、
前記頭部方向取得部は、前記頭部方向センサ部による検出結果を取得することで、前記ユーザの頭部の方向を取得する
請求項8に記載の音声処理装置。 - 前記ヘッドホン駆動信号を時間周波数逆変換する時間周波数逆変換部をさらに備える
請求項1乃至請求項9の何れか一項に記載の音声処理装置。 - 環状調和領域の入力信号、または球面調和領域の入力信号のうちの環状調和領域に対応する部分と、対角化された頭部伝達関数とを合成し、
前記合成により得られた信号を環状調和関数に基づいて環状調和逆変換することで、時間周波数領域のヘッドホン駆動信号を生成する
ステップを含む音声処理方法。 - 環状調和領域の入力信号、または球面調和領域の入力信号のうちの環状調和領域に対応する部分と、対角化された頭部伝達関数とを合成し、
前記合成により得られた信号を環状調和関数に基づいて環状調和逆変換することで、時間周波数領域のヘッドホン駆動信号を生成する
ステップを含む処理をコンピュータに実行させるプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016002167 | 2016-01-08 | ||
JP2016002167 | 2016-01-08 | ||
PCT/JP2016/088379 WO2017119318A1 (ja) | 2016-01-08 | 2016-12-22 | 音声処理装置および方法、並びにプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2017119318A1 JPWO2017119318A1 (ja) | 2018-10-25 |
JP6834985B2 true JP6834985B2 (ja) | 2021-02-24 |
Family
ID=59273911
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017560106A Active JP6834985B2 (ja) | 2016-01-08 | 2016-12-22 | 音声処理装置および方法、並びにプログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US10412531B2 (ja) |
EP (1) | EP3402221B1 (ja) |
JP (1) | JP6834985B2 (ja) |
BR (1) | BR112018013526A2 (ja) |
WO (1) | WO2017119318A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3402223B1 (en) | 2016-01-08 | 2020-10-07 | Sony Corporation | Audio processing device and method, and program |
US10133544B2 (en) * | 2017-03-02 | 2018-11-20 | Starkey Hearing Technologies | Hearing device incorporating user interactive auditory display |
US11076230B2 (en) * | 2017-05-16 | 2021-07-27 | Sony Corporation | Speaker array, and signal processing apparatus |
WO2020196004A1 (ja) * | 2019-03-28 | 2020-10-01 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6215879B1 (en) * | 1997-11-19 | 2001-04-10 | Philips Semiconductors, Inc. | Method for introducing harmonics into an audio stream for improving three dimensional audio positioning |
US7231054B1 (en) | 1999-09-24 | 2007-06-12 | Creative Technology Ltd | Method and apparatus for three-dimensional audio display |
FR2847376B1 (fr) | 2002-11-19 | 2005-02-04 | France Telecom | Procede de traitement de donnees sonores et dispositif d'acquisition sonore mettant en oeuvre ce procede |
US20050147261A1 (en) * | 2003-12-30 | 2005-07-07 | Chiang Yeh | Head relational transfer function virtualizer |
GB0815362D0 (en) | 2008-08-22 | 2008-10-01 | Queen Mary & Westfield College | Music collection navigation |
EP2268064A1 (en) | 2009-06-25 | 2010-12-29 | Berges Allmenndigitale Rädgivningstjeneste | Device and method for converting spatial audio signal |
PL2285139T3 (pl) * | 2009-06-25 | 2020-03-31 | Dts Licensing Limited | Urządzenie i sposób konwersji przestrzennego sygnału audio |
KR101890229B1 (ko) | 2010-03-26 | 2018-08-21 | 돌비 인터네셔널 에이비 | 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치 |
US9681250B2 (en) * | 2013-05-24 | 2017-06-13 | University Of Maryland, College Park | Statistical modelling, interpolation, measurement and anthropometry based prediction of head-related transfer functions |
US9716959B2 (en) * | 2013-05-29 | 2017-07-25 | Qualcomm Incorporated | Compensating for error in decomposed representations of sound fields |
US9369818B2 (en) * | 2013-05-29 | 2016-06-14 | Qualcomm Incorporated | Filtering with binaural room impulse responses with content analysis and weighting |
DE102013223201B3 (de) * | 2013-11-14 | 2015-05-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren und Vorrichtung zum Komprimieren und Dekomprimieren von Schallfelddaten eines Gebietes |
US10009704B1 (en) * | 2017-01-30 | 2018-06-26 | Google Llc | Symmetric spherical harmonic HRTF rendering |
-
2016
- 2016-12-22 WO PCT/JP2016/088379 patent/WO2017119318A1/ja active Application Filing
- 2016-12-22 US US16/066,772 patent/US10412531B2/en active Active
- 2016-12-22 BR BR112018013526-7A patent/BR112018013526A2/ja not_active IP Right Cessation
- 2016-12-22 EP EP16883817.5A patent/EP3402221B1/en active Active
- 2016-12-22 JP JP2017560106A patent/JP6834985B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
BR112018013526A2 (ja) | 2018-12-04 |
WO2017119318A1 (ja) | 2017-07-13 |
JPWO2017119318A1 (ja) | 2018-10-25 |
EP3402221B1 (en) | 2020-04-08 |
EP3402221A1 (en) | 2018-11-14 |
EP3402221A4 (en) | 2018-12-26 |
US10412531B2 (en) | 2019-09-10 |
US20190014433A1 (en) | 2019-01-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108370487B (zh) | 声音处理设备、方法和程序 | |
US11950085B2 (en) | Concept for generating an enhanced sound field description or a modified sound field description using a multi-point sound field description | |
CN110035376B (zh) | 使用相位响应特征来双耳渲染的音频信号处理方法和装置 | |
EP2868119B1 (en) | Method and apparatus for generating an audio output comprising spatial information | |
JP6834985B2 (ja) | 音声処理装置および方法、並びにプログラム | |
US11863962B2 (en) | Concept for generating an enhanced sound-field description or a modified sound field description using a multi-layer description | |
EP2920982A1 (en) | Segment-wise adjustment of spatial audio signal to different playback loudspeaker setup | |
WO2017119321A1 (ja) | 音声処理装置および方法、並びにプログラム | |
WO2017119320A1 (ja) | 音声処理装置および方法、並びにプログラム | |
JP6955186B2 (ja) | 音響信号処理装置、音響信号処理方法および音響信号処理プログラム | |
WO2020196004A1 (ja) | 信号処理装置および方法、並びにプログラム | |
JP7115477B2 (ja) | 信号処理装置および方法、並びにプログラム | |
WO2020100670A1 (ja) | 信号処理装置および方法、並びにプログラム | |
WO2018211984A1 (ja) | スピーカアレイ、および信号処理装置 | |
WO2018066376A1 (ja) | 信号処理装置および方法、並びにプログラム | |
JP7440174B2 (ja) | 音響装置、音響処理方法及びプログラム | |
WO2023085186A1 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
WO2022034805A1 (ja) | 信号処理装置および方法、並びにオーディオ再生システム | |
Vorländer et al. | 3D Sound Reproduction | |
KR20150005438A (ko) | 오디오 신호 처리 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191216 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191217 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210105 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210118 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6834985 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |