JP2006222801A - Moving sound image presenting device - Google Patents

Moving sound image presenting device Download PDF

Info

Publication number
JP2006222801A
JP2006222801A JP2005035047A JP2005035047A JP2006222801A JP 2006222801 A JP2006222801 A JP 2006222801A JP 2005035047 A JP2005035047 A JP 2005035047A JP 2005035047 A JP2005035047 A JP 2005035047A JP 2006222801 A JP2006222801 A JP 2006222801A
Authority
JP
Japan
Prior art keywords
hrir
delay
sound
sound image
listener
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005035047A
Other languages
Japanese (ja)
Inventor
Hiroshi Abe
洋 阿部
Yoichi Suzuki
陽一 鈴木
Yukio Iwatani
幸雄 岩谷
Masashi Toyoda
将志 豊田
Shigenori Kawai
滋典 川合
Hisashi Komatsu
寿 小松
Keiki Hatakeyama
慶輝 畠山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tohoku University NUC
Tokin Corp
Tsuken Electric Industrial Co Ltd
Oi Electric Co Ltd
P Softhouse Co Ltd
Original Assignee
Tohoku University NUC
Tsuken Electric Industrial Co Ltd
Oi Electric Co Ltd
P Softhouse Co Ltd
NEC Tokin Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tohoku University NUC, Tsuken Electric Industrial Co Ltd, Oi Electric Co Ltd, P Softhouse Co Ltd, NEC Tokin Corp filed Critical Tohoku University NUC
Priority to JP2005035047A priority Critical patent/JP2006222801A/en
Publication of JP2006222801A publication Critical patent/JP2006222801A/en
Pending legal-status Critical Current

Links

Landscapes

  • Stereophonic System (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a moving sound image presenting device which obtains rendering effects including a Doppler effect when being given only position information changing momentarily and presents a sound image of high reality/localization. <P>SOLUTION: A head related transfer function is separated into an initial delay and a main response, and the Doppler effect is added so that the delay is processed together with the Doppler effect and spectrum components are rendered later in the main response part, whereby a rendering method is closer to physical phenomena (easy for an application creator to use) and an effect of high reality can be obtained. Head related transfer functions matching individuals are selected and used to obtain an affect of presenting a moving sound image of high reality/localization to many and unspecified persons. <P>COPYRIGHT: (C)2006,JPO&NCIPI

Description

本発明は、三次元空間内で刻々と位置が変化する音像をパラメータ(音源・聴取者の位置情報,モノラル音源)と頭部伝達インパルス応答 (HRIR:Head Related Impulse Response 以後HRIRと記す)より演算処理を施し、聴取者に対して仮想現実的に移動音像を提示する移動音像提示装置の構成に関する。   The present invention calculates a sound image whose position changes every moment in a three-dimensional space from parameters (sound source / listener position information, monaural sound source) and head-related impulse response (HRIR: HRIR). The present invention relates to a configuration of a moving sound image presentation device that performs processing and presents a moving sound image virtually to a listener.

三次元空間内で発せられた音は、反射、回折を始めとする様々な物理現象を経て最終的に両耳に届く。このような現象を聴衆者に擬似的に知覚させるには、原音を演出(レンダリング)を加える必要がある。   The sound emitted in the three-dimensional space finally reaches both ears through various physical phenomena such as reflection and diffraction. In order for the audience to perceive such a phenomenon in a pseudo manner, it is necessary to produce (render) the original sound.

考え得るレンダリングの種類は音源位置情報、初期反射音、後部残響音、回折音、ドップラー効果などがあるが、特に音がその位置を動的に変化させる場合、特に位置情報とドップラー効果が重要である。   Possible types of rendering include sound source location information, early reflections, rear reverberation, diffracted sounds, and Doppler effects, but location information and Doppler effects are particularly important, especially when the sound changes its position dynamically. is there.

音源の位置をレンダリングするには、主に頭部伝達関数合成法が用いられている。このような技術は、例えば特許文献1に開示されている。特許文献1では、あらかじめ複数の位置で観測しておいた頭部音響伝達関数を用い、頭部音響伝達関数を近似するディジタルフィルターに距離減衰を加えることで任意の位置に音像を定位させる方法が示されている。しかしこの方法ではドップラー効果を得られないため、音像の定位感や現実感が十分ではない。   The head related transfer function synthesis method is mainly used to render the position of the sound source. Such a technique is disclosed in Patent Document 1, for example. In Patent Document 1, there is a method in which a sound image is localized at an arbitrary position by using a head acoustic transfer function observed in advance at a plurality of positions and adding distance attenuation to a digital filter approximating the head acoustic transfer function. It is shown. However, since this method cannot obtain the Doppler effect, the sound image is not sufficiently localized and realistic.

従来の移動音像提示装置でのドップラー効果を伴う位置移動のレンダリングでは、予め周波数を必要なだけ上下にシフトさせた上で、位置を付加させるように二段でレンダリングさせている。   In the position movement rendering with the Doppler effect in the conventional moving sound image presentation device, the frequency is shifted in advance up and down as necessary and then rendered in two stages so that the position is added.

特開平8−265900号公報JP-A-8-265900

このように従来の技術では、距離に応じた音圧減衰で音像定位を行うため、実世界で存在する音源・聴取者の相対位置移動に伴うドップラー効果が考慮されておらず、現実感が足りないという問題があった。また、予め周波数をシフトさせる方法ではレンダリングが二段になるため物理現象との整合性が薄く、使用者及びアプリケーション開発者に煩雑な作業を要求するために使用しにくいという問題があった。   In this way, the conventional technology performs sound image localization with sound pressure attenuation according to distance, so the Doppler effect due to the relative position movement of the sound source / listener present in the real world is not taken into account, and the sense of reality is sufficient There was no problem. In addition, the method of shifting the frequency in advance has a problem that rendering is in two stages, so that the consistency with the physical phenomenon is low, and it is difficult to use because it requires complicated work from the user and application developer.

また、頭部伝達関数は聴取者ごとに異なるため、予め実測した頭部伝達関数と聴取者の頭部伝達関数が異なると、音像の現実感・定位感が失われ、不特定多数の聴取者が使用するには難しいという問題がある。   In addition, since the head-related transfer function differs for each listener, if the head-related transfer function measured in advance differs from the listener's head-related transfer function, the sense of reality and localization of the sound image will be lost, and an unspecified number of listeners There is a problem that it is difficult to use.

本発明は、位置情報のみを刻々と与えれば、位置情報とドップラー効果の両方が付加され、さらに個人間で異なる頭部伝達関数をより一致させることで、音像の現実感・定位感のよい移動音源提示装置を提供することを目的としている。   In the present invention, if only position information is given momentarily, both the position information and the Doppler effect are added, and the head-related transfer functions that are different among individuals are made more consistent to move the sound image with a sense of reality and localization. The object is to provide a sound source presentation device.

本発明によれば、空間内の多数の点で測定したHRIRを記憶するHRIR記憶手段と、前記HRIRより遅延を取り除く遅延無HRTF演算手段と、前記遅延無しHRTF演算手段により計算されたHRIRを記憶するHRIR記憶手段と、両耳それぞれに生じるドップラー効果を演算する両耳到達波面算出手段と、畳み込み演算手段と、アプリケーション・聴取者との時間差を調整するパラメータ補間手段を具備し、音源・聴取者の位置・頭部の角度及びドップラー効果による両耳に到達する音波面の精密な模擬を行うことによって、聴取者に仮想現実的な三次元音像を提示することを特徴とした移動音像提示装置が得られる。   According to the present invention, HRIR storage means for storing HRIR measured at a number of points in space, delay-free HRTF calculation means for removing delay from the HRIR, and HRIR calculated by the delay-free HRTF calculation means are stored. HRIR storage means, binaural arrival wavefront calculation means for calculating the Doppler effect generated in both ears, convolution calculation means, and parameter interpolation means for adjusting the time difference between the application / listener and the sound source / listener A moving sound image presentation device that presents a virtual realistic three-dimensional sound image to a listener by accurately simulating the sound wave surface reaching both ears by the position of the head, the angle of the head, and the Doppler effect can get.

また本発明の遅延無HRIR演算手段は、空間内の多数の点で測定したHRIRを記憶するHRIR記憶手段と、アップサンプリング手段と、HRIRの二つのペアに対して相互相関係数を演算し、その値が最大になるように片方のHRIRを遅延させるHRIR遅延手段と、一連の遅延処理を前記HRIR記憶手段に記憶している全HRIRに施した後、全てのHRIRから同一量の遅延を除去する遅延除去手段と、使用するサンプリング周波数に戻すためのダウンサンプリング手段から構成されることを特徴とする、遅延成分を取り除いたHRIRの算出方法及びHRIT算出手段を提供する。   The delay-free HRIR computing means of the present invention computes a cross-correlation coefficient for two pairs of HRIR storage means, upsampling means, and HRIR for storing HRIR measured at a number of points in space, HRIR delay means that delays one HRIR so that its value is maximized, and a series of delay processing is applied to all HRIRs stored in the HRIR storage means, and then the same amount of delay is removed from all HRIRs The present invention provides an HRIR calculation method and HRIT calculation unit from which a delay component has been removed, characterized by comprising a delay removal unit that performs the above and a downsampling unit that returns the sampling frequency to be used.

また本発明の両耳到達波面算出手段は、頭部の回折を考慮した伝達距離算出手段と、左右の伝達距離算出手段より算出された距離に対しアプリケーションによるパラメータ更新までにパラメータ補間を行い、毎補間ごとの距離差を補間間隔で除し左右それぞれの耳に到達する音の相対速度を算出する相対速度算出手段と、算出した相対速度から遅延線の音サンプル読み出し位置を決定する遅延時間成長率の算出手段と、遅延線からの音サンプル読み込みの際のポインタ補間手段と、伝達距離に応じた音の減衰を表現する距離減衰付加手段から構成され、遅延線からの音サンプル読み込み位置を遅延時間成長率に従い刻々と変化させることで、両耳に到達する波面を模擬し、両耳間時間差と両耳それぞれのドップラー効果の付加を可能にしたことを特徴とする移動音像提示装置を提供する。   Further, the binaural arrival wavefront calculating means of the present invention performs parameter interpolation until the parameter is updated by the application with respect to the distance calculated by the transmission distance calculating means considering the diffraction of the head and the left and right transmission distance calculating means. Relative speed calculation means for calculating the relative speed of sound reaching the left and right ears by dividing the distance difference for each interpolation by the interpolation interval, and the delay time growth rate for determining the sound sample readout position of the delay line from the calculated relative speed Calculating means, pointer interpolation means for reading sound samples from the delay line, and distance attenuation adding means for expressing sound attenuation according to the transmission distance, and the sound sample reading position from the delay line as the delay time By changing every moment according to the growth rate, it was possible to simulate the wavefront reaching both ears and to add the time difference between both ears and the Doppler effect of each ear. To provide a mobile sound image presentation apparatus according to claim.

また本発明のHRIR記憶手段は、複数の人間から採取したHRIR情報を記憶してあり、HRIR選択手段によって聴取者個人により適合したHRIRを選択して使用することを特徴とした移動音像提示装置を提供する。   Further, the HRIR storage means of the present invention stores HRIR information collected from a plurality of humans, and selects a HRIR suitable for the individual listener by the HRIR selection means for use. provide.

また本発明のHRIR選択手段は、複数のHRTFより特定の軌道を持った仮想的な移動音像を作成し、あらかじめ聴取者に作成した移動音像の軌道を教示した上で二つの移動音源提示し、どちらの移動音源が教示した軌道と一致するかをトーナメント方式で次々に行い、聴取者個人に一番合致したHRTFを選択することによって、HRTFを個人化し、より定位感の高い三次元音像の提示を特徴とした移動音像提示装置を提供する。   Further, the HRIR selection means of the present invention creates a virtual moving sound image having a specific trajectory from a plurality of HRTFs, presents two moving sound sources after teaching the moving sound image trajectory created in advance to the listener, By selecting which HRTF matches the trajectory taught by the tournament method one after the other and selecting the HRTF that best matches the individual listener, the HRTF is personalized and a more localized 3D sound image is presented. A moving sound image presentation device characterized by the above is provided.

本発明によれば、頭部伝達関数を初期遅延と主応答に分離し、遅延についてはドップラー効果と共に処理をし、スペクトル成分は主応答部分で後からレンダリングをするようにしてドップラー効果を付加したので、レンダリング方法がより物理現象に近く(アプリケーション作成者に使用しやすく)、現実感がよいという効果が得られる。また、個人別により一致した頭部伝達関数を選択して使用することで、不特定多数の聴取者に対して提示する移動音像の現実感・定位感が向上するという効果が得られる。   According to the present invention, the head-related transfer function is separated into the initial delay and the main response, the delay is processed together with the Doppler effect, and the Doppler effect is added so that the spectral component is rendered later in the main response portion. As a result, the rendering method is closer to a physical phenomenon (easy to use for application creators), and the realism is good. In addition, by selecting and using a head-related transfer function that matches each individual, it is possible to improve the sense of reality and localization of the moving sound image presented to an unspecified number of listeners.

以下、本発明の実施の形態について図面を参照しながら説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

図1は本発明の実施の形態による移動音源提示装置の概略構成を示すブロック図である。図1を参照すると、移動音源提示装置300はアプリケーション100からの情報(音源位置101,聴取者位置102,モノラル音源データ103)を受け取って、それに基づいて演出(レンダリング)を施し、聴取者に装着されたヘッドホン200に伝達することで、聴取者に仮想現実的な音像を提示するものである。   FIG. 1 is a block diagram showing a schematic configuration of a moving sound source presentation apparatus according to an embodiment of the present invention. Referring to FIG. 1, the moving sound source presentation device 300 receives information (sound source position 101, listener position 102, monaural sound source data 103) from the application 100, performs rendering (rendering) based on the information, and attaches it to the listener. By transmitting it to the headphones 200, a virtual realistic sound image is presented to the listener.

図1の移動音源提示装置300は、空間内の多数の点で測定したHRIRを記憶するHRIR記憶手段1と、聴視者に一番適合した個人化HRIRを選択する個人化HRIR選択手段2と、前記HRIRより遅延を取り除く遅延無HRTF演算手段3と、前記遅延無しHRTF演算手段3により計算されたHRIRを記憶する遅延無HRIR記憶手段4と、両耳それぞれに生じるドップラー効果を演算する両耳到達波面算出手段5と、畳み込み演算手段7と、アプリケーション・聴取者との時間差を調整するパラメータ補間手段6とから構成されている。   The moving sound source presentation device 300 in FIG. 1 includes an HRIR storage unit 1 that stores HRIR measured at a number of points in space, and a personalized HRIR selection unit 2 that selects a personalized HRIR that best suits the viewer. The non-delayed HRTF calculating means 3 for removing the delay from the HRIR, the non-delayed HRIR storage means 4 for storing the HRIR calculated by the non-delayed HRTF calculating means 3, and the binaural for calculating the Doppler effect generated in each ear. The arrival wavefront calculation means 5, the convolution calculation means 7, and the parameter interpolation means 6 that adjusts the time difference between the application and the listener.

図2は本発明における遅延無HRIR演算手段3の詳細を説明するための構成図である。   FIG. 2 is a block diagram for explaining details of the delay-free HRIR computing means 3 in the present invention.

図2において、本発明における個人化HRIR選択手段2は、すでに選択したものとして省略して記す。   In FIG. 2, the personalized HRIR selection means 2 in the present invention is omitted as being already selected.

HRIR記憶手段1に予め空間内の多数の点で測定して記憶し、HRIR選択手段2で選択したHRIRは、アップサンプリング手段3aにおいて8倍のアップサンプリングが施される。この状態で、二つのHRIRに対して相互相関係数検査手段3bで相互相関関数を演算し、その値が最大になるように片方のHRIRをHRIR遅延手段3cで遅延させる。一連の遅延処理を前記HRIR記憶手段に記憶している全HRIRに施した後、初期遅延除去手段3dで全てのHRIRから同一量の遅延を除去する。   The HRIR storage means 1 measures and stores in advance a number of points in the space, and the HRIR selected by the HRIR selection means 2 is subjected to upsampling 8 times in the upsampling means 3a. In this state, the cross-correlation function is calculated by the cross-correlation coefficient inspection unit 3b for the two HRIRs, and one HRIR is delayed by the HRIR delay unit 3c so that the value becomes maximum. After performing a series of delay processes on all HRIRs stored in the HRIR storage means, the initial delay removal means 3d removes the same amount of delay from all HRIRs.

なお、本実施例では8倍アップサンプリングとしたが、それ以外の数値も選択できる。   In this embodiment, the upsampling is 8 times, but other numerical values can be selected.

図1の両耳到達波面計算手段5における伝達距離算出手段5aは、音源より発せられた音波が聴取者の両耳を通るまでに辿る経路を考えた算出手段である。本発明では図4のように2つの場合に分けた算出を行う。図4(a)のように、音源から球状を仮定した頭部に引いた接線の接点位置が両耳を結んだ直線(以後、耳軸と記す)をまたがない位置に存在する場合、音源から接点までの直線距離と接点から耳までの曲線距離を伝達距離とする。この場合、右耳への伝達距離は図中のR1+R2、左耳への伝達距離はL1+L2となる。これに対し図4(b)のように、接点が耳軸をまたいだ位置に存在する場合、片方の耳までの伝達距離は音源との直線距離により算出し、他方の耳は、前記と同様に音源と接点までの直線距離と接点から耳までの曲線距離により算出する。この場合、音源側の耳の到達距離は図中のD1、音源に対して影になる側の耳への到達距離はS1+S2となる。以上のように、本発明の実施例における移動音像提示装置の伝達距離算出手段は、単に音源と耳との直線距離を考えるのみでなく、回折を考慮した算出手法としている。 The transmission distance calculation means 5a in the binaural arrival wavefront calculation means 5 in FIG. 1 is a calculation means that considers the path that the sound wave emitted from the sound source travels through both ears of the listener. In the present invention, the calculation is divided into two cases as shown in FIG. As shown in FIG. 4 (a), when the contact point of the tangent drawn from the sound source to the head assuming a spherical shape exists at a position that does not cross the straight line connecting both ears (hereinafter referred to as the ear axis), the sound source The straight line distance from the contact point to the contact point and the curved distance from the contact point to the ear are defined as the transmission distance. In this case, the transmission distance to the right ear is R 1 + R 2 in the figure, and the transmission distance to the left ear is L 1 + L 2 . On the other hand, as shown in FIG. 4 (b), when the contact exists at a position across the ear axis, the transmission distance to one ear is calculated by the linear distance to the sound source, and the other ear is the same as described above. The calculation is based on the linear distance from the sound source to the contact point and the curved distance from the contact point to the ear. In this case, the reach distance of the ear on the sound source side is D 1 in the figure, and the reach distance to the ear on the shadow side with respect to the sound source is S 1 + S 2 . As described above, the transmission distance calculation means of the moving sound image presentation apparatus according to the embodiment of the present invention is not only a linear distance between the sound source and the ear, but also a calculation method considering diffraction.

相対速度算出手段5bは、前記伝達距離算出手段に示したように、回折経路を考慮したものにする必要がある。最も単純な算出手段として、音源及び聴取者の速度ベクトルを両耳方向に分解する方法があるが、この方法は、相対速度が音源から両耳への直線経路に依存したものとなる。そこで、本発明の移動音像提示装置では、微少時間における相対位置の変化に基づき相対速度を算出する。相対速度をνr、ある時間における一方の耳と音源との経路距離をγn、次の時刻における距離をγn+1とすると、補間間隔Δt時間における相対速度を次の数1式によって算出する。 As shown in the transmission distance calculation means, the relative speed calculation means 5b needs to take the diffraction path into consideration. As the simplest calculation means, there is a method of decomposing the velocity vector of the sound source and the listener in the direction of both ears. This method depends on the linear velocity from the sound source to both ears. Therefore, in the moving sound image presentation device of the present invention, the relative velocity is calculated based on the change in the relative position in a very short time. When the relative speed is ν r , the path distance between one ear and the sound source at a certain time is γ n , and the distance at the next time is γ n + 1 , the relative speed at the interpolation interval Δt time is calculated by the following equation (1). To do.

この方法により、相対速度は回折経路を考慮したものになる。   With this method, the relative velocity takes into account the diffraction path.

遅延線5d1は、両耳に到達する音サンプルの読み出しをそれぞれの耳に対し独立に行うために用意する。アプリケーション100より得た音源サンプル103は単位時間あたりに1サンプルずつ左右の遅延線5d1に入れる。これに対し遅延線5d1から音サンプルを読み出す際は、前記の相対速度算出手段5bから伝達経路を考慮した相対速度を算出し、遅延時間成長率を算出し、音サンプル読み込み位置を動的に変化させ、ある時刻における両耳への到達音サンプルを算出する。   The delay line 5d1 is prepared in order to read out sound samples reaching both ears independently for each ear. The sound source sample 103 obtained from the application 100 is put into the left and right delay lines 5d1 one sample per unit time. On the other hand, when reading the sound sample from the delay line 5d1, the relative speed calculation means 5b calculates the relative speed in consideration of the transmission path, calculates the delay time growth rate, and dynamically changes the sound sample reading position. And a sound sample reaching both ears at a certain time is calculated.

前記のように、遅延線からの音サンプル読み出し位置の制御に遅延時間成長率を使用する。遅延時間成長率は、音源の速度をνsl、聴取者の速度をνlsとし、次の数2式
により算出する。この遅延時間成長率を用いて、単位時間あたりに読み出し位置を次の数2−1式
ずつインクリメントすることにより、両耳到達音波の模擬が可能になる。
As described above, the delay time growth rate is used to control the sound sample readout position from the delay line. The delay time growth rate is expressed by the following equation, where ν sl is the speed of the sound source and ν ls is the speed of the listener.
Calculated by Using this delay time growth rate, the readout position per unit time is expressed by the following equation 2-1.
By incrementing each one, it is possible to simulate binaural sound waves.

ポインタ補間手段5d2は、遅延線5d1上の読み出し位置が、整数値の遅延線インデックスを示していない場合に用いる。読み込み位置が整数インデックスを示す場合は、そのインデックスに格納されている音サンプル値を出力する。整数インデックスを示さない場合の補間は、ラグランジェ補間により、読み出し位置に対応する音サンプル値の算出を行う。ラグランジェ補間は、曲線の関数上の点を補間する方法であり、n+1点の座標(x0,y0)〜(xn,yn)が与えられたとき、このn+1を通るn次多項式を次の数3式により算出する。 The pointer interpolation means 5d2 is used when the read position on the delay line 5d1 does not indicate an integer delay line index. When the reading position indicates an integer index, the sound sample value stored in the index is output. In the interpolation when the integer index is not indicated, the sound sample value corresponding to the readout position is calculated by Lagrange interpolation. Lagrangian interpolation is a method of interpolating points on a function of a curve. When coordinates (x 0 , y 0 ) to (x n , y n ) of n + 1 points are given, an nth order polynomial passing through this n + 1 is used. Is calculated by the following equation (3).

本装置では、前後それぞれ2サンプルずつのデータから3次の補間多項式を用いて所望の音サンプル値を算出する。   In this apparatus, a desired sound sample value is calculated from the data of two samples before and after using a cubic interpolation polynomial.

距離減衰付加手段5eは、前記の手段を用いて求めた出力サンプルに対し、伝達距離に応じた音の減衰を付加する手段を指す。本装置では、無限大バフル内の振動体を仮定し、音源と各耳との距離をρ、音源の半径をσとし、次の数4式
による減衰量を音サンプルに対し加える。
The distance attenuation adding means 5e refers to means for adding sound attenuation according to the transmission distance to the output sample obtained using the above means. In this device, assuming a vibrating body in an infinite baffle, ρ is the distance between the sound source and each ear, and σ is the radius of the sound source.
Attenuation by is added to the sound sample.

以上の構成要素により移動音像提示装置は構成される。本装置を用いて、シミュレーションを行った結果を示す。シミュレーションの条件は、
・音源:4kHzを中心周波数とするオクターブバンドノイズ
・軌道:前方50m,左1.5mの方向から,後方に直線移動
・速度:1cm/ms (約時速36km)
・HRIR:ダミーヘッドを用いて録音されたもの
である。時間と周波数の関係として、音源のスペクトログラムを図4に、装置の左出力のスペクトログラムを図5に示す。
The moving sound image presenting apparatus is configured by the above components. The result of having performed simulation using this device is shown. The simulation conditions are
・ Sound source: Octave band noise with a center frequency of 4 kHz ・ Orbit: Linear movement backward from the direction of 50 m forward and 1.5 m left ・ Speed: 1 cm / ms (about 36 km / h)
・ HRIR: Recorded using a dummy head. As the relationship between time and frequency, the spectrogram of the sound source is shown in FIG. 4, and the spectrogram of the left output of the apparatus is shown in FIG.

図5が4kHzを中心としたオクターブバンド帯域における成分が定常的に優勢であるのに対し、図6では、時間によって、優勢な帯域が変化している。これにより、ドップラー効果が付加されていることが分かる。   In FIG. 5, the components in the octave band band centering on 4 kHz are steadily dominant, whereas in FIG. 6, the dominant band changes with time. Thereby, it turns out that the Doppler effect is added.

また、時間と音源位置との関係を調べるために、横軸を時間、縦軸を頭部中心からの音源角度として、時間と音源角度の関係を調べた。音源角度は、出力音の両耳間レベル差(ILD:Interaural Level Difference,以後ILDとする)とHRIRにおけるILDとの対応を調べることによって算出した。この結果を図7に示す。   In order to investigate the relationship between time and sound source position, the relationship between time and sound source angle was examined with the horizontal axis representing time and the vertical axis representing the sound source angle from the head center. The sound source angle was calculated by examining the correspondence between the interaural level difference (ILD) of the output sound and the ILD in HRIR. The result is shown in FIG.

この音源角度は、正面方向を0度とし、半時計回りで増加する。図7を見ると、左前方から左後方に移動する軌道に応じた音源角度の変化をしていることがわかる。   The sound source angle increases counterclockwise with the front direction being 0 degrees. It can be seen from FIG. 7 that the sound source angle changes according to the trajectory moving from the left front to the left rear.

以上の結果から、本発明の実施例における移動音像提示装置は、位置とドップラー効果の同時模擬を実現していることがわかる。   From the above results, it can be seen that the moving sound image presentation device in the embodiment of the present invention realizes simultaneous simulation of the position and the Doppler effect.

図3は本発明の一実施例におけるHRTF個人化手段2の具体的な音像提示位置を示す概念図である。   FIG. 3 is a conceptual diagram showing specific sound image presentation positions of the HRTF personalization means 2 in one embodiment of the present invention.

HRTF個人化は下記の手順によって行う。
(1)予め複数の人間(本実施例では16人)からHRTFを計測して用意しておく。
(2)上記複数のHRTFを用いて、図3bに示される矢状面の軌道を持った仮想的な移動音像を作成する。
(3)聴取者に作成した移動音像の軌道を教示する。
(4)聴取者に二つずつ移動音像を提示し、どちらの音像があらかじめ教示した音像の軌道とイメージが合致していたかを比較・選択させる。
(5)この比較をトーナメント方式で行い、最終的に成績が良かったHRTFを決定し選択する。
HRTF personalization is done by the following procedure.
(1) HRTFs are measured and prepared in advance from a plurality of persons (16 persons in this embodiment).
(2) A virtual moving sound image having a sagittal trajectory shown in FIG. 3B is created using the plurality of HRTFs.
(3) Teach the listener the trajectory of the moving sound image created.
(4) Presenting two moving sound images to the listener, and comparing and selecting which sound image matches the image of the sound image trajectory taught in advance.
(5) Perform this comparison in the tournament method, and finally select and select the HRTF that performed well.

移動音像の軌道は、図3(a)に示されるような水平面に提示すると、左右の時間差のみで正確にHRTFの結果を反映し難いので、図3(b)のような矢状面が望ましい。   If the trajectory of the moving sound image is presented on a horizontal plane as shown in FIG. 3 (a), it is difficult to accurately reflect the result of HRTF with only the time difference between the left and right, so a sagittal plane as shown in FIG. 3 (b) is desirable. .

(5)の手順で用いるトーナメントは、スイス式トーナメントを絞り込みに使用することでより厳密に個人化を行うことができるだけでなく、第二の候補や第三の候補となる聴覚ディスプレイの個人化HRTFを求めることができる。   The tournament used in the procedure of (5) can be personalized more strictly by using a Swiss tournament for narrowing down, as well as personalized HRTFs for the second and third candidate auditory displays. Can be requested.

予め用意する音像の数は複数で多いほど良いが、トーナメントの性格上2の倍数または2の乗数がのぞましい。本実施例では初めに32個のHRTFを16組にわけ、それぞれどちらのHRTFを用いた場合の定位感が良いかを選択する。定位感の良いほうは一勝を獲得し悪いほうは一敗となる。次に同じ勝ち数のHRTF同士で16組をつくり選択する。   The more the number of sound images prepared in advance, the better. However, a multiple of 2 or a multiplier of 2 is preferable because of the nature of the tournament. In this embodiment, 32 HRTFs are first divided into 16 sets, and each HRTF is used to select which of the localization feelings is good. The one with a good sense of orientation will win one win and the one with a bad one will lose one. Next, create and select 16 pairs of HRTFs with the same number of wins.

無敗のHRTFが1つになるまでこれを繰り返す。   Repeat this until there is one undefeated HRTF.

このスイス式トーナメントを使用すれば、本来優秀な(より個人に合致した)HRTFが、早い段階で敗退して選択されないことを避けることができる。   Using this Swiss tournament, you can avoid the fact that a good (more personalized) HRTF will be eliminated and not selected early.

図8は、本発明による移動音像提示装置を、音空間訓練装置に適用した例である。   FIG. 8 is an example in which the moving sound image presentation device according to the present invention is applied to a sound space training device.

聴取者に取り付けられる位置センサ付ヘッドホンと、同様に位置センサを具備したハンマー型コントローラと、移動音像提示装置からなる。   It consists of a headphone with a position sensor attached to the listener, a hammer-type controller similarly equipped with a position sensor, and a moving sound image presentation device.

移動音像提示装置では、音空間訓練アプリケーションにより指定された位置とヘッドホンに具備された位置センサによる頭部姿勢情報から仮想的な移動音像を提示する。   In the moving sound image presenting device, a virtual moving sound image is presented from the position specified by the sound space training application and the head posture information by the position sensor provided in the headphones.

聴取者は、提示された音像の場所をコントローラで指し示す。   The listener points the location of the presented sound image with the controller.

指し示す位置は、コントローラに具備された位置センサにより検出され、指し示した位置と提示音像の位置が同一だった場合には得点とする。   The pointed position is detected by a position sensor provided in the controller, and if the pointed position and the position of the presentation sound image are the same, a score is given.

このようなアプリケーションを用いることで、提示された移動音像を正確に把握して指し示す訓練を行うことができる。   By using such an application, it is possible to perform training for accurately grasping and pointing the presented moving sound image.

本発明に係る音源提示装置は、視覚障害者に三次元的な音像を提示して、音の位置を認識する訓練をおこなう訓練装置や、三次元的に提示される音像を操縦する娯楽機器等の様々な分野に適用できる。   The sound source presentation apparatus according to the present invention is a training apparatus for performing training for recognizing a position of a sound by presenting a three-dimensional sound image to a visually impaired person, an entertainment device for manipulating a sound image presented three-dimensionally, and the like It can be applied to various fields.

また本発明によって製造された移動音像提示装置は高精度聴覚ディスプレイとして広く用いることが出来る。   Moreover, the moving sound image presentation apparatus manufactured by the present invention can be widely used as a high-precision auditory display.

本発明による移動音像提示装置の一実施例を示すブロック図である。It is a block diagram which shows one Example of the moving sound image presentation apparatus by this invention. 本発明の一実施例における移動音像提示装置の、遅延HRIR算出手段の詳細構成を示すブロック図である。It is a block diagram which shows the detailed structure of the delay HRIR calculation means of the moving sound image presentation apparatus in one Example of this invention. 本発明の一実施例における移動音像提示装置の、個人化HRIR選択手段において、聴視者に提示する音像の軌道を示す図である。It is a figure which shows the track | orbit of the sound image shown to a viewer in the personalized HRIR selection means of the moving sound image presentation apparatus in one Example of this invention. 本発明の一実施例における移動音像提示装置において、両耳までの伝達距離の算出手段を説明する概念図である。It is a conceptual diagram explaining the calculation means of the transmission distance to both ears in the moving sound image presentation apparatus in one Example of this invention. 本発明の移動音像提示装置の効果を説明するための音源のスペクトログラムを示す図である。It is a figure which shows the spectrogram of the sound source for demonstrating the effect of the moving sound image presentation apparatus of this invention. 本発明の移動音像提示装置の効果を説明するための装置出力音のスペクトログラムを示す図である。It is a figure which shows the spectrogram of the apparatus output sound for demonstrating the effect of the moving sound image presentation apparatus of this invention. 本発明の移動音像提示装置の効果を説明するための時間と音源角度との関係を示す図である。It is a figure which shows the relationship between time for demonstrating the effect of the moving sound image presentation apparatus of this invention, and a sound source angle. 本発明の移動音像提示装置の一実施例を訓練装置に応用したときの一実施例を示す図である。It is a figure which shows one Example when one Example of the moving sound image presentation apparatus of this invention is applied to a training apparatus.

符号の説明Explanation of symbols

1 HRIR記憶手段
2 個人化HRIR選択手段
3 遅延無HRIR算出手段
4 遅延無HRIR記憶手段
5 両耳到達差波面算出手段
5a 伝達距離算出手段
5b 相対速度算出手段
5c 遅延時間成長率算出手段
5d 時変遅延回路
5d1 遅延線
5d2 ポインタ補間手段
5e 距離減衰付加手段
6a パラメータ補間手段
6b パラメータ補間手段
7 畳み込み演算手段
100 アプリケーション
101 音源位置
102 聴取者位置
103 モノラル音源データ
200 ヘッドホン
300 移動音像提示装置
1 HRIR storage means 2 Personalized HRIR selection means 3 Delayless HRIR calculation means 4 Delayless HRIR storage means 5 Binaural arrival difference wavefront calculation means 5a Transmission distance calculation means 5b Relative velocity calculation means 5c Delay time growth rate calculation means 5d Time-varying Delay circuit 5d1 Delay line 5d2 Pointer interpolation means 5e Distance attenuation addition means 6a Parameter interpolation means 6b Parameter interpolation means 7 Convolution calculation means 100 Application 101 Sound source position 102 Listener position 103 Monaural sound source data 200 Headphone 300 Mobile sound image presentation device

Claims (5)

三次元空間内で刻々と位置が変化する音像をパラメータ(音源・聴取者の位置情報,モノラル音源)と頭部伝達インパルス応答 (HRIR:Head Related Impulse Response 以後HRIRと記す)より演算処理を施し聴取者に対して提示する移動音像提示装置において、
空間内の多数の点で測定したHRIRを記憶するHRIR記憶手段と、前記HRIRより遅延を取り除く遅延無HRTF演算手段と、前記遅延無しHRTF演算手段により計算されたHRIRを記憶するHRIR記憶手段と、両耳それぞれに生じるドップラー効果を演算する両耳到達波面算出手段と、畳み込み演算手段と、アプリケーション・聴取者との時間差を調整するパラメータ補間手段を具備し、音源・聴取者の位置・頭部の角度及びドップラー効果による両耳に到達する音波面の精密な模擬を行うことによって、聴取者に仮想現実的な三次元音像を提示することを特徴とした移動音像提示装置。
Listening to sound images whose position changes every moment in a three-dimensional space using parameters (sound source / listener position information, monaural sound source) and head-related impulse response (HRIR: HRIR). In a moving sound image presentation device presented to a person,
HRIR storage means for storing HRIR measured at a number of points in space, delay-free HRTF calculation means for removing delay from the HRIR, HRIR storage means for storing HRIR calculated by the delay-free HRTF calculation means, It has binaural arrival wavefront calculation means for calculating the Doppler effect generated in each of the ears, convolution calculation means, and parameter interpolation means for adjusting the time difference between the application and the listener. An apparatus for presenting a moving sound image, characterized by presenting a virtual three-dimensional sound image to a listener by precisely simulating sound waves that reach both ears by an angle and a Doppler effect.
前記請求項1記載の遅延無HRIR演算手段は、空間内の多数の点で測定したHRIRを記憶するHRIR記憶手段と、アップサンプリング手段と、HRIRの二つのペアに対して相互相関係数を演算し、その値が最大になるように片方のHRIRを遅延させるHRIR遅延手段と、一連の遅延処理を前記HRIR記憶手段に記憶している全HRIRに施した後、全てのHRIRから同一量の遅延を除去する遅延除去手段と、使用するサンプリング周波数に戻すためのダウンサンプリング手段から構成されることを特徴とする、遅延成分を取り除いたHRIRの算出方法及びHRIR算出手段。   The delay-free HRIR computing means according to claim 1 computes cross-correlation coefficients for two pairs of HRIR storage means for storing HRIR measured at a number of points in space, upsampling means, and HRIR. HRIR delay means for delaying one HRIR so that the maximum value is obtained, and a series of delay processing is applied to all HRIRs stored in the HRIR storage means, and then the same amount of delay is applied from all HRIRs. A HRIR calculation method and an HRIR calculation unit from which a delay component has been removed, characterized by comprising: a delay removal unit that removes the delay component; and a downsampling unit that returns the sampling frequency to be used. 前記請求項1の両耳到達波面算出手段は、頭部の回折を考慮した伝達距離算出手段と、左右の伝達距離算出手段より算出された距離に対しアプリケーションによるパラメータ更新までにパラメータ補間を行い、毎補間ごとの距離差を補間間隔で除し左右それぞれの耳に到達する音の相対速度を算出する相対速度算出手段と、算出した相対速度から遅延線の音サンプル読み出し位置を決定する遅延時間成長率の算出手段と、遅延線からの音サンプル読み込みの際のポインタ補間手段と、伝達距離に応じた音の減衰を表現する距離減衰付加手段から構成され、遅延線からの音サンプル読み込み位置を遅延時間成長率に従い刻々と変化させることで、両耳に到達する波面を模擬し、両耳間時間差と両耳それぞれのドップラー効果の付加を可能にしたことを特徴とする移動音像提示装置。   The binaural arrival wavefront calculating means according to claim 1 performs parameter interpolation until a parameter is updated by an application with respect to the distance calculated by the transmission distance calculating means considering the diffraction of the head and the left and right transmission distance calculating means, Relative speed calculation means for calculating the relative speed of sound reaching the left and right ears by dividing the distance difference for each interpolation by the interpolation interval, and delay time growth for determining the sound sample readout position of the delay line from the calculated relative speed It is composed of rate calculation means, pointer interpolation means when reading sound samples from the delay line, and distance attenuation adding means that expresses sound attenuation according to the transmission distance, and delays the sound sample reading position from the delay line By changing every moment according to the time growth rate, the wavefront reaching both ears is simulated, and the time difference between both ears and the Doppler effect of each ear can be added. Moving sound image presentation apparatus according to claim and. 前記請求項1のHRIR記憶手段は、複数の人間から採取したHRIR情報を記憶してあり、HRIR選択手段によって聴取者個人により適合したHRIRを選択して使用することを特徴とした移動音像提示装置。   The HRIR storage means according to claim 1 stores HRIR information collected from a plurality of persons, and selects and uses an HRIR that is more suitable for the individual listener by the HRIR selection means. . 前記請求項4のHRIR選択手段は、複数のHRTFより特定の軌道を持った仮想的な移動音源を作成し、あらかじめ聴取者に作成した移動音像の軌道を教示した上で二つの移動音源提示し、どちらの移動音源が教示した軌道と一致するかをトーナメント方式で次々に行い、聴取者個人に一番合致したHRTFを選択することによって、HRTFを個人化し、より定位感の良い三次元音像を提示できるようにした特徴とした移動音像提示装置。
The HRIR selection means according to claim 4 creates a virtual moving sound source having a specific trajectory from a plurality of HRTFs, teaches the trajectory of the moving sound image created in advance to the listener, and presents the two moving sound sources. , Which one of the moving sound source matches the trajectory taught in the tournament method one after the other, by selecting the HRTF that best matches the individual listener, personalize the HRTF, and produce a more three-dimensional sound image with a better sense of localization A moving sound image presentation device with a feature that can be presented.
JP2005035047A 2005-02-10 2005-02-10 Moving sound image presenting device Pending JP2006222801A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005035047A JP2006222801A (en) 2005-02-10 2005-02-10 Moving sound image presenting device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005035047A JP2006222801A (en) 2005-02-10 2005-02-10 Moving sound image presenting device

Publications (1)

Publication Number Publication Date
JP2006222801A true JP2006222801A (en) 2006-08-24

Family

ID=36984797

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005035047A Pending JP2006222801A (en) 2005-02-10 2005-02-10 Moving sound image presenting device

Country Status (1)

Country Link
JP (1) JP2006222801A (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008020620A1 (en) 2006-08-17 2008-02-21 Mitsubishi Chemical Corporation Negative electrode active material for lithium ion secondary battery, method for producing the same, negative electrode for lithium ion secondary battery using the same, and lithium ion secondary battery
JP2009028083A (en) * 2007-07-24 2009-02-12 Toshiba Corp Ultrasonic diagnosis apparatus and acoustic output method of ultrasonic diagnosis apparatus
JP2010520671A (en) * 2007-03-01 2010-06-10 ジェリー・マハバブ Speech spatialization and environmental simulation
JP2011071665A (en) * 2009-09-25 2011-04-07 Korg Inc Acoustic device
CN109299489A (en) * 2017-12-13 2019-02-01 中航华东光电(上海)有限公司 A kind of scaling method obtaining individualized HRTF using interactive voice
WO2023210699A1 (en) * 2022-04-28 2023-11-02 公立大学法人秋田県立大学 Sound generation device, sound reproduction device, sound generation method, and sound signal processing program

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08191225A (en) * 1995-01-09 1996-07-23 Matsushita Electric Ind Co Ltd Sound field reproducing device
JPH08265900A (en) * 1995-03-27 1996-10-11 Sharp Corp Sound image localization controller
JPH09284899A (en) * 1996-04-08 1997-10-31 Matsushita Electric Ind Co Ltd Signal processor
JPH10174198A (en) * 1996-12-11 1998-06-26 Yamaha Corp Sound image localizing device
JP2003333697A (en) * 2002-05-10 2003-11-21 Tama Tlo Kk Signal interpolating apparatus and interpolating method therefor

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08191225A (en) * 1995-01-09 1996-07-23 Matsushita Electric Ind Co Ltd Sound field reproducing device
JPH08265900A (en) * 1995-03-27 1996-10-11 Sharp Corp Sound image localization controller
JPH09284899A (en) * 1996-04-08 1997-10-31 Matsushita Electric Ind Co Ltd Signal processor
JPH10174198A (en) * 1996-12-11 1998-06-26 Yamaha Corp Sound image localizing device
JP2003333697A (en) * 2002-05-10 2003-11-21 Tama Tlo Kk Signal interpolating apparatus and interpolating method therefor

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008020620A1 (en) 2006-08-17 2008-02-21 Mitsubishi Chemical Corporation Negative electrode active material for lithium ion secondary battery, method for producing the same, negative electrode for lithium ion secondary battery using the same, and lithium ion secondary battery
JP2010520671A (en) * 2007-03-01 2010-06-10 ジェリー・マハバブ Speech spatialization and environmental simulation
JP2009028083A (en) * 2007-07-24 2009-02-12 Toshiba Corp Ultrasonic diagnosis apparatus and acoustic output method of ultrasonic diagnosis apparatus
JP2011071665A (en) * 2009-09-25 2011-04-07 Korg Inc Acoustic device
CN109299489A (en) * 2017-12-13 2019-02-01 中航华东光电(上海)有限公司 A kind of scaling method obtaining individualized HRTF using interactive voice
WO2023210699A1 (en) * 2022-04-28 2023-11-02 公立大学法人秋田県立大学 Sound generation device, sound reproduction device, sound generation method, and sound signal processing program

Similar Documents

Publication Publication Date Title
CN112567768B (en) Spatial audio for interactive audio environments
Serafin et al. Sonic interactions in virtual reality: State of the art, current challenges, and future directions
US20090041254A1 (en) Spatial audio simulation
US11651762B2 (en) Reverberation gain normalization
JP2006222801A (en) Moving sound image presenting device
JP7507300B2 (en) Low-frequency inter-channel coherence control
Tonnesen et al. 3D sound synthesis
WO2023199817A1 (en) Information processing method, information processing device, acoustic playback system, and program
Britton Seeing With Sound

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080110

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091030

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091118

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100324