WO2024105825A1 - 音響再生システム - Google Patents

音響再生システム Download PDF

Info

Publication number
WO2024105825A1
WO2024105825A1 PCT/JP2022/042618 JP2022042618W WO2024105825A1 WO 2024105825 A1 WO2024105825 A1 WO 2024105825A1 JP 2022042618 W JP2022042618 W JP 2022042618W WO 2024105825 A1 WO2024105825 A1 WO 2024105825A1
Authority
WO
WIPO (PCT)
Prior art keywords
speaker
speakers
sound
signal
center
Prior art date
Application number
PCT/JP2022/042618
Other languages
English (en)
French (fr)
Inventor
幹記 矢入
嗣人 星野
隆 武内
フィリップ アーサー ネルソン
Original Assignee
鹿島建設株式会社
アダプティブ オーディオ リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 鹿島建設株式会社, アダプティブ オーディオ リミテッド filed Critical 鹿島建設株式会社
Priority to PCT/JP2022/042618 priority Critical patent/WO2024105825A1/ja
Publication of WO2024105825A1 publication Critical patent/WO2024105825A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic

Definitions

  • This disclosure relates to an audio reproduction system.
  • Patent Document 1 discloses an audio reproduction system that reproduces the direction, distance, spread, etc. of sound in a three-dimensional manner.
  • the system reproduces three-channel sound, a center channel, a left channel, and a right channel, from multiple speakers based on a left recording signal corresponding to the listener's left ear and a right recording signal corresponding to the listener's right ear.
  • the system has a center speaker corresponding to the center channel, multiple left speakers corresponding to the left channel, and multiple right speakers corresponding to the right channel.
  • the system determines the frequency band of the sound to be output for each left speaker and each right speaker, and distributes signals of the appropriate frequency band to the appropriate speakers.
  • the system configures a filter for each speaker to cancel crosstalk.
  • Crosstalk is a component of sound that reaches an ear other than the ear to be controlled. Specifically, the system measures the entire transfer system of the plant matrix from the speaker to both ears, and realizes independent control of both ears by calculating the inverse matrix (inverse system
  • An audio reproduction system reproduces sound in a listening space in which a listener is present.
  • the audio reproduction system includes a plurality of speakers and a controller.
  • the plurality of speakers are arranged in the listening space.
  • the controller reproduces three-channel sound, i.e., a center channel, a left channel, and a right channel, from the plurality of speakers based on a left recording signal corresponding to the listener's left ear and a right recording signal corresponding to the listener's right ear.
  • the plurality of speakers include a center speaker corresponding to the center channel, a plurality of left speakers corresponding to the left channel, and a plurality of right speakers corresponding to the right channel.
  • the bandwidths of the plurality of left speakers and the plurality of right speakers are preset so that the bandwidths of the sounds that can be output are different.
  • the controller includes an inversion unit and a division unit.
  • the inversion unit inverts the polarity of either the input signal to the left speaker based on the left recording signal or the input signal to the right speaker based on the left recording signal so that the phase difference between them is 180 degrees at all frequencies, and inverts the polarity of either the input signal to the right speaker based on the right recording signal or the input signal to the left speaker based on the right recording signal so that the phase difference between them is 180 degrees at all frequencies.
  • the division unit divides the left recording signal and the right recording signal to become signals of discrete bandwidths.
  • the controller reproduces the sound related to the discrete bandwidth signals at the center speaker and the right and left speakers having corresponding bandwidths.
  • Either the multiple speakers or the controller includes a delay means for delaying the sound related to the discrete bandwidth signals output from each of the left and right speakers by a relative delay time preset for each of the left and right speakers with respect to the center speaker for each speaker.
  • the delay time is preset for each left speaker and right speaker so that crosstalk is canceled at a specific frequency included in the bandwidth preset for each left speaker and right speaker.
  • the phase difference between the signal related to the left channel and the signal related to the center channel, and the phase difference between the signal related to the center channel and the signal related to the right channel must be shifted by a predetermined value (e.g., 90 degrees) at all frequencies. Furthermore, the phase difference between the signal related to the left channel and the signal related to the right channel must be shifted by a predetermined value (e.g., 180 degrees) at all frequencies.
  • a predetermined value e.g. 90 degrees
  • a relative delay time is set for each left speaker and each right speaker with respect to the center speaker.
  • the sound related to the discrete bandwidth signal output from each left speaker and each right speaker is delayed for each speaker by the relative delay time with respect to the center speaker that is preset for each left speaker and each right speaker.
  • the delay time is preset for each left speaker and each right speaker so that crosstalk is canceled at a predetermined frequency included in the bandwidth preset for each left speaker and each right speaker.
  • phase difference between the input signal to the left speaker based on the left recording signal and the input signal to the right speaker based on the left recording signal is processed to be shifted by 180 degrees at a predetermined frequency included in each band by inverting the polarity of both input signals so that the polarities of both input signals are different from each other.
  • phase difference between the input signal to the right speaker based on the right recording signal and the input signal to the left speaker based on the right recording signal is processed to be shifted by 180 degrees at a specific frequency included in each band by inverting the polarity of both input signals so that they are different from each other.
  • this sound reproduction system does not calculate an inverse system for all frequencies, but rather inverts the polarity of either the input signal to the left speaker or the right speaker based on the left recording signal, and either the input signal to the right speaker or the left speaker based on the right recording signal, so that crosstalk is canceled at a representative frequency (predetermined frequency) from the frequency band assigned to the speaker, while creating a time difference (simple delay) between the sound of the center speaker and the sound of the left speaker and the right speaker.
  • the calculation of a predetermined frequency included in the frequency band represents the calculation of the frequency band assigned to the speaker. Therefore, this sound reproduction system can significantly reduce calculation costs compared to when the inverse system is calculated for all frequencies, although the accuracy of crosstalk cancellation for sounds at frequencies that deviate from the representative frequency is somewhat reduced.
  • the delay times may be preset for the left and right speakers so that at a given frequency, the phase difference between the left channel sound and the center channel sound is 90 degrees, and the phase difference between the center channel sound and the right channel sound is 90 degrees.
  • the audio reproduction system can process the phase difference between the left channel signal and the center channel signal, and between the center channel signal and the right channel signal, to be 90 degrees at a given frequency included in each band.
  • the delay means in the controller may be a delay unit that delays a signal of a discrete bandwidth by signal processing.
  • the audio reproduction system can provide a time difference (simple delay) for the sound of the center speaker by signal processing.
  • the delay time ⁇ may be determined in advance for each of the left and right speakers so that, in a coordinate system with the origin being the center point of both ears of a listener in a planar view, ⁇ is the angle between a line connecting the position of the right or left speaker and the origin and a line connecting the position of the center speaker and the origin, ⁇ r is the equivalent distance between both ears, and c is the speed of sound.
  • the delay means provided in the multiple speakers may be realized by arranging a center speaker, multiple right speakers, and multiple left speakers to satisfy a positional relationship in which sound related to a signal of a discrete bandwidth reaching a listener is delayed by a preset delay time in each right speaker and each left speaker.
  • the audio reproduction system can provide a time difference (simple delay) with respect to the sound of the center speaker by arranging each right speaker and each left speaker.
  • This disclosure provides technology that can reduce the computational costs associated with independent control of both ears.
  • FIG. 1 is a schematic diagram illustrating an example of a sound reproducing system according to an embodiment.
  • 1 is a block diagram showing an example of a sound reproduction system according to an embodiment.
  • FIG. 1 is a block diagram illustrating binaural synthesis using loudspeakers with a three-channel inverse system.
  • FIG. 2 is a diagram for explaining the geometric positional relationship between a sound source and a listener.
  • FIG. 2 is a diagram for explaining the definition of an azimuth angle interval.
  • FIG. 1 illustrates the concept of a pair of monopole sources whose azimuth angle varies continuously as a function of frequency.
  • 13 is a graph showing the relationship between azimuth angle spacing and frequency for multiple left speakers.
  • FIG. 1 is a schematic diagram illustrating an example of a sound reproducing system according to an embodiment.
  • 1 is a block diagram showing an example of a sound reproduction system according to an embodiment.
  • FIG. 1 is a block diagram illustrating binaural synthesis using loudspeakers with
  • FIG. 13 is a schematic diagram showing an example of a sound reproducing system according to a modified example.
  • FIG. 13 is a block diagram showing an example of a sound reproducing system according to a modified example. This is the result of simulating the sound pressure distribution produced by an audio reproduction system that realizes time delay through signal processing. This is the result of simulating the sound pressure distribution of an audio reproduction system in which time delay is achieved by speaker arrangement.
  • FIG. 1 is a schematic diagram showing an example of a sound reproduction system according to an embodiment.
  • the sound reproduction system 1 shown in Fig. 1 reproduces sound in a listening space 10 in which a listener 11 is present.
  • the sound reproduction system 1 includes a multi-way speaker unit 2 (an example of a plurality of speakers) arranged in the listening space 10, and a controller 3.
  • the controller 3 is connected so as to be able to control the multi-way speaker unit 2.
  • the controller 3 is configured as a computer system including, for example, a processor such as a CPU (Central Processing Unit), memory such as a RAM (Random Access Memory) and a ROM (Read Only Memory), input/output devices such as a touch panel, mouse, keyboard, and display, and a communication device such as a network card.
  • the processor of the controller 3 operates each piece of hardware based on a program stored in the memory, etc., thereby realizing the functions of the controller 3, which will be described later.
  • the controller 3 may be configured to be able to refer to the database 4.
  • the database 4 stores sounds to be provided to the listener 11.
  • the database 4 stores a left recording signal 41 corresponding to the left ear 11L of the listener 11 and a right recording signal 42 corresponding to the right ear 11R of the listener 11.
  • the controller 3 reproduces three-channel sound from the multi-way speaker unit 2 based on the left recording signal 41 and the right recording signal 42.
  • the three channels are a center channel Cch, a left channel Lch, and a right channel Rch, and will be described in detail later in the explanation of FIG. 3.
  • the multi-way speaker unit 2 includes a center speaker 20 corresponding to the center channel Cch, multiple left speakers LW corresponding to the left channel Lch, and multiple right speakers RW corresponding to the right channel Rch. Note that the number of speakers corresponding to each channel is arbitrary.
  • the multiple left speakers LW include, in order from a position close to the center speaker 20 to a position away from it, a first left speaker 21L, a second left speaker 22L, a third left speaker 23L, a fourth left speaker 24L, a fifth left speaker 25L, and a sixth left speaker 26L.
  • the multiple right speakers RW include, in order from a position close to the center speaker 20 to a position away from it, a first right speaker 21R, a second right speaker 22R, a third right speaker 23R, a fourth right speaker 24R, a fifth right speaker 25R, and a sixth right speaker 26R.
  • the bandwidth of the multiple left speakers LW and the multiple right speakers RW is preset so that the bandwidth of the frequency of the sound that can be output is different.
  • the bandwidth of the frequency of the sound that can be output is preset so that the bandwidth is lower the farther away from the center speaker 20.
  • the center speaker 20 reproduces sound in the full range. As a result, when a high frequency sound is reproduced from the multi-way speaker unit 2, sound is output from the center speaker 20 and the left and right speakers close to the center speaker 20. When a low frequency sound is reproduced from the multi-way speaker unit 2, sound is output from the center speaker 20 and the left and right speakers far from the center speaker 20.
  • Fig. 2 is a block diagram showing an example of an audio reproduction system according to an embodiment.
  • the controller 3 includes input terminals for inputting a left recording signal 41 and a right recording signal 42, and is connected to the multi-way speaker unit 2.
  • the controller 3 includes a polarity inversion unit 31 (an example of an inversion unit), a band splitting unit 32 (an example of a splitting unit), a simple delay unit 33 (an example of a delay means), and an amplifier 34.
  • the polarity inversion unit 31 inverts the polarity of either the input signal to the multiple left speakers LW based on the left recording signal 41 or the input signal to the multiple right speakers RW based on the left recording signal 41 so that the polarities of the two input signals are different from each other. Similarly, the polarity inversion unit 31 inverts the polarity of either the input signal to the multiple right speakers RW based on the right recording signal 42 so that the polarities of the input signal to the multiple left speakers LW based on the right recording signal 42 are different from each other. By inverting the polarity, the phase difference between the signal related to the left channel Lch and the signal related to the right channel Rch is adjusted.
  • the polarity inversion unit 31 multiplies one of the signals related to the left channel Lch and the right channel Rch by a negative value so that the input signal to the multiple right speakers RW based on the left recording signal 41 is a negative value.
  • the band splitting unit 32 splits the left recording signal 41 and the right recording signal 42 into bands.
  • the bandwidths of the multiple left speakers LW and the multiple right speakers RW are preset so that the bandwidths of the frequencies of the sounds that can be output are different.
  • the signals split by the band splitting unit 32 are referred to as signals of discrete bandwidths.
  • the signals of discrete bandwidths are distributed to the speakers that can output them and are played back.
  • the simple delay unit 33 delays the sound associated with the discrete bandwidth signals output from each left speaker and each right speaker by a delay time relative to the center speaker that is preset for each left speaker and each right speaker.
  • the delay time is preset for each left speaker and each right speaker so that crosstalk is cancelled at a specific frequency included in the bandwidth preset for each left speaker and each right speaker.
  • the simple delay unit 33 uses signal processing to delay the signal by the same amount for each speaker, that is, for each corresponding bandwidth.
  • the signal processing may be digital signal processing or analog signal processing. Details of the delay time will be described later.
  • the amplifier 34 amplifies the signal output from the controller 3 to the multi-way speaker unit 2.
  • the multi-way speaker unit 2 converts the amplified signal into sound and provides it to the listener 11.
  • the polarity reversal unit 31 may be disposed between the amplifier 34 and the multi-way speaker unit 2. When disposed between the amplifier 34 and the multi-way speaker unit 2, the polarity reversal unit 31 is configured as a switch circuit that switches the positive and negative speaker terminals of either the left speaker or the right speaker and connects them.
  • Fig. 3 is a block diagram for explaining binaural synthesis by speakers using a three-channel inverse system.
  • the input signal for the right ear is dR (j ⁇ ) and the input signal for the left ear is dL (j ⁇ ), where ⁇ is the angular frequency.
  • the inverse system is represented by an inverse filter matrix H.
  • the inverse filter matrix H processes two input signals and outputs filtered signals to three channels, here a sound source V C corresponding to the center channel Cch, a sound source V R corresponding to the right channel Rch, and a sound source V L corresponding to the left channel Lch.
  • the inverse filter matrix H is, for example, a determinant with 2 rows and 3 columns.
  • the transfer matrix from the sound source to the ears of the listener is defined as a plant matrix C.
  • the plant matrix C is, for example, a determinant with 2 rows and 3 columns.
  • the signal received by the right ear is defined as w R (j ⁇ )
  • the signal received by the left ear is defined as w L (j ⁇ ).
  • FIG. 4 is a diagram for explaining the geometrical positional relationship between the sound source and the listener
  • FIG. 5 is a diagram for explaining the definition of the azimuth angle interval.
  • the geometrical positional relationship between the sound source and the listener is expressed in a coordinate system in which the center point of both ears of the listener 11 viewed in a plan view is the origin of the x-axis.
  • the angle between the line connecting the arrangement position of the sound source VL or the sound source VR and the origin and the line connecting the arrangement position of the sound source VC and the origin is defined as the azimuth angle interval ⁇ .
  • the azimuth angle interval ⁇ is the difference in azimuth angles, and is the opening angle between the sound source Vc and the lateral sound source VL or the sound source VL as seen from the listener 11.
  • the equivalent interval between the two ears is defined as ⁇ r.
  • the equivalent interval is the distance corrected by taking into account the effect of diffraction in the head.
  • a plant matrix C normalized by the sound pressure at the left ear is generally expressed by the following equation (1).
  • the wave number k0 ⁇ / c0 ( c0 is the speed of sound) and g (0 or more) is the relative sensitivity of the center channel Cch to the left and right channels Lch and Rch.
  • the effect of the head-related transfer function is not taken into account, and the problem is considered as a left-right symmetric problem under free sound field conditions.
  • the inverse filter matrix H that realizes independent control of two sound receiving points (right ear and left ear) needs to satisfy the relationship of the following equation (2).
  • I represents the unit matrix.
  • the sound source strength (maximum amplification amount) required to reproduce an arbitrary input signal at each frequency can be calculated from the 2-norm of H (the maximum singular value of the inverse filter matrix H) (the following equation (3)).
  • ⁇ i and ⁇ o are two singular values, which correspond to the amplification amounts of the in-phase and anti-phase components of the desired binaural signal, respectively.
  • the singular values can be theoretically derived by using singular value decomposition and are expressed by the following equation (4).
  • Fig. 7 is a diagram for explaining binaural control in a three-channel sound reproduction system. First, a case will be described in which a sound related to a left recording signal 41 is provided to the left ear of a listener.
  • the signal dL (jw) which is the left recording signal 41 is branched into three channels by the inverse filter matrix H.
  • the signal dL (jw) is filtered by H11 (jw) as a signal corresponding to the left channel Lch, and becomes an input signal to the sound source VL .
  • the sound of the sound source VL is provided to the left ear of the listener, and its phase is rotated by 180 degrees and provided to the right ear of the listener.
  • the signal dL (jw) is filtered by H31 (jw) as a signal corresponding to the right channel Rch, and becomes an input signal to the sound source VR .
  • the sound of the sound source VR is provided to the right ear of the listener, and its phase is rotated by 180 degrees and provided to the left ear of the listener. Furthermore, the signal dL (jw) is filtered by H21 (jw) as a signal corresponding to the center channel Cch, and becomes an input signal to the sound source VC . The sound of source V C is presented in phase to both ears of the listener.
  • equation (9) is rearranged with respect to the delay time ⁇ , it is expressed by the following equation (10).
  • crosstalk is cancelled at a predetermined frequency.
  • the delay time ⁇ at the predetermined frequency is determined as the delay time ⁇ in that band, and the delay time ⁇ is uniformly applied in the frequency band.
  • FIG. 8 is a graph showing the relationship between the azimuth angle interval and the frequency for multiple left speakers.
  • the horizontal axis of the graph in FIG. 8 is the azimuth angle interval, and the vertical axis is the frequency.
  • a graph of formula (5) is shown when n is 0.5, 1, 1.5, 2, and 2.5.
  • the first left speaker 21L is assigned the first band R1
  • the second left speaker 22L is assigned the second band R2
  • the third left speaker 23L is assigned the third band R3
  • the fourth left speaker 24L is assigned the fourth band R4
  • the fifth left speaker 25L is assigned the fifth band R5.
  • a seventh band R7 that is even lower than the sixth band R6 may be assigned to a sound source such as a woofer (not shown).
  • a delay time ⁇ relative to the center speaker 20 is set in advance for each left speaker and each right speaker.
  • the sound related to the signal of the discrete bandwidth output from each left speaker and each right speaker is delayed for each speaker by a delay time ⁇ relative to the center speaker that is set in advance for each left speaker and each right speaker.
  • the delay time ⁇ is set in advance for each left speaker and each right speaker so that crosstalk is canceled at a predetermined frequency included in the bandwidth set in advance for each left speaker and each right speaker.
  • the phase difference between the signal related to the left channel Lch and the signal related to the center channel Cch, and between the signal related to the center channel Cch and the signal related to the right channel Rch is processed to be shifted by 90 degrees at a predetermined frequency included in each band.
  • the phase difference between the signal related to the left channel Lch and the signal related to the right channel Rch is processed so that it is shifted by 180 degrees at a predetermined frequency included in each band by inverting the polarity so that the polarity of the input signal to the left speaker based on the left recording signal 41 and the polarity of the input signal to the right speaker based on the left recording signal 41 are different from each other, and by inverting the polarity so that the polarity of the input signal to the right speaker based on the right recording signal 42 and the polarity of the input signal to the left speaker based on the right recording signal 42 are different from each other.
  • the sound reproduction system 1 does not calculate the inverse system for all frequencies, but rather inverts the polarity of one of the sound signals of the left and right speakers and creates a time difference (simple delay) between the sound of the center speaker and the sounds of the left and right speakers so that crosstalk is canceled at a representative frequency (predetermined frequency) from the frequency band assigned to the speakers.
  • the calculation of the specified frequency included in the frequency band represents the calculation of the frequency band assigned to the speakers. Therefore, compared to when the inverse system is calculated for all frequencies, the sound reproduction system 1 can significantly reduce calculation costs, although the accuracy of crosstalk cancellation for sounds at frequencies that deviate from the representative frequency is somewhat reduced.
  • FIG. 9 is a schematic diagram showing an example of an audio reproduction system according to a modified example.
  • audio reproduction system 1A differs in that it is provided with a multi-way speaker unit 2A with a different speaker arrangement and a controller 3A that does not include a delay means, but is otherwise the same.
  • the following description will focus on the differences from audio reproduction system 1, and will not repeat overlapping descriptions.
  • the multi-way speaker unit 2A like the multi-way speaker unit 2, has a center speaker 20 corresponding to the center channel Cch, multiple left speakers LW corresponding to the left channel Lch, and multiple right speakers RW corresponding to the right channel Rch. Note that the number of speakers corresponding to each channel is arbitrary.
  • the center speaker 20, the multiple right speakers RW, and the multiple left speakers LW are arranged so as to satisfy a positional relationship in which a sound related to a signal of a discrete bandwidth reaching the listener 11 is delayed by a delay time ⁇ set in advance in each right speaker and each left speaker.
  • the distance between the speakers and the listener 11 is adjusted in advance so that the sound output from the left and right speakers is delayed by the delay time ⁇ relative to the center speaker 20.
  • the delay time ⁇ shown in equation (10) is converted into a path difference ⁇ l using the sound speed c0 .
  • the path difference ⁇ l is the difference between the path l3 between the center speaker 20 and the listener 11 and the path l1 between the left speaker (or the right speaker) and the listener 11. In this way, the speakers may be arranged in advance to satisfy the delay time ⁇ .
  • FIG. 10 is a block diagram showing an example of an audio reproduction system according to a modified example.
  • the controller 3A shown in FIG. 10 is different from the controller 3 in that it does not include a simple delay unit 33, but is otherwise the same.
  • the number of right speakers and the number of left speakers described in the above embodiment may be changed as appropriate.
  • the number of right speakers and the number of left speakers do not have to be the same.
  • at least one center speaker 20 is sufficient.
  • a center speaker other than the center speaker 20 may be provided.
  • the center speaker 20 and the other center speaker are arranged in the median plane of the listener 11.
  • the center speaker 20 does not need to reproduce sound in the full range, but it is sufficient that the center speaker 20 and the other center speaker reproduce sounds in the frequency ranges assigned to them, and the multiple center speakers as a whole reproduce full-range (all frequency range) sounds.
  • n that determines the frequency band is not limited to these.
  • the value of n that determines the frequency band may be set appropriately as long as it satisfies the condition that the value of n that determines the lower limit is smaller than 2 and the value of n that determines the upper limit is greater than 2.
  • the sound reproduction systems 1 and 1A shown in Fig. 1 and Fig. 9 were used.
  • the sound pressure distribution was simulated assuming that the listener 11 was located at the origin in the listening space 10.
  • the results for the sound reproduction system 1 are shown in Fig. 11, and the results for the sound reproduction system 1A are shown in Fig. 12.
  • Figure 11 shows the results of simulating the sound pressure distribution of an audio reproduction system that realizes time delay through signal processing.
  • Figure 12 shows the results of simulating the sound pressure distribution of an audio reproduction system that realizes time delay through speaker arrangement.
  • Figures 11 and 12 are diagrams that express sound pressure levels (dB) with shading. As shown in Figures 11 and 12, in both sound pressure distributions, it was confirmed that the left ear of listener 11 was nearly 0 dB and the right ear was about -20 dB, in other words, the sound was sufficiently reduced in the right ear. In this way, it was confirmed that independent control of both ears can be achieved using polarity inversion and time delay. It was also confirmed that the time delay may be achieved by signal processing or by speaker arrangement.
  • 1, 1A...sound reproduction system 2, 2A...multi-way speaker unit (one example of multiple speakers), 3, 3A...controller, 10...listening space, 11...listener, 20...center speaker, 41...left recording signal, 42...right recording signal, LW...multiple left speakers, RW...multiple right speakers.

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)

Abstract

音響再生システムは、3チャンネルのサウンドを複数のスピーカから再生させるコントローラを備え、コントローラは、左録音信号に基づいた左スピーカへの入力信号及び右スピーカへの入力信号の何れか一方の極性を反転させ、かつ、右録音信号に基づいた右スピーカへの入力信号及び左スピーカへの入力信号の何れか一方の極性を反転させる反転ユニットと、左録音信号及び右録音信号を、離散的な帯域幅の信号となるように分割する分割ユニットとを有し、複数のスピーカ及びコントローラの何れか一方は、各左スピーカ及び各右スピーカから出力される離散的な帯域幅の信号に係るサウンドを、所定の遅延時間だけスピーカごとに遅らせる遅延手段を含み、遅延時間は所定の周波数においてクロストークがキャンセルされるように左スピーカ及び右スピーカごとに予め設定される。

Description

音響再生システム
 本開示は、音響再生システムに関する。
 特許文献1は、音の方向、距離、広がりなどを立体的に再現する音響再生システムを開示する。システムは、聴取者の左耳に対応する左録音信号と聴取者の右耳に対応する右録音信号とに基づいて、センターチャンネル、左チャンネル及び右チャンネルの3チャンネルのサウンドを複数のスピーカから再生させる。システムは、センターチャンネルに対応するセンタースピーカと、左チャンネルに対応する複数の左スピーカと、右チャンネルに対応する複数の右スピーカとを有する。システムは、左スピーカごと、及び、右スピーカごとに、出力されるサウンドの周波数帯域を決定し、適当な周波数帯域の信号を適当なスピーカに分配する。システムは、スピーカごとに、クロストークをキャンセルするようにフィルタを構成する。クロストークとは、制御対象となる耳とは別の耳に届く音の成分である。具体的には、システムは、スピーカから両耳までのプラント行列の伝達系を全て計測し、その逆行列(逆システム)を演算することで、両耳の独立制御を実現する。
特表2010-532614号公報
 特許文献1に記載のシステムは、全ての周波数に対して逆システムを厳密に構成して制御するため、デジタル信号処理による詳細な設計が必要となる。このため、特許文献1に記載のシステムでは、演算コストが増加するおそれがある。演算コストは、演算の手間、タスクの数、複雑度などを意味する。本開示は、両耳の独立制御に係る演算コストを軽減できる技術を提供する。
 本開示の一側面に係る音響再生システムは、聴取者が存在する聴取空間においてサウンドを再生する。音響再生システムは、複数のスピーカ及びコントローラを備える。複数のスピーカは、聴取空間に配置される。コントローラは、聴取者の左耳に対応する左録音信号と聴取者の右耳に対応する右録音信号とに基づいて、センターチャンネル、左チャンネル及び右チャンネルの3チャンネルのサウンドを複数のスピーカから再生させる。複数のスピーカは、センターチャンネルに対応するセンタースピーカと、左チャンネルに対応する複数の左スピーカと、右チャンネルに対応する複数の右スピーカとを有する。複数の左スピーカ及び複数の右スピーカそれぞれは、出力可能なサウンドの帯域幅が異なるように、帯域幅が予め設定される。コントローラは、反転ユニット及び分割ユニットを有する。反転ユニットは、互いの位相差が全ての周波数において180度になるように左録音信号に基づいた左スピーカへの入力信号及び左録音信号に基づいた右スピーカへの入力信号の何れか一方の極性を反転させ、かつ、互いの位相差が全ての周波数において180度になるように右録音信号に基づいた右スピーカへの入力信号及び右録音信号に基づいた左スピーカへの入力信号の何れか一方の極性を反転させる。分割ユニットは、左録音信号及び右録音信号を、離散的な帯域幅の信号となるように分割する。コントローラは、離散的な帯域幅の信号に係るサウンドを、センタースピーカ、並びに、対応する帯域幅が設定された右スピーカ及び左スピーカで再生させる。複数のスピーカ及びコントローラの何れか一方は、各左スピーカ及び各右スピーカから出力される離散的な帯域幅の信号に係るサウンドを、各左スピーカ及び各右スピーカに予め設定されたセンタースピーカに対する相対的な遅延時間だけ、スピーカごとに遅らせる遅延手段を含む。遅延時間は、各左スピーカ及び各右スピーカに予め設定された帯域幅に含まれる所定の周波数においてクロストークがキャンセルされるように、左スピーカ及び右スピーカごとに予め設定される。
 3チャンネルにおいて両耳の独立制御を実現するためには、ある片側の録音信号に係る処理において、左チャンネルに係る信号とセンターチャンネルに係る信号との間の位相差、および、センターチャンネルに係る信号と右チャンネルに係る信号との間の位相差が、全ての周波数において所定値(例えば90度)ずれる必要がある。さらに、左チャンネルに係る信号と右チャンネルに係る信号との間の位相差は、全ての周波数において所定値(例えば180度)ずれる必要がある。この音響再生システムにおいては、上述した位相差は、遅延時間及び極性反転によって近似的に実現される。
 この音響再生システムにおいては、各左スピーカ及び各右スピーカに、センタースピーカに対する相対的な遅延時間が予め設けられる。各左スピーカ及び各右スピーカから出力される離散的な帯域幅の信号に係るサウンドは、各左スピーカ及び各右スピーカに予め設定されたセンタースピーカに対する相対的な遅延時間だけ、スピーカごとに遅れる。遅延時間は、各左スピーカ及び各右スピーカに予め設定された帯域幅に含まれる所定の周波数においてクロストークがキャンセルされるように、左スピーカ及び右スピーカごとに予め設定される。このような遅延時間が設けられることにより、左チャンネルに係る信号とセンターチャンネルに係る信号との間、および、センターチャンネルに係る信号と右チャンネルに係る信号との間の位相差は、各帯域に含まれる所定の周波数において所定値(例えば90度)ずれるように処理される。さらに、左録音信号に基づいた左スピーカへの入力信号と左録音信号に基づいた右スピーカへの入力信号との位相差は、両者の入力信号の極性が互いに異なるように極性反転されることで、各帯域に含まれる所定の周波数において180度ずれるように処理される。同様に、右録音信号に基づいた右スピーカへの入力信号と右録音信号に基づいた左スピーカへの入力信号との位相差は、両者の入力信号の極性が互いに異なるように極性反転されることで、各帯域に含まれる所定の周波数において180度ずれるように処理される。
 このように、この音響再生システムは、全ての周波数に対して逆システムを計算するのではなく、スピーカに割り当てられた周波数帯域の中から代表的な周波数(所定の周波数)においてクロストークがキャンセルされるように、左録音信号に基づいた左スピーカ及び右スピーカへの入力信号の何れか一方、並びに、右録音信号に基づいた右スピーカ及び左スピーカへの入力信号の何れか一方の極性を反転させつつ、センタースピーカのサウンドと左スピーカ及び右スピーカのサウンドとの間に時間差(単純遅延)をつける。つまり、周波数帯域に含まれる所定の周波数の演算が、スピーカに割り当てられた周波数帯域の演算を代表することになる。よって、この音響再生システムは、全ての周波数に対して逆システムを計算する場合と比べて、代表的な周波数からずれた周波数のサウンドに係るクロストークキャンセルの正確性が多少低下するものの、演算コストを大幅に低減させることができる。
 一実施形態においては、遅延時間は、所定の周波数において、左チャンネルのサウンドとセンターチャンネルのサウンドとの間の位相差が90度ずれるように、及び、センターチャンネルのサウンドと右チャンネルのサウンドとの間の位相差が90度ずれるように、左スピーカ及び右スピーカごとに予め設定されてもよい。この場合、音響再生システムは、左チャンネルに係る信号とセンターチャンネルに係る信号との間、および、センターチャンネルに係る信号と右チャンネルに係る信号との間の位相差を、各帯域に含まれる所定の周波数において90度ずれるように処理できる。
 一実施形態においては、コントローラに備わる遅延手段は、離散的な帯域幅の信号を信号処理で遅延させる遅延ユニットであってもよい。この場合、音響再生システムは、信号処理によって、センタースピーカのサウンドに対して時間差(単純遅延)をつけることができる。
 一実施形態においては、遅延時間Δτは、平面視された聴取者の両耳の中心点を原点とする座標系において、右スピーカ又は左スピーカの配置位置と原点とを結ぶ直線と、センタースピーカの配置位置と原点とを結ぶ直線とのなす角をθ、両耳の等価間隔をΔr、音速をcとしたとき、Δτ=(Δr・sinθ)/(2・c)を満たすように、左スピーカ及び右スピーカごとに予め定められもよい。
 一実施形態においては、複数のスピーカに備わる遅延手段は、センタースピーカ、複数の右スピーカ、及び、複数の左スピーカが、聴取者に到達する離散的な帯域幅の信号に係るサウンドが各右スピーカ及び各左スピーカに予め設定された遅延時間だけ遅延する位置関係を満たすように配置されることで実現されてもよい。この場合、音響再生システムは、各右スピーカ及び各左スピーカの配置によって、センタースピーカのサウンドに対して時間差(単純遅延)をつけることができる。
 一実施形態においては、各スピーカの配置位置は、平面視された聴取者の両耳の中心点を原点とする座標系において、右スピーカ又は左スピーカの配置位置と原点とを結ぶ直線と、センタースピーカの配置位置と原点とを結ぶ直線とのなす角をθ、両耳の等価間隔をΔr、音速をc、右スピーカ又は左スピーカとセンタースピーカとの経路差をΔlとすると、Δl=(Δr・sinθ)/2を満たすように定められてもよい。
 本開示によれば、両耳の独立制御に係る演算コストを軽減できる技術が提供される。
実施形態に係る音響再生システムの一例を示す概要図である。 実施形態に係る音響再生システムの一例を示すブロック図である。 3チャンネルの逆システムを用いたスピーカによるバイノーラル合成を説明するブロック図である。 音源と聴取者との幾何学的な位置関係を説明する図である。 方位角間隔の定義を説明する図である。 方位角が周波数の関数として連続に変化する一対のモノポール音源という概念を説明する図である。 複数の左スピーカにおける方位角間隔と周波数との関係を示すグラフである。 3チャンネルの音響再生システムにおける両耳制御を説明する図である。 変形例に係る音響再生システムの一例を示す概要図である。 変形例に係る音響再生システムの一例を示すブロック図である。 時間遅延を信号処理によって実現した音響再生システムによる音圧分布をシミュレーションした結果である。 時間遅延をスピーカ配置によって実現した音響再生システムによる音圧分布をシミュレーションした結果である。
 以下、図面を参照して、本開示の実施形態について説明する。なお、以下の説明において、同一又は相当要素には同一符号を付し、重複する説明は繰り返さない。図面の寸法比率は、説明のものと必ずしも一致していない。「上」「下」「左」「右」の語は、図示する状態に基づくものであり、便宜的なものである。
[音響再生システムの構成]
 図1は、実施形態に係る音響再生システムの一例を示す概要図である。図1に示される音響再生システム1は、聴取者11が存在する聴取空間10においてサウンドを再生する。図1に示されるように、音響再生システム1は、聴取空間10に配置されるマルチウェイスピーカユニット2(複数のスピーカの一例)、及び、コントローラ3を備える。
 コントローラ3は、マルチウェイスピーカユニット2を制御可能に接続される。コントローラ3は、例えばCPU(Central Processing Unit)などのプロセッサと、RAM(Random Access Memory)及びROM(Read Only Memory)などのメモリと、タッチパネル、マウス、キーボード、ディスプレイなどの入出力装置と、ネットワークカードなどの通信装置とを含むコンピュータシステムとして構成される。コントローラ3は、メモリなどに記憶されたプログラムに基づいてプロセッサが各ハードウェアを動作させることにより、後述するコントローラ3の機能を実現する。
 コントローラ3は、データベース4を参照可能に構成されてもよい。データベース4は、聴取者11へ提供するサウンドを記憶する。データベース4は、一例として、聴取者11の左耳11Lに対応する左録音信号41と聴取者11の右耳11Rに対応する右録音信号42を記憶する。
 コントローラ3は、左録音信号41と右録音信号42とに基づいて、3チャンネルのサウンドをマルチウェイスピーカユニット2から再生させる。3チャンネルは、センターチャンネルCch、左チャンネルLch及び右チャンネルRchであり、詳細は図3の説明において後述する。マルチウェイスピーカユニット2は、センターチャンネルCchに対応するセンタースピーカ20、左チャンネルLchに対応する複数の左スピーカLW、及び、右チャンネルRchに対応する複数の右スピーカRWを備える。なお、各チャンネルに対応するスピーカの数は任意である。
 図1に示される例では、複数の左スピーカLWは、センタースピーカ20に近接する位置から離間する位置へと順に、第1左スピーカ21L、第2左スピーカ22L、第3左スピーカ23L、第4左スピーカ24L、第5左スピーカ25L、及び、第6左スピーカ26Lを含む。複数の右スピーカRWは、センタースピーカ20に近接する位置から離間する位置へと順に、第1右スピーカ21R、第2右スピーカ22R、第3右スピーカ23R、第4右スピーカ24R、第5右スピーカ25R、及び、第6右スピーカ26Rを含む。
 複数の左スピーカLW及び複数の右スピーカRWそれぞれは、出力可能なサウンドの周波数の帯域幅が異なるように、帯域幅が予め設定される。例えば、センタースピーカ20から離間するほど出力可能なサウンドの周波数の帯域幅が低くなるように、予め設定される。センタースピーカ20は、フルレンジでサウンドを再生する。これにより、マルチウェイスピーカユニット2から高い周波数のサウンドを再生するときには、センタースピーカ20と、センタースピーカ20に近い左右のスピーカから音が出力される。マルチウェイスピーカユニット2から低い周波数のサウンドを再生するときには、センタースピーカ20と、センタースピーカ20から遠い左右のスピーカから音が出力される。
[コントローラの詳細]
 図2は、実施形態に係る音響再生システムの一例を示すブロック図である。図2に示されるように、コントローラ3は、左録音信号41と右録音信号42とを入力する入力端子を備え、マルチウェイスピーカユニット2に接続される。コントローラ3は、極性反転ユニット31(反転ユニットの一例)、帯域分割ユニット32(分割ユニットの一例)、単純遅延ユニット33(遅延手段の一例)、及び、増幅器34を備える。
 極性反転ユニット31は、左録音信号41に基づいた複数の左スピーカLWへの入力信号と、左録音信号41に基づいた複数の右スピーカRWへの入力信号との極性が互いに異なるように、両者の入力信号の何れか一方の極性を反転する。同様に、極性反転ユニット31は、右録音信号42に基づいた複数の右スピーカRWへの入力信号と右録音信号42に基づいた複数の左スピーカLWへの入力信号との極性が互いに異なるように、両者の入力信号の何れか一方の極性を反転する。極性を反転させることで、左チャンネルLchに係る信号と右チャンネルRchに係る信号との位相差が調整される。具体的な一例としては、極性反転ユニット31は、左録音信号41に基づいた複数の左スピーカLWへの入力信号が正の値を取る場合に、左録音信号41に基づいた複数の右スピーカRWへの入力信号が負の値を取るように、左チャンネルLchに係る信号及び右チャンネルRchに係る信号の何れか一方にマイナスを乗算する。
 帯域分割ユニット32は、左録音信号41と右録音信号42とを帯域ごとに分割する。上述したとおり、複数の左スピーカLW及び複数の右スピーカRWそれぞれは、出力可能なサウンドの周波数の帯域幅が異なるように、帯域幅が予め設定される。以下では、帯域分割ユニット32によって分割された信号を、離散的な帯域幅の信号という。離散的な帯域幅の信号は、出力可能なスピーカへと振り分けられ、再生される。
 単純遅延ユニット33は、各左スピーカ及び各右スピーカから出力される離散的な帯域幅の信号に係るサウンドを、各左スピーカ及び各右スピーカに予め設定されたセンタースピーカに対する相対的な遅延時間だけスピーカごとに遅らせる。遅延時間は、各左スピーカ及び各右スピーカに予め設定された帯域幅に含まれる所定の周波数においてクロストークがキャンセルされるように、左スピーカ及び右スピーカごとに予め設定される。単純遅延ユニット33は、スピーカ単位、つまり、対応する帯域幅ごとに、信号を一律に同じ時間だけ信号処理で遅らせる。信号処理は、デジタル信号処理でもよいし、アナログ信号処理でもよい。遅延時間の詳細については後述する。
 増幅器34は、コントローラ3からマルチウェイスピーカユニット2へ出力される信号を増幅する。マルチウェイスピーカユニット2は、増幅された信号をサウンドに変換して聴取者11へ提供する。なお、極性反転ユニット31は、増幅器34とマルチウェイスピーカユニット2との間に配置されてもよい。増幅器34とマルチウェイスピーカユニット2との間に配置される場合、極性反転ユニット31は、左スピーカ及び右スピーカの何れか一方のスピーカ端子のプラスマイナスを入れ替えて繋ぐスイッチ回路として構成される。
[両耳の独立制御の詳細]
 コントローラ3による両耳の独立制御を説明するために、最初に、3チャンネルの逆システムを用いたスピーカによるバイノーラル合成を説明する。図3は、3チャンネルの逆システムを用いたスピーカによるバイノーラル合成を説明するブロック図である。図3に示されるように、右耳用の入力信号をd(jω)、左耳用の入力信号をd(jω)とする。ωは角周波数である。
 逆システムは、逆フィルタ行列Hで表現される。逆フィルタ行列Hは、2つの入力信号を処理し、3つのチャンネル、ここではセンターチャンネルCchに対応する音源V、右チャンネルRchに対応する音源V、及び、左チャンネルLchに対応する音源Vに、フィルタ処理後の信号を出力する。逆フィルタ行列Hは、一例として2行3列の行列式である。音源から聴取者の耳までの間の伝達行列をプラント行列Cとする。プラント行列Cは、一例として2行3列の行列式である。右耳で受音される信号をw(jω)、左耳で受音される信号をw(jω)とする。
 図3に示されるシステムを数学的に記述するために、音源及び聴取者11の位置関係は、図4及び図5に示されるように定義される。図4は、音源と聴取者との幾何学的な位置関係を説明する図であり、図5は、方位角間隔の定義を説明する図である。図4に示されるように、音源と聴取者との幾何学的な位置関係は、平面視された聴取者11の両耳の中心点をx軸の原点とする座標系で表現される。音源V又は音源Vの配置位置と原点とを結ぶ直線と、音源Vの配置位置と原点とを結ぶ直線とのなす角を方位角間隔θとする。図5に示されるように、方位角間隔θは、方位角の差であり、聴取者11からみた音源Vcと横の音源V又は音源Vとの開き角である。両耳の等価間隔をΔrとする。等価間隔とは、実際の両耳間の距離を、頭部における回折の影響を考慮して補正した距離である。
 図4及び図5における位置関係において、左耳の音圧で正規化したプラント行列Cは、一般に次の式(1)で表される。
Figure JPOXMLDOC01-appb-M000001
ここで、波数k=ω/c(cは音速)であり、g(0以上)はセンターチャンネルCchの左右チャンネルLch,Rchに対する相対感度である。逆フィルタ行列の物理的解釈を容易にするため、頭部伝達関数の影響は考慮せず、自由音場条件下での左右対称の問題として考察する。
 理想的に2つの受音点(右耳及び左耳)の独立制御を実現する逆フィルタ行列Hは以下の式(2)の関係を満たす必要がある。
Figure JPOXMLDOC01-appb-M000002
ここで、Iは単位行列を表す。
各周波数における任意入力信号の再生に必要な音源強度(最大増幅量)は逆フィルタ行列Hの特異値の最大値であるHの2ノルム(以下の式(3))から求めることができる。
Figure JPOXMLDOC01-appb-M000003
ここで、σ及びσは、2つの特異値であり、それぞれ所望のバイノーラル信号の同相成分と逆相成分の増幅量とに対応する。特異値は特異値分解を用いることで理論的に導出することができ、次の式(4)で表される。
Figure JPOXMLDOC01-appb-M000004
ここで、gは感度である。式(4)に示される特異値σ,σをkΔrsinθの関数として表現し直すと、特異値σ,σは、周期的に変化し、波数kと方位角間隔θとが整数nに対して次の式(5)の関係を満たす場所で顕著な山谷を生じる。
Figure JPOXMLDOC01-appb-M000005
これは、所望の周波数の同相成分および逆相成分を最小限の労力で再生することのできる最適な音源位置が存在することを意味する。2つの特異値σ,σが互いに等しくなる(σ=σ)場合、周波数と方位角との関係は、式(5)においてn=1(両耳間行路差=1/4波長)からn=3(両耳間行路差=3/4波長)まで変化する。したがって、n=2(両耳間行路差=1/2波長)で逆相成分の特異値σが単独で最小となる周波数と方位角との関係を利用することも可能である。
 式(5)において、n=2の場合、Hの2ノルムが最小になるためには、次の式(6)を満たす必要がある。
Figure JPOXMLDOC01-appb-M000006
すなわち、センターチャンネルCchの感度が左右チャンネルLch,Rchよりも21/2倍だけ大きいときに、最も効率良く(過度の増幅なく)逆システムを構成できる。この場合、最小ノルム解から得られる逆フィルタ行列Hは、次の式(7)となる。
Figure JPOXMLDOC01-appb-M000007
これは、逆相成分に寄与する左右2つの音源に拮抗するためには、同相成分に寄与するセンターチャネルがそれらの2倍の音源強度を必要とすることを意味する。3チャンネルの最適な音源分散配置の原理を満たす概念的モノポール音源は、図6に示される。図6に示されるように、式(5)においてn=2を満たすように、周波数と開き角とが一定の関係を保ちながら連続的に変化するモノポール音源となる。
 式(7)で表現される逆フィルタ行列Hに着目すると、H11の位相を90度ずらすとH21となり、H21の位相を90度ずらすとH31となる。また、H11の位相を180度ずらす、つまり、極性反転すると、H31となる。これらの関係を踏まえ、最適な音源分散配置の原理による両耳独立制御について概説する。図7は、3チャンネルの音響再生システムにおける両耳制御を説明する図である。最初に、聴取者の左耳へ左録音信号41に係るサウンドを提供する場合を説明する。
 図7に示されるように、左録音信号41である信号d(jw)は、逆フィルタ行列Hによって3チャンネルに分岐される。信号d(jw)は、左チャンネルLchに対応する信号として、H11(jw)によってフィルタ処理され、音源Vへの入力信号となる。音源Vのサウンドは、聴取者の左耳へ提供されると共に、その位相が180度回転し、聴取者の右耳へ提供される。そして、信号d(jw)は、右チャンネルRchに対応する信号として、H31(jw)によってフィルタ処理され、音源Vへの入力信号となる。音源Vのサウンドは、聴取者の右耳へ提供されると共に、その位相が180度回転し、聴取者の左耳へ提供される。さらに、信号d(jw)は、センターチャンネルCchに対応する信号として、H21(jw)によってフィルタ処理され、音源Vへの入力信号となる。音源Vのサウンドは、同相で聴取者の両耳へ提供される。
 したがって、式(7)を満たすように、H11(jw)=1/4、H31(jw)=-1/4、H21(jw)=21/2j/4とすればよい。つまり、式(5)においてn=2を満たす、周波数と開き角とが一定の関係を保ちながら連続的に変化するモノポール音源であれば、単純な遅延操作と極性反転によって、完全な逆行列システムを実現できる。
 次に、離散化システムの場合について考える。式(5)において、n=2の場合において実現される、所望の周波数の同相成分および逆相成分を最小限の労力で再生することのできる最適な音源位置を、音源V又は音源Vから出力されるサウンドを音源Vに対して相対的に単純遅延させることで実現することを考える。相対的な遅延時間をΔτとしたとき、式(7)は、以下の式(8)のように変形できる。
Figure JPOXMLDOC01-appb-M000008
ここで、Δτωがπ/2(つまり90度)のときに、式(5)が満たされる。このため、n=2における式(5)に2Δτω=πを代入し、式(9)とする。
Figure JPOXMLDOC01-appb-M000009
式(9)を遅延時間Δτで整理すると、以下の式(10)で表される。
Figure JPOXMLDOC01-appb-M000010
式(10)を満たす遅延時間Δτとすることにより、所定の周波数においてクロストークがキャンセルされる。ここでは、図7に示されるグラフにおいて、n=2のときのグラフと、割り振られた帯域との交点RP1~RP6が、上述した所定の周波数として決定される。そして、各周波数帯域において、所定の周波数における遅延時間Δτが、その帯域における遅延時間Δτとして決定され、周波数帯域において、一律に遅延時間Δτが適用される。
 図8は、複数の左スピーカにおける方位角間隔と周波数との関係を示すグラフである。図8のグラフの横軸は方位角間隔、縦軸は周波数である。図8においては、nが0.5,1,1.5,2,2.5のときの式(5)のグラフが示されている。n=1が2チャンネルのグラフであり、n=2が3チャンネルのグラフである。図8に示されるように、概ね2kHz以上の周波数帯域においては、n=1.5の値が下限値となり、n=2.5の値が上限値となるように、各左スピーカに周波数帯域が割り振られる。図8に示される例では、第1左スピーカ21Lには第1帯域R1が割り当てられ、第2左スピーカ22Lには第2帯域R2が割り当てられ、第3左スピーカ23Lには第3帯域R3が割り当てられ、第4左スピーカ24Lには第4帯域R4が割り当てられ、第5左スピーカ25Lには第5帯域R5が割り当てられる。概ね2kHz未満の周波数帯域においては、第6左スピーカ26Lに、n=1.5の値よりもさらに低い帯域を含む第6帯域R6が割り当てられる。第6帯域R6よりもさらに低い第7帯域R7に対しては、図示しないウーハーなどの音源が割り当てられてもよい。
[実施形態のまとめ]
 音響再生システム1においては、各左スピーカ及び各右スピーカに、センタースピーカ20に対する相対的な遅延時間Δτが予め設けられる。各左スピーカ及び各右スピーカから出力される離散的な帯域幅の信号に係るサウンドは、各左スピーカ及び各右スピーカに予め設定されたセンタースピーカに対する相対的な遅延時間Δτだけ、スピーカごとに遅れる。遅延時間Δτは、各左スピーカ及び各右スピーカに予め設定された帯域幅に含まれる所定の周波数においてクロストークがキャンセルされるように、左スピーカ及び右スピーカごとに予め設定される。このような遅延時間が設けられることにより、左チャンネルLchに係る信号とセンターチャンネルCchに係る信号との間、および、センターチャンネルCchに係る信号と右チャンネルRchに係る信号との間の位相差は、各帯域に含まれる所定の周波数において90度ずれるように処理される。さらに、左チャンネルLchに係る信号と右チャンネルRchに係る信号との位相差は、左録音信号41に基づいた左スピーカへの入力信号と左録音信号41に基づいた右スピーカへの入力信号との極性が互いに異なるように極性反転され、かつ、右録音信号42に基づいた右スピーカへの入力信号と右録音信号42に基づいた左スピーカへの入力信号との極性が互いに異なるように極性反転されることで、各帯域に含まれる所定の周波数において180度ずれるように処理される。
 このように、音響再生システム1は、全ての周波数に対して逆システムを計算するのではなく、スピーカに割り当てられた周波数帯域の中から代表的な周波数(所定の周波数)においてクロストークがキャンセルされるように、左スピーカ及び右スピーカのサウンドの信号の何れか一方の極性を反転させつつ、センタースピーカのサウンドと左スピーカ及び右スピーカのサウンドとの間に時間差(単純遅延)をつける。つまり、周波数帯域に含まれる所定の周波数の演算が、スピーカに割り当てられた周波数帯域の演算を代表することになる。よって、音響再生システム1は、全ての周波数に対して逆システムを計算する場合と比べて、代表的な周波数からずれた周波数のサウンドに係るクロストークキャンセルの正確性が多少低下するものの、演算コストを大幅に低減させることができる。
[変形例]
 以上、種々の例示的実施形態について説明してきたが、上記の例示的実施形態に限定されることなく、様々な省略、置換、及び変更がなされてもよい。
 上述した実施例においては、「遅延手段」がコントローラ3に備わる例を説明したが、「遅延手段」は、複数のスピーカの配置によって実現されてもよい。図9は、変形例に係る音響再生システムの一例を示す概要図である。音響再生システム1Aは、音響再生システム1と比べて、スピーカの配置が異なるマルチウェイスピーカユニット2Aと、遅延手段を含まないコントローラ3Aを備える点が相違し、その他は同一である。以下では、音響再生システム1との相違点を中心に説明し、重複する説明は繰り返さない。
 図9に示されるように、マルチウェイスピーカユニット2Aは、マルチウェイスピーカユニット2と同様に、センターチャンネルCchに対応するセンタースピーカ20、左チャンネルLchに対応する複数の左スピーカLW、及び、右チャンネルRchに対応する複数の右スピーカRWを備える。なお、各チャンネルに対応するスピーカの数は任意である。
 センタースピーカ20、複数の右スピーカRW、及び、複数の左スピーカLWは、聴取者11に到達する離散的な帯域幅の信号に係るサウンドが各右スピーカ及び各左スピーカに予め設定された遅延時間Δτだけ遅延する位置関係を満たすように配置される。つまり、左右のスピーカから出力されたサウンドが、センタースピーカ20に対して相対的に遅延時間Δτだけ遅れるように、スピーカと聴取者11との距離が予め調整される。式(10)で示される遅延時間Δτは、音速cを用いて、経路差Δlに変換される。
Figure JPOXMLDOC01-appb-M000011
経路差Δlは、センタースピーカ20と聴取者11との経路lと、左スピーカ(又は右スピーカ)と聴取者11との経路lとの差である。このように、各スピーカを予め遅延時間Δτを満たすように配置してもよい。
 図10は、変形例に係る音響再生システムの一例を示すブロック図である。図10に示されるコントローラ3Aは、コントローラ3と比べて、単純遅延ユニット33を備えない点で相違し、その他は同一である。
 また、上述した実施形態において説明された右スピーカの数、左スピーカの数は、適宜変更されてもよい。右スピーカの数と左スピーカの数とは同一でなくてもよい。さらに、センタースピーカ20は、少なくとも1つあればよい。つまり、センタースピーカ20とは別のセンタースピーカを備えてもよい。センタースピーカ20と別のセンタースピーカとは聴取者11の正中面内に配置される。音響再生システムがセンタースピーカ20及び別のセンタースピーカを有する場合、センタースピーカ20はフルレンジでサウンドを再生する必要はなく、センタースピーカ20及び別のセンタースピーカごとに割り当てられた周波数領域のサウンドを再生し、複数のセンタースピーカが全体としてフルレンジ(全周波数領域)のサウンドを再生できればよい。
 上述した実施形態において、n=1.5の値が下限値となり、n=2.5の値が上限値となるように、周波数帯域がスピーカに割り振られる例を説明したが、周波数帯域を決定するnの数値はこれらに限定されない。周波数帯域を決定するnの数値は、下限値を決定するnが2より小さく、上限値を決定するnが2よりも大きいという条件を満たせば、適宜、設定されてもよい。例えば、n=1の値が下限値となり、n=3の値が上限値となるように周波数帯域が決定されてもよい。
 離散的な帯域幅を代表する周波数は、図7に示されるグラフにおいて、n=2のときのグラフと、割り振られた帯域との交点RP1~RP6であることを説明したが、これに限定されない。代表的な周波数は、各帯域幅において適宜選択されてもよい。
 以下、上記効果を説明すべく本発明者が実施した実施例について述べる。
 図1及び図9に示す音響再生システム1,1Aを用いた。聴取空間10において聴取者11が原点に位置するとして、音圧分布をシミュレーションした。音響再生システム1における結果を図11に示し、音響再生システム1Aにおける結果を図12に示す。
 図11は、時間遅延を信号処理によって実現した音響再生システムによる音圧分布をシミュレーションした結果である。図12は、時間遅延をスピーカ配置によって実現した音響再生システムによる音圧分布をシミュレーションした結果である。図11及び図12は、音圧レベル(dB)を濃淡で表現した図である。図11及び図12に示されるように、いずれの音圧分布においても、聴取者11の左耳がほぼ0dBとなり、右耳が-20dB程度、つまり、右耳において十分減音されることが確認された。このように、極性反転と時間遅延を用いて両耳の独立制御が実現できることが確認された。また、時間遅延は、信号処理で実現されてもよいし、スピーカの配置によって実現されてもよいことが確認された。
 1,1A…音響再生システム、2,2A…マルチウェイスピーカユニット(複数のスピーカの一例)、3,3A…コントローラ、10…聴取空間、11…聴取者、20…センタースピーカ、41…左録音信号、42…右録音信号、LW…複数の左スピーカ、RW…複数の右スピーカ。

Claims (6)

  1.  聴取者が存在する聴取空間においてサウンドを再生する音響再生システムであって、
     前記聴取空間に配置される複数のスピーカと、
     前記聴取者の左耳に対応する左録音信号と前記聴取者の右耳に対応する右録音信号とに基づいて、センターチャンネル、左チャンネル及び右チャンネルの3チャンネルのサウンドを前記複数のスピーカから再生させるコントローラと、
    を備え、
     前記複数のスピーカは、
      前記センターチャンネルに対応するセンタースピーカと、
      前記左チャンネルに対応する複数の左スピーカと、
      前記右チャンネルに対応する複数の右スピーカと、
     を有し、
     前記複数の左スピーカ及び前記複数の右スピーカそれぞれは、出力可能なサウンドの帯域幅が異なるように、帯域幅が予め設定されており、
     前記コントローラは、
      互いの位相差が全ての周波数において180度になるように、前記左録音信号に基づいた前記左スピーカへの入力信号及び前記左録音信号に基づいた前記右スピーカへの入力信号の何れか一方の極性を反転させ、かつ、互いの位相差が全ての周波数において180度になるように、前記右録音信号に基づいた前記右スピーカへの入力信号及び前記右録音信号に基づいた前記左スピーカへの入力信号の何れか一方の極性を反転させる反転ユニットと、
      前記左録音信号及び前記右録音信号を、離散的な帯域幅の信号となるように分割する分割ユニットと、
     を有し、
      前記離散的な帯域幅の信号に係るサウンドを、前記センタースピーカ、並びに、対応する帯域幅が設定された右スピーカ及び左スピーカで再生させ、
     前記複数のスピーカ及び前記コントローラの何れか一方は、各左スピーカ及び各右スピーカから出力される前記離散的な帯域幅の信号に係るサウンドを、各左スピーカ及び各右スピーカに予め設定された前記センタースピーカに対する相対的な遅延時間だけ、スピーカごとに遅らせる遅延手段を含み、
     前記遅延時間は、各左スピーカ及び各右スピーカに予め設定された帯域幅に含まれる所定の周波数においてクロストークがキャンセルされるように、左スピーカ及び右スピーカごとに予め設定される、音響再生システム。
  2.  前記遅延時間は、前記所定の周波数において、前記左チャンネルのサウンドと前記センターチャンネルのサウンドとの間の位相差が90度ずれるように、及び、前記センターチャンネルのサウンドと前記右チャンネルのサウンドとの間の位相差が90度ずれるように、左スピーカ及び右スピーカごとに予め設定される、請求項1に記載の音響再生システム。
  3.  前記コントローラに備わる前記遅延手段は、前記離散的な帯域幅の信号を信号処理で遅延させる遅延ユニットである、請求項2に記載の音響再生システム。
  4.  前記遅延時間Δτは、平面視された前記聴取者の両耳の中心点を原点とする座標系において、前記右スピーカ又は前記左スピーカの配置位置と前記原点とを結ぶ直線と、前記センタースピーカの配置位置と前記原点とを結ぶ直線とのなす角をθ、両耳の等価間隔をΔr、音速をcとしたとき、Δτ=(Δr・sinθ)/(2・c)を満たすように、左スピーカ及び右スピーカごとに予め定められる、請求項3に記載の音響再生システム。
  5.  前記複数のスピーカに備わる前記遅延手段は、前記センタースピーカ、前記複数の右スピーカ、及び、前記複数の左スピーカが、前記聴取者に到達する前記離散的な帯域幅の信号に係るサウンドが各右スピーカ及び各左スピーカに予め設定された前記遅延時間だけ遅延する位置関係を満たすように配置されることで実現される、請求項2に記載の音響再生システム。
  6.  各スピーカの配置位置は、平面視された前記聴取者の両耳の中心点を原点とする座標系において、前記右スピーカ又は前記左スピーカの配置位置と前記原点とを結ぶ直線と、前記センタースピーカの配置位置と前記原点とを結ぶ直線とのなす角をθ、両耳の等価間隔をΔr、音速をc、前記右スピーカ又は前記左スピーカと前記センタースピーカとの経路差をΔlとすると、Δl=(Δr・sinθ)/2を満たすように定められる、請求項5に記載の音響再生システム。
PCT/JP2022/042618 2022-11-16 2022-11-16 音響再生システム WO2024105825A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/JP2022/042618 WO2024105825A1 (ja) 2022-11-16 2022-11-16 音響再生システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2022/042618 WO2024105825A1 (ja) 2022-11-16 2022-11-16 音響再生システム

Publications (1)

Publication Number Publication Date
WO2024105825A1 true WO2024105825A1 (ja) 2024-05-23

Family

ID=91084082

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2022/042618 WO2024105825A1 (ja) 2022-11-16 2022-11-16 音響再生システム

Country Status (1)

Country Link
WO (1) WO2024105825A1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007081928A (ja) * 2005-09-15 2007-03-29 Yamaha Corp Avアンプ装置
JP2010532614A (ja) * 2007-07-05 2010-10-07 アダプティブ オーディオ リミテッド 音響再生装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007081928A (ja) * 2005-09-15 2007-03-29 Yamaha Corp Avアンプ装置
JP2010532614A (ja) * 2007-07-05 2010-10-07 アダプティブ オーディオ リミテッド 音響再生装置

Similar Documents

Publication Publication Date Title
US9877131B2 (en) Apparatus and method for enhancing a spatial perception of an audio signal
JP6594999B2 (ja) 差音再生
EP0880871B1 (en) Sound recording and reproduction systems
US8675899B2 (en) Front surround system and method for processing signal using speaker array
NL1032569C2 (nl) Inrichting en werkwijze voor het opheffen van overspraak en daarvan gebruik makend stereogeluid-genererend-systeem.
US7606377B2 (en) Method and system for surround sound beam-forming using vertically displaced drivers
KR101177853B1 (ko) 오디오 신호의 재생 방법 및 그 재생장치
CN106507251B (zh) 用于多扬声器设备的立体声和滤波器控制
EP1713306A1 (en) Speaker apparatus
US8520862B2 (en) Audio system
EP1862033B1 (en) A transducer arrangement improving naturalness of sounds
CN109699200B (zh) 可变声学扬声器
JPH0137080B2 (ja)
EP3089476A1 (en) Sound system
US20140205100A1 (en) Method and an apparatus for generating an acoustic signal with an enhanced spatial effect
WO2007127781A2 (en) Method and system for surround sound beam-forming using vertically displaced drivers
WO2024105825A1 (ja) 音響再生システム
Gerzon Applications of Blumlein shuffling to stereo microphone techniques
JP2007081775A (ja) ステレオ再生方法及びステレオ再生装置
Backman Microphone array beam forming for multichannel recording
Hamdan Theoretical advances in multichannel crosstalk cancellation systems
JP3186909B2 (ja) ビデオカメラ用ステレオマイクロホン
JPS62318Y2 (ja)
Yairi et al. Effect of discretization on off-axis listeners in binaural synthesis based on the optimal source distribution
TW202008351A (zh) 雙耳音頻再現系統及方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22965801

Country of ref document: EP

Kind code of ref document: A1