WO2010004649A1 - 遅延量決定装置、音像定位装置、遅延量決定方法、遅延量決定処理プログラム - Google Patents

遅延量決定装置、音像定位装置、遅延量決定方法、遅延量決定処理プログラム Download PDF

Info

Publication number
WO2010004649A1
WO2010004649A1 PCT/JP2008/062598 JP2008062598W WO2010004649A1 WO 2010004649 A1 WO2010004649 A1 WO 2010004649A1 JP 2008062598 W JP2008062598 W JP 2008062598W WO 2010004649 A1 WO2010004649 A1 WO 2010004649A1
Authority
WO
WIPO (PCT)
Prior art keywords
delay
delay amount
localization
sound signal
test sound
Prior art date
Application number
PCT/JP2008/062598
Other languages
English (en)
French (fr)
Inventor
小幡健作
太田佳樹
Original Assignee
パイオニア株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by パイオニア株式会社 filed Critical パイオニア株式会社
Priority to JP2010519611A priority Critical patent/JPWO2010004649A1/ja
Priority to PCT/JP2008/062598 priority patent/WO2010004649A1/ja
Priority to US13/003,669 priority patent/US20110142244A1/en
Publication of WO2010004649A1 publication Critical patent/WO2010004649A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/07Synergistic effects of band splitting and sub-band processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/40Visual indication of stereophonic sound image

Definitions

  • the present application relates to a technical field of a delay amount determination device, a sound image localization device, a delay amount determination method, and a delay amount determination processing program for setting a parameter related to sound image localization in a surround system based on a subjective experiment of a listener.
  • Non-Patent Document 1 Proposed a surround playback system that outputs to a speaker
  • this surround playback system basically only the phase for each band is controlled, so there is little deterioration in sound quality, and information that depends on the characteristics of the listener such as the head-related transfer function is not used. , Individual differences in effects are reduced.
  • Patent Document 1 moves the localization point of an audio signal along a predetermined movement locus for the purpose of performing such work easily and efficiently, and an operator can obtain an appropriate localization.
  • the localization point determined to have been set is set as the localization setting position for the audio signal.
  • the present application has been made in view of the above points, and an example of the problem is a delay amount determination device and a sound image localization device that can efficiently determine parameters by reducing test sounds to be heard by the user. Another object is to provide a delay amount determination method and a delay amount determination processing program.
  • a delay amount determination device includes a test sound signal output unit that outputs a test sound signal, and a delay unit that delays the test sound signal according to a set delay amount. And the test sound corresponding to the test sound signal is output from one speaker and the test sound corresponding to the test sound signal delayed by the delay means is output from the other speaker. And a localization angle corresponding to the localization direction input using the input means, and the test sound with two different delay amounts, respectively.
  • a comparison means for comparing a difference between one localization angle and the other localization angle when the signal is delayed with a threshold value, and while the difference is determined to be larger than the threshold value, what Control means for changing one of them, and for causing the comparison means to perform the comparison using the localization angle when the test sound signal is delayed by the changed delay amount and the other localization angle.
  • Selecting means for selecting one delay amount based on a predetermined condition within a range from one of the two delay amounts to the other when the difference is determined to be smaller than the threshold; It is characterized by providing.
  • the delay amount determination device a setting unit that sets the delay amount selected by the selection unit as a delay amount used by the delay unit, and the input sound signal as the one One output means for outputting to the speaker, and other output means for outputting the sound signal delayed by the delay means to the other speaker, wherein the delay means delays the sound signal.
  • the delay amount determining device, the delay amount selected by the selection unit, and the delay amount calculated by the calculation unit are used as the delay amount used by the delay unit.
  • a test sound signal is output, the test sound signal is delayed according to a set delay amount, and a test sound corresponding to the test sound signal is output from one speaker.
  • the test sound corresponding to the delayed test sound signal in a state is input using an input means for inputting a localization direction of a sound image felt by a listener in a state where the test sound is output from the other speaker.
  • a localization angle corresponding to a localization direction, and the difference between one localization angle and the other localization angle when the test sound signal is delayed by two different delay amounts, respectively, is compared with a threshold; While it is determined that the difference is larger than the threshold value, one of the two delay amounts is changed, and the localization angle when the test sound signal is delayed by the changed delay amount and With the other said localization angle
  • one delay amount is selected based on a predetermined condition within a range from one of the two delay amounts at this time to the other It is characterized by doing.
  • the computer corresponds to a test sound signal output unit that outputs a test sound signal, a delay unit that delays the test sound signal according to a set delay amount, and the test sound signal.
  • the localization direction of the sound image felt by the listener in a state where the test sound is output from one speaker and the test sound corresponding to the test sound signal delayed by the delay means is output from the other speaker,
  • a localization angle corresponding to the localization direction input using an input means for inputting, wherein one localization angle and the other when the test sound signal is delayed by two different delay amounts, respectively Comparing means for comparing a difference between the localization angle and a threshold value with a threshold value, while the difference is determined to be large, one of the two delay amounts is changed, and the test sound is changed with the changed delay amount.
  • Signal Control means for causing the comparison means to perform the comparison using the localization angle when delayed and the other localization angle, and when it is determined that the difference is smaller than the threshold value, It is characterized by functioning as a selection means for selecting one delay amount based on a predetermined condition within a range from one of the two delay amounts to the other.
  • FIG. It is a block diagram which shows an example of schematic structure of AV amplifier 50 which concerns on one Example.
  • this surround apparatus outputs a surround signal (an example of a sound signal) as it is to one speaker, and outputs the surround signal to an all-pass filter (a delay means). In one example), after being delayed by a set delay value for each frequency band, it is attenuated and output to the other speaker.
  • a surround signal an example of a sound signal
  • an all-pass filter a delay means
  • the surround playback system outputs the left surround signal input from the outside to the front left speaker as it is, while delaying the left surround signal with an all-pass filter and then attenuating it. It is configured to output to the right speaker. Further, the right surround signal also has the same configuration as that of the left surround signal, just by switching the left and right.
  • the delay value used in the all-pass filter is an example of a delay amount, and its unit is radians.
  • the delay value for each frequency band is a parameter that determines the localization angle of the sound image of the surround sound.
  • the delay value setting device 10 determines an optimum delay value in a listening environment (an example of a listening environment) of a user (an example of a listener) who uses the surround reproduction system by a subjective experiment of the user.
  • FIG. 1 is a block diagram showing an example of a schematic configuration of a delay value setting device 10 according to the present embodiment.
  • the delay value setting device 10 constitutes a part of the surround reproduction system, but the description of the specific configuration of the surround reproduction system excluding the delay value setting device 10 is omitted. In the following, only the configuration for setting the delay value for processing the left surround signal in the surround playback system will be described, but the configuration for setting the delay value for processing the right surround signal is the same.
  • the delay value setting device 10 includes a calculation unit 11 as an example of a comparison unit, a control unit, a selection unit, and a calculation unit, a storage unit 12, and a test signal as an example of a test sound signal output unit.
  • the generator 13 includes a delay unit 14 as an example of a delay unit, a GUI display unit 15, and an input unit 16 as an example of an input unit.
  • the calculation unit 11 includes a CPU (Central Processing Unit), a ROM (Read Only Memory), a RAM (Random Access Memory), and the like, and reads and executes various programs stored in the storage unit 12 to delay. While controlling the whole value setting apparatus 10, it functions as a comparison means, a control means, a selection means, and a calculation means.
  • a CPU Central Processing Unit
  • ROM Read Only Memory
  • RAM Random Access Memory
  • the storage unit 12 is a non-volatile storage unit such as a flash memory, for example, and stores various programs. Further, the storage unit 12 stores a delay value for each set frequency band, and previously stores an optimum delay value for a certain frequency band.
  • the various programs may be supplied from a recording medium via a drive device (not shown), or may be acquired from a server device or the like via a network, or the delay value setting device 10 It may be stored in advance at the time of shipment.
  • the test signal generation unit 13 supplies a test signal (an example of a test sound signal) having a frequency specified by the calculation unit 11 to the left speaker LSP and the delay unit 14.
  • the delay unit 14 delays the test signal supplied from the test signal generation unit 13 by the phase indicated by the delay value designated by the calculation unit 11, and supplies the delayed test signal to the right speaker RSP. It has become.
  • the GUI display unit 15 is configured by, for example, a liquid crystal display or the like, and displays characters, images, and the like based on the control of the calculation unit 11.
  • the input unit 16 is configured by a pointing device such as a mouse or a touch panel, for example, and receives an operation instruction from a user and supplies the instruction content to the arithmetic unit 11 as an instruction signal.
  • a pointing device such as a mouse or a touch panel
  • GUI display unit 15 and the input unit 16 provide a graphical user interface for the user to input the localization position of the subjective sound image based on the test sound output from the speakers LSP and RSP.
  • symbol 100 shows a user's head and the code
  • optimum delay value an optimum delay value (hereinafter referred to as “optimum delay value”) to be stored in the storage unit 12 will be described with reference to FIGS. explain.
  • FIG. 2 is an example of a graph showing the relationship between the delay value and the localization angle obtained in a subjective experiment.
  • FIG. 3 is an example of a graph showing the relationship between the delay value and the localization angle for explaining the method for calculating the optimum delay value.
  • FIG. 4 is an example of the graph which shows the result of the subjective experiment when the frequency of the test sound is 500 Hz, (a) is the graph of the subject A, and (b) is the graph of the subject B. is there.
  • FIG. 5 is an example of a graph showing the result of a subjective experiment when the frequency of the test sound is 250 Hz.
  • (A) is a graph of the subject A
  • (b) is a graph of the subject B. is there.
  • FIG. 6 is an example of the graph which shows the result of the subjective experiment when the frequency of the test sound is 125 Hz
  • (a) is the graph of the subject A
  • (b) is the graph of the subject B. is there.
  • FIG. 7 is an example of a graph showing the relationship between the frequency and the optimum delay value obtained in a subjective experiment.
  • the optimum delay value is determined for each of the two frequency bands, and thereafter, the optimum delay value for the other frequency band is determined based on the two optimum delay values.
  • FIG. 2 is a graph showing the result obtained by the subject experiment conducted by the inventors of the present application at a test sound frequency of 500 Hz.
  • the localization angle of the sound image of the test sound felt by the subject is from 0 to 2 ⁇ . It shows every 0.1 ⁇ radians.
  • the localization angle in this case becomes larger as the direction of the sound image felt by the user spreads to the left side with the front direction of the user being 0 °.
  • the localization angle when the sound image is right on the user is + 90 °, and the localization angle when the sound image is right on the user is ⁇ 90 °. Note that this is a localization angle when the test sound of the right speaker RSP is delayed, and when the test sound of the left speaker LSP is delayed, plus and minus are reversed.
  • the localization angle becomes maximum when the delay value is in the vicinity of 1.2 ⁇ radians to 1.3 ⁇ radians, and this delay value becomes the optimum delay value.
  • the localization angle with respect to delay values other than the above has a slight deviation, but is said to have a substantially line-symmetric relationship with the optimal delay value in the vicinity of 1.2 ⁇ radians to 1.3 ⁇ radians as the symmetry axis. Will be in good condition.
  • a localization angle when the delay value is phi 0 the localization angle when the delay value is phi 1 determined by subjective experiments. Then, a subjective experiment is performed while changing ⁇ 0 or ⁇ 1 so that the values approach each other until the difference between the two localization angles becomes a predetermined threshold value or less.
  • the optimum delay value is smaller than ( ⁇ 0 + ⁇ 1 ) / 2. That is, the optimum delay value, than phi 1 is considered to take a value closer to the phi 0.
  • the delay value ( ⁇ 1 in the above example) with the smaller localization angle is changed to ( ⁇ 0 + ⁇ 1 ) / 2, and only this changed delay value is again obtained.
  • Subjective experiments are performed.
  • the average value of ⁇ 0 and ⁇ 1 at this time is set as the optimum delay value. This can reduce the number of delay values to be subjected to subjective experiments.
  • the threshold may be set by the user.
  • the value after the change of the delay value in the case where the subjective experiment is performed again is not necessarily limited to ( ⁇ 0 + ⁇ 1 ) / 2.
  • the delay value with the larger localization angle may be changed to a value that moves away from the other delay value.
  • this surround playback system creates a sound pressure dip at the ear position on one side of the listener due to mutual interference of sound waves output from the left and right (parts where the sound pressure is particularly reduced compared to other positions). This enhances the difference in sound pressure level between the listener's ears, and localizes the sound image laterally.
  • the sound pressure dip moves to the right as the phase of the sound wave output from the right speaker is delayed.
  • the delay amount becomes ⁇ radians in this way, the sound waves output from the left and right speakers are exactly in reverse phase on the perpendicular bisector of the line connecting the left and right speakers.
  • the sound pressure level between the listener's ears is the same, and the localization angle of the sound image is 0 °. In other words, the listener feels that the sound image is located in front of him. Therefore, in order to position the sound pressure dip near the right ear, it is necessary to further delay the sound wave output from the left speaker from ⁇ radians.
  • the delay amount is 2 ⁇ radians, it is equivalent to a state without phase delay, and the localization angle at this time is basically 0 °.
  • the initial value of phi 0 to ⁇ radians, phi 1 of the initial value was decided to set the 2 ⁇ radians.
  • subjective experiments can be omitted in the range from 0 to ⁇ radians.
  • the initial value of phi 0 to (2n-1) ⁇ radian but the same applies to the initial values for the phi 1 to 2n ⁇ radians (n is 2 or more natural number), and [pi in this Of course, 2 ⁇ radians is optimal.
  • ⁇ 0 and ⁇ 1 may be different from the above as long as they are within the range including the optimum delay value.
  • FIG. 4A showing the result when subject A is dealt with at a frequency of 500 Hz
  • the delay value with the maximum localization angle is 1.3 ⁇ radians
  • FIG. 4B which shows the result when subject B is dealt with at a frequency of 500 Hz
  • the delay value at which the localization angle is maximum is 1.1 ⁇ radians. Therefore, when the frequency is 500 Hz, it can be seen that there is a gap in the optimum delay value by the listener.
  • FIG. 5A showing the result when subject A is dealt with at a frequency of 250 Hz
  • the delay value at which the localization angle is maximum is ⁇ radians (in practice, ⁇ radians and 1.1 ⁇ radians). It is assumed that there is an optimal delay value between
  • FIG. 5B showing the result when subject B is dealt with at a frequency of 250 Hz
  • the delay value with the maximum localization angle is ⁇ radians. Therefore, when the frequency is 250 Hz, it can be seen that there is not much difference in the optimum delay value by the listener.
  • FIG. 6A showing the result when subject A is dealt with at a frequency of 125 Hz
  • the delay value at which the localization angle is maximum is ⁇ radians (actually, ⁇ radians and 1.1 ⁇ radians). It is assumed that there is an optimal delay value between
  • FIG. 5B showing the result when subject B is dealt with at a frequency of 125 Hz
  • the delay value at which the localization angle is maximum is ⁇ radians. Therefore, even when the frequency is 125 Hz, it can be seen that there is not much difference in the optimum delay value by the listener.
  • FIG. 7 shows the result of obtaining a respective optimum delay value by conducting a subjective experiment every 1/3 octave from 125 Hz to 2000 Hz.
  • this graph has a shape close to a curved shape (elliptical arc shape). Therefore, if optimum delay values at three frequencies can be obtained, optimum delay values at other frequencies can also be obtained by curve interpolation.
  • the optimum delay value obtained in advance at one point in any band of 250 Hz or less is set, and subjective experiments are performed at two points in any band exceeding 250 Hz to obtain respective optimum delay values. From these three optimum delay values, optimum delay values for other bands are obtained by interpolation. As a result, the number of frequencies to be subjected to subjective experiments can be reduced.
  • the optimum delay value for four or more bands may be interpolated with the optimum delay value for other frequencies. Further, for example, the optimum delay values for other bands may be interpolated with three or more optimum delay values obtained by subjective experiments.
  • FIG. 8 is a flowchart showing the processing contents in the optimum delay value setting process of the delay value setting device 10 according to the present embodiment.
  • FIG. 9 is a flowchart showing the processing contents in the localization experiment processing of the delay value setting apparatus 10 according to the present embodiment.
  • FIG. 10A and FIG. 10B are diagrams showing display examples of the localization position answer GUI screen 300.
  • the calculation unit 11 of the delay value setting device 10 displays a message on the GUI display unit 15, Prompt for input of speaker position.
  • the viewing position is a distance from the center point of the left speaker LSP and the right speaker RSP to the user.
  • the speaker position is the distance between the left speaker LSP and the right speaker RSP.
  • the calculation unit 11 causes the GUI display unit 15 to display the localization position answer GUI screen 300 (step S1). S2).
  • the localization position answer GUI screen 300 includes a left speaker mark 301, a right speaker mark 302, a user mark 303, a play button 304, a next button 305, and the like.
  • Left speaker mark 301, right speaker mark 302, and user mark 303 indicate the left speaker LSP, the right speaker RSP, and the user, and the positional relationship is displayed according to the input viewing position and speaker position.
  • the user operates the input unit 16 to move the pointer 306 and specify an arbitrary position on the screen, thereby specifying the localization position (or direction) of the test sound felt by the user.
  • the test sound playback button 304 is a button for listening again to the test sound that the user has just listened to.
  • the next button 304 is a button for listening to the next test sound (for example, a test sound having a delay value different from the test sound that has just been heard, a test sound having a different frequency, or the like).
  • the delay value setting device 10 provides the user with a graphical user interface, thereby facilitating the user's answer.
  • the localization position answer GUI screen 300 may be displayed as shown in FIG. 10B, for example.
  • the difference from FIG. 10A is that it is displayed in a grid in FIG. 10B, and the area where the pointer 306 is located among the areas divided by the grid, as indicated by reference numeral 307, for example, Is displayed in reverse video.
  • the localization position of the test sound can be specified by the user selecting an arbitrary area on the screen displayed in a grid.
  • fine setting is possible, but in FIG. 10B, the user can easily answer by limiting the options.
  • step S3 the calculation unit 11 sets the delay value based on the input viewing position and speaker position so that the sound image is localized in front of the user (so that the localization angle is 0 °).
  • the calculation unit 11 performs a localization experiment process described later in a predetermined band 1 (for example, center frequency 500 Hz) (step S4), and then a localization experiment process in the band 2 (for example, center frequency 2000 Hz). Is executed (step S5). In this process, a subjective experiment is performed to determine the optimum delay value in the two bands.
  • a predetermined band 1 for example, center frequency 500 Hz
  • a localization experiment process in the band 2 for example, center frequency 2000 Hz.
  • the calculation unit 11 first sets the center frequency of the set band in the test signal generation unit 13 as an experiment frequency used in the experiment (step S11).
  • the arithmetic unit 11 sets a ⁇ radian to phi 0, sets the 2 ⁇ radians phi 1 (step S12).
  • the computing unit 11 sets ⁇ 0 as the experimental delay value, performs subjective experiment processing with this experimental delay value, and determines ⁇ 0 at this time (step S13). Specifically, the calculation unit 11 sets an experimental delay value in the delay unit 14. Next, the calculation unit 11 controls the test signal generation unit 13 to generate a test signal at the set experimental frequency. The test signal generated by the test signal generation unit 13 is directly supplied to the left speaker LSP through and is also supplied to the delay unit 14. Then, the test signal delayed by the delay unit 14 by the set experimental delay value is supplied to the right speaker RSP. Then, test sounds having experimental frequencies are output from the left speaker LSP and the right speaker RSP, respectively.
  • the user who listens to this specifies the test sound localization position by operating the input unit 16 while viewing the localization position answer GUI screen 300 displayed on the GUI display unit 15.
  • Information corresponding to the specified localization position is supplied from the input unit 16 to the calculation unit 11, and the calculation unit 11 calculates ⁇ 0 based on this information, the viewing position, and the speaker position.
  • ⁇ 1 is set as the experimental delay value, and subjective experiment processing is performed with this experimental delay value, and ⁇ 1 at this time is determined (step S14).
  • the computing unit 11 determines whether or not
  • a threshold value diff an example of a threshold value
  • the arithmetic unit 11 determines whether or not ⁇ 0 is smaller than ⁇ 1 (step S17). ).
  • step S17 when ⁇ 0 is smaller than ⁇ 1 (step S17: YES), the calculation unit 11 sets ⁇ 2 to ⁇ 0 (step S18), and sets ⁇ 0 after this change as an experimental delay value. After setting and performing subjective experiment processing with this experimental delay value in the same manner as in step S13 and determining ⁇ 0 at this time (step S19), the process proceeds to step S16.
  • step S17 NO
  • the calculation unit 11 sets ⁇ 2 to ⁇ 1 (step S20), and sets ⁇ 1 after this change as the experimental delay value. set, as in step S13, performs a subjective experiment process in this experimental delay value, upon determining a theta 1 at this time (step S21), and proceeds to step S16.
  • the calculation unit 11 performs the subjective experiment with the changed delay value while changing ⁇ 0 or ⁇ 1, and when
  • ⁇ 2 is set as the optimum delay value for the band (step S1), and the localization experiment process is terminated.
  • the calculation unit 11 calculates the optimum delay value for the other bands (step S6). Specifically, the calculation unit 11 acquires an optimum delay value for a predetermined low band (for example, 125 Hz) from the storage unit, and uses the optimum delay value and two optimum delay values determined by subjective experiment processing. Linear interpolation is performed to calculate the optimum delay value for other bands. Then, the calculation unit 11 stores the optimum delay value determined by the subjective experiment process and the interpolated optimum delay value in the storage unit 12 as a delay value used in the surround reproduction system.
  • a predetermined low band for example, 125 Hz
  • the test signal generation unit 13 generates a test signal and supplies the test signal to the left speaker LSP and also to the delay unit 14. Then, the delay unit 14 delays the test signal by an amount corresponding to the experimental delay value set by the calculation unit 11, and supplies the delayed test signal to the right speaker RSP.
  • the calculation unit 11 obtains a localization angle corresponding to the localization direction.
  • the computing unit 11 obtains the localization angles ⁇ 0 and ⁇ 1 with two different delay values ⁇ 0 and ⁇ 1 , it compares the difference between the two localization angles with the threshold value diff.
  • the calculation unit 11 changes any one of ⁇ 0 and ⁇ 1 to obtain a localization angle corresponding to the changed delay value, and The difference between the two localization angles is compared with the threshold value diff.
  • the arithmetic unit 11, when it is determined that the difference is equal to or smaller than the threshold diff is in the range from phi 0 to phi 1 at this time, to select one of the delay value as an optimum delay value.
  • the optimum delay value can be obtained after reducing the number of delay values that must be subjected to subjective experiments, the burden on the user due to the experiments can be reduced, and the optimum delay value can be set efficiently. it can.
  • the optimum delay value can be set more efficiently. Can be sought.
  • the optimal delay value can be obtained within an optimal range.
  • the calculation unit 11 changes the experimental delay value with the smaller localization angle so as to approach the other experimental delay value.
  • the calculation unit 11 changes the experiment delay value with the smaller localization angle to ( ⁇ 0 + ⁇ 1 ) / 2, the number of subjective experiments can be efficiently reduced.
  • the calculation unit 11 determines that the difference between ⁇ 0 and ⁇ 1 is equal to or less than the threshold value diff, ( ⁇ 0 + ⁇ 1 ) / 2 is set as the optimal delay value, so that the optimal delay is more efficiently performed.
  • the value can be determined.
  • test signal generation unit 13 generates test signals at different timings at a plurality of different frequencies under the control of the calculation unit 11, and the calculation unit 11 is optimal for each band having these frequencies as center frequencies. A delay value is determined, and optimum delay values in other bands are calculated based on the plurality of optimum delay values.
  • the optimum delay value can be obtained after reducing the number of bands in which the subjective experiment must be performed, the burden on the user due to the experiment can be reduced, and the optimum delay value can be set efficiently. it can.
  • the calculation unit 11 has three delay values, that is, an optimum delay value in two bands based on a subjective experiment and an optimum delay value set in advance for a predetermined band, and an optimum delay value in other bands. Since the values are obtained by linear interpolation, the optimum delay values in all necessary bands can be obtained only by performing a subjective experiment in two bands.
  • the predetermined band is selected within a range (less than about 250 Hz) that is not significantly affected by the characteristics of the listener, and the optimum delay value obtained by a subjective experiment at this time is set in advance. The optimum delay value in the band can be calculated with high accuracy.
  • FIG. 11 is a block diagram illustrating an example of a schematic configuration of the AV amplifier 50 according to the present embodiment.
  • the AV amplifier 50 includes a microcomputer 51, a memory 52, a decoder 53, a test signal generation circuit 54, switches 55 and 56, attenuators 57 and 60, all-pass filters 58 and 61, An adder 59 and 62, a display 63, and a mouse 64 are included.
  • the microcomputer 51 constitutes comparison means, control means, selection means, calculation means, and setting means
  • the test signal generation circuit 54 constitutes test sound signal output means.
  • the all-pass filters 58 and 61 constitute delay means
  • the adders 59 and 62 constitute one output means and the other output means
  • the mouse 64 constitutes input means.
  • the microcomputer 51 is composed of a CPU, ROM, RAM, and the like, and controls the AV amplifier 50 by reading and executing various programs stored in the memory 52, as well as comparison means, control means, selection means, and calculation. It functions as a means and a setting means.
  • the memory 52 is a flash memory and stores various programs and optimum delay values.
  • An audio stream signal As is input to the decoder 53 from the outside of the AV amplifier 50, and the decoder 53 decodes the audio stream signal As and outputs a left stereo signal L, a right stereo signal R, and a left side.
  • a surround signal Ls, a right surround signal Rs, and a low sound range effect signal Lfe are output.
  • the left stereo signal L output from the decoder 53 is supplied to the adder 62.
  • the right stereo signal R is supplied to the adder 59.
  • the left surround signal Ls is supplied to the adder 62 and the attenuator 57, respectively.
  • the right surround signal Rs is supplied to the adder 59 and the attenuator 60, respectively.
  • the low sound range effect signal Lfe is supplied to the subwoofer SW.
  • the test signal generation circuit 54 supplies a test signal having a frequency set by the microcomputer 51 to the switches 55 and 56.
  • the switch 55 has one terminal connected to the test signal generation circuit 54 and the other terminal connected to the adder 62 and the attenuator 57. When the switch 55 is turned on, the test signal from the test signal generation circuit 54 is supplied to the adder 62 and the attenuator 57.
  • the attenuator 57 attenuates the left surround signal Rs supplied from the decoder 53 or the test signal supplied from the test signal generation circuit 54 (for example, 6 dB) and supplies the attenuated signal to the all-pass filter 58.
  • the all-pass filter 58 delays the output signal from the attenuator 57 for each frequency band. Specifically, the all-pass filter 58 divides, for example, an output signal over 5 octaves from around 125 Hz to around 4 KHz into 1/3 octave bands, and is set by the microcomputer 51 for each divided band. The delayed delay value is combined, and the delayed signals for each frequency band are combined into one signal. The all-pass filter 58 supplies the synthesized signal to the adder 59.
  • the adder 59 adds the right stereo signal R from the decoder 53, the right surround signal Rs from the decoder 53, and the output signal of the all-pass filter 58, and outputs the added signal to the right speaker RSP. It has become.
  • the switch 56 has one terminal connected to the test signal generation circuit 54 and the other terminal connected to the adder 59 and the attenuator 60. When the switch 56 is turned on, the test signal from the test signal generation circuit 54 is supplied to the adder 59 and the attenuator 60.
  • the attenuator 60 attenuates the right surround signal Rs supplied from the decoder 53 or the test signal supplied from the test signal generation circuit 54 (for example, 6 dB) and supplies the attenuated signal to the all-pass filter 61.
  • the all-pass filter 61 delays the output signal from the attenuator 60 for each frequency band and supplies it to the adder 59.
  • the configuration of the all-pass filter 61 is the same as that of the all-pass filter 58.
  • the adder 62 adds the left stereo signal L from the decoder 53, the left surround signal Ls from the decoder 53, and the output signal of the all-pass filter 61, and outputs the added signal to the left speaker LSP. It has become.
  • the microcomputer 51 when setting the all-pass filter 58, the microcomputer 51 first turns on the switch 55 and turns off the switch 56.
  • the test signal output from the test signal generation circuit 54 is supplied to the left speaker LSP via the adder 62, and a test sound is output from the left speaker LSP.
  • the test signal output from the test signal generation circuit 54 is attenuated by the attenuator 57 and further delayed by the all-pass filter 58.
  • the test signal is supplied to the right speaker RSP via the adder 59, and a delayed test sound is output from the right speaker RSP.
  • the microcomputer 51 appropriately changes ⁇ 0 and ⁇ 1 in the two bands and sets them as an all-pass filter, obtains the optimum delay value in each band from the optimum delay value obtained as a result, and stores it in the memory 52. .
  • the microcomputer 51 when setting the all-pass filter 61, the microcomputer 51 first turns off the switch 55 and turns on the switch 56.
  • the test signal output from the test signal generation circuit 54 is supplied to the right speaker RSP via the adder 59, and a test sound is output from the right speaker RSP.
  • the test signal output from the test signal generation circuit 54 is attenuated by the attenuator 60 and further delayed by the all-pass filter 61.
  • the test signal is supplied to the left speaker LSP via the adder 62, and a delayed test sound is output from the left speaker LSP.
  • the microcomputer 51 obtains the optimum delay value in the same manner as in the case of the all-pass filter 58 and stores it in the memory 52.
  • the microcomputer 51 turns off the switches 55 and 56 so that the output signal from the decoder 53 is supplied to each unit. . Further, the microcomputer 51 sets the optimal delay value for each band stored in the memory 52 in the all-pass filters 58 and 61.
  • the decoder 53 decodes the signal, and the left stereo signal L, the right stereo signal R, the left surround signal Ls, the right surround signal Rs, and the bass sound effect signal. Lfe is output.
  • the signal When the left surround signal Ls is supplied to the attenuator 57, the signal is delayed in the attenuator 57 and attenuated by the all-pass filter 58.
  • the right surround signal Rs is supplied to the attenuator 60, the signal is delayed in the attenuator 60 and attenuated by the all-pass filter 61.
  • the adder 62 adds the left stereo signal L, the left surround signal Ls, and the output signal from the all-pass filter 61, and supplies the result to the left speaker LSP.
  • the adder 59 adds the right stereo signal R, the right surround signal Rs, and the output signal from the all-pass filter 58, and supplies the sum to the right speaker RSP.
  • the user can enjoy surround sound suitable for his / her own characteristics and his / her listening environment.
  • the present invention is not limited to 4.1 ch, and can be applied to surround playback systems such as 5.1 ch and 4 ch, for example.
  • the present invention is not limited to the above embodiment.
  • the above-described embodiment is an exemplification, and the present invention has the same configuration as that of the technical idea described in the claims of the present invention and exhibits the same function and effect regardless of the present invention. Are included in the technical scope.

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)

Abstract

 ユーザに聴取させる試験音を減らして効率的にパラメータを決定することを可能とする遅延量決定装置、音像定位装置、遅延量決定方法、遅延量決定処理プログラムを提供する。  スピーカLSP及びRSPから試験音が出力されたときの音像の定位方向が、入力部16を用いてユーザにより指定されると、演算部11は、この定位方向に対応する定位角を求め、異なる2つのディレイ値φとφとで定位角θとθとを求めると、この2つの定位角の差と閾値diffとを比較し、差が閾値diffより大きいと判定している間、φとφとのうち何れか一方を変更し、変更した方のディレイ値に対応する定位角を求め、更に2つの定位角の差と閾値diffとを比較する。そして、演算部11は、差が閾値よりdiffより小さいと判定した場合には、このときのφからφまでの範囲内で、一のディレイ値を最適ディレイ値として選択する。

Description

遅延量決定装置、音像定位装置、遅延量決定方法、遅延量決定処理プログラム
 本願は、サラウンドシステムにおいて音像の定位に係るパラメータを聴者の主観実験に基づいて設定する遅延量決定装置、音像定位装置、遅延量決定方法、遅延量決定処理プログラムの技術分野に関する。
 5.1chのようなサラウンドシステムを利用するためには、リスナーの後方にサラウンド用スピーカを配置する必要があるが、一般的な住宅においては、このサラウンド用スピーカを配置するスペースが無い場合が多いことから、従来、前方のスピーカのみで、サラウンド音響を実現するフロントサラウンドシステムが提案されている。
[規則91に基づく訂正 01.09.2008]
 例えば、本願の発明者等は、入力されたサラウンド信号を、左右のスピーカのうち対応するスピーカに出力する一方、このサラウンド信号を周波数帯域毎に所定の遅延量で遅延させるとともに減衰させて、他方のスピーカに出力するサラウンド再生システムを提案した(非特許文献1)。
 このサラウンド再生システムによれば、基本的には帯域毎の位相のみを制御するため、音質の劣化が少なく、また、頭部伝達関数のようなリスナーの特徴に依存するような情報を用いないため、効果の個人差が少なくなる。
 ところで、こうしたサラウンドシステムにおいて、ユーザやリスニング環境に合ったサラウンド効果が得られるようなパラメータを設定するためには、ユーザが自身のリスニング環境において実験や測定を行う必要がある。ところが、こうした作業は、周波数帯域毎に且つ設定すべきパラメータ毎(非特許文献1に記載の発明の場合は、帯域毎の遅延量)に試験音等を出力して行わなければならいため、ユーザに対して相当な負担を強いることとなっていた。
 一方、特許文献1に記載の発明は、こうした作業を簡便且つ効率的に行うことを目的として、オーディオ信号の定位点を所定の移動軌跡に沿って移動させ、操作者が適切な定位を得られたと判断した定位点を、当該オーディオ信号に対する定位設定位置として設定する。
小幡健作、他1名、前方2つのスピーカによるサラウンド再生システム、日本バーチャルリアティ学会第12回大会論文集、2007年9月 特開2005-101738
 しかしながら、前記特許文献1に記載の発明では、定位点が移動している最中、ユーザはその定位点を常に意識しなければならない分、負担が大きいため、その効果は限定的とならざるを得ない。
 本願は、以上の点に鑑みてなされたものであり、その課題の一例は、ユーザに聴取させる試験音を減らして効率的にパラメータを決定することを可能とする遅延量決定装置、音像定位装置、遅延量決定方法、遅延量決定処理プログラムを提供することにある。
 上記課題を解決するために、本願の一つの観点における遅延量決定装置は、試験音信号を出力する試験音信号出力手段と、設定された遅延量に応じて前記試験音信号を遅延させる遅延手段と、前記試験音信号に対応する試験音が一方のスピーカから出力された状態で且つ前記遅延手段により遅延させられた前記試験音信号に対応する試験音が他方のスピーカから出力された状態で聴者が感じた音像の定位方向、を入力するための入力手段と、前記入力手段を用いて入力された前記定位方向に相当する定位角であって、互いに異なる2つの前記遅延量で夫々前記試験音信号が遅延させられたときの一方の定位角と他方の定位角との差を閾値と比較する比較手段と、前記差が前記閾値より大きいと判定されている間、前記2つの遅延量のうち何れか一方を変更し、変更した方の前記遅延量で前記試験音信号が遅延させられたときの前記定位角と他方の前記定位角とを用いて前記比較手段に前記比較を行わせる制御手段と、前記差が前記閾値より小さいと判定された場合に、このときの前記2つの遅延量の一方から他方までの範囲内で予め定められた条件に基づいて一の遅延量を選択する選択手段と、を備えることを特徴とする。
 また、本願の他の観点では、前記遅延量決定装置と、前記選択手段により選択された遅延量を、前記遅延手段により用いられる遅延量として設定する設定手段と、入力された音信号を前記一方のスピーカに出力する一方出力手段と、前記遅延手段により遅延させられた前記音信号を前記他方のスピーカに出力する他方出力手段と、を備え、前記遅延手段は、前記音信号を遅延させることを特徴とする。
 また、本願の更に他の観点では、前記遅延量決定装置と、前記選択手段により選択された遅延量と、前記算出手段により算出された遅延量と、を、前記遅延手段により用いられる遅延量として、夫々対応する周波数に対して設定する設定手段と、入力された音信号を前記一方のスピーカに出力する一方出力手段と、前記遅延手段により遅延させられた前記音信号を前記他方のスピーカに出力する他方出力手段と、を備え、前記遅延手段は、前記音信号を周波数毎に遅延させることを特徴とする。
 また、本願の更に他の観点では、試験音信号を出力し、設定された遅延量に応じて前記試験音信号を遅延させ、前記試験音信号に対応する試験音が一方のスピーカから出力された状態で且つ前記遅延させられた前記試験音信号に対応する試験音が他方のスピーカから出力された状態で聴者が感じた音像の定位方向、を入力するための入力手段を用いて入力された前記定位方向に相当する定位角であって、互いに異なる2つの前記遅延量で夫々前記試験音信号が遅延させられたときの一方の定位角と他方の定位角との差を閾値と比較し、前記差が前記閾値より大きいと判定されている間、前記2つの遅延量のうち何れか一方を変更し、変更した方の前記遅延量で前記試験音信号が遅延させられたときの前記定位角と他方の前記定位角とを用いて前記比較を行い、前記差が前記閾値より小さいと判定された場合に、このときの前記2つの遅延量の一方から他方までの範囲内で予め定められた条件に基づいて一の遅延量を選択することを特徴とする。
 また、本願の更に他の観点では、コンピュータを、試験音信号を出力する試験音信号出力手段、設定された遅延量に応じて前記試験音信号を遅延させる遅延手段、前記試験音信号に対応する試験音が一方のスピーカから出力された状態で且つ前記遅延手段により遅延させられた前記試験音信号に対応する試験音が他方のスピーカから出力された状態で聴者が感じた音像の定位方向、を入力するための入力手段を用いて入力された前記定位方向に相当する定位角であって、互いに異なる2つの前記遅延量で夫々前記試験音信号が遅延させられたときの一方の定位角と他方の定位角との差を閾値と比較する比較手段、前記差が大きいと判定されている間、前記2つの遅延量のうち何れか一方を変更し、変更した方の前記遅延量で前記試験音信号が遅延させられたときの前記定位角と他方の前記定位角とを用いて前記比較手段に前記比較を行わせる制御手段、及び前記差が前記閾値より小さいと判定された場合に、このときの前記2つの遅延量の一方から他方までの範囲内で予め定められた条件に基づいて一の遅延量を選択する選択手段、として機能させることを特徴とする。
[規則91に基づく訂正 01.09.2008]
一実施形態に係るディレイ値設定装置10の概要構成の一例を示すブロック図である。 ある主観実験で得られたディレイ値と定位角との関係を示すグラフの一例である。 最適ディレイ値の算出方法を説明するためのディレイ値と定位角との関係を示すグラフの一例である。 試験音の周波数を500Hzとしたときの主観実験の結果を示すグラフの一例であり、(a)は、被験者Aのグラフであり、(b)は、被験者Bのグラフである。 試験音の周波数を250Hzとしたときの主観実験の結果を示すグラフの一例であり、(a)は、被験者Aのグラフであり、(b)は、被験者Bのグラフである。 試験音の周波数を125Hzとしたときの主観実験の結果を示すグラフの一例であり、(a)は、被験者Aのグラフであり、(b)は、被験者Bのグラフである。 ある主観実験で得られた周波数と最適ディレイ値との関係を示すグラフの一例である。 一実施形態に係るディレイ値設定装置10の最適ディレイ値設定処理における処理内容を示すフローチャートである。 一実施形態に係るディレイ値設定装置10の定位実験処理における処理内容を示すフローチャートである。 (a)及び(b)は、定位位置回答用GUI画面300の表示例を示す図である。 一実施例に係るAVアンプ50の概要構成の一例を示すブロック図である。
符号の説明
 10 ディレイ値設定装置
 11 演算部
 12 記憶部
 13 試験信号発生部
 14 遅延部
 15 GUI表示部
 16 入力部
 50 AVアンプ
 51 マイコン
 52 メモリ
 53 デコーダ
 54 試験信号発生回路
 55、56 スイッチ
 57、60 アッテネータ
 58、61 オールパスフィルタ
 59、62 加算器
 63 ディスプレイ
 64 マウス
 100 ユーザ
 200 音像
 LSP 左側スピーカ
 RSP 右側スピーカ
 SW サブウーファ
 以下、図面を参照して本願の最良の実施形態について詳細に説明する。なお、以下に説明する実施の形態は、ディレイ値設定装置に対して本願を適用した場合の実施形態である。
 [1.サラウンド再生システムの概要]
 始めに、本実施形態に係るディレイ値設定装置10が組み込まれるサラウンド再生システムの概要について説明する。
 本サラウンド装置は、前記非特許文献1に記載されているように、サラウンド信号(音信号の一例)を、そのままスルーで一方のスピーカに出力するとともに、このサラウンド信号を、オールパスフィルタ(遅延手段の一例)で周波数帯域毎に、設定されたディレイ値で遅延させた後、減衰させて、他方のスピーカに出力するようになっている。
 具体的に、本サラウンド再生システムは、外部から入力された左側サラウンド信号を、そのままスルーで前面左側スピーカに出力する一方、当該左側サラウンド信号を、オールパスフィルタで遅延させた後、減衰させて、前面右側スピーカに出力する構成となっている。また、右側サラウンド信号に関しても、左右が入れ替わるだけで、その構成は、左側サラウンド信号の場合と同様である。
 ここで、オールパスフィルタに用いられるディレイ値は、遅延量の一例であり、単位はラジアンである。本サラウンド再生システムにおいては、周波数帯域毎のディレイ値が、サラウンド音声の音像の定位角を決定するパラメータとなる。
 そこで、ディレイ値設定装置10は、本サラウンド再生システムを利用するユーザ(聴者の一例)のリスニング環境(聴取環境の一例)における最適なディレイ値を、ユーザの主観実験により決定するのである。
 [2.ディレイ値設定装置の構成]
 次に、本実施形態に係るディレイ値設定装置10の構成について、図1を用いて説明する。
 図1は、本実施形態に係るディレイ値設定装置10の概要構成の一例を示すブロック図である。
 なお、ディレイ値設定装置10は、上記サラウンド再生システムの一部を構成するが、ディレイ値設定装置10を除く当該サラウンド再生システムの具体的な構成については、説明を省略する。また、以下では、上記サラウンド再生システムにおいて左側サラウンド信号を処理するためのディレイ値を設定する構成のみについて説明するが、右側サラウンド信号を処理するためのディレイ値を設定する構成についても同様である。
 図1に示すように、ディレイ値設定装置10は、比較手段、制御手段、選択手段及び算出手段の一例としての演算部11と、記憶部12と、試験音信号出力手段の一例としての試験信号発生部13と、遅延手段の一例としての遅延部14と、GUI表示部15と、入力手段の一例としての入力部16と、を含んで構成されている。
 演算部11は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)等により構成されており、記憶部12に記憶されている各種プログラム等を読み出し実行ことにより、ディレイ値設定装置10全体を制御するとともに、比較手段、制御手段、選択手段及び算出手段として機能するようになっている。
[規則91に基づく訂正 01.09.2008]
 記憶部12は、例えば、フラッシュメモリ等の不揮発性の記憶手段であり、各種プログラムを記憶している。また、記憶部12には、設定された周波数帯毎のディレイ値が記憶されているとともに、ある周波数帯域については、最適とされているディレイ値が予め記憶されている。なお、各種プログラムは、例えば、図示せぬドライブ装置を介して記録媒体から供給されても良いし、ネットワークを介して、サーバ装置等から取得するようにしても良いし、ディレイ値設定装置10の出荷時に予め記憶させておいても良い。
 試験信号発生部13は、演算部11により指定された周波数の試験信号(試験音信号の一例)を、左側スピーカLSPと、遅延部14と、に供給するようになっている。
 遅延部14は、試験信号発生部13から供給された試験信号を、演算部11により指定されたディレイ値が示す位相分だけ遅延させ、この遅延させた試験信号を、右側スピーカRSPに供給するようになっている。
 GUI表示部15は、例えば、液晶ディスプレイ等により構成されており、演算部11の制御に基づいて文字や画像等を表示するようになっている。
 入力部16は、例えば、マウスやタッチパネル等のポインティングデバイスにより構成されており、ユーザからの操作指示を受け付け、その指示内容を指示信号として演算部11に供給するようになっている。
 ここで、GUI表示部15及び入力部16は、スピーカLSP及びRSPから出力された試験音に基づいてユーザが主観による音像の定位位置を入力するための、グラフィカルユーザインターフェースを提供している。
 なお、符号100は、ユーザの頭部を示し、符号200は、音像を示している。
[規則91に基づく訂正 01.09.2008]
 [3.最適ディレイ値の決定方法]
 次に、本実施形態に係るディレイ値設定装置10において、記憶部12に記憶させる最適なディレイ値(以下、「最適ディレイ値」)を決定するための方法について、図2乃至図7を用いて説明する。
 図2は、ある主観実験で得られたディレイ値と定位角との関係を示すグラフの一例である。また、図3は、最適ディレイ値の算出方法を説明するためのディレイ値と定位角との関係を示すグラフの一例である。また、図4は、試験音の周波数を500Hzとしたときの主観実験の結果を示すグラフの一例であり、(a)は、被験者Aのグラフであり、(b)は、被験者Bのグラフである。また、図5は、試験音の周波数を250Hzとしたときの主観実験の結果を示すグラフの一例であり、(a)は、被験者Aのグラフであり、(b)は、被験者Bのグラフである。また、図6は、試験音の周波数を125Hzとしたときの主観実験の結果を示すグラフの一例であり、(a)は、被験者Aのグラフであり、(b)は、被験者Bのグラフである。また、図7は、ある主観実験で得られた周波数と最適ディレイ値との関係を示すグラフの一例である。
 本実施形態においては、2つの周波数帯域において、夫々最適ディレイ値を決定し、その後、この2つの最適ディレイ値に基づいて、他の周波数帯域における最適ディレイ値を決定するようになっている。
 [3.1 2つの周波数帯域における最適ディレイ値の決定方法]
 図2は、本願の発明者等が、試験音の周波数を500Hzとして行った主観実験で得られた結果を示すグラフであり、被験者が感じた試験音の音像の定位角を、0から2πまで0.1πラジアン毎に示している。
 この場合における定位角は、ユーザの正面方向を0°として、ユーザが感じる音像の方向が左側に広がるほど大となる。そして、音像がユーザの真左にある場合の定位角は+90°であり、音像がユーザの真右にある場合の定位角は-90°である。なお、これは、右スピーカRSPの試験音を遅延させる場合の定位角であって、左スピーカLSPの試験音を遅延させる場合には、プラスマイナスが逆転する。
 図2に示すように、この主観実験においては、ディレイ値が1.2πラジアン~1.3πラジアン付近のときに定位角が最大となり、このディレイ値が最適ディレイ値となる。
 また、上記以外のディレイ値に対する定位角は、多少のずれはあるものの、最適ディレイ値である上記1.2πラジアン~1.3πラジアン付近を対称軸として、ほぼ線対称の関係にあるといっても良い状態となる。
 このように、各ディレイ値に対する定位角は最適ディレイ値を対称軸として線対称となることを前提とした場合において、図3に示すように、ディレイ値φとφとの間に、定位角が最大となるディレイ値が存在すると仮定する。そうすると、φ=φが成立するときに、φとφとの平均値である(φ+φ)/2が、最適ディレイ値ということとなる。
 そこで、本実施形態においては、ディレイ値がφである場合における定位角と、ディレイ値がφである場合における定位角とを主観実験により求める。そして、この2つの定位角の差が所定の閾値以下となるまでφまたはφをその値が互いに近づくように変更しながら主観実験を行う。
 例えば、ディレイ値をφとしたときに得られた定位角θと、ディレイ値をφとしたときに得られた定位角θとを比較値して、θの方が大きい場合には、最適ディレイ値は(φ+φ)/2よりも小さいと考えられる。つまり、最適ディレイ値は、φよりもφの方に近い値をとると考えられる。
 こうした理由から、本実施形態においては、定位角がより小さかった方のディレイ値(上記例ではφ)を(φ+φ)/2に変更し、この変更した方のディレイ値のみについて再度主観実験を行うのである。
 このようにして、2つの定位角の差が閾値以下となったら、このときのφとφとの平均値を最適ディレイ値として設定するようになっている。これによって、主観実験の対象とするディレイ値の点数を削減することができる。
 このときの閾値を小さい値にするほど、最適ディレイ値の精度は高まると考えられるが、その分演算量が増加するので、対象とするシステムに応じて適切な値に設定しておくことが望ましい。また、この閾値は、ユーザが設定しても良い。
 なお、最適ディレイ値として必ずしもφとφとの平均値を選択する必要はなく、例えば、最適ディレイ値からの定位角の下がり具合の傾向が予め分かっている場合には、その傾向に対応して、φからφまでの範囲内で適切なディレイ値を選択しても良い。
 また、再度主観実験を行う方のディレイ値の変更後の値は必ずしも(φ+φ)/2に限る必要はない。例えば、定位角が大きかった方のディレイ値を、他方のディレイ値から遠ざかるような値に変更しても良い。
 以上説明した方法で最適ディレイ値を求めるためには、φとφとの間に最適ディレイ値が存在しなければならない。従って、φ及びφの初期値を適切に設定する必要がある。
 これに関し、本願の発明者等が主観実験を行った結果、最適ディレイ値は、リスナーの特性やリスニング環境などに依らず、πラジアンから2πラジアンまでの範囲内に存在することが判明している(例えば、図2)。この結論は、物理的な検討からも導き出すことができる。
 つまり、本サラウンド再生システムは、左右から出力される音波の相互干渉によってリスナーの片側の耳の位置に音圧のディップ(他の位置と比較して音圧が特に低下する部分)を作り出し、これによってリスナーの両耳間の音圧レベルの差を強調させ、音像を側方に定位させるものである。
 そして、例えば、左右の音圧レベルに差がない場合で説明するが、右側のスピーカから出力される音波の位相を遅延させていくに従って、音圧のディップは右に移動していく。このようにして遅延量がπラジアンとなったとき、左右のスピーカを結ぶ線分の垂直2等分線上において、左右のスピーカから出力される音波は丁度逆相の関係となる。このとき、この垂直2等分線上にリスナーが位置すると仮定すると、リスナーの両耳間での音圧レベルは同一となり、音像の定位角は0°となる。つまり、リスナーは、自分の正面に音像が位置すると感じるのである。従って、音圧のディップを右側の耳付近に位置させるためには、左側のスピーカから出力される音波を、πラジアンから更に遅延させる必要がある。
 そして、遅延量が2πラジアンとなった場合には、位相の遅延が無い状態と等価となるから、このときの定位角は基本的に0°となる。
 そこで、本実施形態においては、φの初期値をπラジアンに設定し、φの初期値を2πラジアンに設定することとした。これによって、0~πラジアンまでの範囲では、主観実験を省略することができる。勿論、φの初期値を(2n-1)πラジアンに設定し、φの初期値を2nπラジアンに設定しても同様であるが(nは、2以上自然数)、この中でπ及び2πラジアンが最適であることは無論である。
 なお、最適ディレイ値を含む範囲であれば、φ及びφの初期値を上記とは別の値としてもかまわない。
 [3.2 他の周波数帯における最適ディレイ値の決定方法]
 図4、図5及び図6は、本願の発明者等が、試験音の周波数が500Hz、250Hz及び125Hzの場合において、夫々2名の被験者を対象として主観実験を行った結果を示すグラフである。なお、左右の試験音に若干の音圧レベル差をつけたため、0ラジアンと2πラジアンとにおける定位角は、0°から若干ずれている。
 周波数500Hzで被験者Aを対処とした場合の結果を示す図4(a)においては、定位角が最大となるディレイ値は1.3πラジアンである。また、同じく周波数500Hzで被験者Bを対処とした場合の結果を示す図4(b)においては、定位角が最大となるディレイ値は1.1πラジアンである。従って、周波数が500Hzである場合においては、リスナーによって最適ディレイ値に開きがあることが見て取れる。
 一方、周波数250Hzで被験者Aを対処とした場合の結果を示す図5(a)においては、定位角が最大となるディレイ値はπラジアンである(実際には、πラジアンと1.1πラジアンとの間に最適ディレイ値が存在するものと考えられる)。また、同じく周波数250Hzで被験者Bを対処とした場合の結果を示す図5(b)においても、定位角が最大となるディレイ値はπラジアンである。従って、周波数が250Hzである場合においては、リスナーによって最適ディレイ値にあまり開きが無いことが見て取れる。
 また、周波数125Hzで被験者Aを対処とした場合の結果を示す図6(a)においては、定位角が最大となるディレイ値はπラジアンである(実際には、πラジアンと1.1πラジアンとの間に最適ディレイ値が存在するものと考えられる)。また、同じく周波数125Hzで被験者Bを対処とした場合の結果を示す図5(b)においても、定位角が最大となるディレイ値はπラジアンである。従って、周波数が125Hzである場合においても、リスナーによって最適ディレイ値にあまり開きが無いことが見て取れる。
 こうした主観実験の結果、比較的低域(250Hz程度以下)の範囲においては、その最適ディレイ値は、リスナーの特性にあまり影響されないことが判明している。従って、この範囲内においては、予め最適ディレイ値を求めておけば、サラウンド再生システムをユーザが実際に利用する段階で、改めて主観実験を行う必要はない。
 また、図7は、125Hzから2000Hzまで1/3オクターブ毎に主観実験を行って夫々の最適ディレイ値を求めた結果である。図7に示すように、このグラフは曲線状に近い形状(楕円の円弧状)となっている。従って、3点の周波数における最適ディレイ値を求めることができれば、その他の周波数における最適ディレイ値も、曲線補間によって求めることができる。
 そこで、本実施形態においては、250Hz以下の任意の帯域1点において予め求めた最適ディレイ値を設定しておき、250Hzを越える任意の帯域2点において主観実験を行い、夫々の最適ディレイ値を求め、これら3つの最適ディレイ値からその他の帯域に対する最適ディレイ値を補間によって求めることとした。これによって、主観実験の対象とする周波数の点数を削減することができる。
 なお、4点以上の帯域に対する最適ディレイ値で、その他の周波数に対する最適ディレイ値を補間しても良い。また、例えば、主観実験で得られた3点以上の最適ディレイ値で、その他の帯域に対する最適ディレイ値を補間しても良い。
 また、以上説明した3.1に記載の方法と3.2に記載の方法との何れも実行することができるように、ディレイ値設定装置10を構成する必要はない。何れか一方のみであっても、主観実験の回数を削減することは可能である。
 [4.ディレイ値設定装置10の動作]
 次に、本実施形態に係るディレイ値設定装置10の動作について説明する。
 図8は、本実施形態に係るディレイ値設定装置10の最適ディレイ値設定処理における処理内容を示すフローチャートである。また、図9は、本実施形態に係るディレイ値設定装置10の定位実験処理における処理内容を示すフローチャートである。また、図10(a)及び図10(b)は、定位位置回答用GUI画面300の表示例を示す図である。
 ユーザが入力部16を操作して、ディレイ値の設定開始を指示すると、図8に示すように、ディレイ値設定装置10の演算部11は、GUI表示部15にメッセージを表示させ、視聴位置とスピーカ位置との入力を促す。視聴位置とは、左側スピーカLSPと右側スピーカRSPとの中心点からユーザまでの距離である。また、スピーカ位置とは、左側スピーカLSPと右側スピーカRSPとの間の距離である。
 ここで、ユーザが、入力部16を操作して、視聴位置とスピーカ位置とを入力すると(ステップS1)、演算部11は、定位位置回答用GUI画面300をGUI表示部15に表示させる(ステップS2)。
 図10(a)に示すように、定位位置回答用のGUI画面300は、左スピーカマーク301、右スピーカマーク302、ユーザマーク303、再生ボタン304、次ボタン305等により構成されている。
 左スピーカマーク301、右スピーカマーク302及びユーザマーク303は、左側スピーカLSP、右側スピーカRSP及びユーザを示し、入力された視聴位置とスピーカ位置とに応じて、その位置関係が表示される。ユーザは、入力部16を操作してポインタ306を移動させ、画面上の任意の位置を指定することにより、ユーザが感じた試験音の定位位置(あるいは方向)が指定される。
 テスト音再生ボタン304は、ユーザが今聴いた試験音を再度聞くためのボタンである。また、次ボタン304は、次の試験音(例えば、今聴いた試験音とはディレイ値が異なる試験音、周波数が異なる試験音等)を聴くためのボタンである。
 このように、ディレイ値設定装置10は、グラフィカルユーザインターフェースをユーザに対して提供することで、ユーザの回答を容易にしている。
 なお、定位位置回答用のGUI画面300を、例えば、図10(b)に示すように表示しても良い。図10(a)との違いは、図10(b)では、グリッド表示されている点であり、グリッドで区切られたエリアのうちポインタ306が位置するエリアが、符号307に示すように、例えば、反転表示される。ここで、ユーザがグリッド表示された画面上の任意のエリアを選択することにより、試験音の定位位置を指定することができる。図10(a)に示す表示態様では、微細な設定が可能となるが、図10(b)においては、選択肢を限定することによって、ユーザが容易に回答を行うことができるようにしている。
 演算部11は、定位位置回答用のGUI画面300を表示すると、次いで、タイムアライメント処理を実行する(ステップS3)。具体的に、演算部11は、入力された視聴位置とスピーカ位置とに基づいて、ユーザの正面に音像が定位するように(定位角が0°となるように)、ディレイ値を設定する。
 次いで、演算部11は、予め定められた帯域1(例えば、中心周波数500Hz)で、後述する定位実験処理を実行し(ステップS4)、次いで、帯域2(例えば、中心周波数2000Hz)で定位実験処理を実行する(ステップS5)。この処理において、主観実験が行われ、2つの帯域における最適ディレイ値が求められる。
 図9に示すように、定位実験処理において、演算部11は、先ず、設定された帯域の中心周波数を、実験に用いる実験周波数として試験信号発生部13に設定する(ステップS11)。
 次いで、演算部11は、φにπラジアンを設定するとともに、φに2πラジアンを設定する(ステップS12)。
 次いで、演算部11は、実験ディレイ値にφを設定し、この実験ディレイ値での主観実験処理を行い、このときのθを決定する(ステップS13)。具体的に、演算部11は、実験ディレイ値を遅延部14に設定する。次いで、演算部11は、試験信号発生部13を制御し、設定した実験周波数で試験信号を発生させる。試験信号発生部13が発生させた試験信号は、そのままスルーで左側スピーカLSPに供給される一方、遅延部14にも供給される。そして、設定された実験ディレイ値で遅延部14により遅延させられた試験信号は、右側スピーカRSPに供給される。そして、左側スピーカLSP及び右側スピーカRSPから、実験周波数の試験音が夫々出力される。
 これを聴いたユーザは、GUI表示部15に表示された定位位置回答用GUI画面300を見ながら入力部16を操作して、試験音の定位位置を指定する。指定された定位位置に対応する情報が入力部16から演算部11に供給され、演算部11は、この情報と視聴位置及びスピーカ位置とに基づいてθを算出する。
 演算部11は、こうしてθを決定すると、同様にして、実験ディレイ値にφを設定し、この実験ディレイ値での主観実験処理を行い、このときのθ1を決定する(ステップS14)。
 次いで、演算部11は、θ=(θ+θ)/2を計算し、θを算出する(ステップS15)。つまり、演算部11は、θとθとの平均値を算出する。
 次いで、演算部11は、|θ-θ|が閾値diff(閾値の一例)よりも大きいか否かを判定する(ステップS16)。つまり、演算部11は、θとθとの差の絶対値が閾値よりも大きいか否かを判定する。
 このとき、演算部11は、|θ-θ|が閾値diffよりも大きい場合には(ステップ16:YES)、次いで、θがθよりも小さいか否かを判定する(ステップS17)。
 このとき、演算部11は、θがθよりも小さい場合には(ステップS17:YES)、θにθを設定し(ステップS18)、この変更後のθを実験ディレイ値に設定し、ステップS13と同様にして、この実験ディレイ値での主観実験処理を行い、このときのθを決定すると(ステップS19)、ステップS16に移行する。
 一方、演算部11は、θがθよりも小さくはない場合には(ステップS17:NO)、θにθを設定し(ステップS20)、この変更後のθを実験ディレイ値に設定し、ステップS13と同様にして、この実験ディレイ値での主観実験処理を行い、このときのθを決定すると(ステップS21)、ステップS16に移行する。
 このように演算部11は、φ0またはφ1を変更しながら、変更後のディレイ値で主観実験を行い、|θ-θ|が閾値diff以下になると(ステップS16:NO)、設定された帯域に対する最適ディレイ値にφ2を設定し(ステップS1)、定位実験処理を終了させる。
 演算部11は、2つの帯域に対する定位実験処理を終えると、その他の帯域に対する最適ディレイ値を算出する(ステップS6)。具体的に、演算部11は、低域の所定帯域(例えば、125Hz)に対する最適ディレイ値を記憶部から取得し、この最適ディレイ値と、主観実験処理によって決定した2つの最適ディレイ値と、で線形補間を行い、これによって他の帯域に対する最適ディレイ値を算出する。そして、演算部11は、主観実験処理によって決定した最適ディレイ値と補間された最適ディレイ値とを、サラウンド再生システムに用いられるディレイ値として記憶部12に記憶させる。
 以上説明したように、本実施形態によれば、試験信号発生部13が、試験信号を発生させ、当該試験信号を左側スピーカLSPに供給するとともに遅延部14に供給する。そして、遅延部14が、この試験信号を、演算部11により設定された実験ディレイ値に相当する分遅延させ、遅延させた試験信号を右側スピーカRSPに供給する。スピーカLSP及びRSPから試験音が出力されたときの音像の定位方向が、入力部16を用いてユーザにより指定されると、演算部11は、この定位方向に対応する定位角を求める。こうして、演算部11は、異なる2つのディレイ値φとφとで定位角θとθとを求めると、この2つの定位角の差と閾値diffとを比較しする。そして、演算部11は、差が閾値diffより大きいと判定している間、φとφとのうち何れか一方を変更し、変更した方のディレイ値に対応する定位角を求め、更に2つの定位角の差と閾値diffとを比較する。そして、演算部11は、差が閾値diff以下であると判定した場合には、このときのφからφまでの範囲内で、一のディレイ値を最適ディレイ値として選択する。
 従って、主観実験を行わなければならないディレイ値の数を減らした上で最適ディレイ値を求めることができるので、当該実験によるユーザの負担が軽減され、効率的に最適ディレイ値の設定を行うことができる。
 また、φ初期値からφの初期値までの範囲内に定位角が最大となるディレイ値が含まれるように、これらの初期値が設定されているので、より効率的に最適ディレイ値を求めることができる。特に、φ初期値はπラジアンであり、φの初期値は2πラジアンであるので、最適な範囲で最適ディレイ値を求めることができる。
 また、演算部11は、φとφとの差が閾値diffより大きいと判定している間、定位角が小さい方の実験ディレイ値を、他方の実験ディレイ値に近づくように変更する。特に、演算部11は、定位角が小さい方の実験ディレイ値を(φ+φ)/2に変更するので、主観実験の回数を効率的に減らすことができる。
 また、演算部11は、φとφとの差が閾値diff以下であると判定した場合には、(φ+φ)/2を最適ディレイ値とするので、より効率的に最適ディレイ値を求めることができる。
 また、試験信号発生部13は、演算部11の制御により、互いに異なる複数の周波数で別々のタイミングで試験信号を発生させ、演算部11は、これらの周波数を夫々中心周波数とする帯域毎に最適ディレイ値を決定し、この複数の最適ディレイ値に基づいて、その他の帯域における最適ディレイ値を算出する。
 従って、主観実験を行わなければならない帯域の数を減らした上で、最適ディレイ値を求めることができるので、当該実験によるユーザの負担が軽減され、効率的に最適ディレイ値の設定を行うことができる。
 また、演算部11は、主観実験による2つの帯域での最適ディレイ値と、予め定められた帯域に対して予め設定された最適ディレイ値と、の3つのディレイ値で、その他の帯域における最適ディレイ値を、線形補間によって求めるので、主観実験を2つの帯域で行うだけで、必要な全ての帯域における最適ディレイ値を求めることができる。特に、予め定められた帯域は、リスナーの特性などにあまり影響されない範囲(250Hz程度以下)で選択され、このときの主観実験等により得られた最適ディレイ値が予め設定されているので、その他の帯域における最適ディレイ値を精度良く算出することができる。
 [5.サラウンド再生システム(4.1ch)への適用例]
 次に、本実施形態を4.1chのサラウンド再生システムのAVアンプに適用した場合の実施例について説明する。
 図11は、本実施例に係るAVアンプ50の概要構成の一例を示すブロック図である。
 図11に示すように、AVアンプ50は、マイコン51と、メモリ52と、デコーダ53と、試験信号発生回路54と、スイッチ55及び56と、アッテネータ57及び60と、オールパスフィルタ58及び61と、加算器59及び62と、ディスプレイ63と、マウス64と、を含んで構成されている。
 ここで、マイコン51は、比較手段、制御手段、選択手段、算出手段及び設定手段を構成し、試験信号発生回路54は、試験音信号出力手段を構成する。また、オールパスフィルタ58及び61は、遅延手段を構成し、加算器59及び62は、一方出力手段及び他方出力手段を構成し、マウス64は、入力手段を構成する。
 マイコン51は、CPU、ROM、RAM等により構成されており、メモリ52に記憶されている各種プログラム等を読み出し実行ことにより、AVアンプ50を制御するとともに、比較手段、制御手段、選択手段、算出手段及び設定手段として機能するようになっている。
 メモリ52は、フラッシュメモリであり、各種プログラム及び最適ディレイ値を記憶するようになっている。
 デコーダ53には、AVアンプ50の外部からオーディオストリーム信号Asが入力されるようになっており、当該デコーダ53は、このオーディオストリーム信号Asを復号し、左側ステレオ信号L、右側ステレオ信号R、左側サラウンド信号Ls、右側サラウンド信号Rs及び低音域効果信号Lfeを出力するようになっている。
 デコーダ53から出力された左側ステレオ信号Lは、加算器62に供給されるようになっている。また、右側ステレオ信号Rは、加算器59に供給されるようになっている。
 また、左側サラウンド信号Lsは、加算器62と、アッテネータ57とに夫々供給されるようになっている。また、右側サラウンド信号Rsは、加算器59と、アッテネータ60とに夫々供給されるようになっている。また、低音域効果信号Lfeは、サブウーファSWに供給されるようになっている。
 試験信号発生回路54は、マイコン51により設定された周波数の試験信号を、スイッチ55及び56に供給するようになっている。
 スイッチ55は、一方の端子が試験信号発生回路54に接続され、他方の端子が加算器62及びアッテネータ57に接続されてる。スイッチ55がONとなると、試験信号発生回路54からの試験信号が加算器62とアッテネータ57とに供給されるようになっている。
 アッテネータ57は、デコーダ53から供給された左側サラウンド信号Rsまたは試験信号発生回路54から供給された試験信号を減衰させ(例えば6dB)、オールパスフィルタ58に供給するようになっている。
 オールパスフィルタ58は、アッテネータ57からの出力信号を周波数帯域毎に遅延させるようになっている。具体的に、オールパスフィルタ58は、例えば、125Hz周辺から4KHz周辺までの5オクターブに渡る出力信号を、3分の1オクターブの帯域毎に分割し、分割された帯域毎に、夫々マイコン51により設定されたディレイ値で遅延させ、遅延させた周波数帯域毎の信号を一つの信号に合成するようになっている。そして、オールパスフィルタ58は、合成した信号を、加算器59に供給するようになっている。
 加算器59は、デコーダ53からの右側ステレオ信号Rと、同じくデコーダ53からの右側サラウンド信号Rsと、オールパスフィルタ58の出力信号とを加算し、加算された信号を右側スピーカRSPに出力するようになっている。
 スイッチ56は、一方の端子が試験信号発生回路54に接続され、他方の端子が加算器59及びアッテネータ60に接続されてる。スイッチ56がONとなると、試験信号発生回路54からの試験信号が加算器59とアッテネータ60とに供給されるようになっている。
 アッテネータ60は、デコーダ53から供給された右側サラウンド信号Rsまたは試験信号発生回路54から供給された試験信号を減衰させ(例えば6dB)、オールパスフィルタ61に供給するようになっている。
 オールパスフィルタ61は、アッテネータ60からの出力信号を周波数帯域毎に遅延させ、加算器59に供給するようになっている。オールパスフィルタ61の構成は、オールパスフィルタ58と同様である。
 加算器62は、デコーダ53からの左側ステレオ信号Lと、同じくデコーダ53からの左側サラウンド信号Lsと、オールパスフィルタ61の出力信号とを加算し、加算された信号を左側スピーカLSPに出力するようになっている。
 以下に、AVアンプ50の動作について説明する。
 先ず、マイコン51の制御に基づいて、オールパスフィルタ58及び61に用いられる最適ディレイ値を夫々設定する。具体的な処理内容は、図8及び図9に示した処理内容と基本的に同様である。
 ここで、マイコン51は、オールパスフィルタ58について設定を行う場合には、先ず、スイッチ55をONにさせる一方、スイッチ56をOFFにさせる。こうすることで、試験信号発生回路54から出力された試験信号は、加算器62を介して左側スピーカLSPに供給され、当該左側スピーカLSPから試験音が出力される。また、同じく試験信号発生回路54から出力された試験信号は、アッテネータ57によって減衰させられ、更にオールパスフィルタ58により遅延させられる。そして、この試験信号が加算器59を介して右側スピーカRSPに供給され、当該右側スピーカRSPから、遅延した試験音が出力される。そして、マイコン51は、2つの帯域において、φとφを適宜変更してオールパスフィルタに設定し、この結果得られた最適ディレイ値から各帯域における最適ディレイ値を求め、メモリ52に記憶させる。
 また、マイコン51は、オールパスフィルタ61について設定を行う場合には、先ず、スイッチ55をOFFにさせる一方、スイッチ56をONにさせる。こうすることで、試験信号発生回路54から出力された試験信号は、加算器59を介して右側スピーカRSPに供給され、当該右側スピーカRSPから試験音が出力される。また、同じく試験信号発生回路54から出力された試験信号は、アッテネータ60によって減衰させられ、更にオールパスフィルタ61により遅延させられる。そして、この試験信号が加算器62を介して左側スピーカLSPに供給され、当該左側スピーカLSPから、遅延した試験音が出力される。そして、マイコン51は、オールパスフィルタ58の場合と同様にして最適ディレイ値を求め、メモリ52に記憶させる。
[規則91に基づく訂正 01.09.2008]
 最適ディレイ値が設定された後、ユーザの指示によりオーディオの再生が指示されると、マイコン51は、スイッチ55及び56をOFFにさせ、デコーダ53からの出力信号が各部に供給されるようにする。また、マイコン51は、メモリ52に記憶されている帯域毎の最適ディレイ値をオールパスフィルタ58と61とに設定する。そして、デコーダ53にオーディオストリーム信号Asが入力されると、当該デコーダ53は、当該信号を復号し、左側ステレオ信号L、右側ステレオ信号R、左側サラウンド信号Ls、右側サラウンド信号Rs及び低音域効果信号Lfeを出力する。アッテネータ57に左側サラウンド信号Lsが供給されると、当該信号は、アッテネータ57において遅延させられ、オールパスフィルタ58により減衰させられる。また、アッテネータ60に右側サラウンド信号Rsが供給されると、当該信号は、アッテネータ60において遅延させられ、オールパスフィルタ61により減衰させられる。
 そして、加算器62により、左側ステレオ信号L、左側サラウンド信号Ls及びオールパスフィルタ61からの出力信号が加算されて、左側スピーカLSPに供給される。また、加算器59により、右側ステレオ信号R、右側サラウンド信号Rs及びオールパスフィルタ58からの出力信号が加算されて、右側スピーカRSPに供給される。
 以上のような構成及び動作のAVアンプ50を利用することにより、ユーザは、自身の特徴や自身のリスニング環境に適したサラウンド音響を楽しむことができる。
 なお、4.1chに限らず、例えば、5.1chや4ch等のサラウンド再生システムに適用することも可能である。
 また、本発明は、上記実施形態に限定されるものではない。上記実施形態は、例示であり、本発明の請求の範囲に記載された技術的思想と実質的に同一な構成を有し、同様な作用効果を奏するものは、如何なるものであっても本発明の技術的範囲に包含される。

Claims (13)

  1.  試験音信号を出力する試験音信号出力手段と、
     設定された遅延量に応じて前記試験音信号を遅延させる遅延手段と、
     前記試験音信号に対応する試験音が一方のスピーカから出力された状態で且つ前記遅延手段により遅延させられた前記試験音信号に対応する試験音が他方のスピーカから出力された状態で聴者が感じた音像の定位方向、を入力するための入力手段と、
     前記入力手段を用いて入力された前記定位方向に相当する定位角であって、互いに異なる2つの前記遅延量で夫々前記試験音信号が遅延させられたときの一方の定位角と他方の定位角との差を閾値と比較する比較手段と、
     前記差が前記閾値より大きいと判定されている間、前記2つの遅延量のうち何れか一方を変更し、変更した方の前記遅延量で前記試験音信号が遅延させられたときの前記定位角と他方の前記定位角とを用いて前記比較手段に前記比較を行わせる制御手段と、
     前記差が前記閾値より小さいと判定された場合に、このときの前記2つの遅延量の一方から他方までの範囲内で予め定められた条件に基づいて一の遅延量を選択する選択手段と、
     を備えることを特徴とする遅延量決定装置。
  2.  請求項1に記載の遅延量決定装置において、
     前記2つの遅延量の一方の遅延量から他方の遅延量までの範囲内に前記定位角が最大となる遅延量が含まれるよう、当該2つの遅延量の初期値が設定されていることを特徴とする遅延量決定装置。
  3.  請求項2に記載の遅延量決定装置において、
     前記2つの遅延量のうち、一方の遅延量の初期値はπラジアンに設定され、他方の遅延量の初期値は2πラジアンに設定されていることを特徴とする遅延量決定装置。
  4.  請求項1に記載の遅延量決定装置において、
     前記制御手段は、前記2つの遅延量のうち前記定位角が小さい方を、他方の遅延量に近づくように変更することを特徴とする遅延量決定装置。
  5.  請求項4に記載の遅延量決定装置において、
     前記制御手段は、前記2つの遅延量のうち前記定位角が小さい方を、当該2つの遅延量の平均値に変更することを特徴とする遅延量決定装置。
  6.  請求項1に記載の遅延量決定装置において、
     前記選択手段は、前記2つの遅延量の平均値を選択することを特徴とする遅延量決定装置。
  7.  請求項1に記載の遅延量決定装置において、
     前記試験音信号出力手段は、互いに異なる複数の周波数の前記試験音信号を発生させ、
     前記選択手段は、周波数毎に遅延量を選択し、
     前記選択手段により周波数毎に選択された遅延量に基づいて、前記複数の周波数を除く他の周波数における遅延量を算出する算出手段を更に備えることを特徴とする遅延量決定装置。
  8.  請求項7に記載の遅延量決定装置において、
     前記試験音信号出力手段は、2つの周波数の前記試験音信号を発生させ、
     前記算出手段は、予め定められた周波数に対して予め設定された前記遅延量と、前記選択手段により選択された2つ前記遅延量と、に基づいて、前記他の周波数における遅延量を補間することを特徴とする遅延量決定装置。
  9.  請求項8に記載の遅延量決定装置において、
     前記予め定められた周波数は、聴者が最適な方向と感じる前記定位方向の、聴者間または聴取環境間での差が小さいとされる周波数範囲として予め定められた範囲内で設定され、
     前記2つの周波数は、前記予め定められた範囲の外で設定されていることを特徴とする遅延量決定装置。
  10.  請求項1乃至6の何れか1項に記載の遅延量決定装置と、
     前記選択手段により選択された遅延量を、前記遅延手段により用いられる遅延量として設定する設定手段と、
     入力された音信号を前記一方のスピーカに出力する一方出力手段と、
     前記遅延手段により遅延させられた前記音信号を前記他方のスピーカに出力する他方出力手段と、を備え、
     前記遅延手段は、前記音信号を遅延させることを特徴とする音像定位装置。
  11.  請求項7乃至9の何れか1項に記載の遅延量決定装置と、
     前記選択手段により選択された遅延量と、前記算出手段により算出された遅延量と、を、前記遅延手段により用いられる遅延量として、夫々対応する周波数に対して設定する設定手段と、
     入力された音信号を前記一方のスピーカに出力する一方出力手段と、
     前記遅延手段により遅延させられた前記音信号を前記他方のスピーカに出力する他方出力手段と、を備え、
     前記遅延手段は、前記音信号を周波数毎に遅延させることを特徴とする音像定位装置。
  12.  試験音信号を出力し、
     設定された遅延量に応じて前記試験音信号を遅延させ、
     前記試験音信号に対応する試験音が一方のスピーカから出力された状態で且つ前記遅延させられた前記試験音信号に対応する試験音が他方のスピーカから出力された状態で聴者が感じた音像の定位方向、を入力するための入力手段を用いて入力された前記定位方向に相当する定位角であって、互いに異なる2つの前記遅延量で夫々前記試験音信号が遅延させられたときの一方の定位角と他方の定位角との差を閾値と比較し、
     前記差が前記閾値より大きいと判定されている間、前記2つの遅延量のうち何れか一方を変更し、変更した方の前記遅延量で前記試験音信号が遅延させられたときの前記定位角と他方の前記定位角とを用いて前記比較を行い、
     前記差が前記閾値より小さいと判定された場合に、このときの前記2つの遅延量の一方から他方までの範囲内で予め定められた条件に基づいて一の遅延量を選択することを特徴とする遅延量決定方法。
  13.  コンピュータを、
     試験音信号を出力する試験音信号出力手段、
     設定された遅延量に応じて前記試験音信号を遅延させる遅延手段、
     前記試験音信号に対応する試験音が一方のスピーカから出力された状態で且つ前記遅延手段により遅延させられた前記試験音信号に対応する試験音が他方のスピーカから出力された状態で聴者が感じた音像の定位方向、を入力するための入力手段を用いて入力された前記定位方向に相当する定位角であって、互いに異なる2つの前記遅延量で夫々前記試験音信号が遅延させられたときの一方の定位角と他方の定位角との差を閾値と比較する比較手段、
     前記差が前記閾値より大きいと判定されている間、前記2つの遅延量のうち何れか一方を変更し、変更した方の前記遅延量で前記試験音信号が遅延させられたときの前記定位角と他方の前記定位角とを用いて前記比較手段に前記比較を行わせる制御手段、及び
     前記差が前記閾値より小さいと判定された場合に、このときの前記2つの遅延量の一方から他方までの範囲内で予め定められた条件に基づいて一の遅延量を選択する選択手段、
     として機能させることを特徴とする遅延量決定処理プログラム。
PCT/JP2008/062598 2008-07-11 2008-07-11 遅延量決定装置、音像定位装置、遅延量決定方法、遅延量決定処理プログラム WO2010004649A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2010519611A JPWO2010004649A1 (ja) 2008-07-11 2008-07-11 遅延量決定装置、音像定位装置、遅延量決定方法、遅延量決定処理プログラム
PCT/JP2008/062598 WO2010004649A1 (ja) 2008-07-11 2008-07-11 遅延量決定装置、音像定位装置、遅延量決定方法、遅延量決定処理プログラム
US13/003,669 US20110142244A1 (en) 2008-07-11 2008-07-11 Delay amount determination device, sound image localization device, delay amount determination method and delay amount determination processing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2008/062598 WO2010004649A1 (ja) 2008-07-11 2008-07-11 遅延量決定装置、音像定位装置、遅延量決定方法、遅延量決定処理プログラム

Publications (1)

Publication Number Publication Date
WO2010004649A1 true WO2010004649A1 (ja) 2010-01-14

Family

ID=41506780

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2008/062598 WO2010004649A1 (ja) 2008-07-11 2008-07-11 遅延量決定装置、音像定位装置、遅延量決定方法、遅延量決定処理プログラム

Country Status (3)

Country Link
US (1) US20110142244A1 (ja)
JP (1) JPWO2010004649A1 (ja)
WO (1) WO2010004649A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013146602A1 (ja) * 2012-03-26 2013-10-03 ヤマハ株式会社 Avアンプ
CN108352159A (zh) * 2015-11-02 2018-07-31 三星电子株式会社 用于识别语音的电子设备和方法
WO2019142604A1 (ja) * 2018-01-19 2019-07-25 シャープ株式会社 信号処理装置、信号処理システム、信号処理方法、信号処理プログラムおよび記録媒体

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100118199A1 (en) * 2008-11-10 2010-05-13 Kabushiki Kaisha Toshiba Video/Audio Processor and Video/Audio Processing Method
JP6264719B2 (ja) * 2012-11-29 2018-01-24 株式会社ノーリツ 壁面取付け式音声発声装置
JP2016019086A (ja) * 2014-07-07 2016-02-01 ヤマハ株式会社 ビーム方向設定装置およびビーム方向設定システム
CN106303821A (zh) * 2015-06-12 2017-01-04 青岛海信电器股份有限公司 串音消除方法与系统
DE102018203661A1 (de) * 2018-03-12 2019-09-12 Ford Global Technologies, Llc Verfahren und Vorrichtung zum Testen von direktionalem Hören in einem Fahrzeug
JP7497755B2 (ja) * 2020-05-11 2024-06-11 ヤマハ株式会社 信号処理方法、信号処理装置、及びプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03210898A (ja) * 1990-01-12 1991-09-13 Yamaha Corp 音像定位制御装置
JPH08205298A (ja) * 1995-01-26 1996-08-09 Victor Co Of Japan Ltd 音像定位制御装置
JPH09252499A (ja) * 1996-03-14 1997-09-22 Mitsubishi Electric Corp 多チャンネル音響再生装置
WO2007108301A1 (ja) * 2006-03-17 2007-09-27 Pioneer Corporation 立体音響再生装置及び立体音響再生用プログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6035045A (en) * 1996-10-22 2000-03-07 Kabushiki Kaisha Kawai Gakki Seisakusho Sound image localization method and apparatus, delay amount control apparatus, and sound image control apparatus with using delay amount control apparatus
US20060013407A1 (en) * 2004-07-19 2006-01-19 Peavey Hartley D Methods and apparatus for sound compensation in an acoustic environment
JP4817664B2 (ja) * 2005-01-11 2011-11-16 アルパイン株式会社 オーディオシステム
US8238563B2 (en) * 2008-03-20 2012-08-07 University of Surrey-H4 System, devices and methods for predicting the perceived spatial quality of sound processing and reproducing equipment

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03210898A (ja) * 1990-01-12 1991-09-13 Yamaha Corp 音像定位制御装置
JPH08205298A (ja) * 1995-01-26 1996-08-09 Victor Co Of Japan Ltd 音像定位制御装置
JPH09252499A (ja) * 1996-03-14 1997-09-22 Mitsubishi Electric Corp 多チャンネル音響再生装置
WO2007108301A1 (ja) * 2006-03-17 2007-09-27 Pioneer Corporation 立体音響再生装置及び立体音響再生用プログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013146602A1 (ja) * 2012-03-26 2013-10-03 ヤマハ株式会社 Avアンプ
CN108352159A (zh) * 2015-11-02 2018-07-31 三星电子株式会社 用于识别语音的电子设备和方法
CN108352159B (zh) * 2015-11-02 2023-05-30 三星电子株式会社 用于识别语音的电子设备和方法
WO2019142604A1 (ja) * 2018-01-19 2019-07-25 シャープ株式会社 信号処理装置、信号処理システム、信号処理方法、信号処理プログラムおよび記録媒体
JPWO2019142604A1 (ja) * 2018-01-19 2021-01-14 シャープ株式会社 信号処理装置、信号処理システム、信号処理方法、信号処理プログラムおよび記録媒体

Also Published As

Publication number Publication date
US20110142244A1 (en) 2011-06-16
JPWO2010004649A1 (ja) 2011-12-22

Similar Documents

Publication Publication Date Title
WO2010004649A1 (ja) 遅延量決定装置、音像定位装置、遅延量決定方法、遅延量決定処理プログラム
JP7502377B2 (ja) 没入型オーディオ再生システム
CN103329571B (zh) 沉浸式音频呈现系统
TWI489887B (zh) 用於喇叭或耳機播放之虛擬音訊處理技術
JP4285531B2 (ja) 信号処理装置、信号処理方法、プログラム
US8971542B2 (en) Systems and methods for speaker bar sound enhancement
US11553296B2 (en) Headtracking for pre-rendered binaural audio
JP6141530B2 (ja) 方向依存処理のためのオーディオ処理器
RU2667377C2 (ru) Способ и устройство обработки звука и программа
CN112019993B (zh) 用于音频处理的设备和方法
JP2008514098A (ja) マルチチャンネルオーディオ制御
KR20190091825A (ko) 스테레오 오디오를 바이노럴 오디오로 업 믹스하는 방법 및 이를 위한 장치
EP2134108B1 (en) Sound processing device, speaker apparatus, and sound processing method
WO2013168200A1 (ja) 音声処理装置、再生装置、音声処理方法およびプログラム
JP2010178375A (ja) 5−2−5マトリックス・エンコーダおよびデコーダ・システム
JP2008154083A (ja) 音場再生装置
WO2023087031A2 (en) Systems and methods for rendering spatial audio using spatialization shaders
JP2003116200A (ja) 音響信号処理回路および音響再生装置
JP4797065B2 (ja) オーディオ信号処理装置及びサラウンド信号生成方法等
JP5015266B2 (ja) センターチャンネル定位装置
US20230091218A1 (en) Headtracking for Pre-Rendered Binaural Audio
JP2006135489A (ja) 再生バランス調整方法、プログラム及び再生バランス調整装置
JP2006135611A (ja) 仮想音像制御装置
WO2013051085A1 (ja) 音声信号処理装置、音声信号処理方法及び音声信号処理プログラム
US11832079B2 (en) System and method for providing stereo image enhancement of a multi-channel loudspeaker setup

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 08778113

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2010519611

Country of ref document: JP

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 13003669

Country of ref document: US

122 Ep: pct application non-entry in european phase

Ref document number: 08778113

Country of ref document: EP

Kind code of ref document: A1