WO2019225190A1 - 情報処理装置、情報処理方法、プログラム - Google Patents

情報処理装置、情報処理方法、プログラム Download PDF

Info

Publication number
WO2019225190A1
WO2019225190A1 PCT/JP2019/015643 JP2019015643W WO2019225190A1 WO 2019225190 A1 WO2019225190 A1 WO 2019225190A1 JP 2019015643 W JP2019015643 W JP 2019015643W WO 2019225190 A1 WO2019225190 A1 WO 2019225190A1
Authority
WO
WIPO (PCT)
Prior art keywords
speaker
speakers
circle
arrangement
information processing
Prior art date
Application number
PCT/JP2019/015643
Other languages
English (en)
French (fr)
Inventor
由紀子 海野
良城 首藤
Original Assignee
ソニー株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ソニー株式会社 filed Critical ソニー株式会社
Priority to US17/056,239 priority Critical patent/US11463836B2/en
Priority to JP2020521085A priority patent/JP7306384B2/ja
Priority to CN201980032496.1A priority patent/CN112119646B/zh
Publication of WO2019225190A1 publication Critical patent/WO2019225190A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/02Spatial or constructional arrangements of loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2205/00Details of stereophonic arrangements covered by H04R5/00 but not provided for in any of its subgroups
    • H04R2205/024Positioning of loudspeaker enclosures for spatial sound reproduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved

Definitions

  • This technology relates to an information processing apparatus, an information processing method, and a program, and particularly relates to a technology of a surround sound system.
  • sound field correction may be performed in order to obtain a sound field suitable for user listening.
  • a user listening position is detected by causing the user to perform an operation indicating his / her listening position, for example, by giving the user at the listening position a measuring instrument such as a microphone.
  • a speaker emits an ultrasonic signal
  • a remote controller at a listening position receives a signal from each speaker, and from each speaker to the remote controller (listening position) using a phase difference of the detected signal.
  • a method for calculating the distance ratio is described.
  • the user needs to hold the remote controller and stand by at the listening position, which may limit the user's behavior while measuring the listening position.
  • the measuring instrument is included as a part of the speaker system, which makes the product configuration complicated.
  • the surround sound system exhibits the surround effect by arranging the speaker at an appropriate angle from the user listening position.
  • the speaker may not be properly arranged due to, for example, the shape and size of the room and the arrangement of furniture and the like. For this reason, in some cases, the surround effect of the surround sound system may not be sufficiently exhibited.
  • the user listening position is estimated without imposing a burden on the user, and suitable for listening regardless of the actual speaker arrangement environment.
  • the purpose is to create a sound reproduction environment.
  • An information processing apparatus includes an estimation unit that estimates a user listening position using position information of N or more speakers that are three or more, and an arrangement unit that sets a virtual speaker arrangement using the user listening position; .
  • a virtual speaker that is a speaker virtually arranged at a position different from the actual speaker arrangement is assumed.
  • the user listening position is estimated based on the position information of the N speakers. Further, a virtual speaker arrangement is set based on the estimated user listening position.
  • the placement unit sets a placement circle centered on the user listening position, and the virtual speaker placement is performed so that the virtual speaker is placed on the circumference of the placement circle. Can be set.
  • the placement unit sets the virtual speaker placement on the circumference of the placement circle centered on the user listening position.
  • the estimation unit recognizes a reference speaker among the N speakers and a farthest speaker positioned farthest from a reference position determined according to the reference speaker. Then, a process for obtaining a reference circle that passes through the reference speaker and the farthest speaker, and a process for moving the center of the reference circle based on the positional information of the N speakers are performed. It is conceivable to estimate the center as the user listening position. A reference circle as large as possible is obtained using the reference speaker and the farthest speaker. By moving the center of the reference circle based on the position information of the N speakers, the user listening position reflecting the actual arrangement state of the N speakers is estimated.
  • the placement unit may perform a process of enlarging the radius of the reference circle by a predetermined constant times. A radius of a size obtained by enlarging the radius of the reference circle by a predetermined constant multiple is calculated.
  • the reference speaker may be a front left speaker and a front right speaker
  • the reference position may be a midpoint between the front left speaker and the front right speaker.
  • the reference speaker may be a front center speaker, and the reference position may be a position where the front center speaker is disposed.
  • the front center speaker as the reference speaker, the user listening position in the left-right direction is estimated based on the front center speaker arranged in front of the user's actual listening position.
  • the estimation unit obtains an average position in at least the front-rear direction of the N speakers by using position information of the N speakers, and the center of the reference circle is the average. It is conceivable to move in the front-rear direction to a position aligned with the position in the left-right direction. An average position in at least the front-rear direction of N speakers is obtained, and a reference point that is the center of the reference circle is moved in the front-rear direction to a position aligned with the average position in the left-right direction. Thereby, the center position of the reference circle after movement is obtained.
  • the placement unit is configured such that the virtual speaker disposed on the circumference of the placement circle has a radius of the placement circle larger than a predetermined length and behind which speaker.
  • the virtual speaker arrangement may be reset by setting the radius of the arrangement circle to the radius of the predetermined length. After setting the virtual speaker arrangement on the circumference of the arrangement circle, the radius of the arrangement circle is set to a predetermined length radius, and the virtual speaker arrangement is re-set to a new arrangement circle having the predetermined length radius. Set.
  • the estimation unit when the N speakers are located within a predetermined range in the front-rear direction, the estimation unit performs positional information on the reference speaker and the front and rear of the N speakers. It is conceivable that the user listening position is estimated using position information of an average position in the direction, and the placement unit sets the radius of the placement circle to the predetermined length.
  • the user listening position is estimated using the position information of the reference speaker and the position information of the average position in the front-rear direction of the N speakers, An arrangement circle having a predetermined radius is set around the estimated user listening position.
  • the information processing apparatus estimates the user listening position using position information of N or more speakers that are three or more, and sets the virtual speaker arrangement using the user listening position.
  • the information processing apparatus is provided with the information processing apparatus, and the processing of the above procedure is executed.
  • the program according to the present technology is a program that causes an information processing apparatus to execute such processing.
  • the information processing method of the present technology is realized in the information processing apparatus including the information processing apparatus.
  • the present technology it is possible to estimate a user listening position without imposing a burden on the user, and to form a sound reproduction environment suitable for listening regardless of a speaker arrangement state.
  • the effects described here are not necessarily limited, and may be any of the effects described in the present disclosure.
  • Speaker system configuration> In the embodiment, assuming a surround sound system capable of connecting three or more speakers, estimation of a user listening position and setting of virtual speaker arrangement are performed. Hereinafter, as shown in FIG. 1, a surround sound system using four speakers 3 (3A, 3B, 3C, 3D) will be described as an example.
  • the four speakers are collectively referred to as “speaker 3” when they are collectively referred to or not particularly distinguished.
  • they are expressed as “speaker 3A” to “speaker 3D”.
  • the channel of the speaker 3 four channels are assumed, which are a front L channel, a front R channel, a surround L channel, and a surround R channel, respectively. They are called “FL channel”, “FR channel”, “SL channel”, and “SR channel”, respectively.
  • 4 channels are an example for explanation, and cases of 5 channels, 5.1 channels, 7 channels, 7.1 channels, and the like are also conceivable.
  • the front left front L channel speaker is “FL speaker”
  • the front right front R channel speaker is “FR speaker”
  • the left rear surround L channel speaker is “ The “SL speaker” and the right rear surround R channel speaker”.
  • SR speaker For example, when the speaker 3A is set to the front L channel, it may be expressed as “FL speaker 3A”.
  • FIG. 1 shows an arrangement example of a surround sound system in a living room, for example.
  • the surround sound system according to the embodiment is configured as a speaker system including the information processing apparatus 1 and speakers 3A, 3B, 3C, and 3D.
  • the speaker system may include a remote controller 5.
  • the speaker system is used for, for example, sound reproduction of video content displayed on the monitor device 9 such as a television receiver, or audio such as music or environmental sound even when the video is not displayed on the monitor device 9. Used for playback.
  • a monitor device 9 is arranged at a position on the front side of the user, for example, in front of the sofa 8.
  • the information processing apparatus 1 is disposed in the vicinity of the monitor apparatus 9.
  • the direction in which the user faces the monitor device 9 is the front.
  • the FL speaker 3A is arranged on the left side of the monitor device 9, and the FR speaker 3B is arranged on the right side.
  • An SL speaker 3C is arranged on the left rear side of the sofa 8, and an SR speaker 3D is arranged on the right rear side.
  • the above arrangement is a typical arrangement example of the monitor device 9 and the 4-channel speaker system.
  • the speakers 3A, 3B, 3C, 3D are connected to the FL channel, It is desirable that they are arranged at positions suitable for the FR channel, SL channel, and SR channel.
  • FIG. 2 shows a configuration example of the speaker system according to the embodiment.
  • the information processing apparatus 1 as a parent device and the speakers 3A, 3B, 3C, and 3D as child devices can communicate with each other.
  • the information processing apparatus 1 and each speaker 3 may be wirelessly communicated by a communication method such as Wi-Fi (registered trademark) or Bluetooth (registered trademark), or may be wired.
  • a communication method such as Wi-Fi (registered trademark) or Bluetooth (registered trademark)
  • LAN Local Area Network
  • USB Universal Serial Bus
  • a dedicated line including an audio line and a control line may be used.
  • An audio signal (digital audio signal or analog audio signal), control data, notification data, and the like are transmitted between the information processing apparatus 1 and the speaker 3 by these wireless or wired communications.
  • the speakers 3A, 3B, 3C, and 3D are synchronized in time via the information processing apparatus 1, for example.
  • the speakers 3A, 3B, 3C, and 3D may be capable of communicating with each other, and a configuration that does not particularly perform communication is also conceivable.
  • the speakers 3A, 3B, 3C, and 3D are channel-set (channel assigned) by the information processing apparatus 1.
  • the speakers 3A, 3B, 3C, and 3D have individual speaker IDs as identifiers, for example, but basically have the same configuration and are not dedicated devices for a certain channel.
  • the speaker 3A can be used as any of an FL speaker, an FR speaker, an SL speaker, and an SR speaker.
  • the other speakers 3B, 3C, 3D Therefore, the user should just arrange
  • Each speaker 3 is assigned a channel by the information processing apparatus 1, and a channel is determined from the viewpoint of the information processing apparatus 1.
  • the information processing apparatus 1 receives the audio signal from the sound source apparatus 2, performs necessary signal processing, and transmits the audio signal distributed to each channel to the assigned speaker 3.
  • Each speaker 3 receives a sound signal of the corresponding channel from the information processing apparatus 1 and outputs a sound. As a result, 4-channel surround sound output is performed.
  • the sound source device 2 shown in FIG. 2 is, for example, a monitor device 9 or a playback device (audio player) not shown.
  • the sound source device 2 supplies L and R stereo channel audio signals (digital audio signals or analog audio signals) and multi-channel surround compatible audio signals to the information processing device 1.
  • the information processing apparatus 1 performs distribution and generation of the audio signal of the channel corresponding to the installed speaker 3, and in this case, generates the audio signal of the FL channel, the FR channel, the SL channel, and the SR channel, It transmits to each speaker 3A, 3B, 3C, 3D.
  • Each speaker 3 includes a speaker unit 32, and the speaker unit 32 is driven by the transmitted audio signal to output audio.
  • Each speaker 3 includes a microphone 33 that can be used for channel setting described later.
  • FIG. 3 shows remote controllers 5A and 5B as examples of the remote controller 5.
  • the remote controllers 5A and 5B transmit user operation information to the information processing apparatus 1 by, for example, infrared rays or radio waves.
  • each speaker 3 as a slave unit can identify communication addressed to itself by the slave address given to its own speaker. Further, each speaker 3 includes its own identifier (speaker ID) in the transmission information, so that the information processing apparatus 1 can identify from which speaker the communication from each speaker 3 is.
  • the information processing apparatus 1 includes a CPU (Central Processing Unit) 11, an output signal forming unit 12, an RF (Radio® Frequency) module 13, and a receiving unit 14.
  • CPU Central Processing Unit
  • RF Radio® Frequency
  • the output signal forming unit 12 performs processing related to the audio signal output to each speaker 3. For example, the output signal forming unit 12 cooperates with the CPU 11 to distribute the audio signal of each channel or to generate a channel audio signal, or to generate an audio signal to each speaker for virtual speaker output to be described later, for example, channel mixing. Signal processing including localization adjustment, delay, etc. is performed.
  • the output signal forming unit 12 also performs amplification processing, sound quality processing, equalizing, band filter processing and the like on the audio signal of each channel. Further, the output signal forming unit 12 may perform a process of generating an audio signal as a test tone used for channel setting.
  • the RF module 13 transmits audio signals and control signals to the speakers 3 and receives signals from the speakers 3. For this reason, the RF module 13 performs encoding processing and transmission processing for wireless transmission of the audio signal and control signal to be transmitted supplied from the CPU 11. Further, the RF module 13 performs reception processing of signals transmitted from the speaker 3, decoding processing of received data, transfer to the CPU 11, and the like.
  • the receiving unit 14 receives the operation signal from the remote controller 5, demodulates / decodes the received operation signal, and transmits the operation information to the CPU 11.
  • the CPU 11 performs arithmetic processing on the audio signal supplied from the sound source device 2, channel setting processing, processing related to the virtual speaker, and the like.
  • the CPU 11 is provided with the functions shown in FIG. 5 by an installed program (software), and arithmetic processing as these functions is performed. That is, the CPU 11 has functions as a relative position recognition unit 11a, a channel setting unit 11b, a virtual speaker setting unit 11c, and a channel signal processing unit 11d.
  • the relative position recognition unit 11a and the channel setting unit 11b perform processing for channel setting of each speaker 3.
  • the relative position recognizing unit 11a receives notification that the user has designated operation from two of the N (three in this example) speakers 3, and sets the two placement reference speakers. Perform recognition processing. Further, the relative position recognition unit 11a performs processing for acquiring distance information between the speakers 3. Further, the relative position recognizing unit 11a performs processing for recognizing the relative positional relationship of the N (four) speakers 3 by using the distance information between the two arrangement reference speakers and the respective speakers.
  • the channel setting unit 11b performs a process of automatically setting the channel of each speaker 3 based on the relative positional relationship recognized by the relative position recognition unit 11a.
  • the virtual speaker setting unit 11c performs processing for setting the virtual speaker arrangement based on the relative positional relationship recognized by the relative position recognition unit 11a and the channel setting by the channel setting unit 11b.
  • the virtual speaker is a speaker virtually arranged at a position different from the actual arrangement of the speakers 3.
  • Setting a virtual speaker by the virtual speaker setting unit 11c means that a predetermined process is performed on the audio signal for each speaker 3, and sound output is performed at a position different from the actual arrangement of the speaker 3 and in a localized state. is there.
  • the virtual speaker setting unit 11c includes a function as an estimation unit 110 that estimates a user listening position and a placement unit 111 that sets a virtual speaker layout using the user listening position, and a virtual speaker placement based on the estimated user listening position. Set. Specific processing by each function as the virtual speaker setting unit 11c will be described later.
  • the channel signal processing unit 11 d generates an N-channel audio signal to be supplied to each of the N speakers 3 for the input audio signal in cooperation with the signal processing in the output signal forming unit 12, and sends it to the RF module 13. Perform the transfer process. Further, the channel signal processing unit 11d performs N channel processing so as to achieve a localization state for realizing the virtual speaker as a transmission signal for each speaker 3 when the virtual speaker setting unit 11c sets the virtual speaker arrangement. The voice signal is generated in cooperation with the output signal forming unit 12.
  • the speaker 3 includes a CPU 31, a speaker unit 32, a microphone 33, a touch sensor 34, an RF module 35, an amplifier 36, and a microphone input unit 37.
  • the CPU 31 performs communication processing and control inside the speaker.
  • the RF module 35 is a module that performs wireless communication with the RF module 13 of the information processing apparatus 1.
  • the RF module 35 receives and decodes the audio signal and control signal transmitted from the information processing apparatus 1, and transfers the decoded signal to the CPU 31.
  • the RF module 35 also encodes the control signal and notification signal transferred from the CPU 31 for wireless transmission, and performs processing for transmitting the encoded signal to the information processing apparatus 1.
  • the CPU 31 supplies the audio signal transmitted from the information processing apparatus 1 to the amplifier 36.
  • the amplifier 36 converts, for example, an audio signal as digital data transferred from the CPU 31 into an analog signal, amplifies it, and outputs it to the speaker unit 32. Thereby, sound output is executed from the speaker unit 32.
  • the amplifier 36 may output a digital audio signal.
  • the audio signal obtained by the microphone 33 is amplified by the microphone input unit 37, converted to digital audio data, for example, and supplied to the CPU 31.
  • the CPU 31 can store a microphone input voice signal together with time information (time stamp) in an internal RAM (Random Access Memory). Or CPU31 may memorize
  • the CPU 31 transfers the stored information to the RF module 35 at a predetermined timing and causes the information processing apparatus 1 to transmit it.
  • the touch sensor 34 is a contact detection sensor formed as a touch pad or the like at a position where the user can easily touch, for example, the upper surface or the front surface of the housing of the speaker 3.
  • the touch operation of the user is detected by the touch sensor 34, and the detection information is transmitted to the CPU 31.
  • the CPU 31 detects that a touch operation has been performed, the CPU 31 causes the information processing apparatus 1 to transmit information on touch operation detection using the RF module 35.
  • the touch sensor 34 is an example of a device that detects a user operation on the speaker 3. Instead of the touch sensor 34 or in addition to the touch sensor 34, a device capable of detecting the user's operation and behavior, such as an imaging device (camera), an operation button, and a capacitance sensor, may be provided. Further, an example in which the touch sensor 34 or the like is not provided by detecting the sound (contact sound) accompanying the touch operation with the microphone 33 is also conceivable.
  • Speaker location information acquisition and channel setting> The channel setting of the present embodiment executed in the above configuration will be described. For simplification of explanation, it is assumed that the speakers 3 are arranged on the same plane.
  • the setting may be wrong. There are also users who don't understand the channel setting work or are troublesome. In such a state, a correct surround sound cannot be reproduced. In the present embodiment, it is possible to correctly set the output channels of all the speakers 3 only by touching some speakers 3 by the user.
  • FIG. 6A shows a state in which, for example, the information processing apparatus 1 and four speakers 3A, 3B, 3C, and 3D are installed as described in FIG.
  • the user since the channel setting of each speaker 3 is not determined in advance, the user installs each speaker 3A, 3B, 3C, 3D at an arbitrary position without minding the channel setting. Naturally, the channels are not yet set for the respective speakers 3.
  • the information processing device 1 that is the master unit and each speaker 3 are turned on, the information processing device 1 and each speaker 3 are wirelessly connected by, for example, WiFi as shown in FIG. Be started.
  • the user touches the speaker 3A placed on the left side of the monitor device 9 as shown by a solid line H1 in FIG. 6B, and subsequently monitors the monitor device 9 as shown by a broken line H2 according to the guidance of the present speaker system.
  • the speaker system may play a guidance voice such as “Please touch the left speaker toward the front” as guidance, or display the message on the monitor device 9.
  • the user performs an operation of touching the touch sensor 34 of the left speaker 3A toward the front (arrow DRU).
  • the direction in which the user faces the monitor device 9 is the front.
  • the speaker system When it is detected that the user has performed an operation of touching the touch sensor 34 of the speaker 3A, for example, the speaker system performs guidance of “Please touch the right speaker toward the front”. In response to this, the user subsequently performs an operation of touching the touch sensor 34 of the speaker 3B.
  • a user who does not use the monitor device 9 is also assumed. Such a user may touch the front left and front right speakers in order in accordance with the position and direction in which he / she usually listens.
  • FIG. 7A shows a state in which the speakers 3A and 3B are FL speakers and FR speakers.
  • the speaker system can specify the FL speaker 3A and the FR speaker 3B, and infer the user's listening direction as a relative positional relationship with respect to the set FL speaker 3A and the FR speaker 3B.
  • the speaker system automatically measures the distance between the speakers 3. It is assumed that the information processing apparatus 1 that is the parent machine and each speaker 3 are time-synchronized using a PTP (Precision Time Protocol) method or the like.
  • the distance between the speakers 3 is measured by detecting the test sound reproduced by one speaker 3 by another speaker 3 and measuring the arrival time. For example, as shown in FIG. 7A, test sounds reproduced by the speaker unit 32 of the FL speaker 3A are picked up by the microphones 33 mounted on the FR speaker 3B, the speakers 3C, and 3D, and stored together with a time stamp (time information). .
  • PTP Precision Time Protocol
  • the test sound may be output for a moment as an electronic sound having a predetermined frequency, for example.
  • a continuous sound such as one second or several seconds may be used.
  • any sound that can measure the arrival time may be used.
  • Such an operation is performed by changing the speaker 3 to be reproduced. That is, when the test sound is reproduced by the speaker 3A as shown in FIG. 7A and the test sound and time information are stored by the speakers 3B, 3C, and 3D, the test sound is reproduced by the speaker unit 32 of the speaker 3B as shown in FIG. 7B.
  • the test sound is collected by the microphones 33 of the speakers 3A, 3C, and 3D, and the test sound and time information are stored. Thereby, each distance between the speakers 3B-3A, between the speakers 3B-3C, and between the speakers 3B-3D indicated by a broken line is measured.
  • the test sound is reproduced by the speaker 3C, and the test sound and time information are stored by the speakers 3A, 3B, and 3D.
  • the distances between the speakers 3C-3A, between the speakers 3C-3B, and between the speakers 3C-3D are measured.
  • the test sound is reproduced by the speaker 3D, and the test sound and time information are stored by the speakers 3A, 3B, and 3C.
  • the distances between the speakers 3D-3A, between the speakers 3D-3B, and between the speakers 3D-3C are measured.
  • the distances between all combinations of the speakers 3 can be measured.
  • the time difference (distance) can be measured twice in one combination. It is desirable to reduce the measurement error by taking the average value of two times.
  • the test sound reproduction / storage process may be completed when the measurement for all the combinations is completed. For example, in the case of the above example, the test sound reproduction from the speaker 3D may be omitted. Further, in this case, the speaker 3 that has already played back may not perform the storage process.
  • the speaker 3A can measure the distances between the speakers 3B, 3C, and 3D after the reproduction of the speaker 3A is completed. Therefore, the speaker 3A may not store the test sound from the speakers 3B and 3C. Does not have to be stored when the test sound is reproduced from the speaker 3C.
  • the information processing apparatus 1 can grasp the arrangement state of either FIG. 8A or FIG. 8B from the distance between the speakers 3.
  • 8A and 8B are arrangements in a mirror image relationship in which the distances between the speakers 3 are the same. Since the FL speaker 3A and the FR speaker 3B have already been specified, the speakers 3A and 3B are on the front side, and thus the information processing apparatus 1 can specify that FIG. 8A is in the actual arrangement state. That is, by assuming that the remaining speakers 3 are located behind the FL speaker 3A and the FR speaker 3B, the possibility of the speaker arrangement of FIG. 8B can be eliminated.
  • the information processing apparatus 1 automatically sets all remaining speaker channels (SL, SR) from the relative positional relationship between the speakers 3 determined in this way (FIG. 8A) and the estimated user orientation. That is, as shown in FIG. 9A, the speaker 3C is automatically set to the SR channel and the speaker 3D is automatically set to the SL channel. Thus, the information processing apparatus 1 has been able to set the FL speaker 3A, the FR speaker 3B, the SR speaker 3C, and the SL speaker 3D. In other words, the FL channel, the FR channel, the SL channel, and the SR channel are assigned to the four speakers 3 that are arbitrarily arranged according to the arrangement positions.
  • the information processing apparatus 1 generates position information of each speaker 3 based on the relative positional relationship between the speakers 3 (FIG. 8A).
  • the position information of each speaker 3 is expressed as a coordinate value on a coordinate plane with the speaker 3A to which the FL channel is assigned as an origin (0, 0), for example.
  • the procedure described above is an example of a procedure for performing channel setting, and is not limited to the above procedure as long as channel setting and position information acquisition of each speaker 3 are performed.
  • the localization control based on the mixing ratio of each channel audio signal and the delay time setting according to the difference between the virtual speaker setting 4 and the position of the actual speaker 3 may actually make the speakers 3A, 3B, 3C, An acoustic space that can be heard from the positions of the virtual speakers 4A, 4B, 4C, and 4D even though sound is emitted from 3D can be created.
  • a surround sound environment can be realized even when an appropriate speaker arrangement is not necessarily made for the surround sound system (or when an appropriate arrangement cannot be performed due to room circumstances). For this reason, when the channel setting of the speaker 3 is performed as described above at the time of initial setup, the virtual speaker setting may be performed subsequently.
  • the estimation of the user listening position and the setting of the virtual speaker arrangement according to the present embodiment executed in the above configuration will be described.
  • the user listening position is estimated using the position information of the speaker 3, and the virtual speaker arrangement is set based on the estimated user listening position.
  • an appropriate virtual speaker arrangement is set for the listening position without taking time and effort for the user.
  • the position of each speaker 3 is indicated by coordinates on the coordinate plane, and the position information of each speaker 3 is represented as a coordinate value calculated from the relative positional relationship of the plurality of speakers 3.
  • the FIG. 10 shows the positions of the speakers 3A, 3B, 3C, and 3D on which the channel is set by the procedure described in FIGS. 6 to 9A on the coordinate plane.
  • the speaker 3A is set to the origin (0, 0)
  • the straight line passing through the FL speaker 3A and the FR speaker 3B is the X axis
  • the straight line passing through the origin and orthogonal to the X axis Becomes the Y axis.
  • the arrangement direction (X-axis direction) of the FL speaker 3A and the FR speaker 3B is the left-right direction for the user.
  • the information processing apparatus 1 recognizes the FL speaker 3A and the FR speaker 3B as reference speakers based on the position information of each speaker 3. .
  • the midpoint M of the FL speaker 3A and the FR speaker 3B, which are reference speakers, is set as the reference position, and the SR speaker 3C located farthest from the midpoint M is recognized as the farthest speaker.
  • speakers that can be selected as the reference speaker are not limited to the FL speaker and the FR speaker.
  • the center speaker may be recognized as a reference speaker, and the position of the center speaker may be determined as the reference position.
  • the center speaker When the center speaker is arranged, there is a high possibility that the user will listen in front of the center speaker. Therefore, by setting the center speaker as the reference speaker and the reference position, a reference position useful for estimating the user listening position can be obtained. Can be sought. Further, when there is a speaker arranged under the monitor device 9 where the user listens, the speaker may be recognized as a reference speaker, and the position of the speaker may be determined as the reference position.
  • the information processing apparatus 1 obtains a reference circle C1 that passes through three points of the FL speaker 3A and the FR speaker 3B that are reference speakers and the SR speaker 3C that is the farthest speaker.
  • a reference point P1 that is the center of the reference circle C1 and a radius R1 of the reference circle C1 are obtained. That is, the position information (coordinate values) of the reference point P1 and the length of the radius R1 are calculated.
  • the information processing apparatus 1 that has obtained the reference circle C1 obtains an enlarged circle C2 obtained by enlarging the reference circle C1 by a predetermined constant multiple, as shown in FIG. That is, the information processing apparatus 1 calculates a radius R2 having a length obtained by enlarging the radius R1 of the reference circle C1 by a predetermined constant multiple. Then, an enlarged circle C2 having a radius R2 with the reference point P1 as the center is obtained.
  • the predetermined constant multiple is 1.6 times
  • the radius R2 of the enlarged circle C2 is a length obtained by enlarging the radius R1 of the reference circle C1 by 1.6 times.
  • the predetermined constant multiple is not limited to 1.6, and any constant multiple exceeding 1.0 can be selected according to the output of the speaker and the arrangement environment of the speaker system.
  • the information processing apparatus 1 that has obtained the enlarged circle C2 sets a virtual speaker arrangement on the circumference of the enlarged circle C2, as shown in FIG.
  • a virtual position (coordinate) is set such that each virtual speaker 4 is arranged at a predetermined angle on the circumference according to an arrangement pattern of 5 channels defined by ITU (International Telecommunication Union) recommendation. Value).
  • the virtual speaker arrangement is not limited to 5 channels, and virtual speaker arrangements corresponding to other multi-channels such as 7 channels may be set. Further, the virtual speaker arrangement may be set based on a standard other than the pattern defined by the ITU recommendation.
  • the information processing apparatus 1 obtains an average position P ⁇ b> 2 of all the speakers 3 using the position information of each speaker 3.
  • the position information of the average position P2 is expressed as average coordinates calculated from the coordinates of the speakers 3A, 3B, 3C, 3D, for example.
  • As the position information of the average position P2 average coordinates in the X-axis direction (left-right direction) and the Y-axis direction (front-back direction), that is, both the X-coordinate and the Y-coordinate may be calculated.
  • the average coordinate (Y coordinate) is calculated.
  • the information processing apparatus 1 that has obtained the average position P2 obtains a movement point P3 at a point where the reference point P1 has been moved in the Y-axis direction based on the position information of the average position P2, and moves the movement point P3. Is estimated as the user listening position Ur. Then, an arrangement circle C3 having the same radius R2 as the enlarged circle C2 is obtained around the user listening position Ur (movement point P3), and a virtual speaker arrangement is set on the circumference of the arrangement circle C3. That is, apparently, the virtual speaker arrangement on the circumference of the enlarged circle C2 and the enlarged circle C2 is moved in the Y-axis direction.
  • the information processing apparatus 1 obtains the moving point P3 at a position where the reference point P1 is moved in the Y-axis direction to a position aligned with the average position P2 in the X-axis direction. That is, the moving point P3 has the X coordinate equal to the X coordinate of the reference point P1, and the Y coordinate equal to the Y coordinate of the average position P2.
  • the reference point P1 when the reference point P1 is moved based on the average position P2, even when the reference point P1 of the reference circle C1 is deviated from the actual user listening position, a more appropriate position is set to the user listening position Ur.
  • the average position P2 is obtained using the position information of all the speakers 3, and the reference point P1 is moved so that the moved reference point P1 (moving point P3) is aligned with the average position P2 in the X-axis direction.
  • the user listening position Ur and the arrangement circle C3 more suitable for the actual user listening position can be obtained.
  • the user listening position Ur is estimated, and the virtual speaker arrangement is set on the circumference of the arrangement circle C3 centered on the user listening position Ur.
  • exception processing described below may be performed depending on the placement status of the speaker 3 and the virtual speaker 4.
  • the virtual speaker arrangement may be reset.
  • FIG. 16 shows a case where the radius R2 of the arrangement circle C3 is larger than the reference radius R3.
  • the virtual speaker 4 ⁇ / b> X positioned rearmost among all the virtual speakers 4 is positioned behind the speaker 3 ⁇ / b> Y positioned rearmost among all the speakers 3. That is, the Y coordinate of the virtual speaker 4X is smaller than the Y coordinate of the speaker 3Y. In such an arrangement situation, there is a possibility that the output of the virtual speaker 4 ⁇ / b> X located at the rearmost position is not properly expressed by the real speaker 3.
  • the radius of the arrangement circle C3 is reset to a reference radius R3 having a predetermined length, and a new reference radius R3 is set. Reset the virtual speaker placement on the circumference of the placement circle.
  • a new arrangement circle having the reference radius R3 is referred to as a reference circle C4.
  • the information processing apparatus 1 obtains a reference circle C4 having a reference radius R3 with the user listening position Ur as the center, and resets the virtual speaker arrangement on the circumference of the reference circle C4.
  • the reference radius R3 having a predetermined length can be set to an arbitrary size according to the environment in which the speaker system is used and the output of the speaker 3. As a result, it is possible to set the reference circle C4 having an appropriate size according to the usage status of the speaker system.
  • the virtual speaker 4X located at the rearmost position is the speaker 3Y located at the rearmost position among all the speakers 3. It may be located further forward. That is, the Y coordinate of the virtual speaker 4X may be larger than the Y coordinate of the speaker 3Y. In such a case, since the output of the virtual speaker 4X can be appropriately expressed by the speaker 3, the above-described resetting is not necessarily performed.
  • all the speakers 3 of the speaker system may be located substantially coaxially in the Y-axis direction (front-rear direction).
  • the size (radius) of the reference circle C1 and the arrangement circle C3 (enlarged circle C2) obtained by the above procedure is large.
  • the sound field obtained by the virtual speaker arrangement set on the circumference of the arrangement circle C3 becomes too wide, a sound reproduction environment suitable for listening may not be formed. Therefore, when all the speakers 3 of the speaker system are located within a predetermined range in the Y-axis direction, for example, within a range of 10 cm, the information processing apparatus 1 is centered based on the position information of the plurality of speakers 3.
  • the position P4 is obtained, and the center position P4 is estimated as the user listening position Ur. Further, it is conceivable to obtain an arrangement circle (reference circle C4) having a reference radius R3 having a predetermined length around the user listening position Ur and setting a virtual speaker arrangement on the circumference of the reference circle C4.
  • FIG. 19 shows a state in which four speakers 3A, 3B, 3C, and 3D are aligned in the X-axis direction and have the same Y coordinate.
  • the information processing apparatus 1 calculates the X coordinate of the midpoint using the positional information of the FL speaker 3A and the FR speaker 3B as the reference speakers, and obtains the X coordinate as the X coordinate of the center position P4.
  • the Y coordinate of the average position in the Y axis direction of all the speakers 3 is calculated, and the Y coordinate is obtained as the Y coordinate of the center position P4.
  • the center position P4 thus obtained is estimated as the user listening position Ur, and a reference circle C4 having a reference radius R3 centered on the user listening position Ur is obtained.
  • the virtual speaker arrangement is set on the circumference of the reference circle C4.
  • a virtual speaker arrangement can be set on the circumference of the arrangement circle (reference circle C4) having a reference radius R3 having a predetermined length, and a sound field with an appropriate size can be obtained.
  • FIG. 20 shows processing from the time when the position information of each speaker 3 is acquired by the information processing apparatus 1 and a channel is assigned to each speaker 3.
  • step S100 the CPU 11 of the information processing apparatus 1 determines whether all the speakers 3 of the speaker system are located within a predetermined range in the Y-axis direction (front-rear direction).
  • the CPU 11 proceeds to step S110 and obtains the center position P4 using the position information of the speakers 3. That is, the X coordinate of the midpoint of the FL speaker 3A and the FR speaker 3B is calculated using the positional information of the FL speaker 3A and the FR speaker 3B as the reference speakers.
  • the Y coordinate of the average position of all the speakers 3 at least in the front-rear direction is calculated using the position information of all the speakers 3.
  • step S110 The X and Y coordinates thus calculated are determined as the coordinate values of the center position P4, and the center position P4 is estimated as the user listening position Ur (see FIG. 19).
  • CPU11 which finished the process of step S110 progresses to the process of step S111 mentioned later. If it is determined in step S100 that all the speakers 3 are not located within the predetermined range in the Y-axis direction, the CPU 11 proceeds to the process of step S101.
  • step S101 the CPU 11 determines the reference speaker (speaker 3A and FR speaker 3B) among all the speakers 3, and the farthest speaker (the farthest speaker from the reference position (middle point M) determined according to the reference speaker) ( Speaker 3C) is recognized (see FIG. 10).
  • step S102 the CPU 11 obtains a reference circle C1 that passes through the reference speaker and the farthest speaker (see FIG. 11). At this time, position information (coordinate values) and a radius R1 of the reference point P1, which is the center of the reference circle C1, are calculated.
  • step S103 the CPU 11 enlarges the reference circle C1 by a predetermined constant multiple (see FIG. 12). That is, the radius R2 is calculated by enlarging the radius R1 by a predetermined constant multiple. At this time, an enlarged circle C2 that is a circle having a radius R2 and having the center at the reference point P1 is obtained. Subsequently, in step S104, the CPU 11 sets a virtual speaker arrangement on the circumference of the enlarged circle C2 (see FIG. 12). As the virtual speaker arrangement, for example, the position information (coordinate values) of each virtual speaker 4 is obtained so as to be arranged on the circumference of the enlarged circle C2 in accordance with a 5-channel speaker arrangement pattern based on the ITU recommendation.
  • the virtual speaker arrangement for example, the position information (coordinate values) of each virtual speaker 4 is obtained so as to be arranged on the circumference of the enlarged circle C2 in accordance with a 5-channel speaker arrangement pattern based on the ITU recommendation.
  • step S105 the CPU 11 obtains the average position P2 of all the speakers 3 using the position information of each speaker 3 (see FIG. 13). That is, the average coordinates of all the speakers 3 are calculated based on the coordinates of each speaker 3, and the value is determined as the coordinate value of the average position P2.
  • position information Y coordinate
  • the CPU 11 compares the position information of the reference point P1 with the position information of the average position P2, and calculates the movement amount.
  • the amount of movement is the difference between the reference point P1 and the average position P2 in the Y-axis direction (front-rear direction). For example, as the difference between the Y coordinate value of the reference point P1 and the Y coordinate value of the average position P2. Can be represented.
  • step S107 the CPU 11 performs a movement process for moving the enlarged circle C2 in the front-rear direction according to the movement amount (see FIG. 14). That is, the moving point P3 is obtained at a position where the reference point P1 which is the center of the enlarged circle C2 is moved in the front-rear direction (Y-axis direction) according to the moving amount, and the arrangement circle C3 having the radius R2 with the moving point P3 as the center Ask for. The moving point P3 is positioned so as to be aligned with the average position P2 in the left-right direction (X-axis direction).
  • the position information (coordinate value) of the moving point P3 is calculated on the assumption that the X coordinate is equal to the X coordinate of the reference point P1, and the Y coordinate is equal to the Y coordinate of the average position P2.
  • the CPU 11 estimates such a moving point P3 as the user listening position Ur.
  • the virtual speaker arrangement set on the circumference of the enlarged circle C2 is also moved. That is, the CPU 11 moves the virtual speaker arrangement set in step S104 in the front-rear direction (Y-axis direction) according to the movement amount, and sets the virtual speaker arrangement on the circumference of the arrangement circle C3.
  • the position information of each virtual speaker 4 after movement is represented by the X coordinate of each virtual speaker 4 determined in step S104 and the Y coordinate obtained by increasing or decreasing the Y coordinate determined in step S104 according to the movement amount. .
  • step S108 the CPU 11 determines whether or not the radius R2 of the arrangement circle C3 is larger than a reference radius R3 having a predetermined length. When it is determined that the radius R2 of the arrangement circle C3 is not larger than the reference radius R3, the CPU 11 ends the process shown in FIG.
  • step S109 the CPU 11 detects the rearmost speaker 3Y among all the speakers 3 and the virtual speaker 4X set rearward among all the virtual speakers 4, and the speaker 3Y is positioned behind the virtual speaker 4X. It is determined whether or not. That is, the positional information of the speaker 3Y and the virtual speaker 4X is compared to determine whether or not the Y coordinate of the speaker 3Y is smaller than the Y coordinate value of the virtual speaker 4X.
  • step S109 When it is determined in step S109 that the Y coordinate of the speaker 3Y is smaller than the Y coordinate of the virtual speaker 4X, that is, when it is determined that the speaker 3Y is located behind the virtual speaker 4X, the CPU 11 of the information processing apparatus 1 The process shown in FIG. 17 ends.
  • the virtual speaker arrangement is set on the circumference of the arrangement circle C3 (see FIG. 18). If it is determined in step S109 that the Y coordinate of the speaker 3Y is not smaller than the Y coordinate of the virtual speaker 4X, that is, if it is determined that the virtual speaker 4Y is located behind the speaker 3Y, the CPU 11 performs the process of step S111. (See FIG. 16).
  • step S111 the CPU 11 obtains a reference circle C4 having a reference radius R3 centered on the user listening position Ur, sets a virtual speaker arrangement on the circumference of the reference circle C4, and ends the processing of FIG. (See FIG. 19).
  • the virtual speaker arrangement for example, position information (coordinate values) of each virtual speaker 4 is determined so as to be arranged on the circumference of the reference circle C4 in accordance with a 5-channel speaker arrangement pattern based on the ITU recommendation.
  • the user listening position Ur is estimated using the position information of the speaker 3, and the virtual speaker arrangement is set based on the user listening position Ur.
  • the user listening position Ur can be estimated without burden on the user, and a sound reproduction environment suitable for listening from the user listening position Ur can be formed.
  • the processing from step S101 to step S107 is as described above. Different procedures may be used.
  • the virtual speaker arrangement is set in each of step S104 and step S107, but the virtual speaker arrangement in step S104 may not be set.
  • the virtual speaker arrangement is set for the first time when the movement point P3 and the arrangement circle C3 are obtained in the movement process of step S107.
  • the radius R2 is obtained in the enlargement process in step S103, and then the user listening position Ur is obtained by moving the reference point P1 in step S107.
  • the enlargement process is performed after obtaining the user listening position Ur. It is possible to do it.
  • the virtual speaker arrangement in step S104 is not performed, and in step S107, the reference point P1 is first moved to obtain the movement point P3 (user listening position Ur), and then the radius R1 of the reference circle C1 is set.
  • the radius R2 may be obtained by multiplying by a constant.
  • the information processing apparatus 1 estimates the user listening position Ur by using the position information of N speakers 3 that are three or more by the function of the estimation unit 110 of the virtual speaker setting unit 11c (FIG. 17). S101 to 107, S110). Further, the virtual speaker arrangement is set using the user listening position Ur by the function of the arrangement unit 111 of the virtual speaker setting unit 11c (S107, S111). In such a user listening position estimation process and a virtual speaker arrangement setting process, the information processing apparatus 1 can first estimate the user listening position Ur based on the position information of the N speakers 3.
  • the information processing apparatus 1 can set the virtual speaker arrangement based on the estimated user listening position Ur.
  • the speaker 3 may not be placed at an optimal position for listening due to the size and shape of the room, the arrangement of furniture, and the like.
  • an optimal sound reproduction environment (sound field) for listening is formed even in such a usage environment. Therefore, a sound reproduction environment suitable for listening can be obtained without being influenced by the actual speaker arrangement environment.
  • the information processing apparatus 1 sets an arrangement circle centered on the user listening position Ur by the function of the arrangement unit 111, and arranges the virtual speaker so that the virtual speaker 4 is arranged on the circumference of the arrangement circle. Is set (S107, S111). Thereby, the virtual speaker arrangement is set on the circumference of the arrangement circle (the arrangement circle C3 and the reference circle C4) with the user listening position Ur as the center. Since the virtual speaker arrangement is set around the estimated user listening position Ur, a sound reproduction environment suitable for listening can be obtained.
  • the information processing apparatus 1 recognizes the reference speaker among the N speakers 3 and the farthest speaker located farthest from the reference position determined according to the reference speaker by the function of the estimation unit 110. (S101), a process of obtaining a reference circle C1 passing through the reference speaker and the farthest speaker (S102), and a process of moving the center (reference point P1) of the reference circle C1 based on the position information of N speakers.
  • the center (movement point P3) of the reference circle (placement circle C3) after movement is estimated as the user listening position Ur (S107).
  • the reference circle C1 By obtaining the reference circle C1 using the reference speaker (3A, 3B) and the farthest speaker (3C) positioned farthest from the reference position determined according to the reference speaker among all the speakers 3, the reference as large as possible A circle C1 is obtained. By obtaining a reference circle C1 that is as large as possible, it is possible to prevent the placement circle 3C in which the virtual speaker placement is set from becoming too small, and to form an acoustic reproduction environment having an appropriate extent. Further, the user listening position Ur (movement point P3) reflecting the actual arrangement state of the speakers 3 is estimated by moving the reference point P1 that is the center of the reference circle C1 based on the position information of the N speakers 3. can do.
  • the information processing apparatus 1 performs a process (S103) of enlarging the radius R1 of the reference circle C1 by a predetermined constant by the function of the arrangement unit 111.
  • a radius R2 obtained by enlarging the radius R1 by a predetermined constant multiple is calculated by enlarging the radius R1 of the reference circle C1 by a predetermined constant multiple.
  • the placement circle C3 having the radius R2 can be obtained and the virtual speaker placement can be set on the circumference of the placement circle C3. Therefore, a more appropriate sound field can be formed according to the actual output of the speaker 3 and the usage environment of the speaker 3.
  • the reference speakers are the front left speaker 3A and the front right speaker 3B
  • the reference position is the midpoint M of the front left speaker 3A and the front right speaker 3B.
  • the reference speaker may be a front center speaker
  • the reference position may be a position where the front center speaker is disposed.
  • the function of the estimation unit 110 obtains the average position P2 in at least the front-rear direction of the N speakers 3 using the position information of the N speakers 3 (3A, 3B, 3C, 3D) (S105).
  • the reference point P1 which is the center of the reference circle C1 and the enlarged circle C2, is moved in the front-rear direction to a position aligned with the average position P2 in the left-right direction (S107).
  • the average position P2 of at least the front and rear directions of the N speakers 3 is obtained, and the reference point P1 that is the center of the reference circle C1 (enlarged circle C2) is moved back and forth to a position aligned with the average position P2 in the left-right direction (X-axis direction) By moving in the (Y-axis direction), the center (movement point P3) of the reference circle (placement circle C3) after the movement is estimated as the user listening position Ur.
  • the average position P2 in the front-rear direction of the N speakers 3 it is possible to estimate an appropriate user listening position in view of the actual speaker 3 arrangement.
  • the average position P2 may be obtained using position information of the speaker 3 excluding the subwoofer. Thereby, the average position of only the speakers 3 that contribute to the surround effect among all the speakers 3 can be obtained.
  • the virtual speaker is arranged on the circumference of the arrangement circle C3 by the function of the arrangement unit 111 so that the radius of the arrangement circle C3 is larger than the radius of the predetermined length (reference radius R3).
  • the radius of the arrangement circle is set to a predetermined length radius (reference radius R3), and the virtual speaker arrangement is reset. That is, the reference circle C4 having a predetermined length radius (reference radius R3) is obtained as a new arrangement circle, and the virtual speaker arrangement is reset on the circumference of the reference circle C4.
  • the information processing apparatus 1 uses the function of the estimation unit 110 to determine the position information of the reference speakers and the N speakers 3.
  • the user listening position Ur is estimated using the position information of the average position P2 in the front-rear direction (S110), and the radius of the arrangement circle is set to a predetermined length (reference radius 3R) by the function of the arrangement unit 111.
  • the information processing apparatus 1 obtains the position (X coordinate) of the user listening position Ur in the left-right direction (X-axis direction) using the position information of the reference speaker, and the front-rear direction (Y-axis direction) of the N speakers 3.
  • the user listening position Ur (center position P4) is estimated by obtaining the position (Y coordinate) of the user listening position Ur in the front-rear direction using the position information of the average position P2.
  • the length of the radius By setting the length of the radius to a predetermined length (reference radius R3), an arrangement circle (reference circle C4) centered on the user listening position Ur thus estimated is obtained, and the arrangement circle (reference circle C4) is obtained.
  • a virtual speaker arrangement is set on the circumference of. Thereby, even when N speakers 3 are located within a predetermined range in the front-rear direction, a virtual speaker arrangement that forms a sound reproduction environment suitable for listening can be performed.
  • the arrangement circle C3 centered on the moving point P3 or the center position P4 is obtained.
  • an arrangement circle for setting the virtual speaker arrangement may be obtained by another method using the position information of the speaker 3.
  • a circle having the minimum square sum of the distance between the circumference and each speaker 3 (the least square circle) may be obtained as the arrangement circle.
  • the program according to the embodiment functions as the above-described relative position recognition unit 11a, channel setting unit 11b, virtual speaker setting unit 11c (estimating unit 110, placement unit 111), and channel signal processing unit 11d, for example, CPU, DSP ( (Digital Signal Processor) or the like, or a program that causes an information processing apparatus to execute as a device including these. That is, the program according to the embodiment includes a process of estimating the user listening position Ur using position information of N speakers 3 that are three or more, and a process of setting a virtual speaker arrangement using the user listening position Ur. Is a program for causing the information processing apparatus to execute. With such a program, the information processing apparatus 1 according to the present disclosure can be realized.
  • Such a program can be recorded in advance in a hard disk drive (HDD) as a recording medium built in a device such as a computer device, a ROM in a microcomputer having a CPU, or the like.
  • a hard disk drive HDD
  • a flexible disk CD-ROM (Compact Disc Read Only Memory), MO (Magnet optical) disk, DVD (Digital Versatile Disc), Blu-ray Disc (Blu-ray Disc (registered trademark)), magnetic disk, semiconductor memory, It can be stored (recorded) temporarily or permanently in a removable recording medium such as a memory card.
  • a removable recording medium can be provided as so-called package software.
  • such a program can be downloaded from a removable recording medium to a personal computer or the like, or downloaded from a download site via a network such as a LAN (Local Area Network) or the Internet.
  • LAN Local Area Network
  • Such a program is suitable for providing a wide range of the information processing apparatus 1 according to the embodiment. For example, by downloading a program to various audio devices, personal computers, portable information processing devices, mobile phones, game devices, video devices, PDAs (Personal Digital Assistants) equipped with arithmetic processing devices, It can be set as the information processing apparatus 1 of an indication.
  • a program for example, by downloading a program to various audio devices, personal computers, portable information processing devices, mobile phones, game devices, video devices, PDAs (Personal Digital Assistants) equipped with arithmetic processing devices, It can be set as the information processing apparatus 1 of an indication.
  • An information processing apparatus comprising: an estimation unit configured to estimate a user listening position using position information of N speakers that are three or more; and an arrangement unit configured to set a virtual speaker arrangement using the user listening position.
  • the information processing apparatus according to (1) wherein the placement unit sets a placement circle centered on the user listening position and sets a virtual speaker placement so that a virtual speaker is placed on a circumference of the placement circle. .
  • the estimation unit recognizes a reference speaker among the N speakers and a farthest speaker located farthest from a reference position determined according to the reference speaker, and passes through the reference speaker and the farthest speaker.
  • a process of obtaining a reference circle and a process of moving the center of the reference circle based on the position information of the N speakers, and estimating the center of the reference circle after the movement as a user listening position (1) Or the information processing apparatus according to (2).
  • the arrangement unit performs a process of enlarging a radius of the reference circle by a predetermined constant times.
  • the reference speakers are a front left speaker and a front right speaker, and the reference position is a midpoint between the front left speaker and the front right speaker.
  • the information processing apparatus according to (3) or (4), wherein the reference speaker is a front center speaker, and the reference position is a position where the front center speaker is disposed.
  • the estimation unit obtains an average position in at least the front-rear direction of the N speakers using position information of the N speakers, and moves the center of the reference circle in the front-rear direction to a position aligned with the average position in the left-right direction.
  • the information processing apparatus according to any one of (3) to (6).
  • the placement unit has a radius of the placement circle when the radius of the placement circle is greater than a predetermined length and the virtual speaker placed on the circumference of the placement circle is behind any of the speakers.
  • the information processing apparatus according to any one of (2) to (7), wherein the virtual speaker arrangement is reset by setting the radius to a predetermined length.
  • the estimation unit uses the position information of the reference speaker and the position information of the average position in the front-rear direction of the N speakers to The information processing apparatus according to any one of (2) to (7), wherein a listening position is estimated, and the placement unit sets a radius of the placement circle to a radius of a predetermined length.
  • the estimation procedure uses the position information of the N speakers to obtain an average position in at least the front-rear direction of the N speakers, and moves the center of the reference circle in the front-rear direction to a position aligned with the average position in the left-right direction.
  • (17) In the arrangement procedure, when the radius of the arrangement circle is larger than a predetermined length and the virtual speaker arranged on the circumference of the arrangement circle is behind any of the speakers, the radius of the arrangement circle is The information processing method according to any one of (11) to (16), wherein the virtual speaker arrangement is reset by setting the radius to a predetermined length.
  • the estimation procedure uses the position information of the reference speaker and the position information of the average position of the N speakers in the front-rear direction.
  • the information processing method according to any one of (11) to (16), wherein a listening position is estimated, and the arrangement procedure sets a radius of the arrangement circle to a radius of a predetermined length.

Abstract

ユーザに負担をかけることなくユーザ聴取位置を推定し、実際のスピーカの配置環境に関わらず聴取に好適な音響再生環境を形成する。3台以上であるN台のスピーカの位置情報を用いてユーザ聴取位置を推定する推定部と、前記ユーザ聴取位置を用いて仮想スピーカ配置を設定する配置部とを備える。これにより、ユーザに負担をかけることなくユーザ聴取位置を推定し、実際のスピーカの配置環境に関わらず聴取に好適な音響再生環境を形成することができる。

Description

情報処理装置、情報処理方法、プログラム
 本技術は情報処理装置、情報処理方法、プログラムに関し、特にサラウンド音響システムの技術に関する。
 複数のスピーカが接続可能なサラウンド音響システムにおいては、ユーザの聴取に適切な音場を得るために音場補正が行われることがある。従来、音場補正を行う際には、聴取位置にいるユーザにマイク等の測定器を持たせるなど、ユーザに自らの聴取位置を示す操作を行わせることでユーザ聴取位置を検出していた。
特開平11-331999号公報
 特許文献1には、スピーカが超音波信号を発し、聴取位置にあるリモートコントローラが各スピーカからの信号を受信し、検出された信号の位相差を用いて各スピーカからリモートコントローラ(聴取位置)までの距離比が算出される方式が記載されている。この場合、ユーザはリモートコントローラを保持して聴取位置で待機する必要があり、聴取位置を測定している間のユーザの行動が制限される虞があった。また、スピーカ等の機器に加えて測定器をスピーカシステムの一部として同梱することで商品構成が複雑になっていた。
 また、サラウンド音響システムはスピーカをユーザ聴取位置から適切な角度に配置することでサラウンド効果を発揮する。しかし、スピーカシステムが使用される環境によっては、例えば部屋の形状や大きさ、家具等の配置の関係で、スピーカを適切に配置できないことがある。このため、場合によってはサラウンド音響システムのサラウンド効果が十分に発揮されない可能性があった。
 そこで本技術では、サラウンド音響システムのような複数のスピーカの配置を行う場合に、ユーザに負担をかけることなくユーザ聴取位置を推定して、実際のスピーカの配置環境に関わらず、聴取に好適な音響再生環境を形成することを目的とする。
 本技術に係る情報処理装置は、3台以上であるN台のスピーカの位置情報を用いてユーザ聴取位置を推定する推定部と、前記ユーザ聴取位置を用いて仮想スピーカ配置を設定する配置部と、を備える。
 このような本技術では、実際のスピーカ配置とは異なる位置に仮想的に配置されたスピーカである仮想スピーカを想定する。N台のスピーカの位置情報を基にユーザ聴取位置が推定される。また、推定したユーザ聴取位置に基づいて仮想スピーカ配置が設定される。
 上記した本技術に係る情報処理装置においては、前記配置部は前記ユーザ聴取位置を中心とする配置円を設定し、前記配置円の円周上に前記仮想スピーカが配置されるように仮想スピーカ配置を設定することが考えられる。
 配置部により、ユーザ聴取位置を中心とする配置円の円周上に仮想スピーカ配置が設定される。
 上記した本技術に係る情報処理装置においては、前記推定部は、前記N台のスピーカのうちの基準スピーカと前記基準スピーカに応じて決められる基準位置から最も遠くに位置された最遠スピーカを認識し、前記基準スピーカと前記最遠スピーカを通る基準円を求める処理と、前記N台のスピーカの位置情報を基に前記基準円の中心を移動する処理とを行い、移動後の前記基準円の中心をユーザ聴取位置と推定することが考えられる。
 基準スピーカと最遠スピーカを用いてできるだけ大きな基準円を求める。基準円の中心をN台のスピーカの位置情報を基に移動させることで、実際のN台のスピーカの配置状況を反映したユーザ聴取位置を推定する。
 上記した本技術に係る情報処理装置においては、前記配置部は前記基準円の半径を所定の定数倍拡大する処理を行うことが考えられる。
 基準円の半径を所定の定数倍拡大することで、当該半径を所定の定数倍拡大した大きさの半径を算出する。
 上記した本技術に係る情報処理装置においては、前記基準スピーカは前方左スピーカと前方右スピーカであり、前記基準位置は前記前方左スピーカと前記前方右スピーカの中点であることが考えられる。
 基準スピーカとして前方左スピーカと前方右スピーカを用いることで、前方左スピーカと前方右スピーカの中点を基準に左右方向におけるユーザ聴取位置を推定する。
 上記した本技術に係る情報処理装置においては、前記基準スピーカは前方中央スピーカであり、前記基準位置は前記前方中央スピーカが配置された位置であることが考えられる。
 基準スピーカとして前方中央スピーカを用いることで、ユーザの実際の聴取位置の正面に配置される前方中央スピーカを基準に左右方向におけるユーザ聴取位置を推定する。
 上記した本技術に係る情報処理装置においては、前記推定部は前記N台のスピーカの位置情報を用いて前記N台のスピーカの少なくとも前後方向における平均位置を求め、前記基準円の中心を前記平均位置と左右方向に並ぶ位置まで前後方向に移動させることが考えられる。
 N台のスピーカの少なくとも前後方向における平均位置を求め、基準円の中心である基準点を平均位置と左右方向に並ぶ位置にまで前後方向に移動させる。これにより、移動後の基準円の中心位置を求める。
 上記した本技術に係る情報処理装置においては、前記配置部は、前記配置円の半径が所定の長さより大きく且つ前記配置円の円周上に配置された前記仮想スピーカが何れの前記スピーカより後方にある場合に、前記配置円の半径を前記所定の長さの半径に設定して、仮想スピーカ配置を再設定することが考えられる。
 配置円の円周上に仮想スピーカ配置を設定した後に、当該配置円の半径を所定の長さの半径に設定して、所定の長さの半径を有する新たな配置円に仮想スピーカ配置を再設定する。
 上記した本技術に係る情報処理装置においては、前記N台のスピーカが前後方向において所定の範囲内に位置している場合に、前記推定部は基準スピーカの位置情報と前記N台のスピーカの前後方向における平均位置の位置情報を用いて前記ユーザ聴取位置を推定し、前記配置部は前記配置円の半径を前記所定の長さに設定することが考えられる。
 N台のスピーカが前後方向における所定の範囲内に位置している場合に、基準スピーカの位置情報とN台のスピーカの前後方向における平均位置の位置情報を用いてユーザ聴取位置を推定し、そのように推定されたユーザ聴取位置を中心に所定の半径の配置円を設定する。
 本技術に係る情報処理方法は、情報処理装置が、3台以上であるN台のスピーカの位置情報を用いてユーザ聴取位置を推定し、前記ユーザ聴取位置を用いて仮想スピーカ配置を設定する。
 情報処理装置において情報処理装置を備え、以上の手順の処理を実行するようにする。
 本技術に係るプログラムは、このような処理を情報処理装置に実行させるプログラムである。これにより本技術の情報処理方法を、情報処理装置を備えた情報処理装置において実現する。
 本技術によれば、ユーザに負担をかけることなくユーザ聴取位置を推定し、スピーカの配置状況に関わらず、聴取に好適な音響再生環境を形成することができる。
 なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載されたいずれかの効果であってもよい。
本技術の実施の形態のスピーカシステムの配置例の説明図である。 実施の形態のスピーカシステムの機器構成の説明図である。 実施の形態のスピーカシステムで用いられるリモートコントローラの説明図である。 実施の形態の情報処理装置及びスピーカの内部構成のブロック図である。 実施の形態の情報処理装置の機能構成の説明図である。 実施の形態のチャネル設定手順の説明図である。 実施の形態のチャネル設定手順の説明図である。 実施の形態のチャネル設定手順の説明図である。 実施の形態のチャネル設定手順及び仮想スピーカ設定の説明図である。 実施の形態のユーザ聴取位置推定と仮想スピーカ配置設定手順の説明図である。 実施の形態のユーザ聴取位置推定と仮想スピーカ配置設定手順の説明図である。 実施の形態のユーザ聴取位置推定と仮想スピーカ配置設定手順の説明図である。 実施の形態のユーザ聴取位置推定と仮想スピーカ配置設定手順の説明図である。 実施の形態のユーザ聴取位置推定と仮想スピーカ配置設定手順の説明図である。 実施の形態の移動処理の他の例の説明図である。 実施の形態の例外処理の説明図である。 実施の形態の例外処理の説明図である。 実施の形態の例外処理の説明図である。 実施の形態の別の例外処理の説明図である。 実施の形態の処理のフローチャートである。
 以下、実施の形態を次の順序で説明する。
<1.スピーカシステム構成>
<2.スピーカの位置情報取得とチャネル設定>
<3.ユーザ聴取位置の推定と仮想スピーカ配置の設定>
<4.処理例>
<5.まとめ及び変形例>
<1.スピーカシステム構成>
 実施の形態では、3台以上のスピーカを接続可能なサラウンド音響システムを想定し、ユーザ聴取位置の推定と仮想スピーカ配置の設定を行う。
 以下では、図1のように、4台のスピーカ3(3A、3B、3C、3D)を用いるサラウンド音響システムを例にして説明していく。
 なお、4台のスピーカを総称する場合や特に区別しない場合は「スピーカ3」と表記する。またスピーカ個体を指す場合は、「スピーカ3A」~「スピーカ3D」と表記する。
 スピーカ3のチャネルとしては、4チャネルを想定し、それぞれフロントLチャネル、フロントRチャネル、サラウンドLチャネル、サラウンドRチャネルとする。それぞれ「FLチャネル」「FRチャネル」「SLチャネル」「SRチャネル」と呼ぶ。
 もちろん4チャネルとするのは説明上の一例で、5チャネル、5.1チャネル、7チャネル、7.1チャネルなどの場合も考えられる。
 各スピーカの設定されたチャネルを区別するためには、左前のフロントLチャネルのスピーカを「FLスピーカ」、右前のフロントRチャネルのスピーカを「FRスピーカ」、左後のサラウンドLチャネルのスピーカを「SLスピーカ」、右後のサラウンドRチャネルのスピーカを「SRスピーカ」と表記する。
 例えばスピーカ3Aが、フロントLチャネルに設定された場合は「FLスピーカ3A」というように表記する場合もある。
 図1は、例えばリビングルームでのサラウンド音響システムの配置例を示している。
 実施の形態のサラウンド音響システムは、情報処理装置1とスピーカ3A、3B、3C、3Dを有するスピーカシステムとして構成される。また当該スピーカシステムはリモートコントローラ5を備える場合もある。
 そして当該スピーカシステムは、例えばテレビジョン受像器等としてのモニタ装置9で表示する映像コンテンツの音響再生に用いられたり、或いはモニタ装置9で映像表示を行わない場合でも、音楽や環境音等のオーディオ再生に用いられる。
 ユーザの正面側となる位置、例えばソファー8の正面にモニタ装置9が配置される。そしてこの例ではモニタ装置9の近傍に情報処理装置1が配置されている。通常、ユーザがモニタ装置9に向く方向が前方となる。
 モニタ装置9の左側にFLスピーカ3A、右側にFRスピーカ3Bが配置されている。
 またソファー8の後方左側にSLスピーカ3C、後方右側にSRスピーカ3Dが配置されている。
 以上の配置は、モニタ装置9と4チャネルスピーカシステムの典型的な配置例である。もちろんユーザの好み、家具の配置、部屋の広さ、部屋の形状などにより、実際の配置は千差万別であるが、基本的には、スピーカ3A、3B、3C、3Dが、FLチャネル、FRチャネル、SLチャネル、SRチャネルとして適した位置に配置されることが望ましい。
 図2に実施の形態のスピーカシステムの構成例を示す。
 スピーカシステムは、親機としての情報処理装置1と、子機としてのスピーカ3A、3B、3C、3Dが通信可能とされている。
 なお、情報処理装置1と各スピーカ3の間は、例えばワイファイ(Wi-Fi:登録商標)やブルートゥース(Bluetooth:登録商標)等の通信方式による無線通信が行われるものでも良いし、有線接続されて、例えばLAN(Local Area Network)通信、USB(Universal Serial Bus)通信等が行われるものでも良い。もちろんオーディオ線や制御線を含む専用線で接続されても良い。
 情報処理装置1とスピーカ3の間は、これらの無線又は有線通信により、音声信号(デジタル音声信号又はアナログ音声信号)や、制御データ、通知データ等の伝送が行われる。また、各スピーカ3A、3B、3C、3Dは例えば情報処理装置1を介して時刻同期がとられる。
 各スピーカ3A、3B、3C、3D同士は、互いに通信可能としてもよいし、特に通信を行わない構成も考えられる。
 スピーカ3A、3B、3C、3Dは、情報処理装置1によってチャネル設定(チャネルアサイン)される。
 スピーカ3A、3B、3C、3Dは、例えば識別子としての個々のスピーカIDを有するが、基本的には同一の構成を備え、或るチャネルに対しての専用装置とされているわけではない。例えばスピーカ3Aは、FLスピーカ、FRスピーカ、SLスピーカ、SRスピーカのいずれとしてでも使用することができる。他のスピーカ3B、3C、3Dも同様である。
 従ってユーザは、各スピーカ3A、3B、3C、3Dの区別を意識せずに、例えば図1のように、自分の周囲となる位置に配置すればよい。
 各スピーカ3は、情報処理装置1によってチャネルアサインされることにより、それぞれ情報処理装置1からみてチャネルが確定される。
 情報処理装置1は、音源装置2からの音声信号を入力し、必要な信号処理を行い、各チャネルに振り分けた音声信号を、それぞれ割り当てたスピーカ3に送信する。各スピーカ3は、それぞれ情報処理装置1から該当のチャネルの音声信号を受信し、音声出力を行う。これにより4チャネルサラウンド音響出力が行われる。
 図2に示す音源装置2は、例えばモニタ装置9であったり、図示しない再生装置(オーディオプレーヤ)等であったりする。
 音源装置2は、L、Rステレオチャネルの音声信号(デジタル音声信号又はアナログ音声信号)や、多チャネルサラウンド対応の音声信号を情報処理装置1に供給する。
 情報処理装置1は、設置されたスピーカ3に対応したチャネルの音声信号の振り分けや生成を行って、この例の場合は、FLチャネル、FRチャネル、SLチャネル、SRチャネルの音声信号を生成し、各スピーカ3A、3B、3C、3Dに送信することになる。
 各スピーカ3はスピーカユニット32を備え、送信されてきた音声信号によりスピーカユニット32が駆動されて音声出力を行う。
 なお各スピーカ3は、後述するチャネル設定に用いることができるマイクロホン33を備えている。
 図3はリモートコントローラ5の例として、リモートコントローラ5A、5Bを示している。リモートコントローラ5A、5Bは、例えば赤外線や電波により、情報処理装置1にユーザの操作情報を送信する。
 図4により、情報処理装置1とスピーカ3の内部構成を説明する。なお、以下では情報処理装置1とスピーカ3の間は無線通信が行われるものとして説明していく。
 無線通信においては、子機である各スピーカ3は、自己のスピーカに与えられたスレーブアドレスにより、自己宛の通信を識別することができる。
 また各スピーカ3は送信情報に自己の識別子(スピーカID)を含むようにすることで、情報処理装置1は、各スピーカ3からの通信を、どのスピーカからの通信であるか識別できる。
 情報処理装置1はCPU(Central Processing Unit)11、出力信号形成部12、RF(Radio Frequency)モジュール13、受信部14を有する。
 出力信号形成部12は、各スピーカ3に対して出力する音声信号に関する処理を行う。例えば出力信号形成部12はCPU11と連携して、各チャネルの音声信号の振り分け又はチャネル音声信号の生成処理や、後述する仮想スピーカ出力のための各スピーカへの音声信号の生成処理、例えばチャネルミキシング、定位調整、遅延等を含む信号処理を行う。また出力信号形成部12は、各チャネルの音声信号について増幅処理、音質処理、イコライジング、帯域フィルタ処理等も行う。
 また出力信号形成部12は、チャネル設定の際に用いるテストトーンとしての音声信号を発生する処理を行う場合もある。
 RFモジュール13は、各スピーカ3に対する音声信号や制御信号の送信や、各スピーカ3からの信号の受信を行う。
 このためRFモジュール13は、CPU11から供給された送信すべき音声信号や制御信号の無線送信用のエンコード処理や送信処理を行う。またRFモジュール13は、スピーカ3から送信されてきた信号の受信処理及び受信データのデコード処理、CPU11への転送等を行う。
 受信部14は、リモートコントローラ5からの操作信号を受信し、受信した操作信号を復調/デコードしてCPU11に操作情報を伝える。
 CPU11は音源装置2から供給された音声信号に対する演算処理や、チャネル設定処理、仮想スピーカに関する処理等を行う。
 本実施の形態の場合、CPU11には、実装されたプログラム(ソフトウエア)により図5に示す機能が設けられ、これら機能としての演算処理が行われる。すなわちCPU11は、相対位置認識部11a、チャネル設定部11b、仮想スピーカ設定部11c、チャネル信号処理部11dとしての機能を備える。
 相対位置認識部11aとチャネル設定部11bは、各スピーカ3のチャネル設定のための処理を行う。
 相対位置認識部11aは、設置されたN台(本例では4台)のスピーカ3のうちの2台から、ユーザによる指定操作があったことの通知を受信して2台の配置基準スピーカを認識する処理を行う。また相対位置認識部11aは、各スピーカ3間の距離情報を取得する処理を行う。さらに相対位置認識部11aは、2台の配置基準スピーカ及び各スピーカ間の距離情報を用いてN台(4台)のスピーカ3の相対位置関係を認識する処理を行う。
 チャネル設定部11bは、相対位置認識部11aが認識した相対位置関係に基づいて、各スピーカ3のチャネルを自動設定する処理を行う。
 仮想スピーカ設定部11cは、相対位置認識部11aが認識した相対位置関係及びチャネル設定部11bによるチャネル設定に基づいて、仮想スピーカ配置を設定する処理を行う。仮想スピーカとは、実際のスピーカ3の配置とは異なる位置に仮想的に配置されたスピーカである。仮想スピーカ設定部11cにより仮想スピーカを設定するということは、各スピーカ3に対する音声信号に所定の処理を加え、実際のスピーカ3の配置とは異なる位置、定位状態での音響出力を行うということである。
 仮想スピーカ設定部11cは、ユーザ聴取位置を推定する推定部110と、ユーザ聴取位置を用いて仮想スピーカ配置を設定する配置部111としての機能を備え、推定したユーザ聴取位置に基づいて仮想スピーカ配置を設定する。仮想スピーカ設定部11cとしての各機能による具体的処理については、後述する。
 チャネル信号処理部11dは、出力信号形成部12での信号処理と連携して、入力された音声信号について、N台の各スピーカ3に供給するNチャネルの音声信号を生成し、RFモジュール13に転送する処理を行う。
 またチャネル信号処理部11dは、仮想スピーカ設定部11cにより仮想スピーカ配置の設定が行われた場合、各スピーカ3のそれぞれに対する送信信号として、仮想スピーカを実現する定位状態となるように処理したNチャネルの音声信号を生成する処理を、出力信号形成部12と連携して行う。
 図4に戻ってスピーカ3の構成を説明する。
 スピーカ3は、CPU31、スピーカユニット32、マイクロホン33、タッチセンサ34、RFモジュール35、増幅器36、マイク入力部37を有する。
 CPU31は通信処理やスピーカ内部の制御を行う。
 RFモジュール35は情報処理装置1のRFモジュール13との間で無線通信を行うモジュールである。RFモジュール35は、情報処理装置1から送信されてくる音声信号や制御信号の受信及びデコード処理を行い、それらのデコードした信号をCPU31に転送する。
 またRFモジュール35はCPU31から転送された制御信号や通知信号を無線送信用にエンコードし、情報処理装置1に対して送信する処理も行う。
 CPU31は、情報処理装置1から送信されてきた音声信号を増幅器36に供給する。
 増幅器36は、CPU31から転送されてきた例えばデジタルデータとしての音声信号をアナログ信号に変換し、増幅してスピーカユニット32に出力する。これによりスピーカユニット32から音響出力が実行される。
 なおスピーカユニット32がデジタル音声データにより直接駆動されるものである場合は、増幅器36はデジタル音声信号を出力すればよい。
 マイクロホン33によっては外部の音声が集音される。マイクロホン33で得られた音声信号はマイク入力部37で増幅され、例えばデジタル音声データに変換されてCPU31に供給される。
 CPU31は、例えば内部RAM(Random Access Memory)にマイク入力音声信号を時刻情報(タイムスタンプ)とともに音声信号を記憶することができる。或いはCPU31は、後述するテスト音としての特定の音声信号が検出された場合に、音声信号は記憶せずに時刻情報のみを記憶してもよい。
 CPU31は、記憶した情報を所定のタイミングで、RFモジュール35に転送し、情報処理装置1に送信させる。
 タッチセンサ34は、例えばスピーカ3の筐体の上面や正面など、ユーザが触れやすい位置にタッチパッドなどとして形成された接触検出センサである。
 タッチセンサ34によりユーザのタッチ操作が検出され、検出情報がCPU31に送信される。
 CPU31は、タッチ操作が行われたことを検知した場合、タッチ操作検知の情報をRFモジュール35によって情報処理装置1に送信させる。
 なおタッチセンサ34は、スピーカ3に対するユーザの操作を検出するデバイスの例である。タッチセンサ34に変えて、或いはタッチセンサ34に加えて、撮像装置(カメラ)や操作ボタン、静電容量センサ等、ユーザの操作や挙動を検出できるデバイスを備えても良い。
 またタッチ操作に伴う音(接触音)をマイクロホン33で検出するようにすることで、タッチセンサ34等を設けない例も考えられる。
<2.スピーカの位置情報取得とチャネル設定>
 以上の構成において実行される本実施の形態のチャネル設定について説明する。
 なお、説明の簡単化のため、各スピーカ3は同じ平面上に配置されるものとする。
 スピーカシステムのセットアップ時のスピーカ出力チャネルの設定をユーザが手動で行う場合、設定をまちがえてしまうことがある。またチャネル設定作業について理解していなかったり、面倒に思うユーザもいる。このような状態では正しいサラウンド音を再現できない。
 本実施の形態では、ユーザがいくつかのスピーカ3にタッチするだけで、全スピーカ3の出力チャネルを正しく設定できるようにする。
 図6~図9により、チャネル設定の手順を説明する。
 図6Aは例えば図1で説明したように情報処理装置1と4台のスピーカ3A、3B、3C、3Dが設置された状態を示している。
 本実施の形態のスピーカシステムは、各スピーカ3のチャネル設定が予め決められていないため、ユーザはチャネル設定を気にせずに各スピーカ3A、3B、3C、3Dを任意の位置に設置する。当然、各スピーカ3については、まだチャネル設定されていない状態である。
 この状態で、親機である情報処理装置1と各スピーカ3の電源を入れると、図示するように情報処理装置1と各スピーカ3間が例えばWiFiなどにより無線通信接続され、これにより初期セットアップが開始される。
 初期セットアップが始まると、ユーザは本スピーカシステムのガイダンスに従って、図6Bに実線H1で示すように、モニタ装置9の左側に置いたスピーカ3Aにタッチし、続いて破線H2で示すようにモニタ装置9の右側に置いたスピーカ3Bにタッチする。
 例えばスピーカシステムはガイダンスとして、「正面に向かって左側のスピーカにタッチしてください」等のガイド音声を流してもよいし、当該メッセージをモニタ装置9に表示してもよい。
 ユーザはこれに応じて、前方(矢印DRU)に向かって左のスピーカ3Aのタッチセンサ34にタッチする操作を行う。通常、ユーザがモニタ装置9に向く方向が前方となる。
 ユーザが例えばスピーカ3Aのタッチセンサ34にタッチする操作を行ったことを検知したら、続いてスピーカシステムは「正面に向かって右側のスピーカにタッチしてください」という内容のガイダンスを行う。
 ユーザはこれに応じて、続いてスピーカ3Bのタッチセンサ34にタッチする操作を行う。
 なお、モニタ装置9を用いないユーザも想定される。そのようなユーザは、自分が普段聴取する位置と方向に合わせて、前方左、前方右のスピーカに順にタッチするようにすればよい。
 以上のようにユーザが順に2台のスピーカ3A、3Bにタッチしたら、スピーカシステムは、このスピーカ3A、3Bを、FLスピーカ、FRスピーカとして設定する。図7Aには、スピーカ3A、3BがFLスピーカ、FRスピーカとされた状態を示している。
 ここまで、スピーカシステムはFLスピーカ3A、FRスピーカ3Bを特定するとともに、ユーザの聴取時の向きを、設定したFLスピーカ3A、FRスピーカ3Bに対する相対的な位置関係として推測することができる。
 続いてスピーカシステムは、各スピーカ3間の距離を自動測定する。親機である情報処理装置1と各スピーカ3の間は、PTP(Precision Time Protocol)方式などを用いて時刻同期しておくものとする。
 スピーカ3間の距離測定は、1つのスピーカ3で再生したテスト音を他のスピーカ3で検出し、到達時間を計測することで行う。
 例えば図7Aに示すように、FLスピーカ3Aのスピーカユニット32で再生するテスト音を、FRスピーカ3B、スピーカ3C、3Dに搭載したマイクロホン33によってそれぞれ収音してタイムスタンプ(時刻情報)とともに記憶する。
 この場合、再生側のスピーカ3Aの再生時刻情報と、他のスピーカ3B、3C、3Dのそれぞれの記憶した時刻情報の差分から、破線で示すスピーカ3A-3B間、スピーカ3A-3C間、スピーカ3A-3D間の各距離が測定できることになる。
 テスト音は、例えば所定周波数の電子音などとして一瞬だけ出力すれば良い。もちろん1秒間、数秒間など継続した音でもよい。いずれにしても、到達時間が計測できる音であれば良い。
 このような動作を、再生するスピーカ3を変更して行っていく。
 即ち図7Aのようにスピーカ3Aでテスト音の再生、スピーカ3B、3C、3Dでテスト音及び時刻情報の記憶を行ったら、続いて図7Bのようにスピーカ3Bのスピーカユニット32でテスト音の再生を行い、スピーカ3A、3C、3Dのマイクロホン33でテスト音を収音し、テスト音及び時刻情報の記憶を行う。これにより破線で示すスピーカ3B-3A間、スピーカ3B-3C間、スピーカ3B-3D間の各距離を測定する。
 さらに図示しないが、続いてスピーカ3Cでテスト音の再生、スピーカ3A、3B、3Dでテスト音及び時刻情報の記憶を行う。これによりスピーカ3C-3A間、スピーカ3C-3B間、スピーカ3C-3D間の各距離を測定する。
 また続いてスピーカ3Dでテスト音の再生、スピーカ3A、3B、3Cでテスト音及び時刻情報の記憶を行う。これによりスピーカ3D-3A間、スピーカ3D-3B間、スピーカ3D-3C間の各距離を測定する。
 以上により、全てのスピーカ3の組み合わせの間での距離を計測できる。
 なお、上記のようにテスト音の再生/記憶を行うと、1つの組み合わせにおいて、2回、時刻差分(距離)が計測できることになる。2回の平均値をとることで、測定誤差を低減することが望ましい。
 また、より初期セットアップの効率化をはかる場合は、全ての組み合わせでの測定が完了した時点でテスト音再生/記憶の処理を終えても良い。例えば上記例の場合、スピーカ3Dからのテスト音再生は省略してもよい。さらにこの場合、すでに再生を行ったスピーカ3は、記憶処理を行わなくてもよい。例えばスピーカ3Aは、自己の再生終了後に各スピーカ3B、3C、3Dとの間の距離が測定できるため、スピーカ3B、3Cからのテスト音再生時に記憶を行わなくてもよいし、同様にスピーカ3Bは、スピーカ3Cからのテスト音再生時に記憶を行わなくてもよい。
 全スピーカ3間の距離を測定し終えると、各スピーカ3の位置関係が決定される。
 即ち情報処理装置1は、各スピーカ3間の距離から、図8A又は図8Bのいずれかの配置状態であることが把握できる。図8Aと図8Bは各スピーカ3間の距離が同じとなる鏡像の関係にある配置である。
 そしてすでにFLスピーカ3AとFRスピーカ3Bが特定されているため、スピーカ3A、3Bが前方側であり、従って情報処理装置1は、図8Aが実際の配置状態であると特定できる。
 つまりFLスピーカ3AとFRスピーカ3Bに対して残りのスピーカ3はユーザの後方に位置すると仮定することで、図8Bのスピーカ配置の可能性を排除できる。
 情報処理装置1は、このように定まった各スピーカ3同士の相対位置関係(図8A)と、推定したユーザ向きから、残りの全てのスピーカのチャネル(SL,SR)を自動設定する。
 つまり図9Aに示すように、スピーカ3CをSRチャネル、スピーカ3DをSLチャネルに自動設定する。
 以上で情報処理装置1はFLスピーカ3A、FRスピーカ3B、SRスピーカ3C、SLスピーカ3Dとの設定ができたことになる。つまり任意に配置された4台のスピーカ3について、それぞれ配置位置に応じて、FLチャネル、FRチャネル、SLチャネル、SRチャネルを割り当てたことになる。
 さらに情報処理装置1は、各スピーカ3同士の相対位置関係(図8A)を基に各スピーカ3の位置情報を生成する。各スピーカ3の位置情報は、例えばFLチャネルが割り当てられたスピーカ3Aを原点(0,0)とする座標平面上の座標値として表される。
 なお、上記に示した手順はチャネル設定を行うための手順の一例であり、各スピーカ3のチャネル設定と位置情報取得が行われる限りにおいて、上記の手順に限られない。
 また、例えば米国特許第9749769号明細書に記載のように任意の位置に仮想スピーカを生成し、その位置からあたかも音が聞こえてくるかのようにする技術がある。
 このような技術を用いることで、図9Bに示すように、実物のスピーカ3A、3B、3C、3Dとは異なる位置に仮想スピーカ4(4A、4B、4C、4D)を生成し、生成した仮想スピーカ4A、4B、4C、4Dに対してチャネルを割り振ることが出来る。
 またより単純には、各チャネル音声信号のミキシング比率による定位制御や、仮想スピーカ設定4と実物のスピーカ3の位置の差分に応じた遅延時間設定によっても、実際にはスピーカ3A、3B、3C、3Dから音を出しているのに、仮想スピーカ4A、4B、4C、4Dの位置から聞こえてくるような音響空間を作ることができる。
 このような仮想スピーカ設定を行うと、サラウンド音響システムとしては必ずしも適切なスピーカ配置がなされていない場合(或いは部屋の事情により適切な配置ができない場合)でも、よりサラウンド音響環境を実現できる。
 このため、初期セットアップの際に上述のようにスピーカ3のチャネル設定を行ったら、続けて仮想スピーカ設定も行うようにしてもよい。
<3.ユーザ聴取位置の推定と仮想スピーカ配置の設定>
 続けて、以上の構成において実行される本実施の形態のユーザ聴取位置の推定及び仮想スピーカ配置の設定について説明する。
 本実施の形態では、スピーカ3の位置情報を用いてユーザ聴取位置が推定され、推定されたユーザ聴取位置に基づいて仮想スピーカ配置が設定される。既に配置されたスピーカの位置情報を用いてユーザ聴取位置を推定することで、ユーザに手間をかけることなく聴取位置に対して適切な仮想スピーカ配置が設定されるようにする。
 図10~図14により、ユーザ聴取位置の推定及び仮想スピーカ配置の設定の手順を説明する。
 上述したように、本実施の形態では、各スピーカ3の位置は座標平面上の座標で示され、各スピーカ3の位置情報は複数のスピーカ3の相対位置関係から算出された座標値として表される。
 図10は、図6乃至図9Aで説明した手順などによってチャネル設定が行われたスピーカ3A、3B、3C、3Dの位置を座標平面上で表したものである。図10及び以降の説明に用いる座標平面においては、スピーカ3Aが原点(0,0)に設定され、FLスピーカ3AとFRスピーカ3Bを通る直線がX軸となり、原点を通りX軸に直交する直線がY軸となる。FLスピーカ3AとFRスピーカ3Bの並び方向(X軸方向)がユーザにおける左右方向となる。
 上述した各スピーカ3の位置情報取得及びチャネル設定が完了すると、図10に示すように、情報処理装置1は各スピーカ3の位置情報に基づいてFLスピーカ3AとFRスピーカ3Bを基準スピーカとして認識する。基準スピーカであるFLスピーカ3AとFRスピーカ3Bの中点Mを基準位置に定め、中点Mから最も遠くに位置されたSRスピーカ3Cを最遠スピーカとして認識する。
 なお、基準スピーカとして選択しうるスピーカは、FLスピーカとFRスピーカに限られない。例えば、センタースピーカを備えたスピーカシステムについては、センタースピーカを基準スピーカとして認識し、センタースピーカの位置を基準位置と定めてもよい。センタースピーカが配置される場合には、センタースピーカの正面でユーザが聴取を行う可能性が高いため、センタースピーカを基準スピーカ並びに基準位置とすることで、ユーザ聴取位置の推定にあたって有用な基準位置を求めることができる。また、ユーザが聴取を行うモニタ装置9の下に配置されるスピーカーがある場合には、当該スピーカを基準スピーカとして認識し、当該スピーカの位置を基準位置として定めてもよい。
 続いて情報処理装置1は、図11に示すように、基準スピーカであるFLスピーカ3AとFRスピーカ3Bと、最遠スピーカであるSRスピーカ3Cの三点を通る基準円C1を求める。このとき、基準円C1の中心である基準点P1と基準円C1の半径R1を求める。すなわち、基準点P1の位置情報(座標値)と半径R1の長さを算出する。
 基準円C1を求めた情報処理装置1は、図12に示すように、基準円C1を所定の定数倍拡大した拡大円C2を求める。すなわち、情報処理装置1は基準円C1の半径R1を所定の定数倍拡大した長さの半径R2を算出する。そして基準点P1を中心とした半径R2の拡大円C2を求める。
 図12に示す例においては、所定の定数倍は1.6倍であり、拡大円C2の半径R2は基準円C1の半径R1を1.6倍に拡大した長さにされている。なお、所定の定数倍は1.6倍に限られず、1.0を超える任意の定数倍をスピーカの出力やスピーカシステムの配置環境に応じて選択することができる。
 拡大円C2を求めた情報処理装置1は、図12に示すように、拡大円C2の円周上に仮想スピーカ配置を設定する。
 仮想スピーカ配置としては、例えば、ITU(International Telecommunication Union)勧告が定める5チャネルの配置パターンに応じて、円周上の所定の角度に各仮想スピーカ4が配置されるように仮想的な位置(座標値)を設定する。なお、仮想スピーカ配置は5チャネルに限られず、例えば7チャネルなどそのほかの多チャネルに対応する仮想スピーカ配置が設定されてもよい。また、ITU勧告の定めるパターン以外の基準で仮想スピーカ配置が設定されてもよい。
 続けて情報処理装置1は、図13に示すように、各スピーカ3の位置情報を用いて全てのスピーカ3の平均位置P2を求める。
 平均位置P2の位置情報は、例えば、スピーカ3A、3B、3C、3Dの座標から算出された平均座標として表される。平均位置P2の位置情報としては、X軸方向(左右方向)とY軸方向(前後方向)におけるそれぞれの平均座標、すなわちX座標とY座標の双方を算出してもよいが、少なくともY軸方向の平均座標(Y座標)を算出する。
 平均位置P2を求めた情報処理装置1は、図14に示すように、平均位置P2の位置情報を基に基準点P1をY軸方向に移動させた地点に移動点P3を求め、移動点P3をユーザ聴取位置Urに推定する。そして、ユーザ聴取位置Ur(移動点P3)を中心に拡大円C2と同じ半径R2の配置円C3を求め、配置円C3の円周上に仮想スピーカ配置を設定する。すなわち、見かけ上、拡大円C2及び拡大円C2の円周上の仮想スピーカ配置をY軸方向に移動させる。
 このとき情報処理装置1は、基準点P1を平均位置P2とX軸方向に並ぶ位置にまでY軸方向に移動させた位置に移動点P3を求めている。つまり、移動点P3は、X座標が基準点P1のX座標に等しく、Y座標が平均位置P2のY座標に等しい。
 図14で示したように平均位置P2を基に基準点P1を移動すると、基準円C1の基準点P1が実際のユーザ聴取位置からずれていた場合においても、より適切な位置をユーザ聴取位置Urとして推定することができる。
 例えば、図15が示すように、最遠スピーカであるスピーカ3Xが基準スピーカであるスピーカ3A、3Bより前方に位置していた場合、基準円C1の中心である基準点P1が実際のユーザ聴取位置より前方に設定されることがある。従って、基準点P1をユーザ聴取位置Urとみなすと、実際のユーザ聴取位置からずれたユーザ聴取位置Urを中心とする配置円C3上に仮想スピーカ配置が設定される虞がある。
 そこで、全てのスピーカ3の位置情報を用いて平均位置P2を求め、移動後の基準点P1(移動点P3)が平均位置P2とX軸方向に並ぶように基準点P1を移動させることで、実際のユーザの聴取位置にそぐう、より相応しいユーザ聴取位置Urと配置円C3を求めることができる。
 以上により、ユーザ聴取位置Urが推定され、ユーザ聴取位置Urを中心とした配置円C3の円周上に仮想スピーカ配置が設定される。
 なお、上記の手順によってユーザ聴取位置Urの推定と仮想スピーカ配置を行うことが考えられるが、スピーカ3、仮想スピーカ4の配置状況等によっては、以下に説明する例外処理を行ってもよい。
 例えば、配置円C3の半径R2が所定の長さの参照半径R3より大きいときには、仮想スピーカ配置の再設定を行ってもよい。
 図16は、配置円C3の半径R2が参照半径R3より大きい場合を示している。さらに、全ての仮想スピーカ4のうち最も後方に位置された仮想スピーカ4Xが全てのスピーカ3のうち最も後方に位置されたスピーカ3Yよりも後方に位置している。すなわち、仮想スピーカ4XのY座標がスピーカ3YのY座標より小さい。このような配置状況にあっては、最も後方に位置された仮想スピーカ4Xの出力が実物のスピーカ3によって適切に表現されない可能性がある。
 そこで、配置円C3の半径R2が参照半径R3より大きく、最も後方に位置される仮想スピーカ4Xが全てのスピーカ3のうち最も後方に位置されたスピーカ3Yよりも後方に位置する場合、つまり仮想スピーカ4XのY座標がスピーカ3YのY座標より小さい場合には、図17が示すように、当該配置円C3の半径を所定の長さの参照半径R3に設定しなおして、参照半径R3の新たな配置円の円周上に仮想スピーカ配置を再設定する。ここでは、このような参照半径R3の新たな配置円を参照円C4と呼ぶ。すなわち、情報処理装置1は例外処理として、ユーザ聴取位置Urを中心とした参照半径R3の参照円C4を求め、参照円C4の円周上に仮想スピーカ配置を再設定している。
 参照半径R3の新たな配置円(参照円C4)の円周上に仮想スピーカ配置を再設定することで、最も後方に位置された仮想スピーカ4の出力を適切に表現することができるようになる。従って、聴取に好適な音響再生環境を形成することができる。
 なお、所定の長さの参照半径R3は、スピーカシステムが使用される環境やスピーカ3の出力に応じて任意の大きさに設定することができる。これにより、スピーカシステムの使用状況に応じた適切な大きさの参照円C4を設定することができる。
 なお、図18の配置例が示すように、配置円C3の半径R2が参照半径3Rより大きくとも、最も後方に位置された仮想スピーカ4Xが全てのスピーカ3のうち最も後方に位置されたスピーカ3Yより前方に位置されている場合がある。つまり仮想スピーカ4XのY座標がスピーカ3YのY座標より大きい場合がある。
 このような場合には仮想スピーカ4Xの出力をスピーカ3によって適切に表現することができるため、上記に示した再設定を必ずしも行う必要はない。
 また、図19が示すように、スピーカシステムの全てのスピーカ3がY軸方向(前後方向)において略同軸上に位置している場合がある。このようなスピーカ配置にあっては、上記の手順で求められる基準円C1並びに配置円C3(拡大円C2)の大きさ(半径)が大きくなる。しかし配置円C3の円周上に設定された仮想スピーカ配置によって得られる音場が広くなりすぎると、聴取に好適な音響再生環境を形成できない可能性がある。
 そこで、スピーカシステムの全てのスピーカ3がY軸方向において所定の範囲内、例えば10cmの範囲内に位置している場合には、情報処理装置1は、複数のスピーカ3の位置情報を基に中心位置P4を求め、中心位置P4をユーザ聴取位置Urに推定する。さらに、ユーザ聴取位置Urを中心に所定の長さの参照半径R3を半径とする配置円(参照円C4)を求め、参照円C4の円周上に仮想スピーカ配置を設定することが考えられる。
 例えば、図19は、4台のスピーカ3A、3B、3C、3DがX軸方向に一直線状に並び、同じY座標を持つ状態を表している。このとき、情報処理装置1は、基準スピーカとしてのFLスピーカ3AとFRスピーカ3Bの位置情報を用いてその中点のX座標を算出し、当該X座標を中心位置P4のX座標として求める。さらに、スピーカ3A、3B、3C、3Dの位置情報を用いて、全てのスピーカ3のY軸方向における平均位置のY座標を算出し、当該Y座標を中心位置P4のY座標として求める。このようにして求められた中心位置P4をユーザ聴取位置Urに推定し、ユーザ聴取位置Urを中心とする参照半径R3の参照円C4を求める。続けて、参照円C4の円周上に仮想スピーカ配置を設定する。
 これにより、所定の長さの参照半径R3の配置円(参照円C4)の円周上に仮想スピーカ配置を設定して、適度な広さの音場を得ることができる。
<4.処理例>
 上記のユーザ聴取位置の推定と仮想スピーカ配置の設定を実現するための情報処理装置1の処理を図20で説明する。情報処理装置1の処理は、CPU11における主に仮想スピーカ設定部11cにおける推定部110と配置部111の機能により実行される処理となる。
 また、図20は、情報処理装置1によって各スピーカ3の位置情報が取得され、各スピーカ3にチャネルが割り当てられた時点からの処理を示している。
 情報処理装置1のCPU11は、ステップS100でスピーカシステムの全てのスピーカ3がY軸方向(前後方向)において所定の範囲内に位置しているか否かを判定する。
 全てのスピーカ3がY軸方向において所定の範囲内に位置していると判定した場合、CPU11はステップS110に進み、スピーカ3の位置情報を用いて中心位置P4を求める。すなわち、基準スピーカであるFLスピーカ3AとFRスピーカ3Bの位置情報を用いて、FLスピーカ3AとFRスピーカ3Bの中点のX座標を算出する。さらに、全てのスピーカ3の位置情報を用いて少なくとも前後方向における全てのスピーカ3の平均位置のY座標を算出する。このように算出したX座標とY座標を中心位置P4の座標値に定めたうえで、中心位置P4をユーザ聴取位置Urに推定する(図19参照)。ステップS110の処理を終えたCPU11は、後述するステップS111の処理に進む。
 また、ステップS100で全てのスピーカ3がY軸方向において所定の範囲内に位置していないと判定した場合、CPU11はステップS101の処理に進む。
 ステップS101でCPU11は、全てのスピーカ3のうちの基準スピーカ(スピーカ3AとFRスピーカ3B)と、基準スピーカに応じて決められる基準位置(中点M)から最も遠くに位置された最遠スピーカ(スピーカ3C)を認識する(図10参照)。
 そしてステップS102でCPU11は、基準スピーカと最遠スピーカを通る基準円C1を求める(図11参照)。このとき、基準円C1の中心である基準点P1の位置情報(座標値)と半径R1が算出される。
 ステップS103でCPU11は、基準円C1を所定の定数倍拡大する(図12参照)。すなわち、半径R1を所定の定数倍拡大して半径R2を算出する。このとき、基準点P1中心とする半径R2の円である拡大円C2が求められる。
 続けてステップS104で、CPU11は、拡大円C2の円周上に仮想スピーカ配置を設定する(図12参照)。仮想スピーカ配置としては、例えば、ITU勧告に基づく5チャネルのスピーカ配置パターンに応じて、拡大円C2の円周上に配置されるように各仮想スピーカ4の位置情報(座標値)を求める。
 ステップS105でCPU11は、各スピーカ3の位置情報を用いて全てのスピーカ3の平均位置P2を求める(図13参照)。すなわち、各スピーカ3の座標を基に全てのスピーカ3の平均座標を算出して、その値を平均位置P2の座標値に定める。
 なお、平均位置P2としては、全てのスピーカ3の少なくとも前後方向における平均位置の位置情報(Y座標)が求められていればよい。
 続けてステップS106でCPU11は、基準点P1の位置情報と平均位置P2の位置情報を比較して移動量を算出する。ここでいう移動量とは、基準点P1と平均位置P2のY軸方向(前後方向)における差異であり、例えば、基準点P1のY座標の値と平均位置P2のY座標の値の差異として表すことができる。
 ステップS107でCPU11は、移動量に応じて拡大円C2を前後方向に移動させる移動処理を行う(図14参照)。すなわち、拡大円C2の中心である基準点P1を移動量に応じて前後方向(Y軸方向)に移動させた位置に移動点P3を求め、移動点P3を中心とした半径R2の配置円C3を求める。
 移動点P3は平均位置P2と左右方向(X軸方向)に並ぶように位置されている。移動点P3の位置情報(座標値)は、X座標が基準点P1のX座標に等しく、Y座標が平均位置P2のY座標に等しいものとして算出される。CPU11はこのような移動点P3をユーザ聴取位置Urに推定する。
 拡大円C2の移動に伴い、拡大円C2の円周上に設定された仮想スピーカ配置も移動される。すなわち、CPU11はステップS104で設定した仮想スピーカ配置を移動量に応じて前後方向(Y軸方向)に移動させ、配置円C3の円周上に仮想スピーカ配置を設定する。移動後の各仮想スピーカ4の位置情報は、ステップS104で決定された各仮想スピーカ4のX座標と、ステップS104で決定されたY座標を移動量に応じて増減させたY座標によって表される。
 ステップS108でCPU11は、配置円C3の半径R2が所定の長さの参照半径R3より大きいか否かを判定する。
 配置円C3の半径R2が参照半径R3より大きくないと判定された場合には、CPU11は図17に示された処理を終了する。
 ステップS108で配置円C2の半径R2が参照半径R3より大きいと判定された場合には、CPU11はステップS109の処理に進む。
 ステップS109においてCPU11は、全てのスピーカ3のうち最も後方にあるスピーカ3Yと全ての仮想スピーカ4のうち最も後方に設定された仮想スピーカ4Xを検出し、スピーカ3Yが仮想スピーカ4Xより後方に位置されているか否かを判定する。すなわち、スピーカ3Yと仮想スピーカ4Xの位置情報を比較して、スピーカ3YのY座標が仮想スピーカ4XのY座標の値より小さいか否かを判定する。
 ステップS109でスピーカ3YのY座標が仮想スピーカ4XのY座標より小さいと判定された場合、つまりスピーカ3Yが仮想スピーカ4Xより後方に位置されていると判定された場合、情報処理装置1のCPU11は図17に示された処理を終了する。この場合には、仮想スピーカ配置は配置円C3の円周上に設定される(図18参照)。
 ステップS109でスピーカ3YのY座標が仮想スピーカ4XのY座標より小さくないと判定された場合、つまり仮想スピーカ4Yがスピーカ3Yより後方に位置されていると判定された場合、CPU11はステップS111の処理に進む(図16参照)。
 ステップS111でCPU11は、ユーザ聴取位置Urを中心とする参照半径R3の参照円C4を求め、参照円C4の円周上に仮想スピーカ配置を設定して図17の処理を終了する(図18、図19参照)。
 仮想スピーカ配置としては、例えば、ITU勧告に基づく5チャネルのスピーカ配置パターンに応じて、参照円C4の円周上に配置されるように各仮想スピーカ4の位置情報(座標値)を定める。
 以上の処理により、スピーカ3の位置情報を用いてユーザ聴取位置Urが推定され、ユーザ聴取位置Urに基づいて仮想スピーカ配置が設定される。これにより、ユーザの負担なくユーザ聴取位置Urを推定し、ユーザ聴取位置Urからの聴取に好適な音響再生環境を形成することができる。
 なお、ステップS108以降の例外処理を行う前までに配置円C3を求めるために必要な情報(ユーザ聴取位置Urと半径R2)が求められる限りにおいて、ステップS101からステップS107に示す処理を上記とは異なる手順で行ってもよい。
 例えば、上記の処理例では、ステップS104とステップS107のそれぞれで仮想スピーカ配置の設定を行ったが、ステップS104の仮想スピーカ配置の設定を行わないことも考えられる。この場合には、ステップS107の移動処理で移動点P3と配置円C3を求めた段階にて、はじめて仮想スピーカ配置を設定することになる。
 また、上記の処理例では、ステップS103の拡大処理で半径R2を求めてからステップS107で基準点P1を移動させてユーザ聴取位置Urを求めたが、ユーザ聴取位置Urを求めた後に拡大処理を行うことも考えられる。この場合には、例えば、ステップS104の仮想スピーカ配置を行わず、ステップS107にて先ず基準点P1を移動させて移動点P3(ユーザ聴取位置Ur)を求めてから、基準円C1の半径R1を定数倍して半径R2を求めてもよい。
<5.まとめ及び変形例>
 実施の形態の情報処理装置1は、仮想スピーカ設定部11cの推定部110の機能により、3台以上であるN台のスピーカ3の位置情報を用いてユーザ聴取位置Urを推定する(図17のS101~107、S110)。また、仮想スピーカ設定部11cの配置部111の機能により、ユーザ聴取位置Urを用いて仮想スピーカ配置を設定する(S107、S111)。
 このようなユーザ聴取位置推定処理と仮想スピーカ配置設定処理においては、情報処理装置1は、まず、N台のスピーカ3の位置情報を基にユーザ聴取位置Urを推定することができる。既に配置されたスピーカ3の位置情報を基にユーザ聴取位置が推定されるため、ユーザにとっては何らかの操作等によって自らの聴取位置を情報処理装置1に通知する手間が省かれ負担がない。
 また、情報処理装置1は推定したユーザ聴取位置Urに基づいて仮想スピーカ配置の設定を行うことができる。実際にスピーカ3を配置する環境によっては、部屋の大きさや形状、家具の配置等の関係で、スピーカ3を聴取に最適な位置に配置できないことがある。しかし、ユーザ聴取位置Urに基づいて仮想スピーカ配置を設定することによって、そのような使用環境においても聴取に最適な音響再生環境(音場)が形成される。従って、実際のスピーカ配置環境に左右されることなく、聴取に好適な音響再生環境を得ることができる。
 実施の形態の情報処理装置1は、配置部111の機能によって、ユーザ聴取位置Urを中心とする配置円を設定し、配置円の円周上に仮想スピーカ4が配置されるように仮想スピーカ配置を設定する(S107、S111)。
 これにより、ユーザ聴取位置Urを円心とする配置円(配置円C3、参照円C4)の円周上に仮想スピーカ配置が設定される。推定されたユーザ聴取位置Urを中心に仮想スピーカ配置が設定されるため、聴取に好適な音響再生環境を得ることができる。
 実施の形態の情報処理装置1は、推定部110の機能によって、N台のスピーカ3のうちの基準スピーカと前記基準スピーカに応じて決められる基準位置から最も遠くに位置された最遠スピーカを認識し(S101)、前記基準スピーカと前記最遠スピーカを通る基準円C1を求める(S102)処理と、N台のスピーカの位置情報を基に基準円C1の中心(基準点P1)を移動する処理とを行い、移動後の基準円(配置円C3)の中心(移動点P3)をユーザ聴取位置Urと推定する(S107)。
 全てのスピーカ3のうち基準スピーカ(3A、3B)と基準スピーカに応じて決められる基準位置から最も遠くに位置された最遠スピーカ(3C)を用いて基準円C1を求めることで、できるだけ大きな基準円C1が求められる。できるだけ大きな基準円C1を求めることで、仮想スピーカ配置が設定される配置円3Cが小さくなりすぎることを防ぎ、適度な広がりを持つ音響再生環境を形成することができる。
 さらに、基準円C1の中心である基準点P1をN台のスピーカ3の位置情報を基に移動させることで、実際のスピーカ3の配置状況を反映したユーザ聴取位置Ur(移動点P3)を推定することができる。これにより、最遠スピーカが他のスピーカから極端に離れて位置に配置されていた場合においても、スピーカシステムにおけるスピーカ3の全体の配置状況を鑑みて、実際のユーザの聴取位置としてより相応しい位置をユーザ聴取位置Urとして推定することができる。
 実施の形態の情報処理装置1は、配置部111の機能によって、基準円C1の半径R1を所定の定数倍拡大する処理(S103)を行う。
 基準円C1の半径R1を所定の定数倍拡大することで、半径R1を所定の定数倍拡大した半径R2が算出される。これにより、半径R2を持つ配置円C3を求めて配置円C3の円周上に仮想スピーカ配置を設定することができる。従って、実際のスピーカ3の出力やスピーカ3の使用環境に合わせてより適切な音場を形成することができる。
 実施の形態では、基準スピーカは前方左スピーカ3Aと前方右スピーカ3Bであり、基準位置は前記前方左スピーカ3Aと前記前方右スピーカ3Bの中点Mであるとした。
 基準スピーカとして前方左スピーカ3Aと前方右スピーカ3Bを用いることで、前方左スピーカ3Aと前方右スピーカ3Bの中点Mが左右方向(X軸方向)におけるユーザ聴取位置Urとして推定される。従って、左右方向におけるユーザ聴取位置Urを推定するための好適な基準位置を得ることができる。
 実施の形態では、基準スピーカは前方中央スピーカであり、基準位置は前方中央スピーカが配置された位置であることも考えられる。
 これにより、ユーザの実際の聴取位置の正面に配置される可能性が高いセンタースピーカ等の前方中央スピーカが配置されていた場合に、前方右スピーカと前方左スピーカに代えて前方中央スピーカを基準スピーカとして用いることで、左右方向(X軸方向)におけるユーザ聴取位置Urを推定するための好適な基準位置をえることができる。
 実施の形態では、推定部110の機能によって、N台のスピーカ3(3A、3B、3C、3D)の位置情報を用いてN台のスピーカ3の少なくとも前後方向における平均位置P2を求め(S105)、基準円C1並びに拡大円C2の中心である基準点P1を平均位置P2と左右方向に並ぶ位置まで前後方向に移動させる(S107)。
 N台のスピーカ3の少なくとも前後方向における平均位置P2を求め、基準円C1(拡大円C2)の中心である基準点P1を平均位置P2と左右方向(X軸方向)に並ぶ位置にまで前後方向(Y軸方向)に移動させることで、移動後の基準円(配置円C3)の中心(移動点P3)がユーザ聴取位置Urとして推定される。N台のスピーカ3の前後方向における平均位置P2を用いることで、実際のスピーカ3の配置状況を鑑みて適切なユーザ聴取位置を推定することができる。
 なお、サブウーファーを備えるスピーカシステムにおいては、サブウーファーを除いたスピーカ3の位置情報を用いて平均位置P2を求めてもよい。これにより、全てのスピーカ3のうちサラウンド効果に貢献するスピーカ3のみの平均位置を求めることができる。
 実施の形態の情報処理装置1は、配置部111の機能によって、配置円C3の半径が所定の長さの半径(参照半径R3)より大きく且つ配置円C3の円周上に配置された仮想スピーカ(仮想スピーカ4X)が何れのスピーカ(スピーカ3Y)より後方にある場合に、配置円の半径を所定の長さの半径(参照半径R3)に設定して、仮想スピーカ配置を再設定する。即ち、所定の長さの半径(参照半径R3)を有する参照円C4を新たな配置円として求め、参照円C4の円周上に仮想スピーカ配置を再設定する。
 いちど設定した配置円C3の半径R2が所定の長さの半径(参照半径3R)よりも大きく、ある仮想スピーカ4Xが実際のスピーカ3Yより後方に配置された場合には、当該仮想スピーカ4の出力を好適に表現することができない虞がある。そこで、所定の長さの半径(参照半径3R)を有する参照円C4を新たな配置円として求め、参照円C4の円周上に仮想スピーカ配置を再設定する。
 これにより、配置円C3が所定の大きさより大きかった場合にも、所定の長さの半径(参照半径R3)を持つ新たな配置円としての参照円C4の円周上に仮想スピーカ配置が設定されて、各仮想スピーカ4の音響効果を好適に形成することができる。
 実施の形態の情報処理装置1は、N台のスピーカ3が前後方向において所定の範囲内に位置している場合に、推定部110の機能によって、基準スピーカの位置情報とN台のスピーカ3の前後方向における平均位置P2の位置情報を用いてユーザ聴取位置Urを推定し(S110)、配置部111の機能によって配置円の半径を所定の長さ(参照半径3R)に設定する。
 N台のスピーカ3が前後方向における所定の範囲内(例えば、幅10cmの範囲内)に位置している場合には、基準スピーカと最遠スピーカを通る基準円C1を求めた場合、基準円C1を基に算出される配置円C3が過度に大きくなり、好適な広さの音場を形成することができない虞がある。そこで、情報処理装置1は、基準スピーカの位置情報を用いて左右方向(X軸方向)におけるユーザ聴取位置Urの位置(X座標)を求め、N台のスピーカ3の前後方向(Y軸方向)における平均位置P2の位置情報を用いて前後方向におけるユーザ聴取位置Urの位置(Y座標)を求めることで、ユーザ聴取位置Ur(中心位置P4)を推定する。半径の長さを所定の長さ(参照半径R3)に設定して、そのように推定されたユーザ聴取位置Urを中心とする配置円(参照円C4)を求め、配置円(参照円C4)の円周上に仮想スピーカ配置を設定する。
 これにより、N台のスピーカ3が前後方向における所定の範囲内に位置している場合でも、聴取に好適な音響再生環境を形成する仮想スピーカ配置を行うことができる。
 なお、上記では移動点P3あるいは中心位置P4を中心とする配置円C3を求めたが、スピーカ3の位置情報を用いた他の手法で仮想スピーカ配置を設定する配置円を求めてもよい。例えば、円周と各スピーカ3の距離の二乗和が最小となる円(最小二乗円)を配置円として求めてもよい。
 実施の形態のプログラムは、上述の相対位置認識部11a、チャネル設定部11b、仮想スピーカ設定部11c(推定部110、配置部111)、チャネル信号処理部11dとしての機能を、例えばCPU、DSP(Digital Signal Processor)等、或いはこれらを含むデバイスとして情報処理装置に実行させるプログラムである。
 すなわち実施の形態のプログラムは、3台以上であるN台のスピーカ3の位置情報を用いてユーザ聴取位置Urを推定する処理と、前記ユーザ聴取位置Urを用いて仮想スピーカ配置を設定する処理と、を情報処理装置に実行させるプログラムである。
 このようなプログラムにより、本開示の情報処理装置1を実現できる。
 このようなプログラムはコンピュータ装置等の機器に内蔵されている記録媒体としてのHDD(Hard Disk Drive)や、CPUを有するマイクロコンピュータ内のROM等に予め記録しておくことができる。
 あるいはまた、フレキシブルディスク、CD-ROM(Compact Disc Read Only Memory)、MO(Magnet optical)ディスク、DVD(Digital Versatile Disc)、ブルーレイディスク(Blu-ray Disc(登録商標))、磁気ディスク、半導体メモリ、メモリカードなどのリムーバブル記録媒体に、一時的あるいは永続的に格納(記録)しておくことができる。このようなリムーバブル記録媒体は、いわゆるパッケージソフトウェアとして提供することができる。
 また、このようなプログラムは、リムーバブル記録媒体からパーソナルコンピュータ等にインストールする他、ダウンロードサイトから、LAN(Local Area Network)、インターネットなどのネットワークを介してダウンロードすることもできる。
 またこのようなプログラムによれば、実施の形態の情報処理装置1の広範な提供に適している。例えば演算処理装置を備えた各種オーディオ機器、パーソナルコンピュータ、携帯型情報処理装置、携帯電話機、ゲーム機器、ビデオ機器、PDA(Personal Digital Assistant)等にプログラムをダウンロードすることで、これらの機器を、本開示の情報処理装置1とすることができる。
 なお、本明細書に記載された効果はあくまでも例示であって限定されるものではなく、また他の効果があってもよい。
 なお本技術は以下のような構成も採ることができる。
 (1)
 3台以上であるN台のスピーカの位置情報を用いてユーザ聴取位置を推定する推定部と、前記ユーザ聴取位置を用いて仮想スピーカ配置を設定する配置部と、を備えた
 情報処理装置。
 (2)
 前記配置部は前記ユーザ聴取位置を中心とする配置円を設定し、前記配置円の円周上に仮想スピーカが配置されるように仮想スピーカ配置を設定する
 上記(1)に記載の情報処理装置。
 (3)
 前記推定部は、前記N台のスピーカのうちの基準スピーカと前記基準スピーカに応じて決められる基準位置から最も遠くに位置された最遠スピーカを認識し、前記基準スピーカと前記最遠スピーカを通る基準円を求める処理と、前記N台のスピーカの位置情報を基に前記基準円の中心を移動する処理とを行い、移動後の前記基準円の中心をユーザ聴取位置と推定する
 上記(1)又は(2)に記載の情報処理装置。
 (4)
 前記配置部は前記基準円の半径を所定の定数倍拡大する処理を行う
 上記(3)に記載の情報処理装置。
 (5)
 前記基準スピーカは前方左スピーカと前方右スピーカであり、前記基準位置は前記前方左スピーカと前記前方右スピーカの中点である
 上記(3)又は(4)のいずれかに記載の情報処理装置。
 (6)
 前記基準スピーカは前方中央スピーカであり、前記基準位置は前記前方中央スピーカが配置された位置である
 上記(3)又は(4)に記載の情報処理装置。
 (7)
 前記推定部は前記N台のスピーカの位置情報を用いて前記N台のスピーカの少なくとも前後方向における平均位置を求め、前記基準円の中心を前記平均位置と左右方向に並ぶ位置まで前後方向に移動させる
 上記(3)乃至(6)のいずれかに記載の情報処理装置。
 (8)
 前記配置部は、前記配置円の半径が所定の長さより大きく且つ前記配置円の円周上に配置された前記仮想スピーカが何れの前記スピーカより後方にある場合に、前記配置円の半径を前記所定の長さの半径に設定して、仮想スピーカ配置を再設定する
 上記(2)乃至(7)のいずれかに記載の情報処理装置。
 (9)
 前記N台のスピーカが前後方向において所定の範囲内に位置している場合に、前記推定部は基準スピーカの位置情報と前記N台のスピーカの前後方向における平均位置の位置情報を用いて前記ユーザ聴取位置を推定し、前記配置部は前記配置円の半径を所定の長さの半径に設定する
 上記(2)乃至(7)のいずれかに記載の情報処理装置。
 (10) 
 3台以上であるN台のスピーカの位置情報を用いてユーザ聴取位置を推定する推定手順と、
 前記ユーザ聴取位置を用いて仮想スピーカ配置を設定する配置手順と、
 を情報処理装置が実行する
 情報処理方法。
 (11)
 前記配置手順は前記ユーザ聴取位置を中心とする配置円を設定し、前記配置円の円周上に仮想スピーカが配置されるように仮想スピーカ配置を設定する
 上記(10)に記載の情報処理方法。
 (12)
 前記推定手順は、前記N台のスピーカのうちの基準スピーカと前記基準スピーカに応じて決められる基準位置から最も遠くに位置された最遠スピーカを認識し、前記基準スピーカと前記最遠スピーカを通る基準円を求める処理と、前記N台のスピーカの位置情報を基に前記基準円の中心を移動する処理とを行い、移動後の前記基準円の中心をユーザ聴取位置と推定する
 上記(10)又は(11)に記載の情報処理方法。
 (13)
 前記配置手順は前記基準円の半径を所定の定数倍拡大する処理を行う
 上記(12)に記載の情報処理方法。
 (14)
 前記基準スピーカは前方左スピーカと前方右スピーカであり、前記基準位置は前記前方左スピーカと前記前方右スピーカの中点である
 上記(12)又は(13)のいずれかに記載の情報処理方法。
 (15)
 前記基準スピーカは前方中央スピーカであり、前記基準位置は前記前方中央スピーカが配置された位置である
 上記(12)又は(13)に記載の情報処理方法。
 (16)
 前記推定手順は前記N台のスピーカの位置情報を用いて前記N台のスピーカの少なくとも前後方向における平均位置を求め、前記基準円の中心を前記平均位置と左右方向に並ぶ位置まで前後方向に移動させる
 上記(12)乃至(15)のいずれかに記載の情報処理方法。
 (17)
 前記配置手順は、前記配置円の半径が所定の長さより大きく且つ前記配置円の円周上に配置された前記仮想スピーカが何れの前記スピーカより後方にある場合に、前記配置円の半径を前記所定の長さの半径に設定して、仮想スピーカ配置を再設定する
 上記(11)乃至(16)のいずれかに記載の情報処理方法。
 (18)
 前記N台のスピーカが前後方向において所定の範囲内に位置している場合に、前記推定手順は基準スピーカの位置情報と前記N台のスピーカの前後方向における平均位置の位置情報を用いて前記ユーザ聴取位置を推定し、前記配置手順は前記配置円の半径を所定の長さの半径に設定する
 上記(11)乃至(16)のいずれかに記載の情報処理方法。
 (19)
 3台以上であるN台のスピーカの位置情報を用いてユーザ聴取位置を推定する処理と、
 前記ユーザ聴取位置を用いて仮想スピーカ配置を設定する処理と、
 を情報処理装置に実行させるプログラム。
 1…情報処理装置、3…スピーカ、4…仮想スピーカ、5…リモートコントローラ、11,31…CPU、11a…相対位置認識部、11b…チャネル設定部、11c…仮想スピーカ設定部、11d…チャネル信号処理部、12…出力信号形成部、110…推定部、111…配置部、C1…基準円、C2…拡大円、C3…配置円、C4…参照円、P1…基準点、P2…平均位置、P3…移動点、R1…半径、R2…半径、R3…参照半径、Ur…ユーザ聴取位置

Claims (19)

  1.  3台以上であるN台のスピーカの位置情報を用いてユーザ聴取位置を推定する推定部と、 前記ユーザ聴取位置を用いて仮想スピーカ配置を設定する配置部と、
     を備えた
     情報処理装置。
  2.  前記配置部は前記ユーザ聴取位置を中心とする配置円を設定し、前記配置円の円周上に仮想スピーカが配置されるように仮想スピーカ配置を設定する
     請求項1に記載の情報処理装置。
  3.  前記推定部は、前記N台のスピーカのうちの基準スピーカと前記基準スピーカに応じて決められる基準位置から最も遠くに位置された最遠スピーカを認識し、前記基準スピーカと前記最遠スピーカを通る基準円を求める処理と、前記N台のスピーカの位置情報を基に前記基準円の中心を移動する処理とを行い、移動後の前記基準円の中心をユーザ聴取位置と推定する
     請求項1に記載の情報処理装置。
  4.  前記配置部は前記基準円の半径を所定の定数倍拡大する処理と、拡大後の基準円を前記配置円に設定する処理とを行う
     請求項3に記載の情報処理装置。
  5.  前記基準スピーカは前方左スピーカと前方右スピーカであり、前記基準位置は前記前方左スピーカと前記前方右スピーカの中点である
     請求項3に記載の情報処理装置。
  6.  前記基準スピーカは前方中央スピーカであり、前記基準位置は前記前方中央スピーカが配置された位置である
     請求項3に記載の情報処理装置。
  7.  前記推定部は前記N台のスピーカの位置情報を用いて前記N台のスピーカの少なくとも前後方向における平均位置を求め、前記基準円の中心を前記平均位置と左右方向に並ぶ位置まで前後方向に移動させる
     請求項3に記載の情報処理装置。
  8.  前記配置部は、前記配置円の半径が所定の長さより大きく且つ前記配置円の円周上に配置された前記仮想スピーカが何れの前記スピーカより後方にある場合に、前記配置円の半径を前記所定の長さの半径に設定して、仮想スピーカ配置を再設定する
     請求項2に記載の情報処理装置。
  9.  前記N台のスピーカが前後方向において所定の範囲内に位置している場合に、前記推定部は基準スピーカと前記N台のスピーカの前後方向における平均位置の位置情報を用いて前記ユーザ聴取位置を推定し、前記配置部は前記配置円の半径を所定の長さの半径に設定する
     請求項2に記載の情報処理装置。
  10.  3台以上であるN台のスピーカの位置情報を用いてユーザ聴取位置を推定する推定手順と、
     前記ユーザ聴取位置を用いて仮想スピーカ配置を設定する配置手順と、
     を情報処理装置が実行する
     情報処理方法。
  11.  前記配置手順は前記ユーザ聴取位置を中心とする配置円を設定し、前記配置円の円周上に仮想スピーカが配置されるように仮想スピーカ配置を設定する
     請求項10に記載の情報処理方法。
  12.  前記推定手順は、前記N台のスピーカのうちの基準スピーカと前記基準スピーカに応じて決められる基準位置から最も遠くに位置された最遠スピーカを認識し、前記基準スピーカと前記最遠スピーカを通る基準円を求める処理と、前記N台のスピーカの位置情報を基に前記基準円の中心を移動する処理とを行い、移動後の前記基準円の中心をユーザ聴取位置と推定する
     請求項10に記載の情報処理方法。
  13.  前記配置手順は前記基準円の半径を所定の定数倍拡大する処理と、拡大後の基準円を前記配置円に設定する処理とを行う
     請求項12に記載の情報処理方法。
  14.  前記基準スピーカは前方左スピーカと前方右スピーカであり、前記基準位置は前記前方左スピーカと前記前方右スピーカの中点である
     請求項12に記載の情報処理方法。
  15.  前記基準スピーカは前方中央スピーカであり、前記基準位置は前記前方中央スピーカが配置された位置である
     請求項12に記載の情報処理方法。
  16.  前記推定手順は前記N台のスピーカの位置情報を用いて前記N台のスピーカの少なくとも前後方向における平均位置を求め、前記基準円の中心を前記平均位置と左右方向に並ぶ位置まで前後方向に移動させる
     請求項12に記載の情報処理方法。
  17.  前記配置手順は、前記配置円の半径が所定の長さより大きく且つ前記配置円の円周上に配置された前記仮想スピーカが何れの前記スピーカより後方にある場合に、前記配置円の半径を前記所定の長さの半径に設定して、仮想スピーカ配置を再設定する
     請求項11に記載の情報処理方法。
  18.  前記N台のスピーカが前後方向において所定の範囲内に位置している場合に、前記推定手順は基準スピーカと前記N台のスピーカの前後方向における平均位置の位置情報を用いて前記ユーザ聴取位置を推定し、前記配置手順は前記配置円の半径を所定の長さの半径に設定する
     請求項11に記載の情報処理方法。
  19.  3台以上であるN台のスピーカの位置情報を用いてユーザ聴取位置を推定する処理と、
     前記ユーザ聴取位置を用いて仮想スピーカ配置を設定する処理と、
     を情報処理装置に実行させるプログラム。
PCT/JP2019/015643 2018-05-22 2019-04-10 情報処理装置、情報処理方法、プログラム WO2019225190A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US17/056,239 US11463836B2 (en) 2018-05-22 2019-04-10 Information processing apparatus and information processing method
JP2020521085A JP7306384B2 (ja) 2018-05-22 2019-04-10 情報処理装置、情報処理方法、プログラム
CN201980032496.1A CN112119646B (zh) 2018-05-22 2019-04-10 信息处理装置、信息处理方法以及计算机可读存储介质

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018-097952 2018-05-22
JP2018097952 2018-05-22

Publications (1)

Publication Number Publication Date
WO2019225190A1 true WO2019225190A1 (ja) 2019-11-28

Family

ID=68616322

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2019/015643 WO2019225190A1 (ja) 2018-05-22 2019-04-10 情報処理装置、情報処理方法、プログラム

Country Status (4)

Country Link
US (1) US11463836B2 (ja)
JP (1) JP7306384B2 (ja)
CN (1) CN112119646B (ja)
WO (1) WO2019225190A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115715470A (zh) * 2019-12-30 2023-02-24 卡姆希尔公司 用于提供空间化声场的方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000059898A (ja) * 1998-08-06 2000-02-25 Matsushita Electric Ind Co Ltd 聴取位置補正装置およびその方法
JP2004241820A (ja) * 2003-02-03 2004-08-26 Denon Ltd マルチチャンネル再生装置
WO2006131894A2 (en) * 2005-06-09 2006-12-14 Koninklijke Philips Electronics N.V. A method of and system for automatically identifying the functional positions of the loudspeakers of an audio-visual system
US20150016642A1 (en) * 2013-07-15 2015-01-15 Dts, Inc. Spatial calibration of surround sound systems including listener position estimation
JP2015122612A (ja) * 2013-12-24 2015-07-02 オンキヨー株式会社 スピーカーアサイン装置、スピーカーアサイン方法、及びスピーカーアサインプログラム
JP2016509820A (ja) * 2013-02-07 2016-03-31 クゥアルコム・インコーポレイテッドQualcomm Incorporated 仮想スピーカーを物理スピーカーにマッピングすること

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3900676B2 (ja) 1998-05-13 2007-04-04 ソニー株式会社 オーディオ装置の聴取位置自動設定装置
US6574339B1 (en) * 1998-10-20 2003-06-03 Samsung Electronics Co., Ltd. Three-dimensional sound reproducing apparatus for multiple listeners and method thereof
IL134979A (en) 2000-03-09 2004-02-19 Be4 Ltd A system and method for optimizing three-dimensional hearing
JP4134794B2 (ja) * 2003-04-07 2008-08-20 ヤマハ株式会社 音場制御装置
JP2005286903A (ja) 2004-03-30 2005-10-13 Pioneer Electronic Corp 音響再生装置、音響再生システム、音響再生方法及び制御プログラム並びにこのプログラムを記録した情報記録媒体
KR100943215B1 (ko) 2007-11-27 2010-02-18 한국전자통신연구원 음장 합성을 이용한 입체 음장 재생 장치 및 그 방법
FR2955996B1 (fr) 2010-02-04 2012-04-06 Goldmund Monaco Sam Methode pour creer un environnement audio avec n haut-parleurs
JP2012104871A (ja) * 2010-11-05 2012-05-31 Sony Corp 音響制御装置及び音響制御方法
CN104335605B (zh) 2012-06-06 2017-10-03 索尼公司 音频信号处理装置、音频信号处理方法和计算机程序
EP2974384B1 (en) * 2013-03-12 2017-08-30 Dolby Laboratories Licensing Corporation Method of rendering one or more captured audio soundfields to a listener
CN106255031B (zh) 2016-07-26 2018-01-30 北京地平线信息技术有限公司 虚拟声场产生装置和虚拟声场产生方法
CN116320907A (zh) * 2018-10-05 2023-06-23 奇跃公司 近场音频渲染

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000059898A (ja) * 1998-08-06 2000-02-25 Matsushita Electric Ind Co Ltd 聴取位置補正装置およびその方法
JP2004241820A (ja) * 2003-02-03 2004-08-26 Denon Ltd マルチチャンネル再生装置
WO2006131894A2 (en) * 2005-06-09 2006-12-14 Koninklijke Philips Electronics N.V. A method of and system for automatically identifying the functional positions of the loudspeakers of an audio-visual system
JP2016509820A (ja) * 2013-02-07 2016-03-31 クゥアルコム・インコーポレイテッドQualcomm Incorporated 仮想スピーカーを物理スピーカーにマッピングすること
US20150016642A1 (en) * 2013-07-15 2015-01-15 Dts, Inc. Spatial calibration of surround sound systems including listener position estimation
JP2015122612A (ja) * 2013-12-24 2015-07-02 オンキヨー株式会社 スピーカーアサイン装置、スピーカーアサイン方法、及びスピーカーアサインプログラム

Also Published As

Publication number Publication date
JPWO2019225190A1 (ja) 2021-06-10
US20210219087A1 (en) 2021-07-15
CN112119646A (zh) 2020-12-22
CN112119646B (zh) 2022-09-06
US11463836B2 (en) 2022-10-04
JP7306384B2 (ja) 2023-07-11

Similar Documents

Publication Publication Date Title
EP2839675B1 (en) Auto detection of headphone orientation
AU2001239516B2 (en) System and method for optimization of three-dimensional audio
JP5973465B2 (ja) オーディオ処理デバイス
US9769585B1 (en) Positioning surround sound for virtual acoustic presence
AU2001239516A1 (en) System and method for optimization of three-dimensional audio
WO2011154270A1 (en) Virtual spatial soundscape
JP2002209300A (ja) 音像定位装置、並びに音像定位装置を用いた会議装置、携帯電話機、音声再生装置、音声記録装置、情報端末装置、ゲーム機、通信および放送システム
US11272312B2 (en) Non-transitory computer-readable medium having computer-readable instructions and system
JP4450764B2 (ja) スピーカ装置
WO2019208012A1 (ja) 信号処理装置、チャネル設定方法、プログラム、スピーカシステム
JP2007060253A (ja) スピーカ配置の判定システム
WO2019225190A1 (ja) 情報処理装置、情報処理方法、プログラム
JP4810378B2 (ja) 音響出力装置及びその制御方法並びに音響システム
KR20170052377A (ko) 전자기기에 대한 주변기기의 각위치 산출 방법 및 이러한 기능을 구비한 주변기기
JP2005057545A (ja) 音場制御装置及び音響システム
Kurabayashi et al. Development of dynamic transaural reproduction system using non-contact head tracking
CN113228711A (zh) 信息处理装置、信息处理方法和信息处理程序
US20190394583A1 (en) Method of audio reproduction in a hearing device and hearing device
JP2014107764A (ja) 位置情報取得装置、およびオーディオシステム
JP2024056580A (ja) 情報処理装置及びその制御方法及びプログラム
JP2015056829A (ja) 補聴器フィッティング装置と、それを用いた補聴器フィッティングシステムおよび補聴器フィッティング方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19808399

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2020521085

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19808399

Country of ref document: EP

Kind code of ref document: A1