WO2017073324A1 - 信号処理装置、信号処理方法、並びにプログラム - Google Patents
信号処理装置、信号処理方法、並びにプログラム Download PDFInfo
- Publication number
- WO2017073324A1 WO2017073324A1 PCT/JP2016/080222 JP2016080222W WO2017073324A1 WO 2017073324 A1 WO2017073324 A1 WO 2017073324A1 JP 2016080222 W JP2016080222 W JP 2016080222W WO 2017073324 A1 WO2017073324 A1 WO 2017073324A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- sound
- distance
- sound source
- position information
- unit
- Prior art date
Links
- 238000012545 processing Methods 0.000 title claims abstract description 56
- 238000003672 processing method Methods 0.000 title claims abstract description 12
- 238000012937 correction Methods 0.000 claims description 56
- 238000005259 measurement Methods 0.000 claims description 32
- 230000002596 correlated effect Effects 0.000 claims description 5
- 238000005516 engineering process Methods 0.000 abstract description 38
- 230000006854 communication Effects 0.000 description 40
- 238000004891 communication Methods 0.000 description 40
- 230000005540 biological transmission Effects 0.000 description 28
- 238000000926 separation method Methods 0.000 description 27
- 238000000034 method Methods 0.000 description 24
- 230000005236 sound signal Effects 0.000 description 24
- 238000004364 calculation method Methods 0.000 description 21
- 230000008569 process Effects 0.000 description 10
- 230000000694 effects Effects 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 230000002411 adverse Effects 0.000 description 3
- 230000007175 bidirectional communication Effects 0.000 description 3
- 230000000875 corresponding effect Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000004378 air conditioning Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S19/00—Satellite radio beacon positioning systems; Determining position, velocity or attitude using signals transmitted by such systems
- G01S19/38—Determining a navigation solution using signals transmitted by a satellite radio beacon positioning system
- G01S19/39—Determining a navigation solution using signals transmitted by a satellite radio beacon positioning system the satellite radio beacon positioning system transmitting time-stamped messages, e.g. GPS [Global Positioning System], GLONASS [Global Orbiting Navigation Satellite System] or GALILEO
- G01S19/42—Determining position
- G01S19/51—Relative positioning
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S5/00—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
- G01S5/18—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
- G01S5/30—Determining absolute distances from a plurality of spaced points of known location
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
- H03G3/30—Automatic control in amplifiers having semiconductor devices
- H03G3/3005—Automatic control in amplifiers having semiconductor devices in amplifiers suitable for low-frequencies, e.g. audio amplifiers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/141—Systems for two-way working between two video terminals, e.g. videophone
- H04N7/147—Communication arrangements, e.g. identifying the communication as a video-communication, intermediate storage of the signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/15—Conference systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/406—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/12—Circuits for transducers, loudspeakers or microphones for distributing signals to two or more loudspeakers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/40—Support for services or applications
- H04L65/403—Arrangements for multi-party communication, e.g. for conferences
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/56—Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
- H04M3/568—Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2203/00—Details of circuits for transducers, loudspeakers or microphones covered by H04R3/00 but not provided for in any of its subgroups
- H04R2203/12—Beamforming aspects for stereophonic sound reproduction with loudspeaker arrays
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/01—Aspects of volume control, not necessarily automatic, in sound systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/20—Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/13—Aspects of volume control, not necessarily automatic, in stereophonic sound systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/15—Aspects of sound capture and related signal processing for recording or reproduction
Definitions
- a video phone system and a video conference system are systems in which users in remote locations can talk while watching video.
- a device for audio conference is arranged at each point between two points separated from each other.
- This transmitting device for audio conferencing collects sound generated from different directions by a plurality of microphones and transmits an audio signal to the other audio conferencing device.
- the voice conference device releases the voice from the speaker.
- Patent Documents 1 to 3 and Non-Patent Document 1 propose to perform control that provides a more realistic feeling in a video conference system or a video phone system.
- the correction unit can restore the sound pressure difference relationship between a plurality of sound sources by correcting the gain of the acoustic signal.
- the distance indicated by the listening position information can be a fixed value.
- a first signal processing method acquires an acoustic signal, acquires sound source position information regarding a distance between a sound source and a sound collecting unit that collects sound from the sound source, and outputs the acoustic signal.
- the sound collection unit includes a microphone array, and the distance measurement unit calculates a cross-correlation between sounds collected by the microphone array and uses a distance between microphones that collect highly correlated sounds. The distance to the sound source can be measured.
- the distance measuring unit can measure the distance to the sound source by analyzing an image picked up from the sound source.
- the distance measuring unit can measure the distance between the sound source and the sound collecting unit using GPS.
- the sound collection unit includes a microphone that collects sound close to a sound source, and the distance measurement unit measures a distance between the predetermined position and the microphone with a predetermined position as a reference. be able to.
- the second signal processing method collects sound from a sound source, measures a distance between the sound source and a sound collecting unit that collects the sound, and collects the collected sound. Listening position information relating to the distance between the playback device that reproduces the sound signal and the listener who listens to the sound reproduced by the playback device is acquired, and based on the measured distance and the distance indicated by the listening position information And correcting the gain of the acoustic signal.
- a second program collects sound from a sound source, measures a distance between the sound source and a sound collecting unit that collects the sound, and collects the sound of the collected sound. Obtaining listening position information related to the distance between the playback device that plays the signal and the listener who listens to the sound played back by the playback device, and based on the measured distance and the distance indicated by the listening position information, A computer is caused to execute a process including a step of correcting the gain of the acoustic signal.
- sound source position information related to a distance between a sound source and a sound collection unit that collects sound from the sound source is acquired.
- the sound from the sound source is collected, and the distance between the sound source and the sound collecting unit that collects the sound is measured.
- Listening position information related to the distance between the playback device that plays back the collected sound signal and the listener who listens to the sound played back by the playback device is acquired, and the measured distance and the listening position information indicate the distance. Based on this, the gain of the acoustic signal is corrected.
- the present technology can be applied to a system in which users in remote locations interact through a network.
- the description is continued assuming that all sound sources are point sound sources, but the present technology can be applied to other than the point sound sources.
- the sound pressure of the sound emitted by the point sound source attenuates in inverse proportion to the distance
- the sound volume (sound pressure) observed at a distance of 1 m from the point sound source is assumed to be 1, and the ratio to that.
- the volume is represented by.
- the sound from the sound source 11 propagates 1 m and is collected by the sound collection unit 13, and propagates 4 m and reaches the listener 22 from the reproduction sound source 21.
- the sound from the sound source 11 since the sound from the sound source 11 propagates 1 m and reaches the sound collecting unit 13, it reaches the sound collecting unit 13 with a sound pressure multiplied by 1/1.
- 5/10 ⁇ 6.0 dB.
- FIG. 3 is a diagram illustrating a configuration of an embodiment of an acoustic communication system to which the present technology is applied.
- the acoustic communication system is composed of a transmission side and a reception side.
- the transmission side includes a sound source 111, a sound source 112, a sound collection unit 113, a sound source separation unit 115, and a distance measurement unit 114.
- the sound source 111 and the sound source 112 are people, speakers, and the like, and emit sound.
- the sound collection unit 113 is a microphone or the like, and collects sound from the sound source 111 or the sound source 112. The sound collected by the sound collection unit 113 is supplied to the sound source separation unit 115.
- the sound source separation unit 115 separates the sound from the sound source 111 and the sound from the sound source 112 when the two sound sources 111 and the sound source 112 exist.
- the separated sound (acoustic signal) is supplied to the receiving side connected via a network or the like.
- the distance measuring unit 114 measures the distance between the sound source and the sound collecting unit 13. For example, as shown in FIG. 3, when two sound sources 111 and 112 are present, the distance between the sound source 111 and the sound collection unit 113 and the distance between the sound source 112 and the sound collection unit 113 are expressed as follows: Measure each. In the following description, the distance between the sound source 111 and the sound collection unit 113 is a distance r 1a, and the distance between the sound source 112 and the sound collection unit 113 is a distance r 1b .
- the distance (sound source position information) measured by the distance measurement unit 114 is supplied to the reception side together with the acoustic signal from the sound source separation unit 115.
- the distance measurement unit 114 and the sound source separation unit 115 are separated, but may be configured as one signal processing device as described later. Moreover, it is good also as one signal processing apparatus also including the sound collection part 113. FIG.
- the receiving side includes a reproduction sound source 121, a sound pressure correction unit 123, and a distance measurement unit 124.
- the reproduction sound source 121 is a speaker or the like, and is a sound emitting device that reproduces sound transmitted from the transmission side.
- the listener 122 listens to the sound from the reproduction sound source 121.
- the sound pressure correction unit 123 functions as a signal processing device that processes an acoustic signal from the transmission side.
- the sound pressure correction unit 123 is supplied with the sound source position information from the distance measurement unit 114 on the transmission side and the acoustic signal from the sound source separation unit 115.
- the sound pressure correction unit 123 is also supplied with listening position information from the distance measurement unit 124.
- the distance measuring unit 124 measures the distance between the reproduction sound source 121 and the listener 122. Here, the distance between the playback sound source 121 and the listener 122 and the distance r 2.
- the sound pressure correction unit 123 determines the distance from the sound source position information and the listening position information when the transmitting sound source and the listener 122 exist in the same space, for example, in a situation as shown in FIG.
- the distance between the sound source and the listener 122 is calculated, and the supplied acoustic signal is corrected so that the sound from the sound source is supplied to the listener 122 with the sound pressure that would be heard in such a situation.
- the gain is corrected by multiplying the acoustic signal by a value corresponding to the distance.
- a distance measuring unit 124 is provided on the reception side, the distance from the reproduction sound source 121 to the listener 122 is measured, and the sound pressure is also taken into consideration. The sound pressure is corrected in the correction unit 123.
- the sound pressure correction unit 123 The sound volume difference between the sound sources can be restored by multiplying the sound signal corresponding to the sound source 111 or the sound source 112) by (r 1 ⁇ r 2 ) / (r 1 + r 2 ).
- R 1 is the distance r 1a or the distance r 1b in FIG.
- difference A the sound pressure difference when heard in the same space shown in FIG. 2 can be restored also in the acoustic signal system shown in FIG.
- the same parts as those in the acoustic communication system shown in FIG. 4 the sound pressure correction performed on the reception side is configured to be performed on the transmission side.
- the sound collection unit 113 includes a sound collection unit 113-1 and a sound collection unit 113-2.
- the sound collection unit 113-1 and the sound collection unit 113-2 are arranged with a predetermined distance.
- the sound collected by the sound collection unit 113-1 is supplied to the direction-specific sound separation unit 301-1, and the sound collected by the sound collection unit 113-2 is supplied to the direction-specific sound separation unit 301-2. Is done.
- the direction-specific sound separation unit 301 separates the supplied sound according to direction.
- the sound collection unit 113 is composed of a microphone array, and the microphone array is divided into a plurality of parts for processing.
- the direction-specific sound separation unit 301 estimates the direction of a sound source based on, for example, the MUSIC (Multiple signal classification) method for each partial array of microphone arrays divided into a plurality of portions, and for each estimated direction. Separate sounds.
- MUSIC Multiple signal classification
- Information regarding the direction of the sound source can also be acquired by the processing by the sound separation unit 301 by direction.
- Information about the direction (direction information) estimated by the direction-specific sound separation unit 301-1 is also supplied to the switch 302-1.
- Information about the direction estimated by the direction-specific sound separation unit 301-2 is also supplied to the switch 302-2.
- the correlation calculation unit 303 calculates a cross-correlation for each combination of the separated acoustic signals, and determines that the sound of the same sound source is included in the acoustic signals in the direction with high correlation.
- the switch 302-1 and the switch 302-2 are switched according to an instruction from the correlation calculation unit 303. That is, each of the switch 302-1 and the switch 302-2 performs switching so that an acoustic signal determined to have a high correlation is supplied to the adder 304-1 or the adder 304-2.
- the position information of the sound source 111 calculated by the position calculation unit 305-1 is supplied to the reception side in association with the acoustic signal of the sound source 111 output from the addition unit 304-1.
- the position calculation unit 305-2 has acquired the distance between the third array unit and the fourth array unit in advance. Using this distance, the direction information about the direction of the sound source 112 relative to the third array unit, and the direction information about the direction of the sound source 112 relative to the fourth array unit, for example, using the principle of triangulation, Calculate the distance.
- the configuration shown in FIG. 5 is taken as an example, and the configuration and operation of the sound collection unit 113, the distance measurement unit 114, and the sound source separation unit 115 when distance and sound signals are acquired have been described.
- the distance and the acoustic signal may be acquired by the configuration and other methods.
- the sound collection unit 113 is not composed of a microphone array, but is composed of a plurality of microphones such as pin microphones.
- the receiving side before transmitting an acoustic signal to the receiving side, the sound propagates to a reference position on the transmitting side (for example, the position of the camera when accompanied by video) based on the obtained position information. Multiply the amount of attenuation you will receive. By doing in this way, the receiving side corrects the sound pressure difference relationship between the sound sources by performing the same process without distinguishing between the case of using the above microphone array and the case of proximity sound collection, It is possible to restore.
- a reference position on the transmitting side for example, the position of the camera when accompanied by video
- the sound signal that has been separated and collected using the microphone array is transmitted with a gain that cancels the attenuation received while propagating from the sound source to the center position of the microphone array, and is sent out.
- FIG. 6 is a diagram illustrating a configuration of the sound pressure correction unit 123 (FIG. 3). Since the sound pressure correction unit 201 shown in FIG. 4 has basically the same configuration as the sound pressure correction unit 123 shown in FIG. 6, the sound pressure correction unit 123 will be described as an example here.
- the acoustic signals supplied from the transmission side are assumed to be an acoustic input signal x 1a and an acoustic input signal x 1b .
- the sound source position information associated with the acoustic input signal x 1a is the sound source position information r 1a
- the sound source position information associated with the sound input signal x 1b is the sound source position information.
- sound source position information r 1b is the position information of the listener 122, the listening position information r 2.
- This acoustic output signal y is an acoustic signal after sound pressure correction, and is an acoustic signal in which the mismatch in the volume difference relationship between the sound sources and the mismatch in the volume difference relationship before and after the movement of the moving sound source or the listener are eliminated.
- the case where the listener 122 is listening by one person at a position separated from the reproduction sound source 121 such as a speaker by the distance r2 has been described as an example.
- a case where a speaker is used as a sound reproducing device and a case where headphones / earphones are used are considered.
- the number of listeners is not limited to one, and it should be assumed that a plurality of listeners are listening.
- Criterion 1 Use the average position of the listener (average distance)
- Criterion 2 Use the position of the listener who is at the closest distance (nearest distance)
- Criterion 3 A fixed distance set in advance is used without estimating the listener's position (fixed value)
- the distance r 2 is set with reference 1
- the distance between the listener 122-1 and the reproduced sound source 121, the distance between the listener 122-2 and the reproduced sound source 121, and the distance between the listener 122-3 and the reproduced sound source 121 There are respectively measured (acquired), the calculated average value, the average value is a distance r 2.
- the distance between the listener 122 located closest to the reproduction sound source 121 and the reproduction sound source 121 is set as the distance r 2 .
- the distance between the listener 122-1 and the playback sound source 121 is a distance r 2.
- a preset fixed value is set as the distance r 2 between the listener 122 and the reproduction sound source 121.
- the sound pressure correction according to the situation at the time of listening can be performed more accurately than the other standards, so that each of the listeners 122-1 to 122-3 can be corrected.
- the listener can be provided with an acoustic signal in which the mismatch in the volume difference relationship between the sound sources and the mismatch in the volume difference relationship before and after the movement of the moving sound source or the listener are eliminated.
- the sound pressure correction unit 123 corrects the sound pressure by multiplying the sound signal corresponding to the sound source by (r 1 ⁇ r 2 ) / (r 1 + r 2 ). From this equation, as the distance r 2 is large, it can be seen that the correction amount increases.
- the correction amount in the sound pressure correction unit 123 is growing. In this case, the corrected acoustic signal may become a loud sound. In other words, an excessive gain is applied.
- the distance measurement unit 124 (FIGS. 3 and 4) does not need to measure the distance. Therefore, when the distance r2 is set according to the reference 3, even when there is no distance measuring unit 124 on the receiving side, the volume difference relationship between the sound sources does not match, and the sound volume before and after the movement of the moving sound source or the listener is moved. It is possible to provide an acoustic signal in which the mismatch in the difference relationship is eliminated.
- Reference 3 can be applied when the listening position is fixed to some extent, for example, when the listener 122 sits side by side on the sofa. That is, in such a case, if the position of the sofa does not change, the distance between the listener 122 and the reproduction sound source 121 is small, the distance r 2 is a fixed value, and the distance r 2 is set to the sofa and the reproduction sound source 121. Distance.
- the reference 1 to 3 have been described as examples, but the present technology can also be applied to the case where the distance between the reproduction sound source 121 and the listener 122 is set by providing another reference.
- the use of a single speaker (reproduction sound source 121) on the receiving side has an advantage that, for example, an echo canceller necessary for performing bidirectional communication can be easily realized.
- an echo canceller that picks up the sound emitted from the speaker with the microphone on the same side and removes the echo sent to the other side again is relatively small if the number of microphones and speakers is small. It can be easily realized.
- the number of microphones / speakers of a scale used in wavefront synthesis cannot be easily realized because it is necessary to prepare an echo canceller for each of the combinations.
- the echo canceller can be suppressed to the number of microphones at most, and separates sounds according to directions.
- the influence of echo can be reduced by adjusting the directivity and lowering the sensitivity in a certain direction of the speaker.
- one-way communication (from the transmission side to the reception side) has been described as an example.
- the present technology can also be applied to bidirectional communication.
- the acoustic communication system called a videophone or a video conference has been described as an example.
- the present technology can be applied to other than the telepresence technology.
- the input unit 1006 includes a keyboard, a mouse, a microphone, and the like.
- the output unit 1007 includes a display, a speaker, and the like.
- the storage unit 1008 includes a hard disk, a nonvolatile memory, and the like.
- the communication unit 1009 includes a network interface.
- the drive 1010 drives a removable medium 1011 such as a magnetic disk, an optical disk, a magneto-optical disk, or a semiconductor memory.
- the program executed by the computer (CPU 1001) can be provided by being recorded on the removable medium 1011 as a package medium, for example.
- the program can be provided via a wired or wireless transmission medium such as a local area network, the Internet, or digital satellite broadcasting.
- the program can be installed in the storage unit 1008 via the input / output interface 1005 by attaching the removable medium 1011 to the drive 1010. Further, the program can be received by the communication unit 1009 via a wired or wireless transmission medium and installed in the storage unit 1008. In addition, the program can be installed in advance in the ROM 1002 or the storage unit 1008.
- the program executed by the computer may be a program that is processed in time series in the order described in this specification, or in parallel or at a necessary timing such as when a call is made. It may be a program for processing.
- system represents the entire apparatus composed of a plurality of apparatuses.
- An acoustic signal acquisition unit for acquiring an acoustic signal;
- a sound source position information acquisition unit that acquires sound source position information relating to a distance between the sound source and a sound collection unit that collects sound from the sound source;
- a listening position information acquisition unit that acquires listening position information relating to a distance between a playback device that plays back the acoustic signal and a listener who listens to the sound played back by the playback device;
- a signal processing apparatus comprising: a correction unit that corrects a gain of the acoustic signal based on the sound source position information and the listening position information.
- the acoustic signal acquisition unit acquires the acoustic signal via a network
- the listening position information includes an average value of a distance between each of the plurality of listeners and the playback device, and a reception position of the plurality of listeners closest to the playback device.
- the sound collection unit is composed of a microphone array, The distance measuring unit calculates a cross-correlation between sounds collected by the microphone array, and measures a distance to the sound source using a distance between microphones that collect highly correlated sounds. ) Or the signal processing apparatus according to (11). (13) The signal processing apparatus according to (10) or (11), wherein the distance measurement unit analyzes an image obtained by capturing a sound source and measures a distance to the sound source. (14) The signal processing apparatus according to (10) or (11), wherein the distance measurement unit measures a distance between the sound source and the sound collection unit using GPS.
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Stereophonic System (AREA)
- Circuit For Audible Band Transducer (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
本技術は、音源間の音圧差を復元することで、より臨場感の増した音を提供することができるようにする信号処理装置、信号処理方法、並びにプログラムに関する。 音響信号を取得する音響信号取得部と、音源と、音源からの音を集音する集音部までの距離に関する音源位置情報を取得する音源位置情報取得部と、音響信号を再生する再生装置と、再生装置で再生された音を受聴する受聴者との距離に関する受聴位置情報を取得する受聴位置情報取得部と、音源位置情報と受聴位置情報に基づいて、音響信号のゲインを補正する補正部とを備える。本技術は、例えば、テレビ電話システムに適用できる。
Description
本技術は、信号処理装置、信号処理方法、並びにプログラムに関する。詳しくは、音源間の音圧差の関係を復元できるようにし、より臨場感が得られるようにするときに用いて好適な信号処理装置、信号処理方法、並びにプログラムに関する。
近年、テレビ電話システムやテレビ会議システムなどと称されるシステムが普及しつつある。例えば、テレビ電話システムやテレビ会議システムは、遠隔地にいるユーザ同士が、映像を見ながら話をできるシステムである。
例えば、テレビ会議システムにおいては、互いに離れた二地点間のそれぞれの地点に、音声会議用の装置が配置される。この音声会議用の送信側の装置は、複数のマイクで異なる方位からの発生音を収音して音声信号を相手側の音声会議装置に送信する。一方、音声会議用の受信側の装置は、相手側の音声会議用の装置で収音された音声信号を受信すると、その音声をスピーカから放音する。
テレビ会議システムやテレビ電話システムにおいて、より臨場感が得られるような制御が行われるようにすることが、例えば特許文献1乃至3や、非特許文献1で提案されている。
安藤彰男, 「物理音響モデルに基づく音響システムの研究動向」, NHK技研 R&D/No.126/2011.3
遠隔地にいるユーザ同士が、テレビ電話システムなどで対話するとき、臨場感を向上させるために、送信側の音場を受信側で再現するようにした場合、例えば、波面合成技術を適用することが考えられる。しかしながら、波面合成技術を用いると、多数のマイクとスピーカが必要となり、コストが高くなってしまう、装置の規模が大掛かりな物となってしまう。
さまざまな場面で、臨場感を向上させることは望まれており、より臨場感を向上させることができるとともに、コストや装置の規模の面などから、より導入しやすい技術の提案が望まれている。
本技術は、このような状況に鑑みてなされたものであり、離れた場所のユーザと、あたかも同一の場所に存在しているかのような臨場感を得ることができるようにするものである。
本技術の一側面の第1の信号処理装置は、音響信号を取得する音響信号取得部と、音源と、前記音源からの音を集音する集音部までの距離に関する音源位置情報を取得する音源位置情報取得部と、前記音響信号を再生する再生装置と、前記再生装置で再生された音を受聴する受聴者との距離に関する受聴位置情報を取得する受聴位置情報取得部と、前記音源位置情報と前記受聴位置情報に基づいて、前記音響信号のゲインを補正する補正部とを備える。
前記補正部は、前記音響信号のゲインを補正することで、複数の音源間の音圧差関係を復元するようにすることができる。
前記補正部は、前記音源位置情報が示す距離が距離r1であり、前記受聴位置情報が示す距離が距離r2である場合、前記音響信号に(r1・r2)/(r1+r2)を乗算するようにすることができる。
前記受聴位置情報が示す距離は、固定値であるようにすることができる。
前記音響信号取得部は、ネットワークを介して前記音響信号を取得し、前記音源位置情報取得部は、ネットワークを介して前記音源位置情報を取得するようにすることができる。
前記受聴位置情報取得部は、ネットワークを介して前記受聴位置情報を取得するようにすることができる。
複数の受聴者がいた場合、前記受聴位置情報は、前記複数の受聴者のそれぞれと前記再生装置との距離の平均値、前記複数の受聴者のうちの前記再生装置に最も近い位置に居る受聴者までの距離、または固定値とされるようにすることができる。
本技術の一側面の第1の信号処理方法は、音響信号を取得し、音源と、前記音源からの音を集音する集音部までの距離に関する音源位置情報を取得し、前記音響信号を再生する再生装置と、前記再生装置で再生された音を受聴する受聴者との距離に関する受聴位置情報を取得し、前記音源位置情報と前記受聴位置情報に基づいて、前記音響信号のゲインを補正するステップを含む。
本技術の一側面の第1のプログラムは、音響信号を取得し、音源と、前記音源からの音を集音する集音部までの距離に関する音源位置情報を取得し、前記音響信号を再生する再生装置と、前記再生装置で再生された音を受聴する受聴者との距離に関する受聴位置情報を取得し、前記音源位置情報と前記受聴位置情報に基づいて、前記音響信号のゲインを補正するステップを含む処理をコンピュータに実行させる。
本技術の一側面の第2の信号処理装置は、音源からの音を集音する集音部と、前記音源と前記集音部との間の距離を測定する距離測定部と、前記集音部で集音された前記音の音響信号を再生する再生装置と、前記再生装置で再生された音を受聴する受聴者との距離に関する受聴位置情報を取得する受聴位置情報取得部と、前記距離測定部で測定された距離と前記受聴位置情報が示す距離に基づいて、前記音響信号のゲインを補正する補正部とを備える。
前記補正部で補正された前記音響信号を、前記再生装置に供給するようにすることができる。
前記集音部は、マイクロフォンアレイで構成され、前記距離測定部は、前記マイクロフォンアレイで集音された音同士の相互相関を計算し、相関の高い音を集音したマイクロフォン同士の距離を用いて、前記音源までの距離を測定するようにすることができる。
前記距離測定部は、音源を撮像した画像を解析して音源までの距離を測定するようにすることができる。
前記距離測定部は、GPSを用いて前記音源と前記集音部との間の距離を測定するようにすることができる。
前記集音部は、音源に近接して集音するマイクロフォンで構成され、前記距離測定部は、所定の位置を基準とし、前記所定の位置と前記マイクロフォンとの間の距離を測定するようにすることができる。
本技術の一側面の第2の信号処理方法は、音源からの音を集音し、前記音源と前記音を集音する集音部との間の距離を測定し、集音された前記音の音響信号を再生する再生装置と、前記再生装置で再生された音を受聴する受聴者との距離に関する受聴位置情報を取得し、測定された前記距離と前記受聴位置情報が示す距離に基づいて、前記音響信号のゲインを補正するステップを含む。
本技術の一側面の第2のプログラムは、音源からの音を集音し、前記音源と前記音を集音する集音部との間の距離を測定し、集音された前記音の音響信号を再生する再生装置と、前記再生装置で再生された音を受聴する受聴者との距離に関する受聴位置情報を取得し、測定された前記距離と前記受聴位置情報が示す距離に基づいて、前記音響信号のゲインを補正するステップを含む処理をコンピュータに実行させる。
本技術の一側面の第1の信号処理装置、信号処理方法、およびプログラムにおいては、音響信号が取得され、音源と、音源からの音を集音する集音部までの距離に関する音源位置情報が取得され、音響信号を再生する再生装置と、再生装置で再生された音を受聴する受聴者との距離に関する受聴位置情報が取得され、音源位置情報と受聴位置情報に基づいて、音響信号のゲインが補正される。
本技術の一側面の第2の信号処理装置、信号処理方法、およびプログラムにおいては、音源からの音が集音され、音源と音を集音する集音部との間の距離が測定され、集音された音の音響信号を再生する再生装置と、再生装置で再生された音を受聴する受聴者との距離に関する受聴位置情報が取得され、測定された距離と受聴位置情報が示す距離に基づいて、音響信号のゲインが補正される。
本技術の一側面によれば、離れた場所のユーザと、あたかも同一の場所に存在しているかのような臨場感を得ることができる。
なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載されたいずれかの効果であってもよい。
以下に、本技術を実施するための形態(以下、実施の形態という)について説明する。なお、説明は、以下の順序で行う。
1.臨場感を損なう一因について
2.音響通信システムの構成
3.音源分離部、距離測定部の構成、動作
4.音圧補正部の構成、動作
5.補正対象の音響信号について
6.記録媒体について
1.臨場感を損なう一因について
2.音響通信システムの構成
3.音源分離部、距離測定部の構成、動作
4.音圧補正部の構成、動作
5.補正対象の音響信号について
6.記録媒体について
<臨場感を損なう一因について>
本技術は、遠隔地にいるユーザ同士が、ネットワークを介して対話するときのシステムに適用できる。また、本技術を適用することで、離れた場所のユーザと、あたかも同一の場所に存在しているかのような臨場感を得ることができる。すなわち本技術は、遠隔地にいる相手とあたかも同じ場にいるかのような臨場感を実現するテレプレゼンスという概念があるが、そのようなテレプレゼンスの技術に適用できる。
本技術は、遠隔地にいるユーザ同士が、ネットワークを介して対話するときのシステムに適用できる。また、本技術を適用することで、離れた場所のユーザと、あたかも同一の場所に存在しているかのような臨場感を得ることができる。すなわち本技術は、遠隔地にいる相手とあたかも同じ場にいるかのような臨場感を実現するテレプレゼンスという概念があるが、そのようなテレプレゼンスの技術に適用できる。
このような臨場感を得られる本技術について説明するために、まず図1、図2を参照し、臨場感を損なう一因について説明を加える。
図1は、音響通信システムの一例を示す図である。送信側は、音源11、音源12、および集音部13を含む。音源11や音源12は、人、スピーカなどである。集音部13は、マイクロフォンなどであり、音源11や音源12からの音を集音する。集音部13で集音された音は、ネットワークなどを介して、受信側に送信される。
受信側は、再生音源21を含む。再生音源21は、スピーカなどであり、送信側から送信されてきた音を再生する。受聴者22は、再生音源21からの音を受聴する。
なお、以下の説明では音源を全て点音源と仮定して説明を続けるが、点音源以外であっても本技術を適用することはできる。また、点音源の発する音の音圧は距離に反比例して減衰していくため、以下の説明においては、点音源から1mの距離で観測される音量(音圧)を1として、それとの比で音量を表すものとする。
このような音響通信システムにおいて、臨場感を損なう一因として、送信側と受信側で感じる各音源間の音量感の差異があげられる。このことについて図1、図2を参照して説明する。
図1に示した音響通信システムにおいて、送信側の集音部13と音源11は、1m(=r1a)離れているとする。また、送信側の集音部13と音源12は、6m(=r1b)離れているとする。また、受信側の再生音源21と受聴者22は、4m(=r2)離れているとする。
集音部13と再生音源21を同一点とした場合、換言すれば、音源11、音源12、再生音源21、および受聴者22が、同一の空間にいた場合、図2に示すような状況となる。すなわち音源11と受聴者22は、5m(=1+4=r1a+r2=ra)だけ離れていることになる。また同様に、音源12と受聴者22は、10m(=6+4=r1b+r2=rb)だけ離れていることになる。
仮に同一空間に音源11、音源12、再生音源21、および受聴者22が存在していた場合、図2に示すように、受聴者22は、5m(=ra)離れた位置で、音源11からの音を聞いていることになる。また、受聴者22は、10m(=rb)離れた位置で、音源12からの音を聞いていることになる。
ところで、点音源の発する音の音圧は距離に反比例して減衰していくため、図2に示したように、音源と受聴者22が同一空間に存在する場合、音源11からの音は、5m伝搬して受聴者22に届くため、1/5倍された音圧で届くことになる。また音源12からの音は、10m伝搬して受聴者22に届くため、1/10倍された音圧で届くことになる。
すなわちこの場合、音源11と音源12が、それぞれ同じ音量で音を発している場合、受聴者22の位置における音源12の音は、音源11の音に比べて約6dB小さい(=5/10)音として知覚される。
一方、図1に示した音響通信システムにおいては、音源11からの音は、1m伝搬して集音部13で集音され、4m伝搬して、再生音源21から受聴者22に届く。この場合、音源11からの音は、1m伝搬して集音部13に届くため、集音部13には、1/1倍された音圧で届くことになる。この1/1倍された音圧の音響信号が、ネットワークなどを介して、再生音源21に伝送され、再生音源21から4m伝搬して受聴者22に届く。よって、1/1×1/4=1/4倍された音圧で、音源11からの音が、受聴者22に届くことになる。
また図1に示した音響通信システムにおいては、音源12からの音は、6m伝搬して集音部13で集音され、4m伝搬して、再生音源21から受聴者22に届く。この場合、音源12からの音は、6m伝搬して集音部13に届くため、集音部13には、1/6倍された音圧で届くことになる。この1/6倍された音圧の音響信号が、ネットワークなどを介して、再生音源21に伝送され、再生音源21から4m伝搬して受聴者22に届く。よって、1/6×1/4=1/24倍された音圧で、音源11からの音が、受聴者22に届くことになる。
図1に示した音響通信システムにおいては、音源11と音源12が、それぞれ同じ音量で音を発している場合、受聴者22の位置における音源12の音は、音源11の音に比べて約15.6dB小さい(=1/6)音として知覚される。
図1に示した音響通信システムにおいては、受聴者22の位置における音源12の音は、音源11の音に比べて約15.6dB小さい音として知覚される。図2に示した状態においては受聴者22の位置における音源12の音は、音源11の音に比べて約6dB小さい音として知覚される。
このように、音響通信システムにおいては、図1に示したような環境の場合、集音部13より遠い位置にある音源12は、集音部13よりも近い位置にある音源11よりも、過剰に小さい音として受聴者22に知覚されてしまう。
換言すれば、図2に示したような状況において、音源11からの音と音源12からの音をそれぞれ受聴者22が知覚するような音圧関係は、図1に示した音響通信システムにおいては再現できず、音源12からの音の方が、音源11からの音よりも過剰に小さく知覚されてしまう。
音響通信システムにおいて、臨場感を損なう一因としては、このような音源間の音量差(音圧差)が維持できないというのがある。
このことを、図1、図2に示した距離r1a,r1b,r2,ra,rbを用いて再度説明する。
図1に示した音響システムにおいて、送信側の集音部13では、音源11の音が、伝搬に伴い1/r1a倍されて届き、その音が、受信側の再生音源21から放音されると、再度伝搬により1/r2倍された音圧で受聴者22に届く。よって、音源11からの音の音圧は、1/(r1a・r2)の大きさとなる。
同様に、音源12からの音の音圧は、1/(r1b・r2)の大きさとなる。よって、受聴者22が知覚する音源11と音源12の音量差は、(r1a/r1b)倍となる。上記したように、r1a=1、r1b=6である場合、1/6=-15.4dBとなる。
一方、図2に示したように、送信側と受信側が、音響通信で繋がるのではなく、物理的に接続されている状況を想定した場合、音源11と受聴者22は、距離ra=r1a+r2だけ離れた位置に存在し、音源12と受聴者22は、距離rb=r1b+r2だけ離れた位置に存在している。このような場合、音源11の音は、1/ra=1/(r1b+r2)倍、音源12の音は、1/rb=1/(r1b+r2)倍の大きさで受聴者22に届く。
よって、受聴者22が感じる音源11と音源12の音量差は、ra/rb=(r1a+r2)/(r1b+r2)倍となる。上記したように、ra=5、rb=10である場合、5/10=-6.0dBとなる。
このように音響通信のための集音や再生を行うと、集音部13近くの音が強調される一方で、遠くの音が抑圧されるという現象が生じる。そのため集音部13から遠い位置の音源(図1では音源12)の音が、実際より遠くに位置しているなど遠近感が狂うほか、集音部13から遠い位置にいる人の声が聞き取れない、洗い物や空調の音など雰囲気を形作る雑多な背景音が聞こえないなど、臨場感に大きな悪影響をもたらす可能性がある。
また、このような現象は、送信側に存在する音源数が1であっても、その音源が移動した場合、または受聴者22自身が移動した場合、同様に問題となる。例えば、音源11の位置にあった音源が、ある時点で音源12の位置に移動した場合を考える。このような状況下のとき、音響通信を用いた場合、音源が遠ざかることによって知覚される音量の減少がより過大となるため、音源が実際以上に遠くに移動したように感じられ、臨場感に悪影響を及ぼしてしまうことが考えられる。
そこで、臨場感に悪影響を取り除くために、波面の伝搬を物理的に再現する波面合成技術がある。しかしながら波面合成を行うためには、多数のマイク(集音装置)とスピーカ(放音装置)が必要となり、通信の伝送帯域も相応に大きくなる。また双方向通信を行うためには多チャンネルのエコーキャンセルが必要となるために技術的なハードルが高く、コストが高くなる傾向にある。
また、単に集音部から遠くの音も近くの音も同様に聞こえるようにするだけであれば、利得制御により出力する音圧を一定のレベル範囲に保つことにより、ある程度対処可能である。しかしながら、この手法のみでは複数音源が同時に発音した際には上手く働かない他、過度に利得をかけると音の遠近感が全くなくなってしまい、かえって臨場感が損なわれる可能性がある。
このようなことに対して、より簡便な方法で効率的に対処することが求められる。以下に説明する本技術を適用することで、より簡便な方法で効率的に対処することができる。
<音響通信システムの構成>
図3は、本技術を適用した音響通信システムの一実施の形態の構成を示す図である。
図3は、本技術を適用した音響通信システムの一実施の形態の構成を示す図である。
音響通信システムは、送信側と受信側とから構成される。送信側は、音源111、音源112、集音部113、音源分離部115、および距離測定部114を含む。音源111や音源112は、人、スピーカなどであり、音を発するものである。集音部113は、マイクロフォンなどであり、音源111や音源112からの音を集音する。集音部113で集音された音は、音源分離部115に供給される。
音源分離部115は、例えば、図3に示したように、2つの音源111と音源112が存在していた場合、音源111からの音と音源112からの音を分離する。分離された音(音響信号)は、ネットワークなどを介して接続されている受信側に供給される。
距離測定部114は、音源と集音部13の距離を測定する。例えば、図3に示したように、2つの音源111と音源112が存在していた場合、音源111と集音部113の間の距離と、音源112と集音部113の間の距離を、それぞれ測定する。なお以下の説明においては、音源111と集音部113の間の距離を距離r1aとし、音源112と集音部113の間の距離を距離r1bとする。
距離測定部114で測定された距離(音源位置情報)は、音源分離部115からの音響信号とともに、受信側に供給される。ここでは、距離測定部114と音源分離部115を別体としているが、後述するように、1つの信号処理装置として構成しても良い。また集音部113も含めて、1つの信号処理装置としても良い。
受信側は、再生音源121、音圧補正部123、および距離測定部124を含む。再生音源121は、スピーカなどであり、送信側から送信されてきた音を再生する放音装置である。受聴者122は、再生音源121からの音を受聴する。
音圧補正部123は、送信側からの音響信号を処理する信号処理装置として機能する。音圧補正部123には、送信側の距離測定部114からの音源位置情報と音源分離部115からの音響信号が供給される。また音圧補正部123には、距離測定部124からの受聴位置情報も供給される。距離測定部124は、再生音源121と受聴者122との間の距離を測定する。ここでは、再生音源121と受聴者122との間の距離を距離r2とする。
音圧補正部123は、音源位置情報と受聴位置情報から、送信側の音源と、受聴者122が、同一空間内に存在したときの距離、例えば、図2に示したような状況下のときの音源と受聴者122との距離を算出し、そのような状況下で聞こえるであろう音圧で、音源からの音が受聴者122に供給されるように、供給された音響信号を補正する。具体的には、音響信号に、距離に応じた値を乗算することで、ゲインを補正する。
図3においても、図1に示した音響通信システムと同じく、送信側の集音部113と音源111は、1m(=r1a)離れているとする。また、送信側の集音部113と音源112は、6m(=r1b)離れているとする。また、受信側の再生音源121と受聴者122は、4m(=r2)離れているとする。
上記した臨場感を損なう要因を取り除くためには、送信側の装置において音源の位置を推定すると同時に、受信側の受聴者の位置も測定する必要がある。そこで、図3に示した音響通信システムにおいては、受信側において、距離測定部124を備え、再生音源121から受聴者122までの距離が測定され、その測定された距離も考慮して、音圧補正部123において音圧が補正される。
送信側の音源111または音源112と集音部113との距離を距離r1とし、受信側の再生音源121と受聴者122との距離を距離r2とした場合、音圧補正部123は、音源(音源111または音源112)に対応した音響信号を、(r1・r2)/(r1+r2)倍することで各音源間の音量差を復元することが出来る。なおr1は、図3における距離r1aまたは距離r1bである。
r1a=1m、r1b=6m、r2=4mである場合、音圧補正部123は、音源111からの音響信号を
(r1a・r2)/(r1a+r2)=1・4/(1+4)=-1.94dB
の音量調整を行い、音源112からの音響信号を
(r1b・r2)/(r1b+r2)=6・4/(6+4)=7.60dB
の音量調整を行う。
(r1a・r2)/(r1a+r2)=1・4/(1+4)=-1.94dB
の音量調整を行い、音源112からの音響信号を
(r1b・r2)/(r1b+r2)=6・4/(6+4)=7.60dB
の音量調整を行う。
このような音量調整(ゲインの補正)が行われることで、音源112からの音は、音源111からの音と相対的に、9.54(=7.60-(-1.94))dB増幅されて、再生音源121から再生され、放音される。
図1、図2を参照した説明において、音源11と音源12の音圧差は、図1に示した音響信号システムにおいては15.6dBであり、図2に示した状況下においては6dBであると説明した。この場合の図1に示した音響信号システムにおける音圧と、図2に示した同一空間で聞いたときの音圧の差分は、9.4(=15.4-6.0)dBである。
この差分(差分Aとする)を解消すれば、図2に示した同一空間で聞いたときの音圧差を、図1に示した音響信号システムにおいても復元できることになる。上記したような処理(ゲインの補正)を行うことで、上記した例では、音源112からの音は、音源111からの音と相対的に、9.54(=7.60-(-1.94))dB増幅された音とすることができるため、差分Aを解消することができる。
よって、音圧補正部123で、上記したように音圧を補正することで、上記の音源間の音量差関係の不一致や、移動音源や受聴者の移動前後の音量差関係の不一致が解消されるため、臨場感を向上させた音響を提供できるようになる。
図4は、本技術を適用した音響通信システムの他の実施の形態の構成を示す図である。
図4に示した音響通信システムにおいて、図3に示した音響通信システムと同一の部分に関しては、同一の符号を付し、適宜説明を省略する。図4に示した音響通信システムでは、受信側で行われていた音圧補正を、送信側で行う構成とされている。
すなわち、図4に示した音響通信システムの送信側は、図3に示した音響通信システムの送信側と比較して、音圧補正部201が追加された構成とされている点が異なり、他の部分は同一である。また図4に示した音響通信システムの受信側は、図3に示した音響通信システムの受信側と比較して、音圧補正部123(図3)が削除された構成とされている点が異なり、他の部分は同一である。
送信側に設けられた音圧補正部201は、音源分離部115で分離された音源111と音源112のそれぞれからの音響信号と、距離測定部114からの音源111と音源112のそれぞれの音源位置情報の供給を受ける。また音圧補正部201は、受信側に備えられている距離測定部124から、再生音源121と受聴者122との距離に関する受聴位置情報をネットワーク経由で受信する。
音圧補正部201は、上記した音圧補正部123と同じ処理を行うことで、音源111と音源112からの音響信号を、受聴者122と音源111、音源112との距離を考慮した音圧に補正し、音源間の音量差関係の不一致や、移動音源や受聴者の移動前後の音量差関係の不一致を解消した状態の音響信号を、受信側に供給する。
受信側は、既に音圧補正がされた音響信号を受信するため、再生音源121では、供給された音響信号を再生するだけで、上記したように、音源間の音量差関係の不一致や、移動音源や受聴者の移動前後の音量差関係の不一致を解消した状態で、受聴者22に音を供給することができる。
このように、図4に示した音響通信システムのように、送信側で音圧補正を完結させる構成としても良い。このような構成を取る場合、受信側から受聴位置情報が得られない場合に、ある既定の受聴位置を定めて音圧補正を行うと定めることで、受信側の機器が既存の音圧差補正を想定していないものだったとしても接続可能となる効果を得られる。
<音源分離部、距離測定部の構成>
図3または図4に示した音響通信システムにおける集音部113、距離測定部114、および音源分離部115の構成について説明する。
図3または図4に示した音響通信システムにおける集音部113、距離測定部114、および音源分離部115の構成について説明する。
図5は、集音部113、距離測定部114、および音源分離部115の構成を示す図である。図5に示した構成においては、距離の測定と音源の分離が同時に行われる。図5には、集音部113、距離測定部114、および音源分離部115で1つの信号処理装置を構成する場合の構成を示している。
図5に示した信号処理装置において、集音部113は、集音部113-1と集音部113-2から構成されている。集音部113-1と集音部113-2は、所定の距離を有した状態で配置されている。
また集音部113-1と集音部113-2は、それぞれ、例えば、横方向にマイクロフォンが複数配置されたマイクロフォンアレイで構成されている。以下の説明において、集音部113-1と集音部113-2を個々に区別する必要がない場合、単に集音部113と記述する。また、他の部分に関しても同様に記載する。
集音部113-1で集音された音は、方向別音分離部301-1に供給され、集音部113-2で集音された音は、方向別音分離部301-2に供給される。方向別音分離部301は、供給された音を、方向別に分離する。
集音部113をマイクロフォンアレイで構成し、そのマイクロフォンアレイを複数の部分に分割して処理を行う。方向別音分離部301は、複数の部分に分割されたマイクロフォンアレイのそれぞれの部分アレイに対して、例えば、MUSIC(Multiple signal classification)法に基づいて音源の方位を推定し、推定された方位別に音を分離する。
MUSIC法に関しては、下記文献に記載がある方法を適用することができる。
R.O.Schmidt, “Multiple emitter location and signal parameter estimation,” IEEE Trans. Antennas Propagation,vol.AP-34,no.3,pp.276~280,Mqrch 1986.
R.O.Schmidt, “Multiple emitter location and signal parameter estimation,” IEEE Trans. Antennas Propagation,vol.AP-34,no.3,pp.276~280,Mqrch 1986.
方向別音分離部301-1で方向別に分離された音響信号は、スイッチ302-1と相関計算部303に供給される。また方向別音分離部301-2で方向別に分離された音響信号は、スイッチ302-2と相関計算部303に供給される。
方向別音分離部301による処理で、音源の方向に関する情報も取得できる。方向別音分離部301-1で推定された方向に関する情報(方向情報)も、スイッチ302-1に供給される。また方向別音分離部301-2で推定された方向に関する情報も、スイッチ302-2に供給される。
相関計算部303は、分離された音響信号の各組み合わせに対して相互相関を計算し、相関の高い方向の音響信号には、同一音源の音が含まれていると判定する。スイッチ302-1とスイッチ302-2は、それぞれ相関計算部303の指示によりスイッチを切り換える。すなわち、相関の高いと判定された音響信号が、加算部304-1または加算部304-2に供給されるようにスイッチ302-1とスイッチ302-2のそれぞれはスイッチングを行う。
加算部304には、相関が高いと判定された音響信号が供給される。例えば、図5に示したように音源111と音源112からの音が、それぞれ集音部113で集音されている場合、加算部304-1に、集音部113-1で集音された音源111からの音響信号と集音部113-2で集音された音源111からの音響信号が供給される。加算部304-1は、供給された音響信号を加算平均して、受信側にネットワークを介して供給する。
同様に、加算部304-2に、集音部113-1で集音された音源112からの音響信号と集音部113-2で集音された音源112からの音響信号が供給される。加算部304-2は、供給された音響信号を加算平均して、受信側にネットワークを介して供給する。
なおここでは加算平均が行われるとして説明したが、他の計算により2以上の音響信号が合成されるようにしても良い。また、ここでは、加算部304を設け、加算平均されてから受信側に供給されるとしたが、加算部304を設けずに、スイッチ302でレベルの高い方の音響信号が選択され、受信側に供給されるようにしても良い。
スイッチ302には、方向別音分離部301から、方向情報も供給される。スイッチ302により選択された方向情報は、位置計算部305に供給される。例えば、スイッチ302-1により、音源111の方向情報が選択され、位置計算部305-1に供給された場合、スイッチ302-2からも、音源111の方向情報が選択され位置計算部305-1に供給される。また、このとき、スイッチ302-2により、音源112の方向情報が選択され、位置計算部305-2に供給され、スイッチ302-2により、音源112の方向情報が選択され位置計算部305-2に供給される。
この場合、集音部113-1の所定の部分のアレイ部(第1のアレイ部とする)で集音された音源111の音響信号が加算部304-1に供給され、第1のアレイ部に対する音源111の方向に関する方向情報が、位置計算部305-1に供給される。また、同様に、集音部113-2の所定の部分のアレイ部(第2のアレイ部とする)で集音された音源111の音響信号が加算部304-1に供給され、第2のアレイ部に対する音源111の方向に関する方向情報が、位置計算部305-1に供給される。
位置計算部305-1は、第1のアレイ部と第2のアレイ部との間の距離は予め取得済である。この距離、第1のアレイ部に対する音源111の方向に関する方向情報、および第2のアレイ部に対する音源111の方向に関する方向情報を用いて、例えば、三角測量の原理を用いることで、音源111までの距離を算出する。
位置計算部305-1により算出された音源111の位置情報は、加算部304-1から出力される音源111の音響信号と関連付けられて、受信側に供給される。
同様に、集音部113-1の所定の部分のアレイ部(第3のアレイ部とする)で集音された音源112の音響信号が加算部304-2に供給され、第3のアレイ部に対する音源112の方向に関する方向情報が、位置計算部305-2に供給される。また、同様に、集音部113-2の所定の部分のアレイ部(第4のアレイ部とする)で集音された音源112の音響信号が加算部304-2に供給され、第2のアレイ部に対する音源112の方向に関する方向情報が、位置計算部305-2に供給される。
位置計算部305-2は、第3のアレイ部と第4のアレイ部との間の距離は予め取得済である。この距離、第3のアレイ部に対する音源112の方向に関する方向情報、および第4のアレイ部に対する音源112の方向に関する方向情報を用いて、例えば、三角測量の原理を用いることで、音源112までの距離を算出する。
位置計算部305-2により算出された音源112の位置情報は、加算部304-2から出力される音源112の音響信号と関連付けられて、受信側に供給される。
このようにして、音源111からの音響信号と、音源111と集音部113の距離が、それぞれ取得され、関連付けられて、受信側に供給される。また音源112からの音響信号と、音源112と集音部113の距離が、それぞれ取得され、関連付けられて、受信側に供給される。
なおここでは、2つの音源に対する処理を例に挙げて説明したが、2以上の音源に対しても同様に処理することで、それぞれの音源からの音響信号と距離が算出され、それぞれ関連付けられて受信側に供給される。
ここでは、図5に示した構成を例に挙げ、距離と音響信号が取得される場合の集音部113、距離測定部114、および音源分離部115の構成および動作について説明したが、他の構成や他の方法により、距離や音響信号が取得されるようにしても良い。
例えば、送信側において、発話者や発音体の数(音源の数)が予めわかっている場合、その数分だけ、集音部113のアレイ部を分割し、処理が行われるようにしても良い。
また、それぞれの音源に、ピンマイクなどと称されるマイクロフォンを装着し、音源に近接して集音できるようにした場合、それぞれの音源に近接した集音部113により、それぞれの音源から音響信号を取得することができる。よって、集音部113で取得された音を、音源別に分離するという処理を省略することができる。この場合、集音部113は、マイクロフォンアレイで構成されるのではなく、ピンマイクなどの複数のマイクロフォンで構成される。
また、音源の位置は、例えば、事前に集音部113の設置位置が決まっている場合には、その設置位置が取得されるようにしても良い。例えば、ユーザにより事前入力された位置情報が用いられるようにしても良い。
また、図5に示した例では、MUSIC法や三角測量を用いて音源までの距離が算出される例を示したが、他の方法、例えば、画像解析や電波的な測位手段等を用いて距離が算出されるようにしても良い。
例えば、集音部113に近い位置に、音源111や音源112を撮像する撮像装置が設置され、その撮像装置により撮像された画像が解析されることにより、音源111や音源112までの距離が推定されるようにしても良い。
また、GPS(Global Positioning System)などの電波的な測位手段により音源の位置が特定され、集音部113から音源までの距離が推定されるようにしても良い。また、赤外線などの電波を用いて、対象物(音源)までの距離が測定されるようにしても良い。
ところで、上記したピンマイクなど、音源に近接した位置に設置され、音源からの音を集音する装置を用いた場合(近接集音の場合)、集音部と音源との位置関係は、どの集音部と音源においてもほぼ同一となる。
図3(または図5)を参照して説明したように、集音部113と音源111の距離と、集音部113と音源112の距離が異なる場合、音圧補正部123(または音圧補正部201)では、その距離を用いて、音圧を補正するが、近接集音の場合、上記したように、同一の距離となってしまう可能性がある。
そこで、近接集音の場合、所定の位置を集音位置として仮定し、その仮定した集音位置からそれぞれの音源の距離が算出され、それぞれの音源からの音の音圧が制御されるようにしても良い。例えば、カメラなどで映像を撮影しながら対話を行うようなテレビ電話などと称されるシステムの場合、近接集音のときには、カメラから各音源の距離が算出され、それぞれの音源からの音の音圧が制御されるようにしても良い。
また、近接集音の場合、音響信号を受信側に送出する前に、得られた位置情報を元に送信側の基準位置(例えば、映像を伴う場合はカメラの位置など)まで音が伝搬する際に受けるであろう減衰量を掛けておく。このようにしておくことで、受信側では、上記したマイクロフォンアレイを用いた場合と近接集音の場合とを区別することなく、同一の処理を行うことで、音源間の音圧差関係を補正、復元することが可能である。
また、受信側で上記したマイクロフォンアレイを用いた場合と近接集音の場合とを区別することなく処理を行うことが出来るようにすることで、マイクロフォンアレイを用いた場合の方を、近接集音の場合の方に合わせる事でも享受可能である。
すなわち、マイクロフォンアレイを用いて分離、集音した後の音響信号に対して、音源からマイクロフォンアレイの中心位置まで伝搬する間に受けた減衰量を打ち消すゲインを掛けて送出することで、近接集音の場合の音を、そのまま送った場合と区別することなく受信側で音源間の音圧差関係を補正、復元することが可能となる。
このように、送信側、換言すれば、音を集音する側では、音を集音し、音源までの距離が測定される。次に、音響信号と距離を取得し、処理する音圧補正部の構成と動作について説明する。
<音圧補正部の構成、動作>
図6は、音圧補正部123(図3)の構成を示す図である。図4に示した音圧補正部201も、図6に示した音圧補正部123と基本的に同様の構成となるため、ここでは、音圧補正部123を例に挙げて説明する。
図6は、音圧補正部123(図3)の構成を示す図である。図4に示した音圧補正部201も、図6に示した音圧補正部123と基本的に同様の構成となるため、ここでは、音圧補正部123を例に挙げて説明する。
音圧補正部123は、乗算器401-1、乗算器402-1、加算部403-1、除算部404-1、乗算器401-2、乗算器402-2、加算部403-2、除算部404-2、加算部405、および乗算部406を含む構成とされている。また、距離測定部124からの受聴位置情報を入力する入力部407も含む。
送信側から供給される音響信号を、音響入力信号x1a、音響入力信号x1bとする。また、送信側から供給される音源位置情報のうち、音響入力信号x1aに関連付けられている音源位置情報を、音源位置情報r1aとし、音響入力信号x1bに関連付けられている音源位置情報を、音源位置情報r1bとする。また、受聴者122の位置情報を、受聴位置情報r2とする。
乗算器401-1には、音響入力信号x1aと音源位置情報r1aが供給される。乗算器401-1は、供給された音響入力信号x1aと音源位置情報r1aを乗算し、乗算部402-1に供給する。乗算部402-1には、受聴位置情報r2も供給される。乗算部402-1は、乗算器401-1からの(音響入力信号x1a×音源位置情報r1a)に、受聴位置情報r2を乗算する。
ここまでの処理で、
(音響入力信号x1a×音源位置情報r1a)×受聴位置情報r2
=(x1a×r1a×r2)=a
が算出される。この値を、図6ではaとして表している。
(音響入力信号x1a×音源位置情報r1a)×受聴位置情報r2
=(x1a×r1a×r2)=a
が算出される。この値を、図6ではaとして表している。
加算部403-1には、音源位置情報r1aと受聴位置情報r2が供給される。加算部403-1は、供給された音源位置情報r1aと受聴位置情報r2を加算する。
(音源位置情報r1a+受聴位置情報r2)=(r1a+r2)=b
(音源位置情報r1a+受聴位置情報r2)=(r1a+r2)=b
除算部404-1には、乗算部402-1からの値aと、加算部403-1からの値bが供給される。除算部404-1は、値aを値bで除算する。
a/b
=((音響入力信号x1a×音源位置情報r1a)×受聴位置情報r2)
/(音源位置情報r1a+受聴位置情報r2)
=(x1a×r1a×r2)/(r1a+r2)
=x1a×((r1a×r2)/(r1a+r2))
この値を値cとする。値cは、例えば、音圧補正後の音源111からの音響信号である。
a/b
=((音響入力信号x1a×音源位置情報r1a)×受聴位置情報r2)
/(音源位置情報r1a+受聴位置情報r2)
=(x1a×r1a×r2)/(r1a+r2)
=x1a×((r1a×r2)/(r1a+r2))
この値を値cとする。値cは、例えば、音圧補正後の音源111からの音響信号である。
ここまでの計算により、音響入力信号x1aを((r1a・r2)/(r1a+r2))倍した値(音響信号)が算出される。
乗算器401-2、乗算器402-2、加算部403-2、除算部404-2においても、音響入力信号x1b、音源位置情報r1b、および受聴位置情報r2に対して、同様の処理が行われることで、音響入力信号x1bを((r1b・r2)/(r1b+r2))倍した値(音響信号)が算出される。
a’/b’=x1b×((r1b・r2)/(r1b+r2))
この値を値dとする。値dは、例えば、音圧補正後の音源112からの音響信号である。
a’/b’=x1b×((r1b・r2)/(r1b+r2))
この値を値dとする。値dは、例えば、音圧補正後の音源112からの音響信号である。
加算部405には、除算部404-1から値cが供給され、除算部404-2から値dが供給される。加算部405は、供給された値cと値dを加算(合成)する。すなわち、加算部405において、異なる音源からの音圧補正後の音響信号が1つの音響信号へと合成される。加算部405からの出力を、値eとする。
加算部405からの値eは、乗算部406に供給される。乗算部406には、音量調整係数αも供給される。音量調整係数αは、例えば、受聴者122が指示した音量であるようにすることができる。乗算部406は、値eに音量調整係数αを乗算し、音響出力信号yを、再生音源121(図3)に出力する。
この音響出力信号yは、音圧補正後の音響信号であり、音源間の音量差関係の不一致や、移動音源や受聴者の移動前後の音量差関係の不一致が解消された音響信号である。
上記した実施の形態においては、受信側で受聴者122は、スピーカなどの再生音源121から距離r2だけ離れた位置で、1人で受聴している場合を例に挙げて説明した。受信側の実施例は、音の再生装置にスピーカを用いる場合とヘッドホン・イヤホンを用いる場合とが考えられる。また、受聴者122も、1人の場合もあるが、複数人の場合もある。
図3や図4を参照して説明したように、単数のスピーカを用いた場合、上記したような処理で音量差関係を正しく復元して聴取させる事ができる受聴者は1名である。しかしながら、実際の使用の際には受聴者は1名とは限らず、複数人で受聴している場合も想定すべきである。
そこで、再生音源121と受聴者122の距離r2を以下のように設定する。ここでは、受聴距離r2の設定基準として、以下の3基準を例に挙げる。基準1、基準2に関しては、図7を参照して説明する。
基準1:受聴者の平均位置を用いる(平均距離)
基準2:最も近い距離にいる受聴者の位置を用いる(最近接距離)
基準3:受聴者の位置推定を行わず、予め設定した固定の距離を用いる(固定値)
基準2:最も近い距離にいる受聴者の位置を用いる(最近接距離)
基準3:受聴者の位置推定を行わず、予め設定した固定の距離を用いる(固定値)
図7を参照するに、再生音源121からの音を、3人の受聴者122-1乃至122-3が受聴する場合を考える。基準1で距離r2を設定する場合、受聴者122-1と再生音源121との距離、受聴者122-2と再生音源121との距離、および受聴者122-3と再生音源121との距離が、それぞれ測定(取得)され、平均値が算出され、その平均値が距離r2とされる。
基準2で距離r2を設定する場合、再生音源121から最も近い位置に居る受聴者122と再生音源121の距離が、距離r2とされる。図7の場合、受聴者122-1と再生音源121との距離が、距離r2とされる。
基準3で距離r2を設定する場合、予め設定されている固定の値が、受聴者122と再生音源121との距離r2として設定される。
基準1で距離r2を設定するようにした場合、受聴時の状況に応じた音圧補正が、他の基準に比べてより的確に行えるため、受聴者122-1乃至122-3のそれぞれの受聴者に、音源間の音量差関係の不一致や、移動音源や受聴者の移動前後の音量差関係の不一致が解消された音響信号を提供することができる。
基準2で距離r2を設定するようにした場合、他の基準に比べて安全に距離を設定できる。上記したように、音圧補正部123においては、音源に対応した音響信号を、(r1・r2)/(r1+r2)倍することで音圧を補正する。この式から、距離r2が大きい程、補正量が大きくなることがわかる。
仮に、図7に示したような状況下において、再生音源121から最も遠い受聴者122-2と再生音源121との距離を、距離r2とした場合、音圧補正部123での補正量が大きくなる。この場合、補正された音響信号が大きな音になってしまう可能性がある。換言すれば、過大なゲインをかけてしまうことになる。
このようなことを防ぐために、再生音源121に最も近い位置に居る受聴者と、再生音源121までの距離を、距離r2とする。基準2で距離r2を設定するようにした場合も、音源間の音量差関係の不一致や、移動音源や受聴者の移動前後の音量差関係の不一致が解消された音響信号を提供することができる。
基準3によると、距離測定部124(図3、図4)で距離を測定しなくても良い構成となる。よって、基準3により距離r2を設定するようにした場合、受信側に距離測定部124がないような場合にも、音源間の音量差関係の不一致や、移動音源や受聴者の移動前後の音量差関係の不一致が解消された音響信号を提供することができる。
また、基準3は、例えば、受聴者122がソファに並んで座るなど、受聴位置がある程度固定されている場合に適用することができる。すなわち、このような場合、ソファの位置が変わらなければ、受聴者122と再生音源121との距離に変化は少なく、距離r2を固定値とし、その距離r2を、ソファと再生音源121との距離とすることができる。
ここでは、基準1乃至3を例に挙げて説明したが、他の基準を設けて、再生音源121と受聴者122との距離が設定されるようにした場合も、本技術を適用できる。
上記したように、受信側で、単数のスピーカ(再生音源121)を用いることで、例えば、双方向通信を行うために必要となるエコーキャンセラーの実現が容易になるという利点もある。双方向通信においてスピーカから発せられた音が同じ側にあるマイクロフォンで拾われて、再度相手側に送出されるエコーを除去するエコーキャンセラーは、マイクフォン・スピーカの数が少数であるならば比較的容易に実現可能である。
しかしながら、例えば、波面合成で使われるような規模のマイクフォン・スピーカ数ではその組み合わせの数それぞれについてエコーキャンセラーを用意する必要が有ることから容易には実現出来ない。
上記した本実施の形態によれば、スピーカ数が1つでも音源間の音圧差関係を保つことが出来るため、エコーキャンセラーは、たかだかマイクフォン数程度に抑えられる上、方向別の音を分離する際に指向性を調節してスピーカのある方向の感度を下げることでエコーの影響を減らすことができる。
なお、上記した実施の形態においては、一方向の通信(送信側から受信側)を例に挙げて説明したが、本技術は、双方向の通信に対しても適用できる。
<補正対象の音響信号について>
上記した実施の形態においては、テレビ電話やテレビ会議などと称される音響通信システムを例に挙げて説明したが、本技術は、そのようなテレプレゼンス技術以外にも適用可能である。
上記した実施の形態においては、テレビ電話やテレビ会議などと称される音響通信システムを例に挙げて説明したが、本技術は、そのようなテレプレゼンス技術以外にも適用可能である。
テレプレゼンスの送信側のように、音響信号に位置情報を関連付けて記録したり、配信したりする技術があるが、記録または配信される音響信号と位置情報が関連付けられた情報を取得するような場合も本技術を適用できる。
音響信号に位置情報を関連付けて記録したり、配信したりする技術としては、例えば、映画業界で普及が進んでいるDolby ATOMS(商標)や現在策定中のMPEG 3Dなど、オブジェクトオーディオと総称される従来のサラウンド以上の表現を可能とする技術が開発されている。
通常、これらのコンテンツは、サウンドエンジニアが想定した受聴位置で意図した通りに聞こえるように、個々の音量が調整されている。そのような調整済のコンテンツに対して、上記した補正を行うことで、受聴者の受聴位置により適した音響に補正することが可能となり、より臨場感を高めることが可能となる。
本技術によれば、音源間の音圧差関係を復元することで、送信側と受信側にいる人の間での音の認知の不自然な相違を低減することが可能となり、より臨場感が得られるようになる。
また本技術によれば、送信側に音源が一つしか存在しない場合でも、その音源が移動する場合や受聴者が移動する場合に移動前と移動後の音圧差関係が保たれることにより受信側で知覚される音源の移動感が正しく保たれるようになり、より臨場感が得られるようになる。
また本技術によれば、波面合成のように多数のスピーカを必要としないことから幅広いユーザにコストを抑えながら導入させることが可能となる。
また、本技術によれば、送信側で音圧を補正する場合、受信側の既存の音響通信システムであったとしても、音響通信を行い、臨場感を高めた音響効果を提供することが可能となる。
<記録媒体について>
上述した一連の処理は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。
上述した一連の処理は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。
図8は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。コンピュータにおいて、CPU(Central Processing Unit)1001、ROM(Read Only Memory)1002、RAM(Random Access Memory)1003は、バス1004により相互に接続されている。バス1004には、さらに、入出力インタフェース1005が接続されている。入出力インタフェース1005には、入力部1006、出力部1007、記憶部1008、通信部1009、及びドライブ1010が接続されている。
入力部1006は、キーボード、マウス、マイクロフォンなどよりなる。出力部1007は、ディスプレイ、スピーカなどよりなる。記憶部1008は、ハードディスクや不揮発性のメモリなどよりなる。通信部1009は、ネットワークインタフェースなどよりなる。ドライブ1010は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブルメディア1011を駆動する。
以上のように構成されるコンピュータでは、CPU1001が、例えば、記憶部1008に記憶されているプログラムを、入出力インタフェース1005及びバス1004を介して、RAM1003にロードして実行することにより、上述した一連の処理が行われる。
コンピュータ(CPU1001)が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア1011に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。
コンピュータでは、プログラムは、リムーバブルメディア1011をドライブ1010に装着することにより、入出力インタフェース1005を介して、記憶部1008にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部1009で受信し、記憶部1008にインストールすることができる。その他、プログラムは、ROM1002や記憶部1008に、あらかじめインストールしておくことができる。
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
また、本明細書において、システムとは、複数の装置により構成される装置全体を表すものである。
なお、本明細書に記載された効果はあくまで例示であって限定されるものでは無く、また他の効果があってもよい。
なお、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
なお、本技術は以下のような構成も取ることができる。
(1)
音響信号を取得する音響信号取得部と、
音源と、前記音源からの音を集音する集音部までの距離に関する音源位置情報を取得する音源位置情報取得部と、
前記音響信号を再生する再生装置と、前記再生装置で再生された音を受聴する受聴者との距離に関する受聴位置情報を取得する受聴位置情報取得部と、
前記音源位置情報と前記受聴位置情報に基づいて、前記音響信号のゲインを補正する補正部と
を備える信号処理装置。
(2)
前記補正部は、前記音響信号のゲインを補正することで、複数の音源間の音圧差関係を復元する
前記(1)に記載の信号処理装置。
(3)
前記補正部は、前記音源位置情報が示す距離が距離r1であり、前記受聴位置情報が示す距離が距離r2である場合、前記音響信号に(r1・r2)/(r1+r2)を乗算する
前記(1)または(2)に記載の信号処理装置。
(4)
前記受聴位置情報が示す距離は、固定値である
前記(1)乃至(3)のいずれかに記載の信号処理装置。
(5)
前記音響信号取得部は、ネットワークを介して前記音響信号を取得し、
前記音源位置情報取得部は、ネットワークを介して前記音源位置情報を取得する
前記(1)乃至(4)のいずれかに記載の信号処理装置。
(6)
前記受聴位置情報取得部は、ネットワークを介して前記受聴位置情報を取得する
前記(1)乃至(4)のいずれかに記載の信号処理装置。
(7)
複数の受聴者がいた場合、前記受聴位置情報は、前記複数の受聴者のそれぞれと前記再生装置との距離の平均値、前記複数の受聴者のうちの前記再生装置に最も近い位置に居る受聴者までの距離、または固定値とされる
前記(1)乃至(6)のいずれかに記載の信号処理装置。
(8)
音響信号を取得し、
音源と、前記音源からの音を集音する集音部までの距離に関する音源位置情報を取得し、
前記音響信号を再生する再生装置と、前記再生装置で再生された音を受聴する受聴者との距離に関する受聴位置情報を取得し、
前記音源位置情報と前記受聴位置情報に基づいて、前記音響信号のゲインを補正する
ステップを含む信号処理方法。
(9)
音響信号を取得し、
音源と、前記音源からの音を集音する集音部までの距離に関する音源位置情報を取得し、
前記音響信号を再生する再生装置と、前記再生装置で再生された音を受聴する受聴者との距離に関する受聴位置情報を取得し、
前記音源位置情報と前記受聴位置情報に基づいて、前記音響信号のゲインを補正する
ステップを含む処理をコンピュータに実行させるためのプログラム。
(10)
音源からの音を集音する集音部と、
前記音源と前記集音部との間の距離を測定する距離測定部と、
前記集音部で集音された前記音の音響信号を再生する再生装置と、前記再生装置で再生された音を受聴する受聴者との距離に関する受聴位置情報を取得する受聴位置情報取得部と、
前記距離測定部で測定された距離と前記受聴位置情報が示す距離に基づいて、前記音響信号のゲインを補正する補正部と
を備える信号処理装置。
(11)
前記補正部で補正された前記音響信号を、前記再生装置に供給する
前記(10)に記載の信号処理装置。
(12)
前記集音部は、マイクロフォンアレイで構成され、
前記距離測定部は、前記マイクロフォンアレイで集音された音同士の相互相関を計算し、相関の高い音を集音したマイクロフォン同士の距離を用いて、前記音源までの距離を測定する
前記(10)または(11)に記載の信号処理装置。
(13)
前記距離測定部は、音源を撮像した画像を解析して音源までの距離を測定する
前記(10)または(11)に記載の信号処理装置。
(14)
前記距離測定部は、GPSを用いて前記音源と前記集音部との間の距離を測定する
前記(10)または(11)に記載の信号処理装置。
(15)
前記集音部は、音源に近接して集音するマイクロフォンで構成され、
前記距離測定部は、所定の位置を基準とし、前記所定の位置と前記マイクロフォンとの間の距離を測定する
前記(10)または(11)に記載の信号処理装置。
(16)
音源からの音を集音し、
前記音源と前記音を集音する集音部との間の距離を測定し、
集音された前記音の音響信号を再生する再生装置と、前記再生装置で再生された音を受聴する受聴者との距離に関する受聴位置情報を取得し、
測定された前記距離と前記受聴位置情報が示す距離に基づいて、前記音響信号のゲインを補正する
ステップを含む信号処理方法。
(17)
音源からの音を集音し、
前記音源と前記音を集音する集音部との間の距離を測定し、
集音された前記音の音響信号を再生する再生装置と、前記再生装置で再生された音を受聴する受聴者との距離に関する受聴位置情報を取得し、
測定された前記距離と前記受聴位置情報が示す距離に基づいて、前記音響信号のゲインを補正する
ステップを含む処理をコンピュータに実行させるためのプログラム。
(1)
音響信号を取得する音響信号取得部と、
音源と、前記音源からの音を集音する集音部までの距離に関する音源位置情報を取得する音源位置情報取得部と、
前記音響信号を再生する再生装置と、前記再生装置で再生された音を受聴する受聴者との距離に関する受聴位置情報を取得する受聴位置情報取得部と、
前記音源位置情報と前記受聴位置情報に基づいて、前記音響信号のゲインを補正する補正部と
を備える信号処理装置。
(2)
前記補正部は、前記音響信号のゲインを補正することで、複数の音源間の音圧差関係を復元する
前記(1)に記載の信号処理装置。
(3)
前記補正部は、前記音源位置情報が示す距離が距離r1であり、前記受聴位置情報が示す距離が距離r2である場合、前記音響信号に(r1・r2)/(r1+r2)を乗算する
前記(1)または(2)に記載の信号処理装置。
(4)
前記受聴位置情報が示す距離は、固定値である
前記(1)乃至(3)のいずれかに記載の信号処理装置。
(5)
前記音響信号取得部は、ネットワークを介して前記音響信号を取得し、
前記音源位置情報取得部は、ネットワークを介して前記音源位置情報を取得する
前記(1)乃至(4)のいずれかに記載の信号処理装置。
(6)
前記受聴位置情報取得部は、ネットワークを介して前記受聴位置情報を取得する
前記(1)乃至(4)のいずれかに記載の信号処理装置。
(7)
複数の受聴者がいた場合、前記受聴位置情報は、前記複数の受聴者のそれぞれと前記再生装置との距離の平均値、前記複数の受聴者のうちの前記再生装置に最も近い位置に居る受聴者までの距離、または固定値とされる
前記(1)乃至(6)のいずれかに記載の信号処理装置。
(8)
音響信号を取得し、
音源と、前記音源からの音を集音する集音部までの距離に関する音源位置情報を取得し、
前記音響信号を再生する再生装置と、前記再生装置で再生された音を受聴する受聴者との距離に関する受聴位置情報を取得し、
前記音源位置情報と前記受聴位置情報に基づいて、前記音響信号のゲインを補正する
ステップを含む信号処理方法。
(9)
音響信号を取得し、
音源と、前記音源からの音を集音する集音部までの距離に関する音源位置情報を取得し、
前記音響信号を再生する再生装置と、前記再生装置で再生された音を受聴する受聴者との距離に関する受聴位置情報を取得し、
前記音源位置情報と前記受聴位置情報に基づいて、前記音響信号のゲインを補正する
ステップを含む処理をコンピュータに実行させるためのプログラム。
(10)
音源からの音を集音する集音部と、
前記音源と前記集音部との間の距離を測定する距離測定部と、
前記集音部で集音された前記音の音響信号を再生する再生装置と、前記再生装置で再生された音を受聴する受聴者との距離に関する受聴位置情報を取得する受聴位置情報取得部と、
前記距離測定部で測定された距離と前記受聴位置情報が示す距離に基づいて、前記音響信号のゲインを補正する補正部と
を備える信号処理装置。
(11)
前記補正部で補正された前記音響信号を、前記再生装置に供給する
前記(10)に記載の信号処理装置。
(12)
前記集音部は、マイクロフォンアレイで構成され、
前記距離測定部は、前記マイクロフォンアレイで集音された音同士の相互相関を計算し、相関の高い音を集音したマイクロフォン同士の距離を用いて、前記音源までの距離を測定する
前記(10)または(11)に記載の信号処理装置。
(13)
前記距離測定部は、音源を撮像した画像を解析して音源までの距離を測定する
前記(10)または(11)に記載の信号処理装置。
(14)
前記距離測定部は、GPSを用いて前記音源と前記集音部との間の距離を測定する
前記(10)または(11)に記載の信号処理装置。
(15)
前記集音部は、音源に近接して集音するマイクロフォンで構成され、
前記距離測定部は、所定の位置を基準とし、前記所定の位置と前記マイクロフォンとの間の距離を測定する
前記(10)または(11)に記載の信号処理装置。
(16)
音源からの音を集音し、
前記音源と前記音を集音する集音部との間の距離を測定し、
集音された前記音の音響信号を再生する再生装置と、前記再生装置で再生された音を受聴する受聴者との距離に関する受聴位置情報を取得し、
測定された前記距離と前記受聴位置情報が示す距離に基づいて、前記音響信号のゲインを補正する
ステップを含む信号処理方法。
(17)
音源からの音を集音し、
前記音源と前記音を集音する集音部との間の距離を測定し、
集音された前記音の音響信号を再生する再生装置と、前記再生装置で再生された音を受聴する受聴者との距離に関する受聴位置情報を取得し、
測定された前記距離と前記受聴位置情報が示す距離に基づいて、前記音響信号のゲインを補正する
ステップを含む処理をコンピュータに実行させるためのプログラム。
111,112 音源, 113 集音部, 114 距離測定部, 115 音源分離部, 121 再生音源, 122 受聴者, 123 音圧補正部, 124 距離測定部, 201 音圧補正部, 301 方向別音分離部, 302 スイッチ, 303 相関計算部, 304 加算部, 305 位置計算部, 401,402 乗算部, 403 加算部, 404 除算部, 405 加算部, 406 乗算部, 407 入力部
Claims (17)
- 音響信号を取得する音響信号取得部と、
音源と、前記音源からの音を集音する集音部までの距離に関する音源位置情報を取得する音源位置情報取得部と、
前記音響信号を再生する再生装置と、前記再生装置で再生された音を受聴する受聴者との距離に関する受聴位置情報を取得する受聴位置情報取得部と、
前記音源位置情報と前記受聴位置情報に基づいて、前記音響信号のゲインを補正する補正部と
を備える信号処理装置。 - 前記補正部は、前記音響信号のゲインを補正することで、複数の音源間の音圧差関係を復元する
請求項1に記載の信号処理装置。 - 前記補正部は、前記音源位置情報が示す距離が距離r1であり、前記受聴位置情報が示す距離が距離r2である場合、前記音響信号に(r1・r2)/(r1+r2)を乗算する
請求項1に記載の信号処理装置。 - 前記受聴位置情報が示す距離は、固定値である
請求項1に記載の信号処理装置。 - 前記音響信号取得部は、ネットワークを介して前記音響信号を取得し、
前記音源位置情報取得部は、ネットワークを介して前記音源位置情報を取得する
請求項1に記載の信号処理装置。 - 前記受聴位置情報取得部は、ネットワークを介して前記受聴位置情報を取得する
請求項1に記載の信号処理装置。 - 複数の受聴者がいた場合、前記受聴位置情報は、前記複数の受聴者のそれぞれと前記再生装置との距離の平均値、前記複数の受聴者のうちの前記再生装置に最も近い位置に居る受聴者までの距離、または固定値とされる
請求項1に記載の信号処理装置。 - 音響信号を取得し、
音源と、前記音源からの音を集音する集音部までの距離に関する音源位置情報を取得し、
前記音響信号を再生する再生装置と、前記再生装置で再生された音を受聴する受聴者との距離に関する受聴位置情報を取得し、
前記音源位置情報と前記受聴位置情報に基づいて、前記音響信号のゲインを補正する
ステップを含む信号処理方法。 - 音響信号を取得し、
音源と、前記音源からの音を集音する集音部までの距離に関する音源位置情報を取得し、
前記音響信号を再生する再生装置と、前記再生装置で再生された音を受聴する受聴者との距離に関する受聴位置情報を取得し、
前記音源位置情報と前記受聴位置情報に基づいて、前記音響信号のゲインを補正する
ステップを含む処理をコンピュータに実行させるためのプログラム。 - 音源からの音を集音する集音部と、
前記音源と前記集音部との間の距離を測定する距離測定部と、
前記集音部で集音された前記音の音響信号を再生する再生装置と、前記再生装置で再生された音を受聴する受聴者との距離に関する受聴位置情報を取得する受聴位置情報取得部と、
前記距離測定部で測定された距離と前記受聴位置情報が示す距離に基づいて、前記音響信号のゲインを補正する補正部と
を備える信号処理装置。 - 前記補正部で補正された前記音響信号を、前記再生装置に供給する
請求項10に記載の信号処理装置。 - 前記集音部は、マイクロフォンアレイで構成され、
前記距離測定部は、前記マイクロフォンアレイで集音された音同士の相互相関を計算し、相関の高い音を集音したマイクロフォン同士の距離を用いて、前記音源までの距離を測定する
請求項10に記載の信号処理装置。 - 前記距離測定部は、音源を撮像した画像を解析して音源までの距離を測定する
請求項10に記載の信号処理装置。 - 前記距離測定部は、GPSを用いて前記音源と前記集音部との間の距離を測定する
請求項10に記載の信号処理装置。 - 前記集音部は、音源に近接して集音するマイクロフォンで構成され、
前記距離測定部は、所定の位置を基準とし、前記所定の位置と前記マイクロフォンとの間の距離を測定する
請求項10に記載の信号処理装置。 - 音源からの音を集音し、
前記音源と前記音を集音する集音部との間の距離を測定し、
集音された前記音の音響信号を再生する再生装置と、前記再生装置で再生された音を受聴する受聴者との距離に関する受聴位置情報を取得し、
測定された前記距離と前記受聴位置情報が示す距離に基づいて、前記音響信号のゲインを補正する
ステップを含む信号処理方法。 - 音源からの音を集音し、
前記音源と前記音を集音する集音部との間の距離を測定し、
集音された前記音の音響信号を再生する再生装置と、前記再生装置で再生された音を受聴する受聴者との距離に関する受聴位置情報を取得し、
測定された前記距離と前記受聴位置情報が示す距離に基づいて、前記音響信号のゲインを補正する
ステップを含む処理をコンピュータに実行させるためのプログラム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017547719A JP6834971B2 (ja) | 2015-10-26 | 2016-10-12 | 信号処理装置、信号処理方法、並びにプログラム |
CN201680061242.9A CN108141665A (zh) | 2015-10-26 | 2016-10-12 | 信号处理装置、信号处理方法和程序 |
US15/769,503 US10425726B2 (en) | 2015-10-26 | 2016-10-12 | Signal processing device, signal processing method, and program |
EP16859560.1A EP3370437A4 (en) | 2015-10-26 | 2016-10-12 | Signal processing device, signal processing method, and program |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015-209551 | 2015-10-26 | ||
JP2015209551 | 2015-10-26 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2017073324A1 true WO2017073324A1 (ja) | 2017-05-04 |
Family
ID=58631544
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2016/080222 WO2017073324A1 (ja) | 2015-10-26 | 2016-10-12 | 信号処理装置、信号処理方法、並びにプログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US10425726B2 (ja) |
EP (1) | EP3370437A4 (ja) |
JP (1) | JP6834971B2 (ja) |
CN (1) | CN108141665A (ja) |
WO (1) | WO2017073324A1 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018234626A1 (en) * | 2017-06-23 | 2018-12-27 | Nokia Technologies Oy | DISTANCE ESTIMATION UNTIL SOURCE SOUND |
WO2018234628A1 (en) | 2017-06-23 | 2018-12-27 | Nokia Technologies Oy | AUDIO DISTANCE ESTIMATING FOR SPATIAL AUDIO PROCESSING |
WO2019012587A1 (ja) * | 2017-07-10 | 2019-01-17 | ヤマハ株式会社 | ゲイン調整装置、遠隔会話装置、ゲイン調整方法、およびゲイン調整プログラム |
WO2021220665A1 (ja) * | 2020-05-01 | 2021-11-04 | tonari株式会社 | 仮想的空間接続装置 |
US11284211B2 (en) | 2017-06-23 | 2022-03-22 | Nokia Technologies Oy | Determination of targeted spatial audio parameters and associated spatial audio playback |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107643509B (zh) * | 2016-07-22 | 2019-01-11 | 腾讯科技(深圳)有限公司 | 定位方法、定位系统及终端设备 |
JP7234555B2 (ja) * | 2018-09-26 | 2023-03-08 | ソニーグループ株式会社 | 情報処理装置、および情報処理方法、プログラム、情報処理システム |
JP7363795B2 (ja) | 2018-09-28 | 2023-10-18 | ソニーグループ株式会社 | 情報処理装置および方法、並びにプログラム |
CN112672251B (zh) * | 2020-12-25 | 2024-04-12 | 通力科技股份有限公司 | 一种扬声器的控制方法和系统、存储介质及扬声器 |
CN113138363A (zh) * | 2021-04-22 | 2021-07-20 | 苏州臻迪智能科技有限公司 | 一种声源定位方法、装置、存储介质和电子设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07193798A (ja) * | 1993-12-27 | 1995-07-28 | Hitachi Ltd | 映像音響通信装置 |
WO2001099469A1 (fr) * | 2000-06-22 | 2001-12-27 | Mitsubishi Denki Kabushiki Kaisha | Systeme de reproduction de la parole, systeme de generation de signaux vocaux et systeme d'appel |
JP2008017126A (ja) * | 2006-07-05 | 2008-01-24 | Yamaha Corp | 音声会議システム |
JP2009246528A (ja) * | 2008-03-28 | 2009-10-22 | Nec Corp | 画像付音声通信システム、画像付音声通信方法およびプログラム |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7012630B2 (en) * | 1996-02-08 | 2006-03-14 | Verizon Services Corp. | Spatial sound conference system and apparatus |
US20020009788A1 (en) * | 2000-07-05 | 2002-01-24 | Bristow Cynthia L. | Modulation of plasma membrane human leukocyte elastase |
US7039198B2 (en) * | 2000-11-10 | 2006-05-02 | Quindi | Acoustic source localization system and method |
JP4518729B2 (ja) | 2002-03-07 | 2010-08-04 | ソニー株式会社 | 画像音響提示システムと方法並びにコンピュータ読み取り可能な記録媒体と画像音響提示プログラム |
CN100534001C (zh) * | 2003-02-07 | 2009-08-26 | 日本电信电话株式会社 | 声音获取方法和声音获取装置 |
US20050147261A1 (en) * | 2003-12-30 | 2005-07-07 | Chiang Yeh | Head relational transfer function virtualizer |
JP4580210B2 (ja) * | 2004-10-19 | 2010-11-10 | ソニー株式会社 | 音声信号処理装置および音声信号処理方法 |
JP2007274462A (ja) | 2006-03-31 | 2007-10-18 | Yamaha Corp | テレビ会議装置、テレビ会議システム |
JP4882757B2 (ja) | 2007-01-18 | 2012-02-22 | ヤマハ株式会社 | 音声会議システム |
WO2008125593A2 (en) * | 2007-04-14 | 2008-10-23 | Musecom Ltd. | Virtual reality-based teleconferencing |
KR101168337B1 (ko) * | 2010-07-08 | 2012-07-24 | 에스케이하이닉스 주식회사 | 데이터 출력 임피던스를 조절할 수 있는 집적회로 및 데이터 출력 임피던스 조절방법 |
US8861756B2 (en) * | 2010-09-24 | 2014-10-14 | LI Creative Technologies, Inc. | Microphone array system |
CN103460285B (zh) * | 2010-12-03 | 2018-01-12 | 弗劳恩霍夫应用研究促进协会 | 用于以几何为基础的空间音频编码的装置及方法 |
US9293151B2 (en) * | 2011-10-17 | 2016-03-22 | Nuance Communications, Inc. | Speech signal enhancement using visual information |
CN102767464B (zh) * | 2012-07-31 | 2014-08-20 | 浙江海洋学院 | 一种带双曲线齿条的波浪发电装置 |
US20160017401A1 (en) * | 2014-07-15 | 2016-01-21 | Geoffrey N. Roth | Method and apparatus for trapping and growing micro-organisms using pre-filter pads and similar pads |
US9712940B2 (en) * | 2014-12-15 | 2017-07-18 | Intel Corporation | Automatic audio adjustment balance |
-
2016
- 2016-10-12 JP JP2017547719A patent/JP6834971B2/ja active Active
- 2016-10-12 EP EP16859560.1A patent/EP3370437A4/en not_active Withdrawn
- 2016-10-12 CN CN201680061242.9A patent/CN108141665A/zh active Pending
- 2016-10-12 US US15/769,503 patent/US10425726B2/en active Active
- 2016-10-12 WO PCT/JP2016/080222 patent/WO2017073324A1/ja active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07193798A (ja) * | 1993-12-27 | 1995-07-28 | Hitachi Ltd | 映像音響通信装置 |
WO2001099469A1 (fr) * | 2000-06-22 | 2001-12-27 | Mitsubishi Denki Kabushiki Kaisha | Systeme de reproduction de la parole, systeme de generation de signaux vocaux et systeme d'appel |
JP2008017126A (ja) * | 2006-07-05 | 2008-01-24 | Yamaha Corp | 音声会議システム |
JP2009246528A (ja) * | 2008-03-28 | 2009-10-22 | Nec Corp | 画像付音声通信システム、画像付音声通信方法およびプログラム |
Non-Patent Citations (1)
Title |
---|
See also references of EP3370437A4 * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11223924B2 (en) | 2017-06-23 | 2022-01-11 | Nokia Technologies Oy | Audio distance estimation for spatial audio processing |
WO2018234628A1 (en) | 2017-06-23 | 2018-12-27 | Nokia Technologies Oy | AUDIO DISTANCE ESTIMATING FOR SPATIAL AUDIO PROCESSING |
US11659349B2 (en) | 2017-06-23 | 2023-05-23 | Nokia Technologies Oy | Audio distance estimation for spatial audio processing |
WO2018234626A1 (en) * | 2017-06-23 | 2018-12-27 | Nokia Technologies Oy | DISTANCE ESTIMATION UNTIL SOURCE SOUND |
US11644528B2 (en) | 2017-06-23 | 2023-05-09 | Nokia Technologies Oy | Sound source distance estimation |
EP3643084A4 (en) * | 2017-06-23 | 2021-03-10 | Nokia Technologies Oy | AUDIO DISTANCE ESTIMATED FOR SPATIAL AUDIO PROCESSING |
US11284211B2 (en) | 2017-06-23 | 2022-03-22 | Nokia Technologies Oy | Determination of targeted spatial audio parameters and associated spatial audio playback |
JPWO2019012587A1 (ja) * | 2017-07-10 | 2020-08-13 | ヤマハ株式会社 | ゲイン調整装置、遠隔会話装置、ゲイン調整方法、およびゲイン調整プログラム |
US10893358B2 (en) | 2017-07-10 | 2021-01-12 | Yamaha Corporation | Gain adjustment device, remote conversation device, and gain adjustment method |
WO2019012587A1 (ja) * | 2017-07-10 | 2019-01-17 | ヤマハ株式会社 | ゲイン調整装置、遠隔会話装置、ゲイン調整方法、およびゲイン調整プログラム |
JP2021176212A (ja) * | 2020-05-01 | 2021-11-04 | tonari株式会社 | 仮想的空間接続装置 |
WO2021220665A1 (ja) * | 2020-05-01 | 2021-11-04 | tonari株式会社 | 仮想的空間接続装置 |
JP7387167B2 (ja) | 2020-05-01 | 2023-11-28 | tonari株式会社 | 仮想的空間接続装置、システム |
Also Published As
Publication number | Publication date |
---|---|
EP3370437A1 (en) | 2018-09-05 |
US20180310097A1 (en) | 2018-10-25 |
CN108141665A (zh) | 2018-06-08 |
EP3370437A4 (en) | 2018-10-17 |
JP6834971B2 (ja) | 2021-02-24 |
JPWO2017073324A1 (ja) | 2018-08-16 |
US10425726B2 (en) | 2019-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2017073324A1 (ja) | 信号処理装置、信号処理方法、並びにプログラム | |
US11991315B2 (en) | Audio conferencing using a distributed array of smartphones | |
JP6149818B2 (ja) | 収音再生システム、収音再生装置、収音再生方法、収音再生プログラム、収音システム及び再生システム | |
KR100878457B1 (ko) | 음상정위 장치 | |
JP7047383B2 (ja) | 音響出力装置、音響出力方法、プログラム | |
US10623877B2 (en) | Generation and playback of near-field audio content | |
US10652686B2 (en) | Method of improving localization of surround sound | |
JP5259622B2 (ja) | 収音装置、収音方法、収音プログラム、および集積回路 | |
US20220345845A1 (en) | Method, Systems and Apparatus for Hybrid Near/Far Virtualization for Enhanced Consumer Surround Sound | |
US9412354B1 (en) | Method and apparatus to use beams at one end-point to support multi-channel linear echo control at another end-point | |
KR20180012744A (ko) | 입체 음향 재생 방법 및 장치 | |
US10440495B2 (en) | Virtual localization of sound | |
JP6972858B2 (ja) | 音響処理装置、プログラム及び方法 | |
KR101071895B1 (ko) | 청취자 위치 추적 기법에 의한 적응형 사운드 생성기 | |
WO2017211448A1 (en) | Method for generating a two-channel signal from a single-channel signal of a sound source | |
GB2536203A (en) | An apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 16859560 Country of ref document: EP Kind code of ref document: A1 |
|
ENP | Entry into the national phase |
Ref document number: 2017547719 Country of ref document: JP Kind code of ref document: A |
|
WWE | Wipo information: entry into national phase |
Ref document number: 15769503 Country of ref document: US |
|
NENP | Non-entry into the national phase |
Ref country code: DE |